0
本文作者: AI研習(xí)社-譯站 | 2018-02-05 11:32 |
這里是,雷鋒字幕組編譯的 Two Minute Papers專欄,每周帶大家用碎片時(shí)間閱覽前沿技術(shù),了解AI領(lǐng)域的最新研究成果。
原標(biāo)題 High-Resolution Image Synthesis and Semantic Manipulation with Conditional GANs
翻譯 | 劉寧 校對(duì) | 凡江 整理 | 凡江
本期所介紹的內(nèi)容是——從語(yǔ)義圖上獲得高分辨率圖片。語(yǔ)義圖是一幅彩色圖片,圖上的不同色塊代表不同種類物體,如行人、汽車、交通標(biāo)志、建筑物等。
只需要在輸入的語(yǔ)義圖上修改相應(yīng)標(biāo)簽,就能把混凝土路面變成土路,把樹替換成建筑等等。
通常,我們采用光線模擬程序或光柵化來(lái)產(chǎn)生語(yǔ)義圖。但是AI研究者提出:為什么我們要使用光柵,而不是編寫一個(gè)可以自己合成圖像的學(xué)習(xí)算法?
下面的生成對(duì)抗網(wǎng)絡(luò)將一張語(yǔ)義圖作為輸入,并由此生成了一張高分辨率的逼真的圖像。之前的技術(shù)多數(shù)只能生成粗糙的低分辨率的圖片,看起來(lái)也不真實(shí)。而這個(gè)研究卻生成了2k乘1k分辨率的圖像,已經(jīng)很接近全高清的照片。
當(dāng)我們想手動(dòng)編輯一張真實(shí)的照片里的內(nèi)容時(shí),傳統(tǒng)的方法需要具備Photoshop等專業(yè)工具的技能。即使是很簡(jiǎn)單的編輯也要耗費(fèi)大量精力,因?yàn)槿搜凼欠浅ky以欺騙的。而語(yǔ)義圖方法的優(yōu)點(diǎn)就是,不需要太多專業(yè)技能就可以很容易實(shí)現(xiàn)編輯。例如,我們可以通過(guò)將供選的物體填充到語(yǔ)義標(biāo)注圖中來(lái)控制生成的圖片。
這項(xiàng)技術(shù)不僅僅適用于室外交通圖片,它還可以對(duì)人臉細(xì)節(jié)進(jìn)行編輯。例如,可以用此方法簡(jiǎn)單地添加胡子。把這項(xiàng)技術(shù)和之前的pix2pix和CRN技術(shù)做了比較,我們可以看出新技術(shù)生成的圖片的質(zhì)量,圖像在分辨率上也有明顯提高。
巧妙的一點(diǎn)在于,語(yǔ)義圖不僅僅用于標(biāo)識(shí),它還生成了一幅邊界圖,使算法輸出分割得更好的圖片。
生成的邊界圖像和語(yǔ)義標(biāo)簽一樣非常有用。另一個(gè)技巧是創(chuàng)建多個(gè)鑒別器網(wǎng)絡(luò),并在不同精度的圖像上使用它們。
論文&代碼 原址 https://tcwang0509.github.io/pix2pixHD/
更多文章,關(guān)注雷鋒網(wǎng),添加雷鋒字幕組微信號(hào)(leiphonefansub)為好友
備注「我要加入」,To be a AI Volunteer !雷鋒網(wǎng)雷鋒網(wǎng)
相關(guān)文章:
從電影到游戲,你也能用GAN畫高清3D地形模型 | 2分鐘論文
從冬天回到夏天,英偉達(dá)的遷移網(wǎng)絡(luò)能派上用場(chǎng) | 2分鐘論文
愛(ài)P才會(huì)贏,英偉達(dá)用GANS弄了個(gè)高清人臉合成項(xiàng)目 | 2分鐘論文
生成式對(duì)抗網(wǎng)絡(luò)GAN有哪些最新的發(fā)展? | 2分鐘讀論文
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。