0
本文作者: AI研習社-譯站 | 2018-01-15 11:00 |
雷鋒網(wǎng):雷鋒字幕組編譯系列短視頻《 2 分鐘論文 》,帶大家用碎片時間閱覽前沿技術(shù),了解 AI 領(lǐng)域的最新研究成果。
翻譯/ 鄧玉愷
整理/ 孫云 凡江
本期論文:Unsupervised Image-to-Image Translation Networks
論文譯名:無監(jiān)督以圖生圖(圖到圖遷移網(wǎng)絡)
英偉達推出的新技術(shù)無監(jiān)督圖到圖遷移網(wǎng)絡,可以根據(jù)已有的圖像,創(chuàng)造出不同場景下的新圖像。比如,把冬天變成夏天,把城市照片換成城市地圖,將白天公路換成夜間公路。
這種技術(shù)的一種典型實現(xiàn)方式是使用生成對抗網(wǎng)絡(Generative Adversarial Networks,簡稱GANS)。GANS是一對神經(jīng)網(wǎng)絡,其中的生成網(wǎng)絡負責生成合成圖像以欺騙判別網(wǎng)絡,而判別網(wǎng)絡嘗試區(qū)分生成器生成的合成圖像和真實圖像。
這兩個神經(jīng)網(wǎng)絡共同學習,其中生成網(wǎng)絡嘗試生成更真實的圖像以欺騙判別網(wǎng)絡,而判別網(wǎng)絡則嘗試著能更好的區(qū)分真實圖像和合成圖像。這個對抗過程將使得這兩個網(wǎng)絡變得越來越好,最終的結(jié)果也表明了該技術(shù)生成的轉(zhuǎn)化圖相當真實。
? 觀看雷鋒網(wǎng)論文解讀大概需要 4 分鐘
在雷鋒網(wǎng)介紹的這篇論文中,作者使用了6個網(wǎng)絡而不是2個網(wǎng)絡。在一項早期的圖像轉(zhuǎn)化工作中,研究者依靠的是循環(huán)一致性約束。這意味著我們可以假設源圖像可以被轉(zhuǎn)換成目標圖像,而目標圖像可以再反過來轉(zhuǎn)換成和源圖像十分相似的圖像。該假設的成立意味著,圖像轉(zhuǎn)化并非任意隨機,而是隱含了深層次的算法轉(zhuǎn)換。
這項新技術(shù)構(gòu)建在一個假設上,假定存在一個隱空間,在這個隱空間中輸入和輸出圖像可以共存。這個隱空間便是復雜數(shù)據(jù)的一種直觀、簡潔的描述。但該技術(shù)仍然存在的局限是,訓練過程過度依賴對抗網(wǎng)絡,沒有顯在的訓練指標,訓練過程收斂的臨界點自然無從得知。
冬天變成夏天
哈士奇變成柯基
現(xiàn)實世界視頻轉(zhuǎn)變成游戲視頻
還可以給人換個發(fā)型或是戴上墨鏡,甚至加個笑容
論文:https://arxiv.org/pdf/1703.00848.pdf
代碼:https://github.com/mingyuliutw/UNIT
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。