1
本文作者: 薩洛 | 2017-02-08 15:06 |
在觀看島國(guó)教育片的時(shí)候,往往在不可描述的部位打上了馬賽克,固然呈現(xiàn)了朦朧美,但部分觀眾依然希望變得更加清晰?,F(xiàn)在,Google Brain 在提升圖片分辨率方面取得了突破性進(jìn)展。他們已經(jīng)成功將 8*8(毫米)網(wǎng)格的像素馬賽克轉(zhuǎn)換成為肉眼可辨識(shí)的人物圖像。
而真正能夠提升低分辨率照片細(xì)節(jié)的最佳突破口就是神經(jīng)網(wǎng)路。當(dāng)我們被照片中所包含的像素信息難倒的時(shí)候,深度學(xué)習(xí)能通過(guò)人類(lèi)常說(shuō)的「幻想」來(lái)增加細(xì)節(jié)。實(shí)質(zhì)就是軟件基于從其他圖片中學(xué)習(xí)到的信息對(duì)圖片進(jìn)行猜測(cè)。
Google Brain 的研究團(tuán)隊(duì)已經(jīng)公布了「像素遞歸超分辨率」技術(shù)(Pixel Recursive Super Resolution)的最新進(jìn)展,盡管結(jié)果看上去有點(diǎn)瘆人,但是整個(gè)還原效果令人印象深刻。
下面是他們復(fù)原的效果案例之一:
右手邊的圖片,是 32 x 32 網(wǎng)格的真實(shí)人物頭像。左手邊的圖片,是已經(jīng)壓縮到 8 x 8 網(wǎng)格的相同頭像,而中間的照片,是 GoogleBrain 基于低分辨率樣片猜測(cè)的原圖。
整個(gè)復(fù)原過(guò)程使用了兩種神經(jīng)網(wǎng)絡(luò)。首先介紹的是調(diào)節(jié)網(wǎng)絡(luò)(Conditioning Network),它將低分辨率照片和數(shù)據(jù)庫(kù)中的高分辨率照片進(jìn)行對(duì)比。這個(gè)過(guò)程中迅速降低數(shù)據(jù)庫(kù)照片中的分辨率,并根據(jù)像素顏色匹配一堆同類(lèi)照片。
接下來(lái)介紹的是優(yōu)先網(wǎng)絡(luò)(prior network),它就會(huì)猜測(cè)那些細(xì)節(jié)可以作為高分辨率照片的特征。利用 PixelCNN 架構(gòu),該網(wǎng)絡(luò)會(huì)篩查該尺寸的同類(lèi)照片,并根據(jù)概率優(yōu)先對(duì)高分辨率照片進(jìn)行填充。例如,在論文提供的例子中,提供的同類(lèi)照片是名人和臥室,優(yōu)先網(wǎng)絡(luò)根據(jù)優(yōu)先級(jí)最終確認(rèn)了名人的照片。優(yōu)先網(wǎng)絡(luò)會(huì)在低分辨率和高分辨率照片中做出決定,如果發(fā)現(xiàn)鼻子的可能性比較大,就會(huì)選擇鼻子。
接下來(lái),兩個(gè)神經(jīng)網(wǎng)絡(luò)的最佳猜測(cè)就會(huì)進(jìn)行整合,最終形成的圖像如下:
下面也是一些通過(guò)超像素技術(shù)變化的樣本:
在你開(kāi)始思考:「這并不準(zhǔn)確,這個(gè)人工智能是愚蠢的」,那么請(qǐng)記住人類(lèi)同樣也是愚蠢的。一名志愿者參與了這樣的測(cè)試,同時(shí)展示降低分辨率的照片和通過(guò) Google Brain 復(fù)原的照片,然后提問(wèn)「你猜那張照片來(lái)自于相機(jī)?」,最終結(jié)果是 10% 的名人照片,測(cè)試者選擇了 Google Brain 的照片。在 28% 的臥室樣片中,測(cè)試者選擇了 Google Brain 的照片。
盡管技術(shù)是純凈的,但是未來(lái)可能會(huì)有非??膳碌膽?yīng)用。就像是波士頓馬拉松爆炸案一樣,不難聯(lián)想到一些執(zhí)法部門(mén)會(huì)濫用該軟件來(lái)抓取嫌疑犯。更為重要的是,人工智能的多次嘗試已經(jīng)被證明存在種族主義,因?yàn)橥鶗?huì)參雜人類(lèi)的偏見(jiàn)。分析型人工智能和圖像技術(shù)的結(jié)合,在未來(lái)必然會(huì)經(jīng)歷一段漫長(zhǎng)的調(diào)試過(guò)程。
via gizmodo
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。