2
本文作者: 不知 | 2015-01-07 07:30 |
看看下面的黑黃相間的條紋,告訴我你看到了什么。沒什么,對(duì)吧?不過,如果問最頂尖的人工智能同樣的問題,它會(huì)告訴你,這個(gè)圖案代表校車。它會(huì)說這一評(píng)估的有效度超過 99%。但這個(gè)答案 100% 錯(cuò)了。
計(jì)算機(jī)真的非常擅長識(shí)別物體。不過,一篇新論文將我們的關(guān)注引向了超智能算法完全無用的領(lǐng)域。這篇論文詳細(xì)闡述了研究人員們?nèi)绾斡秒S機(jī)生成的簡單圖片愚弄最先進(jìn)的深度神經(jīng)網(wǎng)絡(luò)。這些算法一次又一次地將混合的抽象圖形看成是鸚鵡、乒乓球拍、百吉餅和蝴蝶。
這些發(fā)現(xiàn)迫使我們了解一個(gè)很明顯但極其重要的事實(shí):計(jì)算機(jī)視覺和人類視覺根本不相同。然而,由于計(jì)算機(jī)越發(fā)依賴神經(jīng)網(wǎng)絡(luò)來學(xué)習(xí)觀看,我們也不是很確定計(jì)算機(jī)視覺與人類視覺有何差異。正如開展研究的研究人員之一 Jeff Clune 所說的,在人工智能上,“我們可以在不知道如何獲得結(jié)果的情況下得到結(jié)果?!?/p>
發(fā)現(xiàn)這些自訓(xùn)練算法為何如此聰明的方式之一是,找到它們愚笨的地方。在這個(gè)例子中,Clune 和博士生 Anh Nguyen 以及 Jason Yosinski 就是要看頂級(jí)圖像識(shí)別神經(jīng)網(wǎng)絡(luò)是否易受誤報(bào)影響。我們知道,計(jì)算機(jī)能識(shí)別考拉。但是否能讓電腦把其他東西認(rèn)作是考拉呢?
為了找到這一問題的答案,這個(gè)團(tuán)隊(duì)通過進(jìn)化算法生成了隨機(jī)圖像。基本上,這些算法生成了非常有效的視覺誘餌。在進(jìn)化算法中,程序會(huì)生成一張圖片,然后稍微改變一下圖片(突變)。原始圖片和復(fù)制后的圖片都展示給經(jīng)過 ImageNet 訓(xùn)練的神經(jīng)網(wǎng)絡(luò)。ImageNet 包含 130 萬張圖片,已經(jīng)成為訓(xùn)練計(jì)算機(jī)視覺人工智能的必備資源。如果算法對(duì)復(fù)制后的照片更確定,研究人員們就會(huì)保留它,如此循環(huán)往復(fù)。否則他們會(huì)后退一步,然后再次嘗試。Clune 表示道:“這不是適者生存,而是結(jié)果最漂亮的圖片會(huì)生存”,或者更精確的說,計(jì)算機(jī)識(shí)別精度最高的圖片會(huì)生存。
最終,這一技術(shù)生成了幾十張神經(jīng)網(wǎng)絡(luò)認(rèn)為精確度超過 99% 的照片。在你看來,這些照片看起來很不一樣,就是一系列的藍(lán)色和橙色波浪線,一堆橢圓,以及黃黑條紋等。但在人工智能看來,這些圖片都是很明顯的匹配:分別是金魚、遙控器和校車。
在一些情況中,你能開始弄懂人工智能是如何被愚弄的。瞇著眼睛看,校車看起來就像是由黃黑條紋相間組成。類似的,你可以看明白讓人工智能認(rèn)為是“帝王蝶”的隨機(jī)生成圖片確實(shí)能夠組合出蝴蝶翅膀,以及“滑雪面具”圖片確實(shí)看起來像是一張夸張的人臉。
但事情要復(fù)雜得多。研究人員們還發(fā)現(xiàn),人工智能總是會(huì)被純靜態(tài)圖片所愚弄。研究人員們使用略有不同的進(jìn)化技術(shù),生成了另一組圖片。這些圖片看起來幾乎都一樣,和壞掉的電視機(jī)上出現(xiàn)的畫面差不多。然而,頂尖神經(jīng)網(wǎng)絡(luò)以 99% 的精度確認(rèn)這些圖片中是蜈蚣、獵豹和孔雀。
對(duì) Clune 來說,這些發(fā)現(xiàn)暗示神經(jīng)網(wǎng)絡(luò)通過多種視覺線索來識(shí)別物體。這些線索也許和人視覺線索很像(比如校車),也許不像。靜態(tài)圖片的結(jié)果顯示,至少在有些時(shí)候,這些線索非常顆?;?。也許在訓(xùn)練中,神經(jīng)網(wǎng)絡(luò)注意到一條由“綠像素、綠像素、紫像素、綠像素”組成的線條在孔雀的照片中很常見。當(dāng) Clune 及其團(tuán)隊(duì)生成的照片恰巧有同樣的線條,它們就觸發(fā)了“孔雀”特征。研究人員們還能用完全不像的抽象圖片觸發(fā)“蜥蜴”特征,顯示神經(jīng)網(wǎng)絡(luò)只依靠幾項(xiàng)線索來識(shí)別物體,而且每一種線索都能觸發(fā)確認(rèn)的特征。
我們周密計(jì)劃來愚弄這些算法的事實(shí)也指出了如今的人工智能中更大的真相:即便這些算法奏效,我們也并不總是知道它們起作用的原因。“這些模型變得非常大,也非常復(fù)雜,而且它們?cè)谧晕覍W(xué)習(xí)”,身為美國懷俄明州立大學(xué)進(jìn)化人工智能實(shí)驗(yàn)室負(fù)責(zé)人的 Clune 表示道:“神經(jīng)網(wǎng)絡(luò)中有數(shù)百萬神經(jīng)元,它們都各行其事。我們也不是很了解它們何以取得如此驚人的成就?!?/p>
類似的研究是試圖逆向工程這些模型。他們想要了解人工智能的大致輪廓。Clune 解釋道:“在過去一兩年中,我們了解了很多神經(jīng)網(wǎng)絡(luò)黑盒內(nèi)部的情況。這一切都還很模糊,但我們已經(jīng)開始看到它了?!?/p>
在本月早些時(shí)候,Clune 在蒙特利爾舉辦的神經(jīng)信息處理系統(tǒng)大會(huì)上與同行研究人員們討論了這些發(fā)現(xiàn)。此次大會(huì)聚集了一些人工智能領(lǐng)域最聰明的思考者們。大家的反應(yīng)可歸為兩個(gè)陣營。一個(gè)陣營的人認(rèn)為這項(xiàng)研究很有意義,這個(gè)陣營的人年紀(jì)要更大,在人工智能領(lǐng)域的經(jīng)驗(yàn)更豐富。他們或許預(yù)測會(huì)出現(xiàn)不同的結(jié)果,但同時(shí)認(rèn)為這些結(jié)果完全可以合理。
第二個(gè)陣營由沒有花多少時(shí)間思考是什么讓如今的計(jì)算機(jī)大腦運(yùn)轉(zhuǎn)的人組成,這些人對(duì)這一發(fā)現(xiàn)表示震驚。至少在最開始,他們很驚訝,這些強(qiáng)大的算法居然也能犯這么簡單的錯(cuò)誤。需要提醒的是,這些人還發(fā)表神經(jīng)網(wǎng)絡(luò)的論文,并且出現(xiàn)在今年最高級(jí)的人工智能大會(huì)上。
對(duì) Clune 來說,兩極分化的反應(yīng)表明:人工智能領(lǐng)域正發(fā)生代際轉(zhuǎn)變。幾年之前,在人工智能領(lǐng)域工作的人在搭建人工智能。如今,神經(jīng)網(wǎng)絡(luò)已經(jīng)足夠好,研究人員們只是獲取現(xiàn)有的東西來運(yùn)用。Clune 表示:“在很多時(shí)候,你可以直接用這些算法來解決問題。人們涌入進(jìn)來運(yùn)用人工智能就像淘金熱一樣?!?/span>
這并不一定是壞事。但隨著越來越多的東西建立在人工智能上,探索人工智能的缺陷也就變得越來越至關(guān)重要。如果算法僅憑一條像素線就斷定一張圖片是某種動(dòng)物,想想色情照片通過安全搜索過濾器會(huì)有多容易。短期來說,Clune 希望這項(xiàng)研究會(huì)促進(jìn)其他研究人員開發(fā)將圖片全局納入考慮的算法。換句話說,能讓計(jì)算機(jī)視覺更像人類視覺的算法。
這項(xiàng)研究還讓我們考慮這些缺陷的其他表現(xiàn)形式。比如面部識(shí)別也是以來同樣的技術(shù)嗎?Clune 表示:“一模一樣,面部識(shí)別算法也很受同樣的問題影響。”
你還可以想象這一發(fā)現(xiàn)的所有有趣應(yīng)用。或許某種 3D 打印的鼻子就足以讓電腦認(rèn)為你是別人。也許穿上一層表面有幾何形狀的衣服,監(jiān)控系統(tǒng)就會(huì)完全無視你。這一發(fā)現(xiàn)證實(shí),隨著計(jì)算機(jī)視覺使用率上升,破壞它的可能性也很隨之上升。
往大點(diǎn)講,隨著我們進(jìn)入自學(xué)習(xí)系統(tǒng)時(shí)代,這一發(fā)現(xiàn)也提醒了我們一個(gè)快速浮現(xiàn)的現(xiàn)實(shí)。現(xiàn)在我們?nèi)匀荒芸刂莆覀儎?chuàng)造的東西。但隨著它們不斷構(gòu)建自身,我們很快就會(huì)發(fā)現(xiàn),它們復(fù)雜得讓我們看不透了。Clune表示:“人類再也看不懂這些計(jì)算機(jī)代碼。它就像是一個(gè)由互動(dòng)部分組成的經(jīng)濟(jì)體,智能從這中間浮現(xiàn)了出來?!?/p>
我們肯定會(huì)立刻使用這一智能。但在我們這么做時(shí),我們是否能完全理解它就不得而知了。
via wired
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。