2
本文作者: 劉子榆 | 2016-11-25 11:24 |
讀漫畫(huà)對(duì)人工智能太難了
隨著人工智能的不斷發(fā)展,它似乎已經(jīng)在很多方面趕超了人類——面部識(shí)別、物體識(shí)別,還有象棋、圍棋、各種視頻游戲。
人們不禁要問(wèn),還有什么事是 AI 做不好的呢?它在哪方面比不過(guò)人類?現(xiàn)在,馬里蘭大學(xué)帕克分校 ( UMCP ) 的一項(xiàng)研究告訴你,讀漫畫(huà)可能就是其中之一。
據(jù)國(guó)外媒體報(bào)道,馬里蘭大學(xué) Mohit Iyyer 教授對(duì) AI 讀漫畫(huà)書(shū)的能力進(jìn)行了測(cè)試。結(jié)果顯示 AI 在這一領(lǐng)域遠(yuǎn)遠(yuǎn)比不過(guò)人類。
漫畫(huà)由一系列單獨(dú)的圖畫(huà)構(gòu)成,每部分都搭配文字解釋,圖文符合度很高。這樣一來(lái),如果單獨(dú)看某一張圖片或是某一句文本是很難理解到漫畫(huà)意思的。
除此之外,不同作者的繪畫(huà)風(fēng)格、語(yǔ)言風(fēng)格不同,排版也存在巨大的差異。而且漫畫(huà)與視頻不同,每張圖畫(huà)之間的時(shí)間和空間是不連貫的,中間的大量情節(jié)需要讀者發(fā)揮想象力去腦補(bǔ),這種對(duì)人類是輕而易舉的事情,對(duì) AI 卻是難如登天。
Iyyer 教授用 4000 本漫畫(huà)書(shū)創(chuàng)造了一個(gè)由 120 萬(wàn)張漫畫(huà)畫(huà)格組成的圖庫(kù),每張畫(huà)格配有對(duì)應(yīng)的文本對(duì)話框。由于涉及版權(quán)問(wèn)題,圖庫(kù)中的漫畫(huà)全部來(lái)源于 20 世紀(jì) 30 年代到 50 年代的作品。
為了弄清楚 AI 理解漫畫(huà)的能力如何,研究人員進(jìn)行了讓人工智能程序依靠之前見(jiàn)過(guò)的圖畫(huà)預(yù)測(cè)下一個(gè)畫(huà)格的實(shí)驗(yàn)。首先研究小組先讓 AI 學(xué)習(xí)漫畫(huà)的創(chuàng)作過(guò)程,將漫畫(huà)中的一個(gè)畫(huà)格及其對(duì)應(yīng)的文本投給不同的機(jī)器算法,讓它們學(xué)習(xí)一組漫畫(huà)中的每個(gè)畫(huà)格之間是如何相互關(guān)聯(lián)的。在大量訓(xùn)練之后,研究人員把一組AI 之前沒(méi)有見(jiàn)過(guò)的短篇漫畫(huà)集對(duì)它進(jìn)行測(cè)試,并要求它預(yù)測(cè)出下一張圖畫(huà)或者文本的內(nèi)容。結(jié)果發(fā)現(xiàn),人類預(yù)測(cè)的正確率高達(dá) 80 %,而 AI 卻與人類水準(zhǔn)相差甚遠(yuǎn)。
Iyyer 教授解釋,“雖然如今的 AI 已經(jīng)在圖像識(shí)別、文本識(shí)別上取得了不凡的成就,但是對(duì)于看漫畫(huà)這種需要人類大腦進(jìn)行邏輯推理和想象力思考的活動(dòng),它還是遠(yuǎn)遠(yuǎn)不及人類。不過(guò),這也是我們今后努力的方向。”
Via technology
【招聘】雷鋒網(wǎng)(公眾號(hào):雷鋒網(wǎng))堅(jiān)持在人工智能、無(wú)人駕駛、VR/AR、Fintech、未來(lái)醫(yī)療等領(lǐng)域第一時(shí)間提供海外科技動(dòng)態(tài)與資訊。我們需要若干關(guān)注國(guó)際新聞、具有一定的科技新聞選題能力,翻譯及寫(xiě)作能力優(yōu)良的外翻編輯加入。工作地點(diǎn)深圳。簡(jiǎn)歷投遞至 guoyixin@leiphone.com 。兼職及實(shí)習(xí)均可。
推薦閱讀:
預(yù)告:MXNet火了,AI從業(yè)者該如何選擇深度學(xué)習(xí)開(kāi)源框架丨硬創(chuàng)公開(kāi)課
IBM中國(guó)研究院院長(zhǎng)沈曉衛(wèi):從編程時(shí)代邁向認(rèn)知時(shí)代,沒(méi)有一家企業(yè)能獨(dú)擔(dān)此任
人工智能的未來(lái) | 科大訊飛創(chuàng)始人劉慶峰:17年AI從業(yè)經(jīng)驗(yàn),從這10000字長(zhǎng)文中一窺
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。