1
本文作者: 劉偉 | 2017-06-15 12:15 |
雷鋒網(wǎng)消息 Google旗下的DeepMind最近開發(fā)出了一種用于關(guān)系推理的人工神經(jīng)網(wǎng)絡(luò),縮小了人工智能與人類在關(guān)系推理方面的差距。
你正考慮入手的房子附近有多少個(gè)公園?某家餐廳最好的晚餐和紅酒搭配是什么?這些日常問題都需要用到關(guān)系推理。關(guān)系推理是高級思維的重要組成部分,而AI目前還難以掌握。不過, DeepMind的研究人員已經(jīng)開發(fā)出了一種簡單算法來進(jìn)行關(guān)系推理,而且該算法已經(jīng)在復(fù)雜圖像的理解測試中擊敗了人類。
關(guān)系推理是一種運(yùn)用邏輯,聯(lián)系和比較位置、順序以及其他實(shí)體的思維過程。人類通常十分擅長關(guān)系推理,但人工智能的兩種主要模式——基于統(tǒng)計(jì)和基于符號(hào)計(jì)算的算法,在開發(fā)類似能力時(shí)進(jìn)展十分緩慢?;诮y(tǒng)計(jì)的AI算法——或者說機(jī)器學(xué)習(xí)——在圖像識(shí)別領(lǐng)域表現(xiàn)十分出色,但它并沒有運(yùn)用到邏輯能力。基于符號(hào)計(jì)算的AI算法可以使用預(yù)定的規(guī)則進(jìn)行關(guān)系推理,但在學(xué)習(xí)能力方面表現(xiàn)不佳。
神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)與神經(jīng)元在大腦中的連接方式相似。它將簡單的程序組合在一起,彼此協(xié)同,分析數(shù)據(jù)間的關(guān)系和規(guī)律。針對處理圖像、分析語言和學(xué)習(xí)游戲等不同用途,神經(jīng)網(wǎng)絡(luò)具有不同的專門架構(gòu)。DeepMind開發(fā)出了全新的關(guān)系網(wǎng)絡(luò),以分析比較某一特定場景中的每一組對象。DeepMind在倫敦的計(jì)算機(jī)科學(xué)家Timothy Lillicrap表示:“我們的目的很明確,就是推動(dòng)該網(wǎng)絡(luò)發(fā)現(xiàn)物體間存在的關(guān)系”。
Timothy和他的團(tuán)隊(duì)讓該網(wǎng)絡(luò)挑戰(zhàn)了幾項(xiàng)任務(wù),以測試其效力。第一項(xiàng)任務(wù)是分析某張圖片中幾個(gè)物體——比如立方體、球和圓柱體間的關(guān)系。測試人員會(huì)向該網(wǎng)絡(luò)提問,比如:藍(lán)色的物體前面的物體,和灰色金屬球右邊的微小青色物體形狀是否相同。據(jù)雷鋒網(wǎng)了解,為完成這一任務(wù),關(guān)系網(wǎng)絡(luò)結(jié)合了其他兩種神經(jīng)網(wǎng)絡(luò)的能力:一種用于識(shí)別圖片中的物體,另一種用于理解測試人員的提問。根據(jù)研究人員上周發(fā)表的一篇報(bào)告(論文下載):在一系列測試中,其他機(jī)器學(xué)習(xí)算法的正確率只有42%-77%,人類的正確率可達(dá)到92%,而該關(guān)系網(wǎng)絡(luò)的正確率高達(dá)96%,已經(jīng)超越了人類。
DeepMind團(tuán)隊(duì)還用該網(wǎng)絡(luò)挑戰(zhàn)了基于語言的任務(wù)。測試中,該網(wǎng)絡(luò)首先會(huì)接收到一些語句,比如“Sandra撿起足球”“ Sandra去辦公室”。然后測試人員向其提問“足球在哪里”。在回答大多數(shù)問題時(shí),該算法與其競爭算法表現(xiàn)相當(dāng),不過它在處理“Lily是一只天鵝,Lily是白色的,Greg也是一只天鵝,那么Greg是什么顏色”之類的推理問題時(shí)表現(xiàn)更加出色。面對類似問題時(shí),該算法的正確率高達(dá)98%,而其他算法的正確率只有45%。最后,研究團(tuán)隊(duì)還讓該算法分析了一段動(dòng)畫,動(dòng)畫中有十個(gè)球彈來彈去,其中一些球通過不可見的彈簧或杠桿連接在一起。僅僅通過運(yùn)動(dòng)軌跡,該算法就能準(zhǔn)確判斷90%的連接。研究人員還通過這種方式訓(xùn)練該算法識(shí)別用移動(dòng)的點(diǎn)代替的人群。
波士頓大學(xué)計(jì)算機(jī)科學(xué)家凱特·??疲↘ate Saenko)并沒有參與這該算法的開發(fā),但他聯(lián)合開發(fā)了另一個(gè)能夠回答關(guān)于圖像的復(fù)雜問題的算法。??票硎荆撍惴ǖ膬?yōu)勢之一就是它在概念上非常簡單。該算法取得的進(jìn)步主要?dú)w功于一個(gè)方程式,后者允許該算法與其他網(wǎng)絡(luò)相結(jié)合,正如它在完成比較物體的任務(wù)中所做的那樣。研究人員發(fā)表的報(bào)告中稱該算法為“一個(gè)簡單的即插即用模塊”,它可以讓系統(tǒng)中的其他部分專注于它們各自擅長的領(lǐng)域。
加利福尼亞州斯坦福大學(xué)的計(jì)算機(jī)科學(xué)家賈斯汀·約翰遜(Justin Johnson)共同參與了第一項(xiàng)測試任務(wù)的設(shè)計(jì),同時(shí)他也聯(lián)合開發(fā)了一種在該任務(wù)中表現(xiàn)出色的算法。他說道:“測試結(jié)果令我影響深刻?!???苿t補(bǔ)充道:“未來關(guān)系網(wǎng)絡(luò)可以幫助學(xué)習(xí)社交網(wǎng)絡(luò),分析監(jiān)控畫面,或者控制自動(dòng)駕駛汽車?!?/p>
約翰遜表示,要像人類一樣靈活,該算法還必須學(xué)會(huì)回答更具挑戰(zhàn)性的問題。要實(shí)現(xiàn)這一點(diǎn),該算法不僅要學(xué)會(huì)比較兩個(gè)物體,還要能比較三個(gè)物體,甚至多對物體,或者大集合中的某幾組物體。他說道,“我正致力于開發(fā)能擁有自己的策略的模型”。 DeepMind正在開發(fā)的是一種特定類型,而非普適性型的關(guān)系推理網(wǎng)絡(luò),不過它仍然是人類在前進(jìn)道路上邁出的重要一步。
via science 雷鋒網(wǎng)編譯
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。