0
雷鋒網(wǎng) AI 科技評論按:深度學習的研究者們一直希望給神經(jīng)網(wǎng)絡(luò)加上顯式的泛化能力,以便讓它完成更困難的任務(wù)。DeepMind 近期也在這個方向上展開了研究并在 JAIR(Journal of Artificial Intelligence Research)雜志發(fā)表了論文,也在博客中以一個踢足球為引子介紹了論文的主要內(nèi)容。雷鋒網(wǎng) AI 科技評論把博客內(nèi)容編譯如下。
假想你在踢足球。球到了你腳下,然后你打算把球傳給沒人盯防的前鋒。這個看起來簡單的動作,其實需要兩種不同的思維。
首先,你需要認識到自己腳下有一個足球。這個認知動作需要直覺式的認識思維:你很難詳細描述你是如何知道腳下有一個足球的,你只是看到了這個球而已。然后,你打算把球傳給某一個前鋒,做出這樣的決策需要概念思維。這個決策是基于你自己的判斷做出的:之所以你打算把球傳給這個前鋒,是因為沒人盯防他。
這兩種思維之間的區(qū)別讓 DeepMind 的研究人員們感到非常有趣,因為這兩種不同的思維剛好對應(yīng)了兩種不同的機器學習方法,那就是深度學習和符號程序生成(symbolic program synthesis)。深度學習的核心是直覺式的認知思維,而符號程序生成關(guān)注的是概念式的、基于規(guī)則的思維。兩種系統(tǒng)各有所長,深度學習對有噪聲數(shù)據(jù)的魯棒性不錯,但是難以解釋,并且需要很多數(shù)據(jù)來訓練;而符號化的系統(tǒng)解釋起來就要簡單得多,需要的訓練數(shù)據(jù)也少得多,但是處理有噪聲的數(shù)據(jù)就非常困難。人類的認知過程當然可以無縫銜接這兩種不同的思考方式,但是在單個 AI 系統(tǒng)中同樣實現(xiàn)這兩種思維就不是一件簡單的任務(wù)了。
DeepMind 的論文《Learning Explanatory Rules from Noisy Data》就研究了這個問題,表明在一個系統(tǒng)中綜合直覺感知思考和可解釋概念推理是可能的。這篇論文也發(fā)表在了 JAIR 雜志上。論文中介紹的系統(tǒng),「?ILP」,對噪聲魯棒、能高效地利用數(shù)據(jù),而且能夠產(chǎn)生可解釋的規(guī)則。
在論文中,DeepMind 演示了 ?ILP 在歸納任務(wù)中的表現(xiàn)。展示給系統(tǒng)的是成對的數(shù)字的圖像,系統(tǒng)要做的是輸出一個標簽(0 或者 1)來表示左側(cè)圖中的數(shù)字是否小于右側(cè)圖中的數(shù)字。解決這樣的任務(wù)就同時需要前面提到的兩種思維:識別圖像中的具體是哪個數(shù)字需要直覺性的認知思維,而足夠泛化地理解「小于」關(guān)系則需要概念思維。
對于一個標準的深度學習模型來說(比如帶有 MLP 的卷積神經(jīng)網(wǎng)絡(luò)),如果給它足夠的數(shù)據(jù),它也能很快學會解決這個問題。一旦訓練結(jié)束,給它看從未見過的對象對,它也能正確分類??墒侨绻胍苷_地泛化,還是需要每一對數(shù)字都有很多個樣本用來訓練才行。這樣的模型很善于做視覺任務(wù)的泛化:只要它看過所有測試集里有的每對數(shù)字(如下圖綠色區(qū)域),它就能泛化到新的圖像上。但是它做不了符號化思維的泛化:如果有一對數(shù)字是它沒有見過的(如下圖藍色區(qū)域),它就沒辦法泛化。Gary Marcus 和 Joel Grus 等研究者最近也在文章中指出了這一點,令人深思。
?ILP 和標準神經(jīng)網(wǎng)絡(luò)的不同之處就是在于它能以符號化的方式泛化,而且它也和標準的符號化程序不一樣,它可以泛化它的視覺能力。它從樣本中學習到的顯式程序是可閱讀的、可解釋的、可驗證的。對 ?ILP 來說,給它樣本集中的一部分(和需要的結(jié)果),它就能產(chǎn)生一個可以滿足它們的程序。它會用梯度下降搜索整個程序空間。如果程序的輸出和參考數(shù)據(jù)中得到的理想輸出不一致,系統(tǒng)就會引導程序更新,讓輸出更符合數(shù)據(jù)。
論文中介紹的系統(tǒng) ?ILP 可以符號化地泛化。當它看過「x<y」、「y<z」、「x<z」的樣本之后,它就會考慮「<」這個關(guān)系有可能是傳遞性的。當它確認了這個通用規(guī)則之后,它就可以把它用在一對以前從來沒有見過的數(shù)字上。
DeepMind 的研究人員們認為,他們的這項成果某種程度上回答了「在深度神經(jīng)網(wǎng)絡(luò)中實現(xiàn)符號化泛化有沒有可能」這個問題。在未來的研究中,他們還打算把類似 ?ILP 這樣的系統(tǒng)集成到強化學習智能體和更大的深度學習模型中。他們希望賦予智能體新的能力,不僅要能夠推理,還要懂得做出即時反應(yīng)。
論文地址:http://www.jair.org/media/5714/live-5714-10391-jair.pdf
via DeepMind Blog,雷鋒網(wǎng) AI 科技評論編譯
相關(guān)文章:
李飛飛:在物體識別之后,計算機視覺還要多久才能理解這個世界 | IROS 2017
DeepMind 開源虛擬實驗室 Psychlab,利用認知心理學對智能體進行研究
DeepMind眼中的神經(jīng)科學研究:人工智能進步的另一個重要支點
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。