0
本文作者: 周翔 | 2017-04-28 12:41 | 專題:GMIC 北京 2017 |
雷鋒網(wǎng)按:4月27日,GMIC 2017(全球移動(dòng)互聯(lián)網(wǎng)大會(huì))北京站開幕。卡內(nèi)基梅隆大學(xué)計(jì)算機(jī)科學(xué)學(xué)院機(jī)器學(xué)習(xí)系主任Tom Mitchell發(fā)表了“突破人類和機(jī)器的邊界”的主題演講。Tom Mitchell認(rèn)為,通過對(duì)人類大腦的模仿,計(jì)算機(jī)在變得越來越強(qiáng)。隨著機(jī)器智能和腦科學(xué)的進(jìn)一步發(fā)展,未來兩個(gè)學(xué)科之間應(yīng)該有更多的交集,并互相學(xué)習(xí)和借鑒。
Tom Mitchell:卡內(nèi)基梅隆大學(xué)計(jì)算機(jī)科學(xué)學(xué)院機(jī)器學(xué)習(xí)系主任、教授,美國工程院院士,美國科學(xué)進(jìn)展學(xué)會(huì)(AAAS)成員,人工智能進(jìn)展學(xué)會(huì)(AAAI)成員,美國《Machine Leaming》雜志、國際機(jī)器學(xué)習(xí)年度會(huì)議(ICML)的創(chuàng)始人。他在機(jī)器學(xué)習(xí)、人工智能、認(rèn)知神經(jīng)科學(xué)等領(lǐng)域卓有建樹,撰寫了機(jī)器學(xué)習(xí)方面最早的教科書之一《機(jī)器學(xué)習(xí)》,是機(jī)器學(xué)習(xí)領(lǐng)域的著名學(xué)者。
以下是演講全文,雷鋒網(wǎng)做了不改變?cè)獾恼恚?/p>
今天在這里,我想和大家探討一個(gè)問題,那就是我們的智能如何從物理材料中實(shí)現(xiàn)突破,這是科學(xué)界還未解答的問題。目前有兩種研究途徑,首先是研究大腦,因?yàn)榇竽X是有智能的,第二是努力打造一種具有智能的機(jī)器。這是兩種學(xué)習(xí)智能的方法,已經(jīng)進(jìn)行了很長時(shí)間了。
我今天想說的是,這兩個(gè)領(lǐng)域相互之間沒有交集,每個(gè)領(lǐng)域的專家對(duì)另外一個(gè)領(lǐng)域都不太了解,我們需要投入更多的資源來進(jìn)行兩者之間的交叉研究。首先講的是第一點(diǎn),這兩個(gè)研究領(lǐng)域在過去十年里面取得了很大的進(jìn)展;第二點(diǎn),我們現(xiàn)在已經(jīng)對(duì)兩個(gè)維度都進(jìn)行相應(yīng)的實(shí)例研究,兩者之間的確出現(xiàn)了一些交集,可以互相學(xué)習(xí)和借鑒。
所以我會(huì)對(duì)這方面進(jìn)行一些探討,希望進(jìn)一步激活兩者之間的交集。首先可以看一下,我們的人工智能在過去的十幾年里取得了重大進(jìn)展,最近人工智能已經(jīng)戰(zhàn)勝了人類圍棋的冠軍,而且國際象棋、德州撲克也已經(jīng)被人工智能攻下,現(xiàn)在我們看到的則是無人駕駛汽車,比如Uber就在進(jìn)行這樣的測(cè)試。
在過去的十年里,計(jì)算機(jī)視覺技術(shù)的進(jìn)展很快,機(jī)器識(shí)別的準(zhǔn)確率從過去的60%上升到95%左右。在語音方面也實(shí)現(xiàn)了突破,去年10月,微軟的對(duì)話語音識(shí)別技術(shù)在產(chǎn)業(yè)標(biāo)準(zhǔn)Switchboard語音識(shí)別基準(zhǔn)測(cè)試中實(shí)現(xiàn)了詞錯(cuò)率(word error rate, 簡稱WER)低至5.9%的突破 ,創(chuàng)造了當(dāng)時(shí)該領(lǐng)域內(nèi)錯(cuò)誤率的最低紀(jì)錄。
比如前面講到了下圍棋、下象棋,人工智能在這一領(lǐng)域突破非常快,背后主要是依靠深層次的機(jī)器學(xué)習(xí)。另外我們?cè)谀X科學(xué)方面的發(fā)展也非常迅猛,在過去十幾年的時(shí)間里,有很多先進(jìn)的技術(shù)和設(shè)備,使得我們可以采用無創(chuàng)或者微創(chuàng)的方法進(jìn)入到人的大腦,進(jìn)行毫米級(jí)地觀察,而且在毫秒內(nèi)就可以對(duì)幾千張影像進(jìn)行分析,觀察人腦的活性。此外,動(dòng)物大腦的研究更加令人歡心鼓舞,通過基因方面的研究,在基因上進(jìn)行相應(yīng)的工程,對(duì)老鼠和其他動(dòng)物相應(yīng)的神經(jīng)元進(jìn)行修飾、改變,這樣可以更好的對(duì)人的神經(jīng)活動(dòng)進(jìn)行一些管理和控制。
通過這樣一些腦科學(xué)的發(fā)展,腦科學(xué)領(lǐng)域的一些理論和假設(shè)都取得了突破。比如老鼠在一個(gè)迷宮中行走的時(shí)候,老鼠對(duì)自己在迷宮中的位置的感覺到底是怎樣的,這就可以通過觀測(cè)它的神經(jīng)元放電來找到。不同的情況下,大腦各個(gè)區(qū)會(huì)域進(jìn)行相應(yīng)的振蕩,因此可以在不同的時(shí)間點(diǎn)進(jìn)行觀測(cè),當(dāng)人們?cè)谏缃坏臅r(shí)候,大腦當(dāng)中管社交的部分會(huì)得到同步的激活,不過有自閉癥的人和正常人的狀況也不一樣??傊?,無論是人工智能還是腦科學(xué),都取得了令人矚目的巨大進(jìn)展。
所以就出現(xiàn)了這樣一個(gè)問題:為什么不將兩者結(jié)合起來呢?在研究方面,無論時(shí)腦科學(xué)還是人工智能都在進(jìn)行交叉的研究。首先是計(jì)算機(jī)視覺,神經(jīng)網(wǎng)絡(luò)的確使得計(jì)算機(jī)的視覺發(fā)生革命性的改變,這樣的一個(gè)神經(jīng)網(wǎng)絡(luò),可以用來預(yù)測(cè)人腦當(dāng)中的神經(jīng)元的活動(dòng),包括它的視覺皮層相應(yīng)的活動(dòng),這是一個(gè)深層次的神經(jīng)網(wǎng)絡(luò)。我們可以來看一些細(xì)節(jié),左上方是單個(gè)神經(jīng)網(wǎng)絡(luò)當(dāng)中的單元,通過輸入輸出可以看到相關(guān)的情況。我們可以對(duì)它的輸入進(jìn)行研究,觀察它到底是怎樣的組合,右下圖展現(xiàn)的是這些單個(gè)神經(jīng)元組成的網(wǎng)絡(luò),一個(gè)輸出成為另外一個(gè)輸入的情況,我們可以對(duì)這樣深層次的網(wǎng)絡(luò)進(jìn)行訓(xùn)練,比如把輸入的影像通過輸出展現(xiàn)出這個(gè)影像到底是什么,然后進(jìn)行相應(yīng)的深度學(xué)習(xí)。
這個(gè)時(shí)候我們就可以對(duì)網(wǎng)絡(luò)當(dāng)中滯后的階段進(jìn)行探測(cè),看一下成為條件的時(shí)候它是怎么編碼的。在2014年的時(shí)候,有人做了一些實(shí)驗(yàn),他們訓(xùn)練了不同的網(wǎng)絡(luò),在訓(xùn)練了這些神經(jīng)網(wǎng)絡(luò)之后,把同樣的影像給這些神經(jīng)網(wǎng)絡(luò)看,通過FMI的掃描儀,觀察人的大腦當(dāng)中相應(yīng)的神經(jīng)活動(dòng),來更好地進(jìn)行預(yù)測(cè),這是令人稱奇的的結(jié)果?,F(xiàn)在人工的神經(jīng)網(wǎng)絡(luò)可以被我們用來訓(xùn)練,做一些相應(yīng)的預(yù)測(cè),也就是說我們現(xiàn)在可以建立一種橋梁,對(duì)大腦當(dāng)中的腦神經(jīng)的活動(dòng)進(jìn)行預(yù)測(cè),這樣就打開了無限的可能,可以回答很多有趣的問題。
比如人的視覺到底是怎樣形成的,以及可以用怎樣的設(shè)備設(shè)計(jì)更好的人工神經(jīng)網(wǎng)絡(luò),幫助我們做這樣的預(yù)測(cè)。一層一層進(jìn)行輸入、輸出,這樣可以進(jìn)一步推動(dòng)人工的神經(jīng)網(wǎng)絡(luò)。我們知道大腦當(dāng)中的確是不一樣的,大腦當(dāng)中是有前輸和后輸?shù)?,在這個(gè)橋梁當(dāng)中可以進(jìn)行研究,人工的大腦和人的大腦到底有什么區(qū)別,然后相互借鑒、促進(jìn)。
這里有另外一個(gè)例子,也是來自于最近的一個(gè)研究,是自然語言處理領(lǐng)域的研究成果,那就是谷歌的自動(dòng)翻譯系統(tǒng)的能力得到了很大的提升,比之前更精確了,這是為什么呢?主要是深層次的神經(jīng)網(wǎng)絡(luò),更可能是由于網(wǎng)絡(luò)里有一些儲(chǔ)存。通過對(duì)大腦的研究,我們觀測(cè)大腦怎樣用神經(jīng)活動(dòng)來解釋不同單詞相應(yīng)的詞義,這些詞義給了我們更好的回答方式。對(duì)這些細(xì)節(jié)進(jìn)行研究,我們會(huì)產(chǎn)生一種模型或者理論,來幫助我們對(duì)大腦的活動(dòng)進(jìn)行預(yù)測(cè),通過這樣一個(gè)模型結(jié)構(gòu),來對(duì)應(yīng)任何輸入。
比如說電話,首先這個(gè)模型產(chǎn)生一個(gè)代碼,用它預(yù)測(cè)神經(jīng)活動(dòng),大腦當(dāng)中有兩萬個(gè)不同的位置被預(yù)測(cè)出來。然后進(jìn)一步通過矢量來進(jìn)行預(yù)測(cè),比如這里是芹菜和飛機(jī)的兩個(gè)矢量,兩個(gè)矢量的特征都和相應(yīng)的詞對(duì)應(yīng)。對(duì)應(yīng)芹菜可以看到和芹菜相關(guān)聯(lián)的字?jǐn)?shù),口味是和芹菜相應(yīng)的一個(gè)關(guān)聯(lián)度;對(duì)飛機(jī)來說,則會(huì)出現(xiàn)很多的動(dòng)詞,可以看到相關(guān)的一些詞就出現(xiàn)了。
通過這樣的一些模型當(dāng)中的編碼,可以很好的復(fù)現(xiàn)一些皮層當(dāng)中出現(xiàn)的詞,我們對(duì)模型進(jìn)行訓(xùn)練。我們看到在下面對(duì)任何詞的神經(jīng)活動(dòng),比如芹菜,把這些語義的特征組合起來,通過模型的學(xué)習(xí),把這些特征進(jìn)行關(guān)聯(lián),可以發(fā)現(xiàn),“吃”這個(gè)詞和芹菜這個(gè)詞的關(guān)聯(lián)度是最高的。通過這樣的研究很有意義,給到一個(gè)新詞,比如說之前沒有訓(xùn)練過,在對(duì)它的預(yù)測(cè)分析分析當(dāng)中我們發(fā)現(xiàn),在83%的情況下有兩個(gè)新的詞,哪個(gè)是第一關(guān)聯(lián),哪個(gè)是第二關(guān)聯(lián),有50%的可能性是正確的,有的詞從來沒有出現(xiàn)過,也會(huì)有很高的識(shí)別率,也就是說,神經(jīng)的活動(dòng)對(duì)詞義的表達(dá),是用了我們矢量表達(dá)法來進(jìn)行詞義解釋。這是技術(shù)的表達(dá),在人工智能和人腦當(dāng)中存在一個(gè)橋梁的關(guān)系。
第三個(gè)例子是我們講的強(qiáng)化學(xué)習(xí),這個(gè)是現(xiàn)在非常流行的,比如相關(guān)的培訓(xùn)當(dāng)中會(huì)出現(xiàn)一些強(qiáng)化學(xué)習(xí)的算法。很多時(shí)候?qū)?dòng)物的一些獎(jiǎng)勵(lì)學(xué)習(xí),也屬于強(qiáng)化學(xué)習(xí)的方式。比如發(fā)一些糖給猴子吃,猴子認(rèn)為這是獎(jiǎng)勵(lì),所以大腦里有放電的現(xiàn)象,然后就可以找到對(duì)應(yīng)的神經(jīng)元。
這樣的一種神經(jīng)元放電代表什么呢?可能對(duì)這個(gè)獎(jiǎng)勵(lì),也就是這個(gè)糖有所感應(yīng),所以放電了。通過這樣的實(shí)驗(yàn)來訓(xùn)練這些猴子,給到猴子糖以后,后一秒就開始閃光,這個(gè)時(shí)候我們可以看到的情況就是給了猴子糖以后,猴子的神經(jīng)元沒有任何反應(yīng),而是當(dāng)閃光以后,猴子的神經(jīng)元才放電,說明猴子的神經(jīng)元并不是因?yàn)榻o了糖才反應(yīng),而是對(duì)獎(jiǎng)勵(lì)這個(gè)事情本身放電,這是很酷的研究。
還有一種情況,沒有給糖,只是閃光,猴子怎么反應(yīng)?沒有給糖,沒有任何獎(jiǎng)勵(lì),這個(gè)神經(jīng)元就會(huì)怎么樣來表達(dá)呢?閃光之后,猴子發(fā)現(xiàn)并沒有給糖,這是一種抑郁,而不是獎(jiǎng)勵(lì)了,這是和強(qiáng)化學(xué)習(xí)直接相關(guān)的。這樣的一個(gè)情況,很好地解釋了我們看到的猴子的神經(jīng)元的表現(xiàn),因此在人工智能算法和我們?nèi)说拇竽X之間或者動(dòng)物的大腦之間,有這樣一種橋梁的關(guān)系,因此強(qiáng)化學(xué)習(xí)的算法對(duì)機(jī)器人的控制是可以用的,比如可以用于打敗人類冠軍的Alpha Go的訓(xùn)練。因此通過這樣的一些對(duì)大腦行為的觀測(cè)和檢測(cè)可以幫助我們進(jìn)行人工神經(jīng)網(wǎng)絡(luò)的訓(xùn)練。
通過這些方式,我們剛才也講了矢量的應(yīng)用和強(qiáng)化學(xué)習(xí)的方式,這樣一些人工智能的算法,在我們的大腦當(dāng)中,觀測(cè)到了神經(jīng)元活動(dòng)的關(guān)聯(lián),因此我覺得,現(xiàn)在人的腦科學(xué)和人工智能方面到了可以有更多交集的好時(shí)機(jī),我們應(yīng)該在人工智能和腦科學(xué)之間搭建更多的橋梁。
我前面也舉出了一些實(shí)例,希望大家可以進(jìn)一步研究,盡管人的大腦不是由硅組成的電腦,但是有可能任何產(chǎn)生智能的物理方式都是有一些信息的約束條件的,這樣的一種結(jié)構(gòu)可以進(jìn)行深層次的學(xué)習(xí)。我們可以從人工智能和人腦當(dāng)中找到更多的答案幫助推進(jìn)科學(xué)的進(jìn)步,再次感謝各位。
雷鋒網(wǎng)相關(guān)文章:《吳甘沙對(duì)話Tom Mitchell:人工智能如何顛覆我們的城市 | GMIC 2017》
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。
本專題其他文章