0
編輯 | 叢 末
那么,人工智能發(fā)展到最后真的會變得和生物大腦完全一樣嗎?不一定,因?yàn)閮烧叻?wù)于不同的目的。人工智能要實(shí)現(xiàn)的是具有專用功能的機(jī)器,而生物智能要實(shí)現(xiàn)的是能適應(yīng)大自然環(huán)境的有機(jī)體。
但是生物大腦是億萬年進(jìn)化的產(chǎn)物,所以它在進(jìn)化過程中已經(jīng)摸索出極佳的信息處理的架構(gòu)和算法,這些架構(gòu)和算法可以為發(fā)展人工智能帶來啟發(fā)。
所以從原則上來說,兩者存在交集,但并沒有包含關(guān)系。
在北京智源大會舉行的“認(rèn)知神經(jīng)基礎(chǔ)”專題論壇,來自北京師范大學(xué)認(rèn)知神經(jīng)科學(xué)與學(xué)習(xí)國家重點(diǎn)實(shí)驗(yàn)室的畢彥超教授、北京大學(xué)心理與認(rèn)知學(xué)院的方方教授、北京師范大學(xué)心理學(xué)部的劉嘉教授、北京大學(xué)計算機(jī)系的吳思教授、中國科學(xué)院自動化研究所的余山教授分別做了報告,共同探究認(rèn)知神經(jīng)科學(xué)能為AI帶來什么啟發(fā)。
畢彥超教授做了《人類大腦的知識表征》的報告。畢彥超教授在哈佛大學(xué)獲得心理學(xué)(認(rèn)知、腦、行為)博士學(xué)位,在人腦實(shí)現(xiàn)語義知識表達(dá)方面做過很深入的研究。
以下是演講全文,AI科技評論做了不改變原意的整理。
AI的知識表征一般指從文本提取各種知識圖譜,而人腦里其實(shí)存在很多非語言描述的知識。
舉兩個例子,有的大腦損傷的病人,給他一個剪刀,他知道這是剪刀,也知道剪刀是用來剪東西的。但是他完全不知道該怎么用,連應(yīng)該怎么拿都不知道。
另外一類病人,我們也給他一個剪刀,他知道怎么拿,也知道應(yīng)該用怎么樣的動作,但是他是從前往后剪,正常用剪刀都是從后往前剪。
這兩個例子表明,即使是非常簡單的運(yùn)動動作,也需要存儲知識的指導(dǎo)。人的大腦對外界信號的理解,比如識別語音、識別文字、識別圖片等等,其識別的最終目的是在我們大腦中提取外界刺激所不包含的信息。這就是普遍性的知識,只有提取了這種知識,我們才對信號有了理解,對世界有了理解,我們才能做相應(yīng)的運(yùn)動動作。
大腦的知識保存在哪個腦區(qū)?如下圖所示,這是我們看一個詞時,大腦的激活狀態(tài)。大腦活動一開始直接從視覺皮層激活,但其實(shí)這個過程不僅僅包含視覺信號加工,大腦活動會迅速擴(kuò)散到全腦。
大腦是一個功能分區(qū)非常明顯的系統(tǒng),比如大腦的枕葉處理視覺信號,顳葉處理聽覺信號。那么知識存儲在哪里呢?綜合近二三十年的研究,答案是“EveryWhere”。
下圖是綜合09年之前幾百篇研究得到的元分析結(jié)果,每一個黃點(diǎn)都是激活點(diǎn)。這是人腦在理解詞匯、圖片的時候激活的地方,實(shí)際上幾乎全腦都會被激活,表面知識可能是非常廣泛的分布式存儲。
大腦的特定腦區(qū)保存了什么信息?知識的保存為什么需要這么多腦區(qū)的參與?認(rèn)知神經(jīng)科學(xué)多年來的主流觀點(diǎn)是,即使對一個非常簡單的概念,比如牛,也分成不同類型的知識存儲在相應(yīng)不同的大腦系統(tǒng)里。
比如聽到“?!边@個詞,我們會知道它的外形、動作、聲音、與人的關(guān)系,不同的信息以相應(yīng)的感覺經(jīng)驗(yàn)的模式編碼在系統(tǒng)中。
其中比如牛的外形,我們的視覺系統(tǒng)看過很多牛,那么相應(yīng)的激活模式就保存在大腦視覺皮層。下次問我牛的外形,過去的對視覺信號激活的痕跡就會被提取出來,包含它的外形信息。
所以,知識分布式存儲的原因是:第一,簡單概念中也包含不同類型的知識;第二,特定類型的知識存儲依賴于特定腦區(qū)本來的功能。
那么,這種感覺、運(yùn)動經(jīng)驗(yàn)的編碼是人類知識表征的全部嗎?人又如何存儲跟感覺、運(yùn)動信號并不完全對應(yīng)的各種抽象知識呢?比如剛才所說的牛,牛肉很有營養(yǎng)、牛會產(chǎn)牛奶等等,這種抽象知識怎么保存在大腦系統(tǒng)里?
我們用實(shí)驗(yàn)來回答這個問題。我們通過實(shí)驗(yàn)探究先天盲人和正常人在顏色知識表征上的區(qū)別。我們大腦中怎么存儲玫瑰花是紅色這個知識?現(xiàn)有的理論是以過去看玫瑰花的時候,相關(guān)的“紅色”神經(jīng)元的發(fā)放模式就會印記為“玫瑰”的知識,也就是說印記在視覺皮層里加工形狀的視覺編碼。
先天盲人出生時由于種種原因而沒有視覺,問他們玫瑰是什么顏色時,他們?nèi)匀徽_地回答玫瑰是紅色的。顏色是個很特別的特征,因?yàn)槭枪獠ㄩL度特征,除了視覺沒有其他感覺通道可以感知。先天的盲人既然沒有視覺經(jīng)驗(yàn),只能是靠語言輸入獲得這個知識。那么他們能獲得不同顏色之間的復(fù)雜關(guān)系嗎。
我們首先做了一系列的行為實(shí)驗(yàn)。比如,直接問他們不同的東西在顏色上是相似還是不相似、有多么相似。下圖是他們行為結(jié)果的矩陣圖,每一小格都是人們對兩個客觀顏色相似程度的回答,左邊是正??刂平M,右邊是先天盲人。可以看到先天盲人不僅僅可以回答顏色知識問題,而且回答的結(jié)果模式跟正常人是非常相似的,相關(guān)系數(shù)是0.88。
此外,對于過渡地帶的顏色,比如酒紅、玫瑰紅這些顏色,盲人和正常人的表現(xiàn)也有很大相似。
下圖是物體顏色的判斷空間的視覺呈現(xiàn),左邊是正常人控制組,右邊是盲人組,可以看到盲人判斷顏色之間的遠(yuǎn)近非常接近正常人。所以即使完全沒有感覺到視覺信號,只提供語言符號信號的話,人也可以建立起相似的知識空間。
通過解碼先天盲人和明眼被試人的腦活動對顏色信息編碼,發(fā)現(xiàn):第一,我們的確發(fā)現(xiàn)大腦當(dāng)中有一片視覺腦區(qū)負(fù)責(zé)正常人編碼顏色,但是盲人并沒有。該腦區(qū)包含只對顏色敏感的神經(jīng)元,正常人的活動模式是兩個東西顏色越像,神經(jīng)元的活動越像。盲人則沒有這個效應(yīng),因?yàn)樗麄儚膩頉]有顏色視覺經(jīng)驗(yàn)。
對于盲人而言,在另一個腦區(qū),顳葉前部上側(cè),神經(jīng)元的活動模式是兩個顏色越像,它們的活動越像。最重要的發(fā)現(xiàn)是,不光是盲人,正常人在這個腦區(qū)也有一模一樣的效應(yīng),也就是說正常人的顏色編碼其實(shí)涉及兩個腦區(qū),一個腦區(qū)只有正常人有,以顏色感知覺模式編碼顏色知識,另一個區(qū)域正常人和先天盲人都有,編碼以語言渠道獲得的知識。下圖是這種雙重編碼的知識系統(tǒng)的示意圖。我們把后面這個視覺信號相關(guān)的物體顏色知識一個區(qū)域叫“Sensory Derived knowledge representation”,前面這個個區(qū)域dorsal ATL叫“Language Derived knowledge representation”。
既然存儲有兩套不同的編碼系統(tǒng),在大腦不同的區(qū)域編碼不同的信號信息。大家可以猜測一下,先天盲人怎么表征“彩虹”和“雨”?盲人什么都看不見,但雨還是能感受到的,比如濕度、觸覺等等,但是看不見彩虹。我們這篇在Nature Communication 2018年發(fā)表的工作發(fā)現(xiàn),對于正常人來說,雨和彩虹非常相似。對于盲人來說,雨是一個具體詞,彩虹則是一個非常抽象的詞匯,更強(qiáng)存儲于完全進(jìn)行符號編碼的腦區(qū),而雨對于盲人而言,還跟正常人一樣,在感覺皮層很多區(qū)域都有加工。
我們還可以從另外分布式網(wǎng)絡(luò)結(jié)構(gòu)的角度問人腦知識表征的問題。再次看看下圖,人在理解詞匯和圖片的時候激活的腦區(qū)是分布式的。這個網(wǎng)絡(luò)有什么結(jié)構(gòu)?
我們可以讓在被試不做任何具體任務(wù)、躺著發(fā)呆,然后我們通過功能磁共振測量大腦活動。這時候的大腦活動其實(shí)也不是噪音,而是有很多內(nèi)在規(guī)律。我們把不同腦區(qū)之間的連接強(qiáng)度提取出來,構(gòu)成一個由點(diǎn)和邊組成的圖,就得到了大腦不同腦區(qū)之間的連接方式。
我們觀察這個圖內(nèi)在的結(jié)構(gòu),會發(fā)現(xiàn)有非常穩(wěn)定的三個模塊—子網(wǎng)絡(luò)。一個是綠色的腦區(qū)之間聯(lián)系特別緊密,一個是藍(lán)色的腦區(qū)之間聯(lián)系特別緊密,一個是紅色的腦區(qū)之間聯(lián)系特別緊密。我們根據(jù)以前對這些腦區(qū)的理解,發(fā)現(xiàn)綠色的腦區(qū)是語言進(jìn)行加工的地方。紅色的腦區(qū)是感覺、運(yùn)動的信號進(jìn)行加工及多感覺通道融合的地方。藍(lán)色的腦區(qū)是執(zhí)行控制的系統(tǒng),是對不同的信息進(jìn)行組合和切換的系統(tǒng)。
前面發(fā)現(xiàn)的提取顏色知識時的兩種編碼腦區(qū)正好就分布在綠色子網(wǎng)絡(luò)和紅色子網(wǎng)絡(luò)里。所以總體來說,這兩個系統(tǒng)在全腦水平上呈現(xiàn)出兩個不同類型的網(wǎng)絡(luò)模塊,分別進(jìn)行語言符號獲得知識的編碼和感覺獲得知識的編碼。
我們下面的問題就是,這兩個系統(tǒng)的編碼機(jī)制是什么。我針對每一個系統(tǒng),舉一個實(shí)驗(yàn)來介紹一下我們的思路。
感覺來源的知識:感覺信號還是計算內(nèi)容?
我們比較先天視覺剝奪對這種分布的影響。我們讓正常人和先天盲人聽很多不同類型的詞匯,看看他們視覺皮層激活的情況。在某一個視皮層區(qū)域,正常人在看沙發(fā)、辦公室等大場景的物體,激活就會特別強(qiáng)。在另一個區(qū)域,正常人在看小的工具,比如剛才說的剪子、錘子等,激活就會特別強(qiáng)。對這兩個區(qū)域,先天盲人的激活模式和正常人是完全一樣的。盲人從來沒有看見過場景和工具,只能用觸覺或者其他渠道獲取相關(guān)信息,其激活模式也和正常人一樣。
這是不是因?yàn)槠鋵?shí)光的信號本身并沒有那么重要,只要編碼相關(guān)形狀的信息,無論是光信號獲得的,還是觸覺信號獲得的,只要是相似的幾何形狀關(guān)系計算就可以?
此外,正常人大腦視覺皮層還有一個區(qū)域,對動物類的視覺刺激很敏感,比如人的面孔、小貓的形狀、小狗的形狀,但如果聽詞和先天盲人聽詞就沒有這種表現(xiàn)。也就是說,大腦的激活模式不僅僅依據(jù)對視覺信號的敏感度,還跟物體的類型有關(guān)系。
為什么會有的視覺皮層區(qū)域不受感覺信號通道的影響、有些則受?我們推測,這可能與人視覺加工的計算目的相關(guān)。生物大腦識別物體的機(jī)制不僅僅是為了貼標(biāo)簽。人貼標(biāo)簽是為了交流信息,但是在語言產(chǎn)生之前,人的大腦已經(jīng)進(jìn)化了很漫長的時間。在一個簡單的場景中,比如餐廳,我們看到的豐富視覺信息中不同元素需要會引導(dǎo)我們作出非常不同反應(yīng)??吹饺艘猩鐣苑磻?yīng);看到刀叉要有操作性反應(yīng);看到桌椅要有繞開或坐下的反應(yīng)。
視覺系統(tǒng)處理視覺信號,重要目的是正確的提取相關(guān)的反應(yīng),以適應(yīng)生存。
人的視覺識別或者視覺知識的存儲,會額外考慮到人對應(yīng)的運(yùn)動動作是什么。比如下圖中的藍(lán)框是人的視覺系統(tǒng),有不同的層級,這些層級組織的方式要匹配到合適的反應(yīng)上。
在視覺系統(tǒng)的組織或者視覺知識存儲的時候,跟反應(yīng)之間的對應(yīng)關(guān)系就有可能發(fā)生在不同的層面。所以,我們可以理解,對于沙發(fā)、錘子等物體,盲人和正常人的視覺組織方式是很相似的,這是因?yàn)樗麄冇锌赡茉谝曈X和運(yùn)動信號對應(yīng)上是比較透明的。盲人雖然沒有視覺,但是以同樣的方式使用這些物體。但是有可能對于蛇、蝴蝶、老虎等等這類信號,并不是從形狀上判斷如何反應(yīng),正常人和盲人接收這些信號的通道不一樣,所以正常人和盲人的感覺組織方式就不一樣。
按照特定感覺信息所編碼的知識體系,不僅僅是感覺信號本身,還要考慮到不同系統(tǒng)之間的對應(yīng)關(guān)系。所以,人腦的感覺知識編碼和僅對標(biāo)簽分類進(jìn)行訓(xùn)練的深度學(xué)習(xí)是非常不同的。
語言來源的知識和AI的知識圖譜
所以我們做了一個初步的嘗試,看它們之間是不是真的有對應(yīng)關(guān)系。我們同時做了兩個實(shí)驗(yàn),給定同樣的詞,一套提供給人的大腦系統(tǒng),一套提供給AI系統(tǒng),然后建構(gòu)相關(guān)性表征。下圖左邊矩陣是人在掃描儀里面看那些詞(比如贊成、多數(shù)、幻想)然后對每一個詞獲得一個大腦活動的模式。下圖右邊是我們用word2vec的方式建立的詞和詞之間的關(guān)系。
我們發(fā)現(xiàn)人腦幾個語言子網(wǎng)絡(luò)中和word2vec模式唯一有顯著相關(guān)的就是綠色的系統(tǒng),也就是人對語言符號加工比較敏感的系統(tǒng)。
大腦系統(tǒng)里可能有這樣的綠色系統(tǒng),它并不關(guān)心特定的感覺信號來源比如視覺、聽覺、運(yùn)動等等,但特別對于抽象符號類型的關(guān)系很敏感。第一個相關(guān)證據(jù)是,先天盲人完全沒有視覺經(jīng)驗(yàn),沒有任何其他感覺信號可以獲得顏色知識,其編碼區(qū)域就是在這個綠色系統(tǒng)。第二個相關(guān)證據(jù)是,綠色系統(tǒng)的活動模式跟word2vec相關(guān),而其它的區(qū)域跟word2vec都不相關(guān)。
總結(jié)
知識在在人的大腦里以這兩套模式存儲,組合在一起是人類知識表征。無論我們是看一個圖片,還是看一個詞,最終都是這兩套系統(tǒng)一起激活。需要額外強(qiáng)調(diào)的是感覺知識的表征,不僅僅和感覺信號本身有關(guān),還和運(yùn)動動作相關(guān)。我們推測可能感覺來源的知識系統(tǒng)對非文本編碼的“common sense knowledge”表征有額外重要的作用;而語言來源的知識系統(tǒng)也在視覺識別中有所影響。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。