喬姆斯基專訪：深度學習并沒有探尋世界本質

本文作者：蔣寶尚

2020-03-30 16:21

導語：人類的意義由我們自己決定

整理 | 蔣寶尚

喬姆斯基是一位開創(chuàng)性的人物，尤其是他那本《句法結構》被認為是20世紀理論語言學研究上最偉大的貢獻。

不光《句法結構》，還有《現代希伯萊語語素音位學》、《轉換分析》等一系列語言學著作傳達了對多種正規(guī)語言的洞見，也對計算機科學產生了重要的影響。

據說，喬姆斯基的語言模式也可從數學的角度來討論，這也引起了數學家，尤其是組合數學家的興趣。
近日，MIT的 AI 科學家 Lex Fridman 對喬姆斯基進行了專訪，在接受采訪的時候，從外星人談到了語言學，然后談到了深度學習，并探討了人類哲學。他認為深度學習當前都在學習大量的例子，沒有對本質進行探尋。另外，他還認為我們人類的意義由我們自己決定，人類什么樣的行動就人類存在的意義......

（雷鋒網） AI科技評論在不改變原意的情況下對專訪進行翻譯，請欣賞~

問：如果外星人造訪地球，你認為我們能找到與他們溝通的共同語言么？

答：是可以的。

大約在二三十年前，馬文·明斯基就和他的學生一起做了一個實驗：不加限制條件的運行最簡單的圖靈機，看看會發(fā)生什么？結果是大多數要么死機，要么進入無限循環(huán)，只有少數給出了類似算術的東西。所以馬文得出結論：如果高智商的外星人造訪地球，那么他們至少會做一些簡單的算術。實際上，馬文并不知道，自然語言的核心原理是在極限情況產生類似于算術的運算。所以，基于人類語言的核心屬性或者算術的核心屬性可以建立一種普遍共享的交流模式。

問：語言的結構是什么？語言在我們頭腦中的內部系統(tǒng)與它所表達的外部結構有何不同。

答：這是兩種不同的語言概念，兩個概念是同時存在的。你本身的一些屬性決定了你要說的是英文，而不是其他語言，所以有一個內在的系統(tǒng)，并且是局部性存在于你的大腦中決定了你的表達，和筆記本電腦的內部結構類似，這個系統(tǒng)也屬于大腦中的特定配置。

你也可以用語言外化腦海中的東西，但是我們對語言的使用，大多數數是內在的思考，而我們正在外化的那套東西是一個外部系統(tǒng)。

問：像視覺等基本的東西都是從人類頭腦中涌現的么？

答：在某種程度上，是由我們的基因決定。基因決定了我們擁有的是哺乳動物而不是昆蟲的視覺系統(tǒng)，基因決定了我們擁有人類的語言能力。

早在幾個世紀前的工業(yè)革命時期，就已經有人認為語言是人類認知本質的核心，是思想的源泉，是構建思想和表達思想的方式，并且語言具有基本的創(chuàng)造能力，是自由、獨立、無拘無束.......

確實，語言是我們人類非凡能力的基礎，但這些能力幫助人類取得是一些并不那么偉大，但同時又有那么點獨特的成就。

問：思考和推理的能力和語言有很深的聯系么？內在的語言系統(tǒng)本質上是內部推理的機制么？

答：語言肯定是推理的機制，但我們還有更多的科學天賦，沒人知道這個天賦到底是什么，但是它卻能確定什么是有意義的，什么是沒有意義的。我們本身在使用語言，但同時也獲得了超出范圍的理解。

問：您能嘗試定義什么是極限么？您認為有可能找到人類認知的極限么？

答：大多數科學家認為，人類智力原則上可以回答任何問題，但這是一個非常奇怪的信念。我們不是神，所以我們的能力存在范圍和界限。舉個例子，遺傳因素決定了你是一個豐富而復雜的有機體，也讓你擁有了哺乳動物的視覺系統(tǒng)以及手臂，這個遺傳因素規(guī)定了人類發(fā)展的方向，阻止其他方向的發(fā)展，例如，胚胎出來的動物沒有發(fā)育成昆蟲。因此在賦予豐富性和復雜性的同時也限制了所能獲得的東西。

假設我們的認知能力是世界的一部分，那么它們就應該具有相同的屬性，并形成了豐富和復雜結構的內在能力，同時規(guī)定了“方向”，所以認知有極限。

（雷鋒網）

舉例來說，在牛頓時代，從伽利略到牛頓，現在科學的發(fā)展都基于一個基本的假設：世界，宇宙整體是個機械體。這里的機械體類似于齒輪、杠杠等概念。

所以，他們認為這個世界只是一個更加復雜一些的機械變體。但是令牛頓苦惱的是，他證明了世界上沒有機器、沒有接觸就可以存在相互作用。

與牛頓同時代的人，如萊布尼茲和惠更斯認為這回到了“神秘主義”，牛頓對此表示同意。事實上牛頓和許多其他科學家一樣，用他的余生試圖以某種方式繞過它。所以，理論不會產生一個可理解的世界，除非你可以在機器上復制它，而它又證明了沒有機器。

譯者注：牛頓、惠更斯等人在內都認為超距作用是不可能的。

經過漫長的斗爭，科學家們花了很長時間接受這個常識，但同時這也意味著他們放棄了對一個可理解的世界的探索。大衛(wèi)·休謨曾經說過，牛頓通過展示他留給我們的機械哲學、機械科學的不完美來揭開自然界的許多秘密，仍然存在著永遠存在的奧秘，科學只是改變了目標。

科學只是拋棄了謎團，如果不能解決，它會把迷團放在一邊。對于我們而言，我們只是找到了通俗易懂的理論，牛頓的理論是可以理解的。

這一切都表明了人類認知的局限性，我們尋找可理解的世界的目標，從伽利略到牛頓，都是對事物如何運作的本能構想，都是機械哲學。

這和我們想要一個有規(guī)則的幾何圖形的世界一樣，正如笛卡爾指出的那樣，即使世界上沒有三角形的事物，我們也會有三角形的觀念。其實在我們心中，我們只是根據完美的幾何物體強加了一種世界的概念。

問：這樣就給我們暗示了認知的潛在限制么？

答：個人認為確實如此，但這是一個非常有爭議的觀點，如果你詢問科學家，他們會說不可能，我們什么都可以理解。

問：已經有公司在做腦機接口，他們想著擴大大腦獲取信息的能力，您認為這會擴展我們的認知能力、語言能力、推理能力么？

答：可以認為某種意義上的擴展，此類想法在幾千年前就已經存在了?？梢酝ㄟ^讀一本書擴展認知能力，所以腦機接口也是擴展。沒有什么能夠超出我們天生的認知能力，就像不能把哺乳動物的視覺系統(tǒng)變成昆蟲系統(tǒng)一樣。

問：也許你不能直接去想，但是你可以了解信息？

答：沒有此類實驗，你可以描繪蜜蜂看到的東西，并用一種形式呈現出來，這樣似乎我們能夠利用這個東西了。事實上，蜜蜂科學家已經這么做了。

問：您認為我們可以描繪的東西其實比蜜蜂大，然后發(fā)現一些東西，讓我們能夠理解量子世界，量子力學么？

答：你可以，麻省理工的學生能夠學習和理解量子力學。

問：其實他們也不是真的理解。

答：不是物理意義上的，這可能另一個理解有限的領域，其實我們理解這些理論，但它描述的世界沒有任何意義。例如薛定諤的貓，你可以理解這個理論，但正如薛定諤指出那樣，這并不是一個可以理解的世界。愛因斯坦是一個經典的現實主義者，所以他總是懷疑量子理論。

問：你在語言學或認知科學中看到的語言或思想中最迷人的方面是什么？

答：我認為語言最深層的屬性或者最令人費解的屬性是一種結構性依賴的東西?，F在我們對它很了解，但之前卻令人費解了很長一段時間。

舉例來說，這家伙修車小心翼翼地打包工具（the guy who fixed the car carefully packed his tools），這句話其實是令人模棱兩可的，它所表達的意思可以是小心翼翼的修理汽車，也可以是小心的打包他的工具。副詞與哪個動詞相關的（是離最近的還是最遠的）是一個非常令人費解的事情。

問：你認為深度學習，或者基于神經網絡的機器學習的極限是什么？

答：要給出一個真實的答案，必須要了解發(fā)生事情的確切過程，如果這些過程是不透明的，那么很難清晰的證明可以做什么，不可以做什么。

拋開細節(jié)不談，深度學習現在正在做的是收集大量的例子，并試圖找到一些模式。這在某些方面可能會很有趣，但我還是想問：AI是工學還是理學？工學的意義是試圖理解關于世界元素的東西，所以他可能需要一個谷歌翻譯器。

它有用么？非常有用，所以從工學的角度來說，谷歌翻譯器非常有用。但是它有沒有告訴我們關于人類語言的事情？顯然沒有。所以，從一開始它就已經遠離了科學。

谷歌翻譯器是如何工作的呢？它需要一個巨大的文本，例如華爾街日報語料庫，然后其想達到的目標是離語料庫的正確描述越來越近。實際上語料庫中每句話都是一個實驗，你所說的每一句話都是一個實驗，都想弄明白話語是否符合語法？

所以，我們可以問問自己有沒有什么科學可以采取隨機的實驗，即沒有目的的進行實驗？比如，一名化學博士生，他在寫一篇論文，論文沒有明確的目的，只是將很多東西隨意的混合，然后抱著“也許”的心態(tài)，看是否能發(fā)現一些東西。

顯然，這名博士生會趕出實驗室。

科學都是試圖找到批判性的實驗，這些實驗可以回答一些理論問題。

谷歌翻譯器一開始就離科學很遠，而且一直如此。針對翻譯器，人們只是文谷歌翻譯器在語料上做的有多好？然后一直忽略了另一個從未提及的問題：在違反語言規(guī)則的事情上，它做的有多好？

以前面提到的結構依賴為例子，假設有一種語言，使用線性鄰近作為解釋模型，深度學習也能很容易利用這一點。有了這個模型就意味著學習語言是一件簡單的事情，但從科學的角度來看，這是一個失敗，我們其實并沒有發(fā)現本質。

問：神經網絡看起來像是一種近似器，在辯論中回蕩著正確的行為主義。但我認為，當數據集很大時，實際上有一些根本不同的東西。您認為我們可以用神經網絡來學習，表示復雜的語言結構么？它會以某種方式幫助我們理解科學么？

答：有可能，可能會發(fā)現沒有注意到的模式，比如，有一種語言，使用者都已經消失，只有一些記錄。我們能做的是從記錄中發(fā)現一些什么，如果有說這種語言的人還存活，那么這個人不比什么樣的實驗都管用，但是如果沒有人存活，那么就只能用一些數據做實驗，然后從中學到一些東西。

問：下面討論一些哲學問題。您說過，社會上的邪惡源于制度，而不是我們的本性，大多數人都是善良的，他們有善良的意圖，但也有故意作惡的能力。這取決于他們的成長，取決于他們的環(huán)境么？

答：或許是源于我們的天性，實際上我們做的任何事情都源于我們的本性，制度也是人性表達的一種方式。

但據我們所知，人性可以產生許多不同的制度，但已經發(fā)展起來的那些結構與歷史偶然性有關。制度對于我們的本性必不可少，像市場制度這樣的東西只是我們本性的一部分，我們還有其他的一些制度。

古典自由主義的認為，只有自由才是我們的本能，是我們本性的核心，但是他的反面也是我們的本性，人性可以容納這兩種本質。

問：有沒有一些記憶給你帶來了快樂，然后你想再次體驗？

答：當然。墜入愛河，有一些孩子。

問：您在語言學，認知學方面給世界做出了突出的貢獻，重溫你當時第一次想到那些概念的時候，會讓你感到興奮么？

答：興奮。當你發(fā)現一些東西的時候，例如對結構依賴性的觀察和解釋，都是令人興奮的。

在20世紀50年代，那時候語言被認為是一種外部的現象，一種思想之外的東西。很明顯，這似乎是不合理的，就像我前面說的，你身上的東西決定了你說的是英文，而不是斯瓦希里語。

但不是真正的發(fā)現，而是一種觀察，這有點像17世紀，那時候現代科學剛剛開始，科學家們愿意對看似顯而易見的事情感到困惑。

例如，大家都認為一個沉重的鉛球比一個輕的下降的更快，但是伽利略對此表示懷疑，并進行了實驗。

在50年代，語言學也是這樣的，愿意對一些從某種角度看似顯而易見的現象感到迷惑不解。例如，結構語言學在當時幾乎是官方的學說，把語言事實當作孤立的單位加以考察。事實上，生物學家對有機體也有類似的觀點，當你觀察每個人的時候是如此的不同，但你又能代表任何人?，F在，我們都知道，上述與事實相距甚遠：它們對于生物體，什么是語言有非常狹隘的限制。

對常識懷疑，這就是“詢問”的本質。問：對人類來說，最特殊的事情就是死亡率，您是否在考慮死亡率的價值？

答：我自己對于死亡率不怎么在意，但我擔心如果我的意識消失了，整個宇宙都會消失，那就非?？膳铝?。

問：你找到這個問題的答案了么？

答：沒有人能夠找到答案，但我不再被它所困擾。

問：在問一個荒謬的問題，您認為我們存在，我們在地球上生活有什么意義。

答：人類通過自己的活動已經回答了這個問題，沒有普遍的答案。需要我們自己來確定有什么意義。

（雷鋒網）

雷峰網原創(chuàng)文章，未經授權禁止轉載。詳情見轉載須知。