2
【編者按】在人工智能領(lǐng)域,聯(lián)接主義和符號主義的思想和方法在各自的領(lǐng)域都取得了巨大成功。但是,機械學習的方法能否抽象出因果規(guī)律,機械定理證明方法能否發(fā)展出真正的概念定理體系,這些都還是極具爭議的問題。
人工智能領(lǐng)域的主要思想流派大致可以分為符號主義和聯(lián)接主義。兩種方法具有完全不同的哲學觀點、計算方法和適用范圍。兩者都有著令人嘆為觀止的壯麗恢弘,但也都有著自身難以打破的魔咒。
聯(lián)接主義與深度學習
聯(lián)接主義(Connectionism)又稱為仿生學派(Bionicsism)或生理學派(Physiologism),其主要原理為神經(jīng)網(wǎng)絡(luò)及神經(jīng)網(wǎng)絡(luò)間的連接機制與學習算法(Artifical Neural Nework),實質(zhì)上是來自于人類大腦神經(jīng)網(wǎng)絡(luò)的計算機模擬:大腦的每個神經(jīng)元細胞具有樹突、軸突和細胞體。樹突可以接收信號,軸突用于輸出信號,不同細胞的樹突和軸突之間是神經(jīng)突觸,不同的突觸具有不同的權(quán)重。樹突傳入的信號強度與相應(yīng)的突觸權(quán)重相乘,經(jīng)由細胞體設(shè)置的非線性閾值檢驗,觸發(fā)軸突的興奮或抑制。數(shù)目龐大的神經(jīng)元連接成結(jié)構(gòu)復(fù)雜的網(wǎng)絡(luò),從而實現(xiàn)靈活多樣的功能。
在并不久遠的歷史中,神經(jīng)網(wǎng)絡(luò)幾經(jīng)沉浮,滄海桑田。在學術(shù)界和工程界,數(shù)度一哄而上,旋即一哄而散。近些年來,依隨計算能力的突飛猛進,特別是圖形處理單元(GPU)的大規(guī)模普及,使神經(jīng)網(wǎng)絡(luò)再度以深度學習(Deep Learning)的嶄新姿態(tài)登場。
深度學習在圖像處理、模式識別等領(lǐng)域如狂飆突進, 一掃幾乎所有經(jīng)典算法,勢不可擋。一夜之間,自然語音的處理和理解、人臉檢測和識別都變成了現(xiàn)實。同時,深度學習方法深刻地轉(zhuǎn)變了學術(shù)研究的范式。以前學者們所采用的觀察現(xiàn)象、提煉規(guī)律、數(shù)學建模、模擬解析、實驗檢驗、修正模型的研究套路被徹底顛覆,被數(shù)據(jù)科學的方法所取代:收集數(shù)據(jù),訓練網(wǎng)絡(luò),實驗檢驗,加強訓練。
深度學習方法具有許多其它方法無可比擬的優(yōu)點:
首先,深度學習的算法具有普適性。
同樣的訓練方法可以用于不同的具體應(yīng)用,例如人臉檢測和語音識別都可以應(yīng)用同樣的訓練方法,區(qū)別只在于訓練數(shù)據(jù)的不同。這一點具有神經(jīng)生物學的依據(jù):MIT的科學家將幼年猴子的視神經(jīng)和聽神經(jīng)剪斷,互換后再連接,猴子的視覺和聽覺都得以正常發(fā)育。相對于傳統(tǒng)方法,對于拓撲問題和幾何問題,我們需要應(yīng)用完全不同的理論和計算工具。
其次,機器學習的算法本身相對簡單,算法所涉及的數(shù)學理論相對初等,實現(xiàn)復(fù)制的難度相對較低。
目前流行的觀點認為,對于機器學習而言,算法的優(yōu)越性不再重要,真正決定性的要素是數(shù)據(jù)的龐大和完全。更為深刻之處則在于:深度學習能夠自動形成不同層次的概念。深度學習網(wǎng)絡(luò)一如人類的視覺中樞是具有層次的,局部的具體特征,被底層網(wǎng)絡(luò)所總結(jié);全局的抽象特征,被高層網(wǎng)絡(luò)所提取。并且,這些特征被網(wǎng)絡(luò)以權(quán)重的形式所儲存。傳統(tǒng)方法所無法明晰表述的概念,例如不同畫家的藝術(shù)風格、音樂特色等只可意會無法言傳的感覺在現(xiàn)在可以被精確量化,并以數(shù)字的形式被識別、處理、轉(zhuǎn)換和融合。人工智能的本質(zhì)特征之一就是系統(tǒng)能夠自發(fā)地形成概念。當然,深度學習方法更是具有無可比擬的實用價值,人臉識別、語音識別方面的突破也為工業(yè)商業(yè)的發(fā)展提供了難以想象的廣闊空間。
但與此同時,機器學習的方法也具有方法論上的巨大缺陷:
首先,深度學習的目的是學習一個函數(shù),或者概率分布,本質(zhì)上是唯像的解釋,換言之,這種方法揭示了“相關(guān)性”而非“因果性”。歷史上,人類積累科學知識,在初期總是得到“經(jīng)驗公式”,但是最終還是在尋求更為深刻的本質(zhì)的理解,例如從煉丹術(shù)到化學、量子力學的發(fā)展歷程。
其次,目前機器學習算法的空間和時間代價過大。比如我們考察人臉表情識別問題,人臉上只有幾十條肌肉,加上光源變化、視角變化等等因素,所有人臉帶表情的照片所形成的空間(流形)不會超過上百維。但是,所訓練的神經(jīng)網(wǎng)絡(luò)往往具有數(shù)十萬維。訓練數(shù)據(jù)量巨大,訓練周期過長。
再次,目前深度學習方法的理論相對比較薄弱,算法經(jīng)驗性較強。參數(shù)的調(diào)節(jié)方法目前依然是一門“藝術(shù)”,而非“工藝”,算法最終收斂到局部最優(yōu)。如果將機器學習算法視作蒙特卡洛方法(也稱統(tǒng)計模擬方法,是指使用隨機數(shù)或偽隨機數(shù)來解決計算問題,與之對應(yīng)的是確定性算法),那么理論上它的收斂速度是低于傳統(tǒng)方法的。深度學習方法在視覺領(lǐng)域無可爭議地取得了令人矚目的成功,但是動物的視覺可能比人類更為敏銳和靈活,人類智能最為獨特之處在于數(shù)學推理,特別是機械定理證明,對于這一點機器學習方法是無能為力的。為此,我們必須借助于符號主義方法。
符號主義與機械定理證明
符號主義(Symbolicism),又稱為邏輯主義(Logicism)、心理學派(Psychologism)或計算機學派(Computerism),其原理主要為物理符號系統(tǒng)(即符號操作系統(tǒng))假設(shè)和有限合理性原理。
符號主義方法模仿數(shù)理科學的發(fā)展方式,將知識系統(tǒng)地整理成公理體系。這種方法將數(shù)學嚴格公理化,從公理出發(fā),由邏輯推理得到引理,定理,推論。廣義而言,將數(shù)學發(fā)現(xiàn)整理成一系列的邏輯代數(shù)運算,將直覺洞察替代為機械運算。在初等幾何領(lǐng)域,機械定理證明方法取得了巨大的成功。例如利用吳文俊方法和Groebner基方法推演出幾乎所有經(jīng)典歐式幾何的定理:將輸入圖形的關(guān)鍵點建立坐標,各種已知的幾何條件表示成代數(shù)方程(一般表示成關(guān)鍵點坐標的多項式方程),同樣將結(jié)論的幾何條件轉(zhuǎn)化為多項式方程。那么證明定理即等價于驗證結(jié)論多項式在由條件多項式生成的理想之中。
和機械學習方法類似,這種機械定理證明方法將千奇百怪的幾何定理證明方法都轉(zhuǎn)化為一種方法,因而具有極大的普適性;同時,機械定理證明可以保證推導(dǎo)過程中出現(xiàn)錯誤的概率極小。人們一度相信,在計算機的巨大幫助下,許多深刻的定理證明將會輕易獲得。
但是,這種機械定理證明的方法也存在巨大的爭議:
首先,公理化方法具有本質(zhì)的局限性。
哥德爾的工作證明了對于任何一個公理體系,總是存在一個客觀真理,不被此公理體系所包含。這在某種意義上意味著人類探索自然真理的過程是無限的。對于任何一個包含算術(shù)公理體系的公理體系,總存在一個命題,它無論對錯都和公理體系不發(fā)生矛盾。比如我們知道有理數(shù)有無窮多個,實數(shù)有無窮多個;有理數(shù)可以和實數(shù)的一個子集建立雙射,實數(shù)無法和有理數(shù)的子集建立雙射,從這個意義上而言,有理數(shù)嚴格少于實數(shù)。那么,是否存在一個無窮數(shù)集,它的個數(shù)嚴格介于有理數(shù)和實數(shù)之間(在如上的意義下)。這個問題的答案無論是有或無,對于現(xiàn)代數(shù)學公理體系都不發(fā)生矛盾。
其次,機械定理證明方法在根本上是“證明”了定理,還是“檢驗”了定理?
在數(shù)學歷史上,對于一個著名猜想的證明和解答,答案本身并不重要,在尋找證明的過程中所凝練的概念、提出的方法、發(fā)展的理論才是真正目的所在。機械定理證明驗證了命題的真?zhèn)危菬o法明確地提出新的概念和方法,實質(zhì)上背離了數(shù)學的真正目的。比如地圖四色定理證明,數(shù)學家將平面圖的構(gòu)型分成1936種,然后用計算機逐一驗證,在這一過程中,沒有新穎概念的提出。換言之,用機械蠻力替代了幾何直覺。
再次,機械定理證明的前提是問題的代數(shù)化。
初等幾何問題必須經(jīng)過坐標化,條件和結(jié)論的代數(shù)化之后,才能運用理想理論來機械證明。但是,幾何問題代數(shù)化本身可能就是最為“智能”的步驟。比如大量黎曼幾何和低維拓撲中的命題無法被直接代數(shù)化。另外一點則在于算法的復(fù)雜度,希爾伯特定理是說多元多項式環(huán)中的理想都是有限生成的,這一定理保證了 Grober 基方法在有限步驟內(nèi)停止,但是這一算法在計算過程中所消耗的空間有可能是超指數(shù)膨脹,因此在現(xiàn)實中,對于復(fù)雜的定理,這一算法無法勝任。
另外一點,機械定理證明給出的結(jié)果人類經(jīng)常無法理解,從中無法直接得到啟迪。
迄今為止,機械定理證明方法尚未發(fā)現(xiàn)具有重大意義的人類未曾知道的定理。
“人何以為人”才是問題的本質(zhì)
在實際應(yīng)用中,聯(lián)接主義和符號主義的方法是相互融合、取長補短的。
比如,棋類比賽本質(zhì)上是一個公理系統(tǒng),屬于符號計算的范疇,傳統(tǒng)上可以用邏輯推理加上空間搜索技術(shù)加以解決。由于搜索空間的指數(shù)膨脹,如何剪枝(簡單的說就是把不合適的情況直接去掉)成為關(guān)鍵。剪枝依賴于記憶并識別一些有意義的模式,這些模式可以用深度學習的方法來獲?。壳斑@一研究已經(jīng)由帝國理工學院的馬修-萊團隊實現(xiàn),并獲得成功)。而對于空間復(fù)雜度更高的圍棋,人工智能依然無法戰(zhàn)勝人類。我們相信,這一局面也很快會被打破。
人工智能的方法日新月異,日益侵占著人類智能的領(lǐng)地。聯(lián)接主義和符號主義的思想和方法相輔相成,各有千秋,它們在各自的領(lǐng)域都無可爭議地取得了巨大成功。但是,機械學習的方法能否抽象出因果規(guī)律,機械定理證明方法能否發(fā)展出真正的概念定理體系,這些都是具有激烈爭議的問題。聯(lián)接主義和符號主義所面臨的魔咒都指向同一個根本問題:機械蠻力和人類智能的本質(zhì)差異究竟在哪里,人之所以為人的本質(zhì)在哪里。
【作者顧險峰,哈佛大學計算機科學博士,現(xiàn)任紐約州立大學石溪分校計算機系終身教授、清華大學丘成桐數(shù)學科學中心客座教授。顧險峰博士與丘成桐先生,以及國際著名數(shù)學家、計算機科學家共同創(chuàng)立了一門橫跨數(shù)學和計算機科學的交叉學科:計算共形幾何,應(yīng)用現(xiàn)代幾何理論于工程和醫(yī)療領(lǐng)域,特別是曲面參數(shù)化,曲面注冊,人臉識別,形狀分析,醫(yī)學圖像等等。顧險峰為此獲得了2013年世界華人數(shù)學家大會最高獎-晨興應(yīng)用數(shù)學金獎?!?/strong>
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。