0
雷鋒網(wǎng) AI 科技評(píng)論按:「追溯大師」是雷鋒網(wǎng) AI 科技評(píng)論的新設(shè)欄目,專門介紹那些在歷史上對(duì)人工智能發(fā)展形成重大影響的學(xué)術(shù)大師們。作為欄目的首位主角,艾弗拉姆·諾姆·喬姆斯基博士(Avram Noam Chomsky)在語(yǔ)言學(xué)方面的成就也許你略有耳聞,而他與人工智能的聯(lián)系,你又了解多少呢?
艾弗拉姆·諾姆·喬姆斯基博士(Avram Noam Chomsky,1928 年 12 月 7 日—),麻省理工學(xué)院語(yǔ)言學(xué)的榮譽(yù)退休教授,發(fā)表的《生成語(yǔ)法》被認(rèn)為是 20 世紀(jì)理論語(yǔ)言學(xué)研究上最偉大的貢獻(xiàn)。
喬姆斯基從小便聰穎過(guò)人,16 歲入讀賓夕法尼亞大學(xué),在俄裔語(yǔ)言學(xué)家 Zellig Harris 的影響下攻讀語(yǔ)言學(xué),本碩期間深入研究 「現(xiàn)代希伯萊語(yǔ)的詞素音位學(xué)」;博士期間,他以年輕學(xué)者的身份在哈佛大學(xué)繼續(xù)深耕語(yǔ)言學(xué)研究,最終完成后來(lái)使他收獲巨大聲譽(yù)的學(xué)術(shù)成就雛形——「轉(zhuǎn)換生成語(yǔ)法」。
該學(xué)說(shuō)的集大成之作,是在 1957 年出版、使喬姆斯基收獲巨大聲譽(yù)的《句法結(jié)構(gòu)》。喬姆斯基在《句法結(jié)構(gòu)》中論證了語(yǔ)法的生成能力,他認(rèn)為我們應(yīng)該把語(yǔ)法看成是能生成無(wú)限句子的有限規(guī)則系統(tǒng):
短語(yǔ)結(jié)構(gòu)規(guī)則有三種:合并、遞歸、推導(dǎo)式,其基本形式是 x→y?!x作"改寫",這個(gè)公式就是將 x 改寫成 y。
短語(yǔ)結(jié)構(gòu)規(guī)則生成的是"核心語(yǔ)符列",不經(jīng)過(guò)轉(zhuǎn)換直接由這種語(yǔ)符列得出的基本句型叫"核心句"。
轉(zhuǎn)換規(guī)則包括:移位、刪略、添加。
如今,轉(zhuǎn)換生成語(yǔ)法已成為西方當(dāng)代語(yǔ)言學(xué)理論中的基礎(chǔ)性內(nèi)容。
在機(jī)器翻譯的早期研究中,美國(guó)的 METAL*(MEchanicalTranslationandAnalysisofLan-guage) 就充分利用了喬姆斯基的轉(zhuǎn)換生成語(yǔ)法和短語(yǔ)結(jié)構(gòu)理論。
*注:1978 年,美國(guó)得克薩斯大學(xué)與聯(lián)邦德國(guó)西門子公司開(kāi)始合作研制德英機(jī)器翻譯系統(tǒng) METAL 系統(tǒng)。它是高度模塊化的結(jié)構(gòu),可并入語(yǔ)義分析、情報(bào)檢索和專家系統(tǒng)模塊。
該系統(tǒng)采用短語(yǔ)結(jié)構(gòu)文法來(lái)構(gòu)造語(yǔ)言規(guī)則系統(tǒng),通過(guò)轉(zhuǎn)換生成目標(biāo)語(yǔ)言,主要基于爾科夫過(guò)程方法實(shí)現(xiàn)系統(tǒng)運(yùn)行。根據(jù)資料記載,METAL 系統(tǒng)的翻譯速度為 5.7 秒/詞, 約為人工翻譯的 6 倍 ( 1984 年時(shí)的試驗(yàn)結(jié)果),由此成功在多個(gè)專業(yè)領(lǐng)域上被利用。
為自然語(yǔ)言系統(tǒng)打下基礎(chǔ)
從宏觀層面來(lái)說(shuō),轉(zhuǎn)換生成語(yǔ)法反映了喬姆斯基對(duì)于理性主義傳統(tǒng)的堅(jiān)守, 這種理性主義在語(yǔ)言學(xué)中主要體現(xiàn)在三個(gè)方面:
第一, 承認(rèn)存在一種普遍的語(yǔ)言, 與此對(duì)應(yīng), 還應(yīng)存在一種對(duì)各種語(yǔ)言都適用的「普遍語(yǔ)法」。喬姆斯基在語(yǔ)言學(xué)研究中一直不斷地尋求這種普遍語(yǔ)法, 并為它提供了具體的語(yǔ)言學(xué)描述, 即「管轄與約束理論」。
第二, 承認(rèn)存在一種先天的語(yǔ)言學(xué)習(xí)機(jī)制 (LAD)。喬姆斯基認(rèn)為, 語(yǔ)言學(xué)習(xí)是一種演繹過(guò)程:兒童從先天的 LAD 中推導(dǎo)出母語(yǔ)的具體結(jié)構(gòu), 并在語(yǔ)言環(huán)境中驗(yàn)證這些假設(shè);那些證明與他們聽(tīng)到的語(yǔ)言相符合的假設(shè)被選作他們母語(yǔ)的語(yǔ)法。
第三, 堅(jiān)持理性主義的方法論原則, 認(rèn)為語(yǔ)言學(xué)具有自然科學(xué)的某些特征, 即通過(guò)一些普遍原則, 可以用演繹法推導(dǎo)出具體的語(yǔ)法。
早期麻省理工學(xué)院人工智能實(shí)驗(yàn)室成員 Robert C. Berwick 曾高度評(píng)價(jià)喬姆斯基語(yǔ)言學(xué)革命對(duì)人工智能研究的積極意義,尤其是「管轄與約束理論」(GB 理論),他認(rèn)為該理論讓「觸類旁通」的語(yǔ)言分析系統(tǒng)成為可能。
GB 理論是喬姆斯基八十年代初從事普遍語(yǔ)法研究的產(chǎn)物, 它的核心由一系列互相聯(lián)系、互相制約的基本原則組成。這些原則具有普遍性, 適用于每種語(yǔ)言, 同時(shí)又具有靈活性, 允許不同的語(yǔ)言在一定范圍內(nèi)有些差異。Berwick 認(rèn)為 GB 理論特別適合用來(lái)設(shè)計(jì)未來(lái)的人工智能自然語(yǔ)言系統(tǒng),其優(yōu)越性主要體現(xiàn)在三個(gè)方面:
GB 理論的系數(shù)化以及依賴約束的做法使它成為遵循語(yǔ)言學(xué)理論、探索匹配處理的較好的工程系統(tǒng)。
它使我們得心應(yīng)手地處理不合規(guī)范的錯(cuò)誤輸入 (ill-formed input)。
GB 理論通過(guò)很少的參數(shù)表征所有的語(yǔ)言, 當(dāng)它指出句法翻譯的方式后, 我們就能用統(tǒng)一方式來(lái)分析各種各樣的不同的語(yǔ)言
在 GB 理論出現(xiàn)以前, 許多語(yǔ)言學(xué)家利用大量的語(yǔ)法規(guī)則分析紛紜復(fù)雜的語(yǔ)言現(xiàn)象。GB 理論摒棄了這一傳統(tǒng)做法, 改為依靠統(tǒng)一的、參數(shù)化的約束系統(tǒng)的交互作用來(lái)解釋復(fù)雜的句子。
換句話說(shuō),如果我們有 10 種獨(dú)立的約束, 每項(xiàng)約束可以取兩個(gè)值 (利用該項(xiàng)約束或不利用), 我們?cè)瓌t上僅以 10 項(xiàng)約束就能描述 210 個(gè)句子, 這比用 1000 多種語(yǔ)法規(guī)則解釋這些句子要方便得多。
對(duì)編程語(yǔ)言的影響
在喬姆斯基的語(yǔ)言學(xué)理論中,喬姆斯基定義了四型文法,并數(shù)學(xué)化地表述了每一型的語(yǔ)言表達(dá)能力,該理論后來(lái)深刻影響了編譯領(lǐng)域中語(yǔ)法前端的設(shè)計(jì)。
約翰?巴克斯將喬姆斯基的語(yǔ)言學(xué)理論引入到計(jì)算機(jī)編譯技術(shù)領(lǐng)域,據(jù)此書(shū)寫出了 ALGOL 58 的語(yǔ)法,并提出可實(shí)現(xiàn)的計(jì)算機(jī)語(yǔ)法分析算法。巴克斯的工作在計(jì)算機(jī)編譯系統(tǒng)的發(fā)展史上是里程碑意義的——它第一次允許編程語(yǔ)言中出現(xiàn)表達(dá)式語(yǔ)法和結(jié)構(gòu)化控制流。
簡(jiǎn)單地說(shuō),喬姆斯基的理論回答了這樣一個(gè)問(wèn)題,即具備何種特征的語(yǔ)言可以用于書(shū)寫程序,而巴克斯的工作則告訴我們,計(jì)算機(jī)程序確實(shí)能夠用人類可以理解的方式寫出并同時(shí)讓人類和計(jì)算機(jī)理解。
喬姆斯基的文法理論在計(jì)算機(jī)領(lǐng)域中真正被使用的共有兩者:三型文法和二型文法。前者的特征是語(yǔ)法中不存在遞歸下降結(jié)構(gòu),它的代表是基本正則表達(dá)式(擴(kuò)展后的正則表達(dá)式情況略有不同);而二型文法即上下文無(wú)關(guān)文法,特征是任何語(yǔ)言元素在任何上下文中的含義始終保持一致。
多數(shù)如今的程序設(shè)計(jì)語(yǔ)言語(yǔ)法都以此為基礎(chǔ),換句話說(shuō),以上兩者構(gòu)成了如今所有實(shí)用計(jì)算機(jī)程序設(shè)計(jì)語(yǔ)言的分析器理論基礎(chǔ),也有成熟的數(shù)據(jù)結(jié)構(gòu)和算法支持。
事實(shí)上,喬姆斯基在其學(xué)術(shù)生涯中并未真正涉獵過(guò)計(jì)算機(jī)和 AI 領(lǐng)域,甚至還對(duì) AI 領(lǐng)域的某些做法頗有微詞(比如曾指出 N 元文法的缺陷),然而并不阻礙其高屋建瓴的思想對(duì)這兩個(gè)領(lǐng)域造成不可估量的影響。在機(jī)器學(xué)習(xí)大行其道的當(dāng)下,其偏向理性主義的體系思考,依然對(duì)我們有不少借鑒意義,只不過(guò)就需要我們?nèi)プ鲞M(jìn)一步的挖掘。
參考文獻(xiàn):
1)《喬姆斯基與人工智能》. 王巍 寇世琪
https://zhuanlan.zhihu.com/p/24018768
2)NLP 主流反思的扛鼎之作: 立委譯《Church:鐘擺擺得太遠(yuǎn)》
https://blog.csdn.net/memray/article/details/50605879
3)知乎「喬姆斯基的語(yǔ)言學(xué)理論對(duì)編程語(yǔ)言的影響有多大?」提問(wèn)下的回答
https://www.zhihu.com/question/21843639/answer/19524698
雷鋒網(wǎng) AI 科技評(píng)論
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。