丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
人工智能學術 正文
發(fā)私信給黃善清
發(fā)送

0

「無心插柳柳成蔭」的喬姆斯基 | 追溯 AI 大師系列

本文作者: 黃善清 2019-05-05 14:16
導語:他與人工智能的聯(lián)系,你又了解多少呢?

雷鋒網 AI 科技評論按:「追溯大師」是雷鋒網 AI 科技評論的新設欄目,專門介紹那些在歷史上對人工智能發(fā)展形成重大影響的學術大師們。作為欄目的首位主角,艾弗拉姆·諾姆·喬姆斯基博士(Avram Noam Chomsky)在語言學方面的成就也許你略有耳聞,而他與人工智能的聯(lián)系,你又了解多少呢?

「無心插柳柳成蔭」的喬姆斯基 | 追溯 AI 大師系列

艾弗拉姆·諾姆·喬姆斯基博士(Avram Noam Chomsky,1928 年 12 月 7 日—),麻省理工學院語言學的榮譽退休教授,發(fā)表的《生成語法》被認為是 20 世紀理論語言學研究上最偉大的貢獻。

喬姆斯基從小便聰穎過人,16 歲入讀賓夕法尼亞大學,在俄裔語言學家 Zellig Harris 的影響下攻讀語言學,本碩期間深入研究 「現(xiàn)代希伯萊語的詞素音位學」;博士期間,他以年輕學者的身份在哈佛大學繼續(xù)深耕語言學研究,最終完成后來使他收獲巨大聲譽的學術成就雛形——「轉換生成語法」。

該學說的集大成之作,是在 1957 年出版、使喬姆斯基收獲巨大聲譽的《句法結構》。喬姆斯基在《句法結構》中論證了語法的生成能力,他認為我們應該把語法看成是能生成無限句子的有限規(guī)則系統(tǒng):

  • 短語結構規(guī)則有三種:合并、遞歸、推導式,其基本形式是 x→y。→讀作"改寫",這個公式就是將 x 改寫成 y。

  • 短語結構規(guī)則生成的是"核心語符列",不經過轉換直接由這種語符列得出的基本句型叫"核心句"。

  • 轉換規(guī)則包括:移位、刪略、添加。

如今,轉換生成語法已成為西方當代語言學理論中的基礎性內容。

在機器翻譯的早期研究中,美國的 METAL*(MEchanicalTranslationandAnalysisofLan-guage) 就充分利用了喬姆斯基的轉換生成語法和短語結構理論。

*注:1978 年,美國得克薩斯大學與聯(lián)邦德國西門子公司開始合作研制德英機器翻譯系統(tǒng) METAL 系統(tǒng)。它是高度模塊化的結構,可并入語義分析、情報檢索和專家系統(tǒng)模塊。

該系統(tǒng)采用短語結構文法來構造語言規(guī)則系統(tǒng),通過轉換生成目標語言,主要基于爾科夫過程方法實現(xiàn)系統(tǒng)運行。根據資料記載,METAL 系統(tǒng)的翻譯速度為 5.7 秒/詞, 約為人工翻譯的 6 倍 ( 1984 年時的試驗結果),由此成功在多個專業(yè)領域上被利用。

為自然語言系統(tǒng)打下基礎

從宏觀層面來說,轉換生成語法反映了喬姆斯基對于理性主義傳統(tǒng)的堅守, 這種理性主義在語言學中主要體現(xiàn)在三個方面:

  • 第一, 承認存在一種普遍的語言, 與此對應, 還應存在一種對各種語言都適用的「普遍語法」。喬姆斯基在語言學研究中一直不斷地尋求這種普遍語法, 并為它提供了具體的語言學描述, 即「管轄與約束理論」。

  • 第二, 承認存在一種先天的語言學習機制 (LAD)。喬姆斯基認為, 語言學習是一種演繹過程:兒童從先天的 LAD 中推導出母語的具體結構, 并在語言環(huán)境中驗證這些假設;那些證明與他們聽到的語言相符合的假設被選作他們母語的語法。

  • 第三, 堅持理性主義的方法論原則, 認為語言學具有自然科學的某些特征, 即通過一些普遍原則, 可以用演繹法推導出具體的語法。

早期麻省理工學院人工智能實驗室成員 Robert C. Berwick 曾高度評價喬姆斯基語言學革命對人工智能研究的積極意義,尤其是「管轄與約束理論」(GB 理論),他認為該理論讓「觸類旁通」的語言分析系統(tǒng)成為可能。

GB 理論是喬姆斯基八十年代初從事普遍語法研究的產物, 它的核心由一系列互相聯(lián)系、互相制約的基本原則組成。這些原則具有普遍性, 適用于每種語言, 同時又具有靈活性, 允許不同的語言在一定范圍內有些差異。Berwick 認為 GB 理論特別適合用來設計未來的人工智能自然語言系統(tǒng),其優(yōu)越性主要體現(xiàn)在三個方面:

  • GB 理論的系數化以及依賴約束的做法使它成為遵循語言學理論、探索匹配處理的較好的工程系統(tǒng)。

  • 它使我們得心應手地處理不合規(guī)范的錯誤輸入 (ill-formed input)。

  • GB 理論通過很少的參數表征所有的語言, 當它指出句法翻譯的方式后, 我們就能用統(tǒng)一方式來分析各種各樣的不同的語言

在 GB 理論出現(xiàn)以前, 許多語言學家利用大量的語法規(guī)則分析紛紜復雜的語言現(xiàn)象。GB 理論摒棄了這一傳統(tǒng)做法, 改為依靠統(tǒng)一的、參數化的約束系統(tǒng)的交互作用來解釋復雜的句子。

換句話說,如果我們有 10 種獨立的約束, 每項約束可以取兩個值 (利用該項約束或不利用), 我們原則上僅以 10 項約束就能描述 210 個句子, 這比用 1000 多種語法規(guī)則解釋這些句子要方便得多。

對編程語言的影響

在喬姆斯基的語言學理論中,喬姆斯基定義了四型文法,并數學化地表述了每一型的語言表達能力,該理論后來深刻影響了編譯領域中語法前端的設計。

約翰?巴克斯將喬姆斯基的語言學理論引入到計算機編譯技術領域,據此書寫出了 ALGOL 58 的語法,并提出可實現(xiàn)的計算機語法分析算法。巴克斯的工作在計算機編譯系統(tǒng)的發(fā)展史上是里程碑意義的——它第一次允許編程語言中出現(xiàn)表達式語法和結構化控制流。

簡單地說,喬姆斯基的理論回答了這樣一個問題,即具備何種特征的語言可以用于書寫程序,而巴克斯的工作則告訴我們,計算機程序確實能夠用人類可以理解的方式寫出并同時讓人類和計算機理解。

喬姆斯基的文法理論在計算機領域中真正被使用的共有兩者:三型文法和二型文法。前者的特征是語法中不存在遞歸下降結構,它的代表是基本正則表達式(擴展后的正則表達式情況略有不同);而二型文法即上下文無關文法,特征是任何語言元素在任何上下文中的含義始終保持一致。

多數如今的程序設計語言語法都以此為基礎,換句話說,以上兩者構成了如今所有實用計算機程序設計語言的分析器理論基礎,也有成熟的數據結構和算法支持。

事實上,喬姆斯基在其學術生涯中并未真正涉獵過計算機和 AI 領域,甚至還對 AI 領域的某些做法頗有微詞(比如曾指出 N 元文法的缺陷),然而并不阻礙其高屋建瓴的思想對這兩個領域造成不可估量的影響。在機器學習大行其道的當下,其偏向理性主義的體系思考,依然對我們有不少借鑒意義,只不過就需要我們去做進一步的挖掘。

參考文獻:

1)《喬姆斯基與人工智能》. 王巍 寇世琪

https://zhuanlan.zhihu.com/p/24018768

2)NLP 主流反思的扛鼎之作: 立委譯《Church:鐘擺擺得太遠》

https://blog.csdn.net/memray/article/details/50605879

3)知乎「喬姆斯基的語言學理論對編程語言的影響有多大?」提問下的回答

https://www.zhihu.com/question/21843639/answer/19524698

雷鋒網 AI 科技評論

雷峰網原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知。

「無心插柳柳成蔭」的喬姆斯基 | 追溯 AI 大師系列

分享:
相關文章
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經綁定,現(xiàn)在您可以設置密碼以方便用郵箱登錄
立即設置 以后再說