0
本文作者: 我在思考中 | 2022-09-15 17:37 |
AI 科技評論獲悉,中國機器翻譯事業(yè)的開創(chuàng)者之一、原中國社科院語言研究所研究員劉倬老師與世長辭,享年 89 歲。沉痛悼念劉倬老師!
劉倬,1933 年 4 月 4 日生于河北省大成縣。1949 年從北京市立一中畢業(yè)后,他進入華北大學學習,同年11月被分配到哈爾濱外專學習俄語,1951 年畢業(yè)后留校任助教。1953 年,他被調(diào)入北京高等教育部,在綜合大學司任科員。1954 年至 1960 年間,他在北京俄語學院任語言學講師。
自 1960 年11月起,劉倬加入中國社會科學院語言研究所,從事機器翻譯的研究和開發(fā),直至 1998 年離休。在職期間,他曾擔任語言研究所學術(shù)委員會委員、中國語言學會會員、中國中文信息學會常務理事、自然處理專業(yè)委員會主任。
劉倬先生在機器翻譯事業(yè)中最重要的代表作品之一,是他在 1964 年與劉涌泉、高祖舜合作出版的《機器翻譯淺說》一書,該書論述了漢外機器翻譯系統(tǒng)的研制方法。
58 年前,三位作者在這本書中對未來機器翻譯的發(fā)展和應用展開暢想:
從本書的出版算起,我國的自然語言處理研究已歷經(jīng)了半個多世紀的發(fā)展和演變,溝通無國界的夢想在今天正在逐步實現(xiàn),這離不開劉倬等老一輩自然語言處理學者的多年耕耘。
劉倬與本書的另一位作者劉涌泉并稱中國機器翻譯領(lǐng)域的“二劉”。劉涌泉曾于 1958 年發(fā)表中國學者的第一篇機器翻譯論文《俄漢機器翻譯中的詞序問題及其解決辦法》,他主持的俄漢機器翻譯項目于 1959 年在計算所 104 機上試驗成功,從而使得中國成為世界上第五個進行機器翻譯試驗的國家。劉倬與劉涌泉兩位前輩在社科院語言研究所共同從事機器翻譯研究,為后來 NLP 的發(fā)展做出了許多奠定性的貢獻。
參與“二劉”機器翻譯項目的還有另一位中國早期計算語言學的推動者、著名語言信息處理技術(shù)專家——馮志偉。
在馮志偉的機器翻譯研究生涯中,劉倬和劉涌泉給予了他巨大支持。《機器翻譯淺說》發(fā)布后不久,全世界的機器翻譯進入一個低谷期,中國的機器翻譯也停滯了 10 多年,直到 20 世紀 70 年代后期人工智能第二次浪潮,機器翻譯再次復興。此時馮志偉接過“二劉”的班,以中國科學技術(shù)大學研究生院信息科學系研究生的方式掛在劉涌泉名下,期間赴法國進修,于 1981 年回國。這時中國的機器翻譯進入上升期,馮志偉回國后在家鄉(xiāng)昆明組織舉辦了全國第一次機器翻譯會議,劉倬和劉涌泉都在其中。1982 年,馮志偉在國際計算語言學大會(COLING)上發(fā)表論文,成為首次在 NLP 國際頂會上發(fā)表文章的中國學者。
馮志偉對劉倬先生的離世表示悼念:
在早期基于規(guī)則的符號機器翻譯研究領(lǐng)域,劉倬作為一位先驅(qū)者,實現(xiàn)了多個關(guān)鍵的技術(shù)創(chuàng)新,例如把數(shù)據(jù)和程序分開的策略改變,從規(guī)則的固定表格模式處理推進到定義規(guī)則特定語言,賦能規(guī)則的自由書寫,以及引入隱含常識的 ontology 知識庫,個性與共性分離與交互技術(shù),等等。
劉倬多年來在機器翻譯領(lǐng)域的方法探索的集中體現(xiàn),是他從 1975 年開始主持研制的 JFY 型英漢翻譯系統(tǒng)。
JFY 型翻譯系統(tǒng)是JFY-I型、II型、III型、IV 型翻譯系統(tǒng)的總稱,整套系統(tǒng)的研制前后共經(jīng)歷了十多年,凝結(jié)了劉倬多年來在機器翻譯領(lǐng)域的思想探索。該系統(tǒng)基于專家詞典,以實際應用為目標,結(jié)合語言學理論基礎和算法設計,并通過大量語料的檢驗,最終實現(xiàn)了一個覆蓋十幾個專業(yè)領(lǐng)域的英漢科技文獻翻譯系統(tǒng)。
其中,JFY-I 型翻譯系統(tǒng)(1976-1978)是套題錄翻譯系統(tǒng),JFY-II 型翻譯系統(tǒng)(1978-1980)是一套全文翻譯系統(tǒng),這兩個系統(tǒng)是劉倬與中國科技情報研究所等單位共同研制的,其后的 JFY-III 型翻譯系統(tǒng)(1980-1982)則是與中國軍事科學院合作,這三個系統(tǒng)都是試驗性的, 目的是在理論和技術(shù)上探索研制機器翻譯規(guī)則系統(tǒng)的方法和經(jīng)驗。
從 JFY-IV 型翻譯系統(tǒng)開始,便是商品化的應用系統(tǒng)。這個機譯系統(tǒng)的設計從 1982 年開始,經(jīng)歷了三次重大的原則性改變,最終在 1987 年定型。劉倬對該系統(tǒng)的設計提出許多重要觀點,如保持翻譯系統(tǒng)的開放性,使語言規(guī)則的增、刪、改簡便易行;編制語言規(guī)則時注意結(jié)合共性與個性,把轉(zhuǎn)換機制引入原文句型分析;在句法分析中采用以軸心詞為中心的隨機上下文分析法;等等。
為了創(chuàng)建一套方便實用的開發(fā)工具,劉倬親自設計了一套 NLP 專用語言,即 JFY 語言,它是一種功能齊全且使用靈活的函數(shù)型產(chǎn)生式語言,用于實現(xiàn)JFY型機器翻譯從解釋器到控制器、從專家詞典(個性規(guī)則)到句型轉(zhuǎn)換(共性規(guī)則)的系統(tǒng)架構(gòu)和流程。
在當時,中文機器翻譯的難度比起西方語種的翻譯難度要大得多,據(jù)當時受劉倬和劉涌泉共同指導、參與了系統(tǒng)研發(fā)的學生李維(前弘璣首席科學家、前訊飛 AI 研究院副院長,NLP 資深架構(gòu)師)回憶,劉倬有一個絕技,可以不借用任何工具,憑著苦思冥想找到系統(tǒng)問題的所在。系統(tǒng)若有一個 bug,劉倬就睡不著,常常是半夜捉住 bug,第二天就迫不急待上機試驗。如今的軟件工程師大概很難想象,在當年沒有任何糾錯工具的開發(fā)環(huán)境下是怎樣編碼系統(tǒng)的。
經(jīng)過多年運行和功能調(diào)拭,JFY-IV 型翻譯系統(tǒng)的語言學理論基礎和算法設計技術(shù)都被證明是正確且有效的,能夠取得令人滿意的翻譯結(jié)果。
如今,中國的機器翻譯事業(yè)以及自然語言處理學科都已步入世界前列,機器翻譯技術(shù)不斷迭代、創(chuàng)新,但劉倬先生所留下的諸多重要核心思想將經(jīng)久不衰。
劉倬先生千古!
http://ling.cass.cn/xueren/xzjs/202110/t20211029_5370373.html
掃碼添加 AI 科技評論 微信號,投稿&進群:
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。