0
本文作者: 我在思考中 | 2022-09-15 17:37 |
AI 科技評(píng)論獲悉,中國(guó)機(jī)器翻譯事業(yè)的開(kāi)創(chuàng)者之一、原中國(guó)社科院語(yǔ)言研究所研究員劉倬老師與世長(zhǎng)辭,享年 89 歲。沉痛悼念劉倬老師!
劉倬,1933 年 4 月 4 日生于河北省大成縣。1949 年從北京市立一中畢業(yè)后,他進(jìn)入華北大學(xué)學(xué)習(xí),同年11月被分配到哈爾濱外專(zhuān)學(xué)習(xí)俄語(yǔ),1951 年畢業(yè)后留校任助教。1953 年,他被調(diào)入北京高等教育部,在綜合大學(xué)司任科員。1954 年至 1960 年間,他在北京俄語(yǔ)學(xué)院任語(yǔ)言學(xué)講師。
自 1960 年11月起,劉倬加入中國(guó)社會(huì)科學(xué)院語(yǔ)言研究所,從事機(jī)器翻譯的研究和開(kāi)發(fā),直至 1998 年離休。在職期間,他曾擔(dān)任語(yǔ)言研究所學(xué)術(shù)委員會(huì)委員、中國(guó)語(yǔ)言學(xué)會(huì)會(huì)員、中國(guó)中文信息學(xué)會(huì)常務(wù)理事、自然處理專(zhuān)業(yè)委員會(huì)主任。
劉倬先生在機(jī)器翻譯事業(yè)中最重要的代表作品之一,是他在 1964 年與劉涌泉、高祖舜合作出版的《機(jī)器翻譯淺說(shuō)》一書(shū),該書(shū)論述了漢外機(jī)器翻譯系統(tǒng)的研制方法。
58 年前,三位作者在這本書(shū)中對(duì)未來(lái)機(jī)器翻譯的發(fā)展和應(yīng)用展開(kāi)暢想:
從本書(shū)的出版算起,我國(guó)的自然語(yǔ)言處理研究已歷經(jīng)了半個(gè)多世紀(jì)的發(fā)展和演變,溝通無(wú)國(guó)界的夢(mèng)想在今天正在逐步實(shí)現(xiàn),這離不開(kāi)劉倬等老一輩自然語(yǔ)言處理學(xué)者的多年耕耘。
劉倬與本書(shū)的另一位作者劉涌泉并稱(chēng)中國(guó)機(jī)器翻譯領(lǐng)域的“二劉”。劉涌泉曾于 1958 年發(fā)表中國(guó)學(xué)者的第一篇機(jī)器翻譯論文《俄漢機(jī)器翻譯中的詞序問(wèn)題及其解決辦法》,他主持的俄漢機(jī)器翻譯項(xiàng)目于 1959 年在計(jì)算所 104 機(jī)上試驗(yàn)成功,從而使得中國(guó)成為世界上第五個(gè)進(jìn)行機(jī)器翻譯試驗(yàn)的國(guó)家。劉倬與劉涌泉兩位前輩在社科院語(yǔ)言研究所共同從事機(jī)器翻譯研究,為后來(lái) NLP 的發(fā)展做出了許多奠定性的貢獻(xiàn)。
參與“二劉”機(jī)器翻譯項(xiàng)目的還有另一位中國(guó)早期計(jì)算語(yǔ)言學(xué)的推動(dòng)者、著名語(yǔ)言信息處理技術(shù)專(zhuān)家——馮志偉。
在馮志偉的機(jī)器翻譯研究生涯中,劉倬和劉涌泉給予了他巨大支持。《機(jī)器翻譯淺說(shuō)》發(fā)布后不久,全世界的機(jī)器翻譯進(jìn)入一個(gè)低谷期,中國(guó)的機(jī)器翻譯也停滯了 10 多年,直到 20 世紀(jì) 70 年代后期人工智能第二次浪潮,機(jī)器翻譯再次復(fù)興。此時(shí)馮志偉接過(guò)“二劉”的班,以中國(guó)科學(xué)技術(shù)大學(xué)研究生院信息科學(xué)系研究生的方式掛在劉涌泉名下,期間赴法國(guó)進(jìn)修,于 1981 年回國(guó)。這時(shí)中國(guó)的機(jī)器翻譯進(jìn)入上升期,馮志偉回國(guó)后在家鄉(xiāng)昆明組織舉辦了全國(guó)第一次機(jī)器翻譯會(huì)議,劉倬和劉涌泉都在其中。1982 年,馮志偉在國(guó)際計(jì)算語(yǔ)言學(xué)大會(huì)(COLING)上發(fā)表論文,成為首次在 NLP 國(guó)際頂會(huì)上發(fā)表文章的中國(guó)學(xué)者。
馮志偉對(duì)劉倬先生的離世表示悼念:
在早期基于規(guī)則的符號(hào)機(jī)器翻譯研究領(lǐng)域,劉倬作為一位先驅(qū)者,實(shí)現(xiàn)了多個(gè)關(guān)鍵的技術(shù)創(chuàng)新,例如把數(shù)據(jù)和程序分開(kāi)的策略改變,從規(guī)則的固定表格模式處理推進(jìn)到定義規(guī)則特定語(yǔ)言,賦能規(guī)則的自由書(shū)寫(xiě),以及引入隱含常識(shí)的 ontology 知識(shí)庫(kù),個(gè)性與共性分離與交互技術(shù),等等。
劉倬多年來(lái)在機(jī)器翻譯領(lǐng)域的方法探索的集中體現(xiàn),是他從 1975 年開(kāi)始主持研制的 JFY 型英漢翻譯系統(tǒng)。
JFY 型翻譯系統(tǒng)是JFY-I型、II型、III型、IV 型翻譯系統(tǒng)的總稱(chēng),整套系統(tǒng)的研制前后共經(jīng)歷了十多年,凝結(jié)了劉倬多年來(lái)在機(jī)器翻譯領(lǐng)域的思想探索。該系統(tǒng)基于專(zhuān)家詞典,以實(shí)際應(yīng)用為目標(biāo),結(jié)合語(yǔ)言學(xué)理論基礎(chǔ)和算法設(shè)計(jì),并通過(guò)大量語(yǔ)料的檢驗(yàn),最終實(shí)現(xiàn)了一個(gè)覆蓋十幾個(gè)專(zhuān)業(yè)領(lǐng)域的英漢科技文獻(xiàn)翻譯系統(tǒng)。
其中,JFY-I 型翻譯系統(tǒng)(1976-1978)是套題錄翻譯系統(tǒng),JFY-II 型翻譯系統(tǒng)(1978-1980)是一套全文翻譯系統(tǒng),這兩個(gè)系統(tǒng)是劉倬與中國(guó)科技情報(bào)研究所等單位共同研制的,其后的 JFY-III 型翻譯系統(tǒng)(1980-1982)則是與中國(guó)軍事科學(xué)院合作,這三個(gè)系統(tǒng)都是試驗(yàn)性的, 目的是在理論和技術(shù)上探索研制機(jī)器翻譯規(guī)則系統(tǒng)的方法和經(jīng)驗(yàn)。
從 JFY-IV 型翻譯系統(tǒng)開(kāi)始,便是商品化的應(yīng)用系統(tǒng)。這個(gè)機(jī)譯系統(tǒng)的設(shè)計(jì)從 1982 年開(kāi)始,經(jīng)歷了三次重大的原則性改變,最終在 1987 年定型。劉倬對(duì)該系統(tǒng)的設(shè)計(jì)提出許多重要觀點(diǎn),如保持翻譯系統(tǒng)的開(kāi)放性,使語(yǔ)言規(guī)則的增、刪、改簡(jiǎn)便易行;編制語(yǔ)言規(guī)則時(shí)注意結(jié)合共性與個(gè)性,把轉(zhuǎn)換機(jī)制引入原文句型分析;在句法分析中采用以軸心詞為中心的隨機(jī)上下文分析法;等等。
為了創(chuàng)建一套方便實(shí)用的開(kāi)發(fā)工具,劉倬親自設(shè)計(jì)了一套 NLP 專(zhuān)用語(yǔ)言,即 JFY 語(yǔ)言,它是一種功能齊全且使用靈活的函數(shù)型產(chǎn)生式語(yǔ)言,用于實(shí)現(xiàn)JFY型機(jī)器翻譯從解釋器到控制器、從專(zhuān)家詞典(個(gè)性規(guī)則)到句型轉(zhuǎn)換(共性規(guī)則)的系統(tǒng)架構(gòu)和流程。
在當(dāng)時(shí),中文機(jī)器翻譯的難度比起西方語(yǔ)種的翻譯難度要大得多,據(jù)當(dāng)時(shí)受劉倬和劉涌泉共同指導(dǎo)、參與了系統(tǒng)研發(fā)的學(xué)生李維(前弘璣首席科學(xué)家、前訊飛 AI 研究院副院長(zhǎng),NLP 資深架構(gòu)師)回憶,劉倬有一個(gè)絕技,可以不借用任何工具,憑著苦思冥想找到系統(tǒng)問(wèn)題的所在。系統(tǒng)若有一個(gè) bug,劉倬就睡不著,常常是半夜捉住 bug,第二天就迫不急待上機(jī)試驗(yàn)。如今的軟件工程師大概很難想象,在當(dāng)年沒(méi)有任何糾錯(cuò)工具的開(kāi)發(fā)環(huán)境下是怎樣編碼系統(tǒng)的。
經(jīng)過(guò)多年運(yùn)行和功能調(diào)拭,JFY-IV 型翻譯系統(tǒng)的語(yǔ)言學(xué)理論基礎(chǔ)和算法設(shè)計(jì)技術(shù)都被證明是正確且有效的,能夠取得令人滿(mǎn)意的翻譯結(jié)果。
如今,中國(guó)的機(jī)器翻譯事業(yè)以及自然語(yǔ)言處理學(xué)科都已步入世界前列,機(jī)器翻譯技術(shù)不斷迭代、創(chuàng)新,但劉倬先生所留下的諸多重要核心思想將經(jīng)久不衰。
劉倬先生千古!
http://ling.cass.cn/xueren/xzjs/202110/t20211029_5370373.html
掃碼添加 AI 科技評(píng)論 微信號(hào),投稿&進(jìn)群:
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。