北京語言大學語言智能研究院正式成立，多位重磅嘉賓探討語言智能學科建設(shè)

本文作者： skura

2019-06-24 10:30

導語：中國中文信息學會名譽理事長，原哈工大黨委書記，國際計算語言學協(xié)會 (ACL) 終身成就獎獲得者李生擔任名譽院長。

雷鋒網(wǎng) AI 科技評論按，2019 年 6 月 15 日，北京語言大學語言智能研究院成立儀式暨語言智能學術(shù)論壇在京舉辦。來自學界和業(yè)界的多位重磅嘉賓參與了會議。

本次會議由北京語言大學信息科學學院黨總支書記李超主持。在語言智能研究院成立儀式上，教育部科技司雷朝滋司長，中國科學院院士清華大學人工智能研究院院長張鈸教授，語言智能研究院名譽院長、國際計算語言學學會終身成就獎得主哈爾濱工業(yè)大學李生教授先后進行了致辭。緊接著，劉利校長和雷朝滋司長共同為研究院揭牌。

北京語言大學語言智能研究院正式成立，多位重磅嘉賓探討語言智能學科建設(shè)

語言智能研究院正式成立

語言智能研究院是在北京語言大學信息科學學院、語言資源高精尖創(chuàng)新中心基礎(chǔ)上，整合北京語言大學校內(nèi)外的信息科學、語言學及應(yīng)用語言學、認知科學等學科優(yōu)勢資源與優(yōu)秀人才，全新打造的一所旗艦級交叉學科研究機構(gòu)。語言智能研究院依托信息科學學院進行建設(shè)，其前身，是成立于 1987 年 10 月的「語言信息處理研究所」，該研究所是我國第一批專門研究語言信息處理的研究機構(gòu)，并以此為基礎(chǔ)發(fā)展出來了北京語言大學計算機系、信息科學學院、國家語言資源監(jiān)測與平面媒體研究中心、語言監(jiān)測與社會計算研究所、大數(shù)據(jù)與語言教學研究、管理科學與工程研究所、漢語國際教育技術(shù)研發(fā)中心等單位，組建了老中青結(jié)合、本碩博齊全的教學科研團隊。

在揭牌儀式之后，語言智能研究院與新華社技術(shù)局、國家知識產(chǎn)權(quán)局中國專利信息中心、神州泰岳集團、金山軟件集團、理光軟件研究所舉行了簽約儀式。

隨后，語言智能學術(shù)論壇開始。本次論壇的主持人是北京語言大學教授荀恩東。參與論壇的嘉賓有北京理工大學計算機學院院長黃河燕，語言資源高精尖創(chuàng)新中心主任、原北京語言大學黨委書記李宇明，信息科學學院名譽院長、北京語言大學銀齡學者宋柔，中國中文信息處理學會副理事長、秘書長孫樂，蘇州大學計算機科學與技術(shù)學院副院長、人類語言技術(shù)研究所長、人工智能研究院副院長、國家杰出青年科學基金獲得者張民，模式識別國家重點實驗室副主任、自然語言處理團隊負責人宗成慶。

北京語言大學語言智能研究院正式成立，多位重磅嘉賓探討語言智能學科建設(shè)

北京語言大學銀齡學者宋柔：語言學和語言工程處于嚴重脫節(jié)狀態(tài)，需攜手合作

論壇伊始，信息科學學院名譽院長、北京語言大學銀齡學者宋柔首先進行了主題為「語言知識工程與語言智能學科建設(shè)」的引導報告。

宋柔表示，關(guān)于建設(shè)語言智能研究院，他想側(cè)重強調(diào)語言學和語言工程的深度融合。我們有各種學科，例如物理、化學、生物等。物理學作為一個基礎(chǔ)學科，它支撐了許多物理工程，例如交通工程、建筑工程、機械工程等等；化學作為一門基礎(chǔ)理論學科，支持了化學工程，包括化肥、農(nóng)藥、煉油、食品、紡織等等；生物學科作為一門基礎(chǔ)的理論學科，支持了醫(yī)學工程、生物工程、農(nóng)業(yè)工程等等。但是，在語言工程方面，目前的實際情況是，支持它的基礎(chǔ)學科是數(shù)據(jù)科學而不是語言學，語言學反而遭到了冷落。數(shù)據(jù)科學是一種工具性的科學，是很多學科的通用基礎(chǔ)，但不能取代專業(yè)領(lǐng)域的科學。語言學和語言工程目前處在一個嚴重脫節(jié)的狀態(tài)。這是一個不正常的現(xiàn)象。

宋柔認為，語言學需要通過建立語言知識體系，語言工程需要做計算方面的工作和應(yīng)用方面的工作。這兩個方面的結(jié)合點就在于在形式化。語言知識體系需要有形式化的手段將它表示出來，計算模型需要建立在形式模型基礎(chǔ)之上。但是，研究語言學的人不擅長于形式化的表達，研究計算機科學的人并不清楚如何做語言知識的形式模型。因此，在交接這一塊存在很大問題。要解決這一問題，語言學和語言工程需要攜手協(xié)作。研究語言學的人應(yīng)該關(guān)心形式化的要求和方法，了解算法和程序是怎么回事，往形式模型的方向去做研究，而不能只做面向人的語言學研究。而從事語言工程的人也需要了解語言知識體系，分析自己所做的應(yīng)用需要什么樣的語言知識，在建立計算模型之前首先建立恰當?shù)男问侥Ｐ汀?/p>

宋柔提出，在人才培養(yǎng)方面不能只教學生具體的模型，因為模型是會更新的。在實際教學中不僅要講結(jié)果、講概念和方法，還需要告訴他們，這個概念是怎么來的，這個方法是怎么來的。我們需要把科研內(nèi)容和教學結(jié)合起來。

雷鋒網(wǎng)了解到，宋柔1981年畢業(yè)于北京大學計算機系取得碩士學位，師從我國著名數(shù)學家、計算機科學家、語言學家和教育家馬希文。馬希文同時也是北京語言大學語言信息處理研究所的創(chuàng)始人，他在語言研究中倡導數(shù)學、計算機科學與語言學的結(jié)合，做出了諸多開創(chuàng)性的工作，宋柔教授的“加強數(shù)據(jù)科學與語言科學結(jié)合建立語言知識體系”的倡議正是馬希文治學觀念的進一步延續(xù)。

在宋柔教授的精彩發(fā)言之后，語言智能學術(shù)論壇圓桌會議正式開始，本次會議的主題是「語言知識工程與語言智能學科建設(shè)」，在隨后的發(fā)言中，多位專家也表達了與宋柔教授類似的觀點。

北京語言大學語言資源高精尖創(chuàng)新中心主任、原北京語言大學黨委書記李宇明：數(shù)據(jù)驅(qū)動與知識驅(qū)動齊頭并進才能打破人工智能天花板

李宇明表示，在計算機信息處理技術(shù)剛出現(xiàn)時，語言學家非常激動，積極投身到信息處理領(lǐng)域。計算機給人類的發(fā)展帶來了重大的變化，而在這一階段，語言學家做了很多重要的工作。

我們經(jīng)歷了由知識驅(qū)動轉(zhuǎn)向數(shù)據(jù)驅(qū)動的過程。在轉(zhuǎn)向數(shù)據(jù)驅(qū)動的時候，語言學的知識看起來沒有什么用處，甚至有的團隊里面不需要語言學家了。語言學家希望在語言學領(lǐng)域，通過自己的知識為人工智能作出貢獻，但是卻看起來徒勞無功。

很多人認為，現(xiàn)在人工智能的發(fā)展必然還會遇到一個天花板。數(shù)據(jù)驅(qū)動給社會帶來的紅利是不可估量的，但它本質(zhì)上存在著缺陷。那么，如何打破這種天花板？數(shù)據(jù)驅(qū)動和知識驅(qū)動齊頭并進，才有希望打破可能出現(xiàn)的人工智能的天花板。

北京語言大學之所以成立語言智能研究院，是因為我們在語言上有一些優(yōu)勢，希望將語言學和計算機科學結(jié)合起來。接下來，知識工程、服務(wù)漢語國際教育，特別是語言學習和外語學習，將會成為我們工作重點之一。

北京語言大學還是有著自己的短板，這些短板我們會逐漸進行彌補。每個學校都有自己的短板，這些短板加在一塊，就是整個國家的發(fā)展問題。我們當前最需要做的，就是做國家最需要的工作，彌補國家的短板。

北京理工大學計算機學院院長黃河燕：語言學需要和計算機更好地融合

黃河燕談道，在以前他們一直是基于多種知識融合的方法來做機器翻譯。他們使用的規(guī)則中，20% 的規(guī)則處理了 80% 的語言現(xiàn)象，剩下的 20% 的語言現(xiàn)象在處理的時候，會遇到各種新的問題。

如果有足夠多的數(shù)據(jù)，就能解決很多的問題。他們用統(tǒng)計學、神經(jīng)網(wǎng)絡(luò)的方法，能夠?qū)?shù)據(jù)進行建模和訓練，這也是一種很好的解決問題的方式。但是，很多時候有數(shù)據(jù)涵蓋不了的一些現(xiàn)象和問題無法解決。

對不同的應(yīng)用，知識表示的方式也可能不同。知識表示和業(yè)務(wù)是密切相關(guān)的。

她認為，在語言學科的定位上，重要的是如何把語言知識和計算機更好地融合在一起。它們需要一個比較好的規(guī)范標準，在規(guī)范的情況下做建設(shè)?，F(xiàn)在語言學的發(fā)展很快，很多學科都需要進行交叉。

在人才培養(yǎng)方面，首先，他們必須結(jié)合最新、最前沿的知識，結(jié)合產(chǎn)業(yè)界最新的技術(shù)。其次在設(shè)計課程的時候，他們最好也設(shè)計語言智能的課程體系。在設(shè)計課程的時候，要結(jié)合相關(guān)學科的基礎(chǔ)課程，多學科的交叉領(lǐng)域也是非常需要的。最后，進行本碩博貫通的培養(yǎng)方式。這樣不僅會有比較強的體系，還能在各個階段提供一個支撐性銜接的平臺，真正達到人才培養(yǎng)的目的。

中國中文信息處理學會副理事長、秘書長孫樂：要解決關(guān)鍵問題，而不是追逐熱門技術(shù)

關(guān)于語言學領(lǐng)域的工作，孫樂給與會者們分享了兩個觀點。

第一個觀點是，我們應(yīng)該不忘初心。很多時候，人們因為人工智能熱去做這些研究，但實際上，我們可能還是要回到語言本身。語言在產(chǎn)生之初改變了整個人類的歷史，正是有了語言，人類的知識才一代一代傳承下來。語言智能是人的核心能力。

所以我們應(yīng)該意識到語言智能的挑戰(zhàn)，它是一個核心的一個挑戰(zhàn)，這并不是短期或者簡簡單單就可以實現(xiàn)的，它可能是一個非常艱苦的工作。在做研究的時候，我們不能只追逐熱門技術(shù)，還是要去解決一些關(guān)鍵的問題。

第二個觀點是，漢語是一門非常有特色的語言。早期的一些研究發(fā)現(xiàn)，人的大腦在處理不同的語言時，采用的區(qū)域是不一樣的。在治療一些有不同的語言障礙的病人時，科學家發(fā)現(xiàn)，說漢語的病人治療的部位和說英語的病人不一致。從語言特色上看，漢語處理比英語處理難度更大，我們應(yīng)該多做一些比較性的研究。

模式識別國家重點實驗室副主任，自然語言處理團隊負責人宗成慶：語料標準對于長期的基礎(chǔ)理論研究很重要

談到語言資源的建設(shè)，宗成慶提出了三個基本觀點。

一是關(guān)于技術(shù)理論和標準。漢語是我們的母語，但是中國人對漢語卻拿不出自己的標準。我們要扎扎實實長期地研究漢語本身的特點，先做出一個標準。我們希望有一個漢語國家數(shù)據(jù)庫。作為母語，我們是有條件、也有能力做到這些事情的。

二是我們應(yīng)該盡快拿出這個標準，這對于長期的基礎(chǔ)理論研究來說是必要的。

三是我們現(xiàn)在做的語料標準更多注重語言本身的一些分析處理。而語言理解除了需要語言本身的知識以外，還有相當一部分是屬于常識性的知識，如果不了解常識，我們很可能還是不能理解句子的意思。

關(guān)于教學，他會給中科院的學生布置大作業(yè)，以及實現(xiàn)一個項目，實現(xiàn)一個系統(tǒng)。但是，最后他收到的作業(yè)非常糟糕，幾乎所有的學生都是用開源工具做的，并沒有自己的思考，學生離開了開源工具就什么也做不了。我們應(yīng)該鼓勵學生用自己想出來的方法，而不是開源工具去做實驗。

蘇州大學計算機科學與技術(shù)學院副院長張民：我們要發(fā)展學科基礎(chǔ)，建設(shè)自然語言處理工程

張民認為，語言學和自然語言處理所要解決的問題不一樣。語言學有它自己的學科研究范圍，沒有義務(wù)去解決自然語言處理的問題。

談到工程，談到實際需求，我們需要考慮一個問題，人工智能為什么發(fā)展起來？最重要的原因，是因為產(chǎn)業(yè)的驅(qū)動和經(jīng)濟效益。從這一點上來說，我們要感謝產(chǎn)業(yè)界。目前，產(chǎn)業(yè)界和學術(shù)界嚴重脫離。很多小公司并不知道自然語言處理是什么，完全是從軟件工程的角度來處理的。

我們要發(fā)展學科基礎(chǔ)，建設(shè)自然語言處理工程。到底是語言智能還是語言學智能，到底是語言知識還是語言學知識，這個關(guān)系不大。外界對語言知識的期望是包羅萬象，能夠表達所有的常識。所有的知識都是能夠用語言學表達的，但是語言學家只研究語義。

我們自己需要和國家同步努力，人工智能這個學科到底是人工智能還是智能科學技術(shù)，這個問題誰也說不清楚。人工智能、語言工程和傳統(tǒng)的工程不一樣，它是發(fā)展的、開放的，不能被明確地定義。學科問題是個大問題，一定要講清楚。

至此，「語言智能學術(shù)論壇」圓桌結(jié)束。在本次圓桌會議中，嘉賓們對語言知識工程，語言學的研究都紛紛發(fā)表了自己的心得、看法，對于學科建設(shè)和人才培養(yǎng)也提出了很多獨到的見解。

加強學術(shù)交流，打造智能語言研究橋頭堡

在上午的圓桌結(jié)束后，下午還繼續(xù)進行了「語言智能學術(shù)論壇」系列學術(shù)報告。

在下午的學術(shù)報告中，哈爾濱工業(yè)大學李生教授、微軟亞洲研究院周明研究員、中國科學院宗成慶研究員、哈爾濱工業(yè)大學劉挺教授、蘇州大學張民教授、北京大學穗志方教授、北京語言大學張勁松教授、荀恩東教授就語言智能的發(fā)展方向、前沿技術(shù)、基礎(chǔ)資源和應(yīng)用挑戰(zhàn)進行了精彩報告。整場報告干貨滿滿，嘉賓們從語言智能技術(shù)到當前發(fā)展趨勢進行了精彩的解讀。數(shù)千名網(wǎng)友通過在線方式觀看了典禮和論壇直播。

今年，為更好地服務(wù)國家戰(zhàn)略和北語發(fā)展需求，進一步鞏固并拓展其在語言學及其相關(guān)領(lǐng)域的引領(lǐng)地位，更好地支撐“雙一流”建設(shè)，北京語言大學舉辦了一系列學術(shù)活動，并成立語言智能研究院，旨在將語言智能研究院建設(shè)成為國內(nèi)外權(quán)威、具有巨大影響力的人工智能研究機構(gòu)。 2019 年 5 月，北京語言大學舉辦了「紀念馬希文教授八十誕辰暨《邏輯·語言·計算——馬希文文選》出版」座談會與學術(shù)研討會。而今年 8 月，由中國計算機學會（CCF）、中國中文信息學會（CIPS）聯(lián)合舉辦的第四屆「語言與智能高峰論壇」也將在北京語言大學舉辦。據(jù)悉，語言智能研究院擬于近期啟動團隊組建工作，面向校內(nèi)外、國內(nèi)外多種形式招聘著名專家和優(yōu)秀中青年學者加盟研究院。中國中文信息學會名譽理事長，原哈工大黨委書記，國際計算語言學協(xié)會 (ACL) 終身成就獎獲得者李生更是擔任語言智能研究院的名譽院長。

未來，北京語言大學能否成為智能語言研究橋頭堡？相信在不久的將來，北京語言大學語言智能研究院一定能夠在語言知識工程領(lǐng)域做出很多優(yōu)秀的成果，為我國語言智能事業(yè)的發(fā)展做出杰出的貢獻。

雷鋒網(wǎng)雷鋒網(wǎng)

雷峰網(wǎng)版權(quán)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

0人收藏

相關(guān)文章

skura

編輯

發(fā)私信

當月熱門文章

北京語言大學語言智能研究院正式成立，多位重磅嘉賓探討語言智能學科建設(shè)

北京語言大學語言智能研究院正式成立，多位重磅嘉賓探討語言智能學科建設(shè)