0
本文作者: skura | 2019-06-24 10:30 |
雷鋒網(wǎng) AI 科技評論按,2019 年 6 月 15 日,北京語言大學語言智能研究院成立儀式暨語言智能學術論壇在京舉辦。來自學界和業(yè)界的多位重磅嘉賓參與了會議。
本次會議由北京語言大學信息科學學院黨總支書記李超主持。在語言智能研究院成立儀式上,教育部科技司雷朝滋司長,中國科學院院士清華大學人工智能研究院院長張鈸教授,語言智能研究院名譽院長、國際計算語言學學會終身成就獎得主哈爾濱工業(yè)大學李生教授先后進行了致辭。緊接著,劉利校長和雷朝滋司長共同為研究院揭牌。
語言智能研究院正式成立
語言智能研究院是在北京語言大學信息科學學院、語言資源高精尖創(chuàng)新中心基礎上,整合北京語言大學校內外的信息科學、語言學及應用語言學、認知科學等學科優(yōu)勢資源與優(yōu)秀人才,全新打造的一所旗艦級交叉學科研究機構。語言智能研究院依托信息科學學院進行建設,其前身,是成立于 1987 年 10 月的「語言信息處理研究所」,該研究所是我國第一批專門研究語言信息處理的研究機構,并以此為基礎發(fā)展出來了北京語言大學計算機系、信息科學學院、國家語言資源監(jiān)測與平面媒體研究中心、語言監(jiān)測與社會計算研究所、大數(shù)據(jù)與語言教學研究、管理科學與工程研究所、漢語國際教育技術研發(fā)中心等單位,組建了老中青結合、本碩博齊全的教學科研團隊。
在揭牌儀式之后,語言智能研究院與新華社技術局、國家知識產(chǎn)權局中國專利信息中心、神州泰岳集團、金山軟件集團、理光軟件研究所舉行了簽約儀式。
隨后,語言智能學術論壇開始。本次論壇的主持人是北京語言大學教授荀恩東。參與論壇的嘉賓有北京理工大學計算機學院院長黃河燕,語言資源高精尖創(chuàng)新中心主任、原北京語言大學黨委書記李宇明,信息科學學院名譽院長、北京語言大學銀齡學者宋柔,中國中文信息處理學會副理事長、秘書長孫樂,蘇州大學計算機科學與技術學院副院長、人類語言技術研究所長、人工智能研究院副院長、國家杰出青年科學基金獲得者張民,模式識別國家重點實驗室副主任、自然語言處理團隊負責人宗成慶。
北京語言大學銀齡學者宋柔:語言學和語言工程處于嚴重脫節(jié)狀態(tài),需攜手合作
論壇伊始,信息科學學院名譽院長、北京語言大學銀齡學者宋柔首先進行了主題為「語言知識工程與語言智能學科建設」的引導報告。
宋柔表示,關于建設語言智能研究院,他想側重強調語言學和語言工程的深度融合。我們有各種學科,例如物理、化學、生物等。物理學作為一個基礎學科,它支撐了許多物理工程,例如交通工程、建筑工程、機械工程等等;化學作為一門基礎理論學科,支持了化學工程,包括化肥、農藥、煉油、食品、紡織等等;生物學科作為一門基礎的理論學科,支持了醫(yī)學工程、生物工程、農業(yè)工程等等。但是,在語言工程方面,目前的實際情況是,支持它的基礎學科是數(shù)據(jù)科學而不是語言學,語言學反而遭到了冷落。數(shù)據(jù)科學是一種工具性的科學,是很多學科的通用基礎,但不能取代專業(yè)領域的科學。語言學和語言工程目前處在一個嚴重脫節(jié)的狀態(tài)。這是一個不正常的現(xiàn)象。
宋柔認為,語言學需要通過建立語言知識體系,語言工程需要做計算方面的工作和應用方面的工作。這兩個方面的結合點就在于在形式化。語言知識體系需要有形式化的手段將它表示出來,計算模型需要建立在形式模型基礎之上。但是,研究語言學的人不擅長于形式化的表達,研究計算機科學的人并不清楚如何做語言知識的形式模型。因此,在交接這一塊存在很大問題。要解決這一問題,語言學和語言工程需要攜手協(xié)作。研究語言學的人應該關心形式化的要求和方法,了解算法和程序是怎么回事,往形式模型的方向去做研究,而不能只做面向人的語言學研究。而從事語言工程的人也需要了解語言知識體系,分析自己所做的應用需要什么樣的語言知識,在建立計算模型之前首先建立恰當?shù)男问侥P汀?/p>
宋柔提出,在人才培養(yǎng)方面不能只教學生具體的模型,因為模型是會更新的。在實際教學中不僅要講結果、講概念和方法,還需要告訴他們,這個概念是怎么來的,這個方法是怎么來的。我們需要把科研內容和教學結合起來。
雷鋒網(wǎng)了解到,宋柔1981年畢業(yè)于北京大學計算機系取得碩士學位,師從我國著名數(shù)學家、計算機科學家、語言學家和教育家馬希文。馬希文同時也是北京語言大學語言信息處理研究所的創(chuàng)始人,他在語言研究中倡導數(shù)學、計算機科學與語言學的結合,做出了諸多開創(chuàng)性的工作,宋柔教授的“加強數(shù)據(jù)科學與語言科學結合建立語言知識體系”的倡議正是馬希文治學觀念的進一步延續(xù)。
在宋柔教授的精彩發(fā)言之后,語言智能學術論壇圓桌會議正式開始,本次會議的主題是「語言知識工程與語言智能學科建設」,在隨后的發(fā)言中,多位專家也表達了與宋柔教授類似的觀點。
北京語言大學語言資源高精尖創(chuàng)新中心主任、原北京語言大學黨委書記李宇明:數(shù)據(jù)驅動與知識驅動齊頭并進才能打破人工智能天花板
李宇明表示,在計算機信息處理技術剛出現(xiàn)時,語言學家非常激動,積極投身到信息處理領域。計算機給人類的發(fā)展帶來了重大的變化,而在這一階段,語言學家做了很多重要的工作。
我們經(jīng)歷了由知識驅動轉向數(shù)據(jù)驅動的過程。在轉向數(shù)據(jù)驅動的時候,語言學的知識看起來沒有什么用處,甚至有的團隊里面不需要語言學家了。語言學家希望在語言學領域,通過自己的知識為人工智能作出貢獻,但是卻看起來徒勞無功。
很多人認為,現(xiàn)在人工智能的發(fā)展必然還會遇到一個天花板。數(shù)據(jù)驅動給社會帶來的紅利是不可估量的,但它本質上存在著缺陷。那么,如何打破這種天花板?數(shù)據(jù)驅動和知識驅動齊頭并進,才有希望打破可能出現(xiàn)的人工智能的天花板。
北京語言大學之所以成立語言智能研究院,是因為我們在語言上有一些優(yōu)勢,希望將語言學和計算機科學結合起來。接下來,知識工程、服務漢語國際教育,特別是語言學習和外語學習,將會成為我們工作重點之一。
北京語言大學還是有著自己的短板,這些短板我們會逐漸進行彌補。每個學校都有自己的短板,這些短板加在一塊,就是整個國家的發(fā)展問題。我們當前最需要做的,就是做國家最需要的工作,彌補國家的短板。
北京理工大學計算機學院院長黃河燕:語言學需要和計算機更好地融合
黃河燕談道,在以前他們一直是基于多種知識融合的方法來做機器翻譯。他們使用的規(guī)則中,20% 的規(guī)則處理了 80% 的語言現(xiàn)象,剩下的 20% 的語言現(xiàn)象在處理的時候,會遇到各種新的問題。
如果有足夠多的數(shù)據(jù),就能解決很多的問題。他們用統(tǒng)計學、神經(jīng)網(wǎng)絡的方法,能夠對數(shù)據(jù)進行建模和訓練,這也是一種很好的解決問題的方式。但是,很多時候有數(shù)據(jù)涵蓋不了的一些現(xiàn)象和問題無法解決。
對不同的應用,知識表示的方式也可能不同。知識表示和業(yè)務是密切相關的。
她認為,在語言學科的定位上,重要的是如何把語言知識和計算機更好地融合在一起。它們需要一個比較好的規(guī)范標準,在規(guī)范的情況下做建設?,F(xiàn)在語言學的發(fā)展很快,很多學科都需要進行交叉。
在人才培養(yǎng)方面,首先,他們必須結合最新、最前沿的知識,結合產(chǎn)業(yè)界最新的技術。其次在設計課程的時候,他們最好也設計語言智能的課程體系。在設計課程的時候,要結合相關學科的基礎課程,多學科的交叉領域也是非常需要的。最后,進行本碩博貫通的培養(yǎng)方式。這樣不僅會有比較強的體系,還能在各個階段提供一個支撐性銜接的平臺,真正達到人才培養(yǎng)的目的。
中國中文信息處理學會副理事長、秘書長孫樂:要解決關鍵問題,而不是追逐熱門技術
關于語言學領域的工作,孫樂給與會者們分享了兩個觀點。
第一個觀點是,我們應該不忘初心。很多時候,人們因為人工智能熱去做這些研究,但實際上,我們可能還是要回到語言本身。語言在產(chǎn)生之初改變了整個人類的歷史,正是有了語言,人類的知識才一代一代傳承下來。語言智能是人的核心能力。
所以我們應該意識到語言智能的挑戰(zhàn),它是一個核心的一個挑戰(zhàn),這并不是短期或者簡簡單單就可以實現(xiàn)的,它可能是一個非常艱苦的工作。在做研究的時候,我們不能只追逐熱門技術,還是要去解決一些關鍵的問題。
第二個觀點是,漢語是一門非常有特色的語言。早期的一些研究發(fā)現(xiàn),人的大腦在處理不同的語言時,采用的區(qū)域是不一樣的。在治療一些有不同的語言障礙的病人時,科學家發(fā)現(xiàn),說漢語的病人治療的部位和說英語的病人不一致。從語言特色上看,漢語處理比英語處理難度更大,我們應該多做一些比較性的研究。
模式識別國家重點實驗室副主任,自然語言處理團隊負責人宗成慶:語料標準對于長期的基礎理論研究很重要
談到語言資源的建設,宗成慶提出了三個基本觀點。
一是關于技術理論和標準。漢語是我們的母語,但是中國人對漢語卻拿不出自己的標準。我們要扎扎實實長期地研究漢語本身的特點,先做出一個標準。我們希望有一個漢語國家數(shù)據(jù)庫。作為母語,我們是有條件、也有能力做到這些事情的。
二是我們應該盡快拿出這個標準,這對于長期的基礎理論研究來說是必要的。
三是我們現(xiàn)在做的語料標準更多注重語言本身的一些分析處理。而語言理解除了需要語言本身的知識以外,還有相當一部分是屬于常識性的知識,如果不了解常識,我們很可能還是不能理解句子的意思。
關于教學,他會給中科院的學生布置大作業(yè),以及實現(xiàn)一個項目,實現(xiàn)一個系統(tǒng)。但是,最后他收到的作業(yè)非常糟糕,幾乎所有的學生都是用開源工具做的,并沒有自己的思考,學生離開了開源工具就什么也做不了。我們應該鼓勵學生用自己想出來的方法,而不是開源工具去做實驗。
蘇州大學計算機科學與技術學院副院長張民:我們要發(fā)展學科基礎,建設自然語言處理工程
張民認為,語言學和自然語言處理所要解決的問題不一樣。語言學有它自己的學科研究范圍,沒有義務去解決自然語言處理的問題。
談到工程,談到實際需求,我們需要考慮一個問題,人工智能為什么發(fā)展起來?最重要的原因,是因為產(chǎn)業(yè)的驅動和經(jīng)濟效益。從這一點上來說,我們要感謝產(chǎn)業(yè)界。目前,產(chǎn)業(yè)界和學術界嚴重脫離。很多小公司并不知道自然語言處理是什么,完全是從軟件工程的角度來處理的。
我們要發(fā)展學科基礎,建設自然語言處理工程。到底是語言智能還是語言學智能,到底是語言知識還是語言學知識,這個關系不大。外界對語言知識的期望是包羅萬象,能夠表達所有的常識。所有的知識都是能夠用語言學表達的,但是語言學家只研究語義。
我們自己需要和國家同步努力,人工智能這個學科到底是人工智能還是智能科學技術,這個問題誰也說不清楚。人工智能、語言工程和傳統(tǒng)的工程不一樣,它是發(fā)展的、開放的,不能被明確地定義。學科問題是個大問題,一定要講清楚。
至此,「語言智能學術論壇」圓桌結束。在本次圓桌會議中,嘉賓們對語言知識工程,語言學的研究都紛紛發(fā)表了自己的心得、看法,對于學科建設和人才培養(yǎng)也提出了很多獨到的見解。
加強學術交流,打造智能語言研究橋頭堡
在上午的圓桌結束后,下午還繼續(xù)進行了「語言智能學術論壇」系列學術報告。
在下午的學術報告中,哈爾濱工業(yè)大學李生教授、微軟亞洲研究院周明研究員、中國科學院宗成慶研究員、哈爾濱工業(yè)大學劉挺教授、蘇州大學張民教授、北京大學穗志方教授、北京語言大學張勁松教授、荀恩東教授就語言智能的發(fā)展方向、前沿技術、基礎資源和應用挑戰(zhàn)進行了精彩報告。整場報告干貨滿滿,嘉賓們從語言智能技術到當前發(fā)展趨勢進行了精彩的解讀。數(shù)千名網(wǎng)友通過在線方式觀看了典禮和論壇直播。
今年,為更好地服務國家戰(zhàn)略和北語發(fā)展需求,進一步鞏固并拓展其在語言學及其相關領域的引領地位,更好地支撐“雙一流”建設,北京語言大學舉辦了一系列學術活動,并成立語言智能研究院,旨在將語言智能研究院建設成為國內外權威、具有巨大影響力的人工智能研究機構。 2019 年 5 月,北京語言大學舉辦了「紀念馬希文教授八十誕辰 暨《邏輯·語言·計算——馬希文文選》出版」座談會與學術研討會。而今年 8 月,由中國計算機學會(CCF)、中國中文信息學會(CIPS)聯(lián)合舉辦的第四屆「語言與智能高峰論壇」也將在北京語言大學舉辦。據(jù)悉,語言智能研究院擬于近期啟動團隊組建工作,面向校內外、國內外多種形式招聘著名專家和優(yōu)秀中青年學者加盟研究院。中國中文信息學會名譽理事長,原哈工大黨委書記,國際計算語言學協(xié)會 (ACL) 終身成就獎獲得者李生更是擔任語言智能研究院的名譽院長。
未來,北京語言大學能否成為智能語言研究橋頭堡?相信在不久的將來,北京語言大學語言智能研究院一定能夠在語言知識工程領域做出很多優(yōu)秀的成果,為我國語言智能事業(yè)的發(fā)展做出杰出的貢獻。
雷鋒網(wǎng)雷鋒網(wǎng)
雷峰網(wǎng)版權文章,未經(jīng)授權禁止轉載。詳情見轉載須知。