丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
人工智能 正文
發(fā)私信給汪思穎
發(fā)送

0

ACL終身成就獎得主李生:自然語言處理研究的五點體會

本文作者: 汪思穎 2019-01-16 14:39
導語:說人工智能對語言、圖像和語音識別起到翻天覆地的作用,那好像夸張了一點,但是確實,人工智能起到了很大的作用。

雷鋒網(wǎng) AI 科技評論按,近日,北京語言大學語言資源高精尖創(chuàng)新中心與中國中文信息學會聯(lián)合主辦首屆「語言智能與社會發(fā)展」論壇,多名來自教育部、高校、語言學界、機器翻譯界、企業(yè)界的重磅嘉賓出席。會上,ACL 終生成就獎得主、自然語言處理領(lǐng)域泰斗李生教授進行了精彩的發(fā)言,闡述了人工智能對自然語言處理所帶來的突破性改變,以及它的一些局限性。

ACL終身成就獎得主李生:自然語言處理研究的五點體會

李生,哈爾濱工業(yè)大學教授、博士生導師。自然語言處理(NLP)領(lǐng)域?qū)<?、ACL 終身成就獎得主。李生教授先后主持了 10 余項包括原航天工業(yè)總公司、「863」計劃、國家自然科學基金等科研項目,獲得 7 項部級科技進步獎。他自 1985 年開始研究漢英機器翻譯,是我國最早從事該方向研究的學者之一。他帶領(lǐng)團隊研制的漢英機器翻譯系統(tǒng) CEMT-I 于 1989 年成為我國第一個通過技術(shù)鑒定的漢英機器翻譯系統(tǒng),其在機器翻譯技術(shù)及其相關(guān)的句法、語義分析等自然語言處理方向成就卓著,為機器翻譯在中國的發(fā)展做出了開拓性貢獻。

作為中國改革開放以來最早從事自然語言處理研究的學者之一,李生教授除了自身的科研成就以外,更為中國計算機領(lǐng)域培養(yǎng)了一批成就卓著的青年專家,包括 ACL 首位華人主席、百度公司技術(shù)副總裁王海峰博士,微軟亞洲研究院首席研究員周明博士,國家杰青獲得者、蘇州大學計算機學院副院長張民教授等,為中國計算機技術(shù)一代又一代的發(fā)展貢獻了力量。

以下為李生教授發(fā)言內(nèi)容:

大家都談到語言和人工智能的關(guān)系,我是搞自然語言處理的,我深切地領(lǐng)會到從 16 年開始真正掀起的第三次人工智能熱潮。說人工智能對語言、圖像和語音識別起到翻天覆地的作用,那好像夸張了一點,但是確實,人工智能起到了很大的作用。

比如說圖像識別,現(xiàn)在由于有了深度學習,有了多層人工神經(jīng)網(wǎng)絡(luò)之后,我們在這方面的成果確實突飛猛進,包括現(xiàn)在的刷臉技術(shù),基本上已經(jīng)用在很多地方了,如車站、碼頭、機場、無人售貨商店等。神經(jīng)網(wǎng)絡(luò)解決了一個很大的問題,以往進行特征提取時,需要通過人工提取,難度很大,有了深度學習之后,機器自動提取特征,難度相應(yīng)減小。其他如語音識別、機器翻譯也都突飛猛進,深度學習在這當中起到了很大的作用。我覺得在圖像識別、語音識別和自然語言處理當中,機器翻譯算得上是難度最大的一個研究方向。

所以我想談幾點體會:

第一,語言智能是人工智能的最高層次或者最高階段,語言智能在未來人工智能的應(yīng)用上有著舉足輕重的作用。

我對語言智能的理解就是,它是自然語言處理(NLP)和自然語言理解(NLU)的人工智能化,這應(yīng)該是人工智能的最高層次。很多人說目前這個時代,CV 在人工智能中唱主角,未來可能會由 CV 轉(zhuǎn)成 NLP,NLP 要唱主角。

大家常說,比爾蓋茨說過一句話,「自然語言處理是人工智能皇冠上的一顆明珠」。這句話不是比爾蓋茨說的,當時我們在劉挺老師課題組關(guān)于情感分析的一個會上,微軟亞洲研究院常務(wù)副院長周明博士說了這句話,周明說由他來說分量不夠,想算成我說的,我說這樣不行,然后他就把這句話移到比爾蓋茨身上了。大家現(xiàn)在知道了,這句話的真正出處不在比爾蓋茨。

NLP 的目標是實現(xiàn)自然語言與機器語言的連續(xù)交互。人講的語言,無論是漢語、俄語、日語,都屬于自然語言,機器能夠識別的叫機器語言,現(xiàn)在的交互,既有人和人的交互,也有人和機器的交互。我們的目標是實現(xiàn)自然語言與機器語言之間的理解、轉(zhuǎn)換與生成,這也是為什么我認為語言智能是人工智能的最高層次。

語言和文字是人類區(qū)別于其他動物的至關(guān)重要的標志,我覺得它對人類社會目前發(fā)展至少起到兩方面作用。一是大家的協(xié)同合作,比如在座各位教授不同課題組之間的合作,例如合作協(xié)議也是用語言文字記下的。第二就是代與代之間的文化傳承,這也是靠文字。我擔任中文信息學會理事會理事長時,有些少數(shù)民族沒有文字,只有語言,這非??上?。

我談的第二個觀點就是自然語言處理的核心問題(或難度最大的問題)是機器翻譯。

機器翻譯分為三個階段:第一個階段是基于規(guī)則的機器翻譯。那個階段會先把文章中打亂的句子變成單詞,之后再查字典,然后進行翻譯,翻譯之后,可能中文跟英文并不完全對應(yīng),需要再按照語法規(guī)則進行調(diào)整,最主要是調(diào)序的問題。第二個階段是基于統(tǒng)計的機器翻譯,在 15、16 年之前,我們都是使用這個方法。第三個階段是最近幾年的基于多層人工神經(jīng)網(wǎng)絡(luò)的深度學習機器翻譯。

機器翻譯在近些年間,在這三個階段其實有兩個重大的變化,一是語法上的,喬姆斯基的生成語法理論,第二就是深度學習。原來大家一直對語義分析犯愁,但是深度學習已經(jīng)開始對語義分析進行探險,大家知道詞嵌入的方法,現(xiàn)在把詞向量再進一步發(fā)展到句子向量,含有語義信息了。在處理過程中,對于單語種,比如說詞匯的語義信息,可以把語義相近的靠在一起,不同語種的源語言和目標語言的分布式處理辦法,也可以把源語言和目標語言語義相近的一起靠。這個雖然不能說從根本上解決問題,但是減輕了人對語義分析很大的憂愁。

第三個問題就是機器翻譯的難點和重點。

我很頭疼的是科學性和藝術(shù)性,如藝術(shù)性的規(guī)律怎么總結(jié)出來。另外,自然語言具有高度開放性和高度靈活性。在開放性上,如網(wǎng)絡(luò)出現(xiàn)以后,新詞不斷涌現(xiàn),例如粉絲這個詞匯。在靈活性方面,可以自己隨便去組詞,這些新組成的詞也很讓人頭疼。

語義理解說白了就是對說話人意圖的理解。意圖理解與上下文有關(guān)系,但是語言本身存在歧義性和多樣性,另外,語言高度依賴知識,大家都知道常識知識,例如煤球是黑的,元宵是白的,小孩子常說,「地球人都知道」,但是機器不知道。另外還有領(lǐng)域知識,上下文、語言、環(huán)境等都會影響對語義的準確理解。實際上在多對多的翻譯中,根據(jù)當前的語境找出一種最為合適的譯文,我覺得這是個難題。

第四個問題,人工智能也好,機器智能也好,人類對他們有個共同要求——學習和求解問題的能力。

人的學習是沒問題的,回顧一下,人在小時候可能是憑感性認識,或者直接學習比較多??吹揭恢回垼瑡寢寱嬖V你這是只貓,會給你留下印象,你會抽象出概念。到了公園看到老虎,老虎和貓長得差不多。小孩會問,這是不是也是貓,媽媽就告訴你,這不是貓,這是老虎。怎么區(qū)別老虎和貓呢?最起碼老虎的個頭比貓大。小孩子他不一定能記太多,記住這個就基本上會區(qū)分了。

對于學習,人一開始通過感性認識,即感知,進行自主學習,到了一定階段,他就從家長的不斷教導、老師講的課程或者從媒體上接觸新東西,不斷積累知識,這是間接知識。

前面這種學習方法叫無監(jiān)督學習,后面這種學習方法叫監(jiān)督學習。人的學習是小樣本學習,將無監(jiān)督學習和監(jiān)督學習結(jié)合起來,而機器現(xiàn)在需要依賴大量標注數(shù)據(jù)來進行學習,即監(jiān)督學習,例如前面描述的圖像識別,就是通過大量的標注圖像不斷學習。機器學習相對于人的學習來說,受限太多。

有人說我們現(xiàn)在走在感知到認知的路上,在感知問題上,不能說大的問題基本上解決,但已經(jīng)解決了一部分。在認知階段,形成對語義的深層理解難度還比較大,這是計算機下一步要發(fā)展的。

人工智能突飛猛進,解決了很多過去想都不敢想的關(guān)鍵問題,但這只是初步的,它還有好多解決不了的致命問題,比如方才所說的常識知識,以及思考和邏輯推理的問題,這對機器學習也是一種制約。我們?nèi)祟愑辛酥R之后,可以不斷推理和思考,但是人工智能現(xiàn)在還不具備思維和推理能力,特別是不具備前面說的常識性知識。

我的觀點就是,如果不能解決常識性問題和邏輯推理,要想實現(xiàn)通用人工智能或者機器認知,就會非常困難?,F(xiàn)在的研究應(yīng)該在這方面多下些功夫。雖說現(xiàn)在也有思考對語義的理解,比如 18 年 10 月,谷歌推出了 BERT 雙向編碼語言模型,但這個模型消耗的資源代價還是比較高的。

另外,深度學習確實解決了人工智能的很多問題,但是除了深度學習之外,還可以探討其他人工智能的算法和模型。我們需要做更多的深度的理論研究和探討,掌握好核心技術(shù)。理論深入之后才能有技術(shù),有了技術(shù)之后才能有算法和模型。

最后一個問題就是大家常談到的問題,過去也說了很多。「機器會消滅人類」,「機器將取代人」,尤其是以不久前去世的霍金為代表的許多人主張這一觀點。我從來就持相反的觀點,我認為機器代替不了人。

現(xiàn)在的人工智能還只是弱人工智能,不是強人工智能,也不是超強人工智能?,F(xiàn)在人工智能的作用,還是用機器代替簡單的、重復(fù)的以及危險性的勞動,想要解決找不到規(guī)律的問題,人工智能還不能做到,也代替不了人。人要盡量用好機器這個助手,自如地運用好機器,這樣既可以提高工作效率,也可以保證質(zhì)量。

今天大家談到外語教學,我覺得人工智能對外語老師和外語專業(yè)的學生都不會有太大的影響。低水平淘汰是自然規(guī)律,例如講不好的,沒有科研能力的教師,該淘汰就得被淘汰。原來大家爭論最多的是醫(yī)生,說醫(yī)生要被淘汰,醫(yī)生與教師一樣,是很難被淘汰的。醫(yī)療影像診斷還得靠水平高的醫(yī)生來看。

包括我前面說的翻譯,也是一樣,我覺得最好的翻譯、最好的教師和醫(yī)生,一定是那些對人工智能系統(tǒng)或者教育機器深入了解,能運用自如的人。把這些作為輔助手段,水平會越來越高,效果會越來越好。不是誰淘汰誰的問題,機器永遠是人的工具。

附語言智能與社會發(fā)展論壇 2018 宣言:語言智能與外語教育協(xié)同發(fā)展

序言

近年來,機器翻譯等語言智能技術(shù)迅猛發(fā)展,并開始在輿論中對人工外語服務(wù)形成沖擊。一時間,語言智能技術(shù)落地、外語教育存廢及投入多寡等,成為社會熱議的話題,也成為國家教育規(guī)劃和技術(shù)規(guī)劃中亟需面對的問題。

原則

本論壇相信:

1.語言智能技術(shù)的發(fā)展將極大地推進人類進步,社會應(yīng)當張開雙臂擁抱語言智能,支持語言智能的發(fā)展,適應(yīng)語言智能的發(fā)展,最大限度地從語言智能的發(fā)展中獲取社會效益,最大限度地避免語言智能對社會產(chǎn)生的副作用。

2.語言和語言學習是人之所以為人、提升智力和大腦功能的關(guān)鍵。語言智能也不是單純的機器智能,而是以人類語言能力為基礎(chǔ)、實現(xiàn)增強與互聯(lián)的深度人機結(jié)合的綜合智能行為。語言智能在其發(fā)展歷程中也離不開語言學的基礎(chǔ)支撐。因而在技術(shù)發(fā)展、專業(yè)教育等方面,不應(yīng)輕視人類語言知識、語言能力的根本作用。

本論壇堅持:

1.作為工具的語言智能技術(shù)無法替代外語從業(yè)者,但對不掌握智能工具的外語從業(yè)者會帶來沖擊。

2.語言智能發(fā)展應(yīng)以人為本,以公眾福祉為目標,應(yīng)尊重社會倫理和科技倫理,承擔起社會責任。

3.外語教育(包括第二語言教育)應(yīng)與時俱進,將語言智能的挑戰(zhàn)作為轉(zhuǎn)型發(fā)展的契機。堅持語言教育的工具性、人文性的雙重屬性,重視語言運用能力、跨文化交際能力和文化包容心的教育,重視語言智能技術(shù)的學習與應(yīng)用,培養(yǎng)不同文化間的穿行者。

倡議

我們需要冷靜地、理性地預(yù)測機器翻譯等語言智能技術(shù)的發(fā)展未來,科學估量它在翻譯事務(wù)當中將發(fā)揮的作用,有效幫助國家制定符合實際的外語發(fā)展規(guī)劃,幫助外語從業(yè)者做好心理準備,主動適應(yīng)新形勢。

本論壇倡議,外語教育面對語言智能時代的沖擊和挑戰(zhàn),為自身發(fā)展和學生前途計,應(yīng)當全力適應(yīng)人機共存的語言生活形態(tài),充分利用語言工具的革命性變化,革新教學范式和人才培養(yǎng)路徑,增強受教育者智能工具的使用能力,幫助其過好智能時代的外語生活。

機器翻譯等語言智能技術(shù)的發(fā)展和實踐,不應(yīng)也不可能謀求全面替代人類的外語能力,在公共宣傳、科普演示中,語言智能學界和產(chǎn)業(yè)界應(yīng)當實事求是地報告語言智能的發(fā)展現(xiàn)實,不夸大語言智能技術(shù)的現(xiàn)有性能,不做缺乏科學依據(jù)的展望,不能對人類的外語工作造成恐慌,不能對人類的外語事業(yè)規(guī)劃造成形勢誤判。

語言智能的發(fā)展秉承以人為中心的發(fā)展觀,不斷向更深層次與更廣范圍的人機互助、人機共處前進,使之成為進一步提升人類語言能力和溝通能力、凝聚社群心靈、融會世界知識的工具。語言智能與外語教育協(xié)同發(fā)展,共同進步,助力人類命運共同體的形成。

呼吁語言智能界、倫理學界及社會有關(guān)界別及有識人士,成立“語言智能倫理委員會”,保證語言智能在符合人類倫理的框架內(nèi)發(fā)展,劃定語言智能技術(shù)應(yīng)用的道德邊界和法律邊界。

雷鋒網(wǎng)雷鋒網(wǎng)

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

ACL終身成就獎得主李生:自然語言處理研究的五點體會

分享:

編輯

關(guān)注AI學術(shù),例如論文
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說