丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
人工智能 正文
發(fā)私信給叢末
發(fā)送

0

獨(dú)家專訪華為諾亞方舟劉群:從 26 年學(xué)術(shù)生涯到執(zhí)掌華為語(yǔ)音語(yǔ)義團(tuán)隊(duì)

本文作者: 叢末 2019-08-06 18:15
導(dǎo)語(yǔ):文末附劉群教授獲 ACL2019 最佳長(zhǎng)論文獎(jiǎng)感言!

ACL 2019 剛剛落下帷幕,想必大家對(duì)于今年 ACL 的意大利風(fēng)情以及火熱程度記憶猶新,其中最令人印象深刻的則要數(shù) 8 篇 ACL 2019 最佳論文出爐的高光時(shí)刻,其中,劉群教授團(tuán)隊(duì)更是一舉拿下了最佳長(zhǎng)論文獎(jiǎng),連同最佳短論文獎(jiǎng)、2 篇杰出論文獎(jiǎng)的華人一作一起,在 ACL 2019 上一展華人風(fēng)采。

2018 年 7 月,愛(ài)爾蘭都柏林城市大學(xué)教授、自然語(yǔ)言處理和機(jī)器翻譯領(lǐng)域?qū)<覄⑷赫郊尤肴A為諾亞方舟實(shí)驗(yàn)室的消息,引起了學(xué)術(shù)、工業(yè)兩界的不小轟動(dòng)。而將時(shí)間維度再往前推 6 年,劉群教授的頭銜前綴是「中國(guó)科學(xué)院計(jì)算技術(shù)研究所自然語(yǔ)言處理研究組負(fù)責(zé)人」,他在計(jì)算所 20 年的學(xué)界職業(yè)經(jīng)歷,開啟了他在機(jī)器翻譯領(lǐng)域深耕的大門,也成為他在回憶研究生涯時(shí)的第一扇門。

日前,AI 科技評(píng)論有幸對(duì)劉群教授進(jìn)行了專訪,主要就他在學(xué)術(shù)界長(zhǎng)達(dá) 26 年的研究經(jīng)歷、加入華為諾亞方舟實(shí)驗(yàn)室的的契機(jī)、其執(zhí)掌的語(yǔ)音語(yǔ)義團(tuán)隊(duì)的整體布局和未來(lái)規(guī)劃以及對(duì)于自然語(yǔ)言處理的發(fā)展現(xiàn)狀和未來(lái)發(fā)展方向的看法,進(jìn)行了一次深度對(duì)話。

獨(dú)家專訪華為諾亞方舟劉群:從 26 年學(xué)術(shù)生涯到執(zhí)掌華為語(yǔ)音語(yǔ)義團(tuán)隊(duì)

劉群,1989 年畢業(yè)于中國(guó)科學(xué)技術(shù)大學(xué)計(jì)算機(jī)系,1992 年于中國(guó)科學(xué)院計(jì)算技術(shù)研究所獲得碩士學(xué)位,2004 年于北京大學(xué)獲得博士學(xué)位。2012 年 7 月之前,他是中國(guó)科學(xué)院計(jì)算技術(shù)研究所的研究員和自然語(yǔ)言處理研究組負(fù)責(zé)人。2012 年 7 至 2018 年 6 月,劉群任都柏林城市大學(xué)教授、愛(ài)爾蘭 ADAPT 研究中心(前身 CNGL 研究中心)自然語(yǔ)言處理主題負(fù)責(zé)人。2018 年 7 月,他正式加入華為諾亞方舟實(shí)驗(yàn)室,任語(yǔ)音語(yǔ)義首席科學(xué)家,主導(dǎo)語(yǔ)音和自然語(yǔ)言處理領(lǐng)域的前沿研究和技術(shù)創(chuàng)新。

他是自然語(yǔ)言處理和機(jī)器翻譯領(lǐng)域的國(guó)際著名專家,他的研究方向包括多語(yǔ)言信息處理、機(jī)器翻譯模型、方法與評(píng)價(jià)等。他最初領(lǐng)導(dǎo)研制的 ICTCLAS 開源系統(tǒng)是應(yīng)用最廣泛的中文詞語(yǔ)切分和詞性標(biāo)注工具,該項(xiàng)成果獲得中國(guó)中文信息學(xué)會(huì)錢偉長(zhǎng)中文信息科學(xué)技術(shù)獎(jiǎng)一等獎(jiǎng)。他領(lǐng)導(dǎo)的研究組在基于句法的機(jī)器翻譯領(lǐng)域開展了長(zhǎng)期的研究工作,其中代表性成果包括樹到串模型、最大熵轉(zhuǎn)錄語(yǔ)法模型、基于森林的機(jī)器翻譯方法等。

劉群教授在自然語(yǔ)言處理頂級(jí)會(huì)議和期刊上發(fā)表論文 60 余篇,迄今為止被引用 6900 余次(GoogleScholar),相關(guān)成果獲得了北京市科學(xué)技術(shù)二等獎(jiǎng)和國(guó)家科技進(jìn)步二等獎(jiǎng),并授權(quán)給很多企業(yè)推廣應(yīng)用。他組織承擔(dān)和重點(diǎn)參與了國(guó)家自然科學(xué)基金、八六三計(jì)劃、愛(ài)爾蘭科學(xué)基金會(huì)、歐盟第七框架和 H2020 框架等眾多大型科學(xué)研究項(xiàng)目。劉群教授已培養(yǎng)碩士博士研究生 40 余人,很多學(xué)生已成為一些大學(xué)自然語(yǔ)言處理和機(jī)器翻譯領(lǐng)域的活躍研究人員和一些大型互聯(lián)網(wǎng)企業(yè)的機(jī)器翻譯團(tuán)隊(duì)的負(fù)責(zé)人。

在學(xué)術(shù)界的那些年:從默默無(wú)聞到國(guó)際知名

在對(duì)自己迄今為止的自然語(yǔ)言處理研究生涯的回顧中,劉群教授分享了很多故事,而這些故事,要從他 1989 年進(jìn)入中科院計(jì)算所就讀研究生開始說(shuō)起。

默默無(wú)聞的早期研究之路

1989 年至 1992 年,是劉群教授的研究生階段。剛進(jìn)入計(jì)算所的時(shí)候,他的導(dǎo)師是張祥老師,也就是當(dāng)時(shí)計(jì)算所二室的主任,之后分到了陳肇雄老師領(lǐng)導(dǎo)的機(jī)器翻譯課題組。正是在此期間,他對(duì)計(jì)算語(yǔ)言學(xué)和機(jī)器翻譯的研究產(chǎn)生了濃厚的興趣,由此走上了機(jī)器翻譯這一研究方向,并且在以后的研究工作也一直集中在該領(lǐng)域,從未離開過(guò)。

碩士畢業(yè)后,陳肇雄老師從計(jì)算所二室獨(dú)立出來(lái),成立了計(jì)算所機(jī)器翻譯中心,而當(dāng)時(shí)的劉群還是一個(gè)初出茅廬的研究人員,他選擇了留在計(jì)算所二室,開始獨(dú)立開展機(jī)器翻譯研究,并選擇了漢英機(jī)器翻譯這一具體的研究課題。而在此期間,他與北京大學(xué)計(jì)算語(yǔ)言學(xué)研究所展開了合作,并由此與其后來(lái)的博士導(dǎo)師俞士汶老師結(jié)緣。

從畢業(yè)到 1998 年,劉群領(lǐng)導(dǎo)的研究團(tuán)隊(duì)與北大的合作項(xiàng)目初見成效,漢英機(jī)器翻譯系統(tǒng)參加 863 專家組組織的中文信息處理與智能人機(jī)接口技術(shù)評(píng)測(cè)取得了較好的成績(jī),劉群的研究工作也迎來(lái)了一次小的高潮。

1999 年至 2004 年,是劉群的博士階段,他繼續(xù)在漢英機(jī)器翻譯這條研究軌道上深耕。而值得一提的是,在此期間,國(guó)際上的機(jī)器翻譯研究發(fā)生了較大的變化,其中一個(gè)最大的變化便是 IBM 公司自 1989 年便開始研究的統(tǒng)計(jì)機(jī)器翻譯方法,這種方法在國(guó)際上經(jīng)過(guò)多年沉寂后,從 1999 年開始流行起來(lái),而國(guó)內(nèi)大部分的研究者還沒(méi)有意識(shí)到這個(gè)變化。

而劉群意識(shí)到這一問(wèn)題的時(shí)間已是 2002 年,當(dāng)時(shí)他參加美國(guó) NIST 的漢英機(jī)器翻譯評(píng)測(cè),結(jié)果讓其大失所望,也使其意識(shí)到了統(tǒng)計(jì)機(jī)器翻譯方法與傳統(tǒng)的規(guī)則方法相比所具有的明顯優(yōu)勢(shì),開始轉(zhuǎn)到了統(tǒng)計(jì)方法上來(lái)。

而這一年也被劉群教授視作其研究生涯的一個(gè)重要轉(zhuǎn)折點(diǎn):研究方式從傳統(tǒng)的規(guī)則方法過(guò)渡到統(tǒng)計(jì)方法,由此在之后的幾年時(shí)間內(nèi)取得了一系列突破性成果,工作成果從默默無(wú)聞開始在機(jī)器翻譯領(lǐng)域嶄露頭角。而他本人也在這一段時(shí)間獲得了博士學(xué)位,并不久就在計(jì)算所評(píng)上了研究員(相當(dāng)于教授),完成了作為一個(gè)研究人員身份的轉(zhuǎn)變。

工作成果開始在機(jī)器翻譯界嶄露頭角

2005 年,劉群教授領(lǐng)導(dǎo)的團(tuán)隊(duì)在 NIST 評(píng)測(cè)中獲得了第五名的成績(jī),并且在這一年,他的學(xué)生第一次在 ACL 上發(fā)表了論文。對(duì)于當(dāng)時(shí)還較為沉寂的中國(guó)自然語(yǔ)言處理和機(jī)器翻譯研究界而言,劉群教授的這些成果算是為中國(guó)的自然語(yǔ)言處理和機(jī)器翻譯在國(guó)際舞臺(tái)上露了一次臉。

劉群教授感慨道:「在此之前國(guó)內(nèi)基本上只有微軟亞洲研究院在 ACL 有一些成果,但那個(gè)時(shí)候微軟亞研在國(guó)內(nèi)是非常高大上的,他們可以從世界各地聘來(lái)最頂尖的研究人員,同時(shí)高薪聘請(qǐng)國(guó)內(nèi)最資深的教授和最聰明的年輕人,并給這些研究人員提供最好的研究條件,這讓國(guó)內(nèi)的大學(xué)和研究機(jī)構(gòu)都望塵莫及。那時(shí)國(guó)內(nèi)高校和研究機(jī)構(gòu)基本上沒(méi)有人能夠在 ACL 上發(fā)表論文,然而我的課題組連續(xù)兩年發(fā)表了三篇論文(2006 年又在 ACL 上發(fā)表了兩篇論文),并且我們還在 NIST 評(píng)測(cè)中取得了第五名的成績(jī),而前四名都是這一領(lǐng)域知名的研究機(jī)構(gòu),并且互相之間有很多的交流和合作。而我們?cè)诋?dāng)時(shí)國(guó)際交流比較少、國(guó)內(nèi)外開源工具都非常有限的情況下,獨(dú)立做出這樣的成果是非常難得的,所以當(dāng)時(shí)無(wú)論在國(guó)內(nèi)還是在國(guó)際上的影響,都比較大?!?/p>

而這些成果的取得,很大程度上還是源于劉群教授開始啟用統(tǒng)計(jì)方法來(lái)研究機(jī)器翻譯的遠(yuǎn)見。

另外在 2002 年開始用統(tǒng)計(jì)方法做機(jī)器翻譯到 2005 年在國(guó)際舞臺(tái)上取得成績(jī)期間,劉群教授還做了一些比較有影響力的工作,其中一項(xiàng)便是基于統(tǒng)計(jì)方法做中文分詞,取得了國(guó)內(nèi)最好的成績(jī),并且,他還將這一工具進(jìn)行了開源,緩解了這個(gè)研究領(lǐng)域的瓶頸問(wèn)題,提升了整個(gè)國(guó)內(nèi)中文自然語(yǔ)言處理和機(jī)器翻譯領(lǐng)域的研究水平。

劉群教授談到,也就是從這幾年開始,他在自然語(yǔ)言處理和機(jī)器翻譯領(lǐng)域的工作開始具有了較大的影響力,獲得了該領(lǐng)域較大的關(guān)注。

離開計(jì)算所,任職都柏林城市大學(xué)

就劉群教授看來(lái),其職業(yè)生涯比較重要的轉(zhuǎn)折點(diǎn)便是 2002 年看到了國(guó)內(nèi)外在機(jī)器翻譯研究上的差距,轉(zhuǎn)而開始使用統(tǒng)計(jì)方法來(lái)研究機(jī)器翻譯,并在此領(lǐng)域開展了一系列深入的研究工作,也由此在該領(lǐng)域產(chǎn)生了比較大的影響力。

而在加入華為開始工業(yè)界的征程之前,劉群教授在學(xué)術(shù)界的職業(yè)生涯還發(fā)生了另一項(xiàng)重大的變動(dòng):于 2012 年離開計(jì)算所,前往都柏林城市大學(xué)任職。

在計(jì)算所任職的那 20 年,除了研究上從默默無(wú)聞到開始在機(jī)器翻譯領(lǐng)域嶄露頭角,劉群教授回憶起來(lái),還用了另外一句話來(lái)做形容,那就是「沒(méi)有盡頭的經(jīng)費(fèi)壓力」。

「我在計(jì)算所帶團(tuán)隊(duì)的時(shí)候壓力非常大,主要是來(lái)自經(jīng)費(fèi)的壓力。當(dāng)時(shí)國(guó)家給我們的經(jīng)費(fèi)大概是工資的百分之二三十,經(jīng)費(fèi)不夠就需要你自己去爭(zhēng)取國(guó)家或者企業(yè)項(xiàng)目掙經(jīng)費(fèi),那段時(shí)間隨著我們的工作影響力逐漸增大,計(jì)算所在各方面給了我很多支持,我的團(tuán)隊(duì)也在逐漸增大,最大的時(shí)候達(dá)到近 30 人,然而維持這個(gè)團(tuán)隊(duì)的經(jīng)費(fèi)是要我們自己去爭(zhēng)取的。結(jié)果好幾次在年終結(jié)算的時(shí)候,我們的經(jīng)費(fèi)都嚴(yán)重超支,幾乎難以為繼。所以很長(zhǎng)一段時(shí)間里,我基本上沒(méi)有心思去做其他的事情,整天就是去找項(xiàng)目做以維持團(tuán)隊(duì)研究開銷?!?/p>

這也成為劉群教授在 2012 年選擇離開計(jì)算所到愛(ài)爾蘭都柏林城市大學(xué)任職的原因之一,而另一個(gè)更重要的原因則是他希望擁有一段國(guó)外科研經(jīng)歷,從而能夠更好地了解和直觀地感受西方國(guó)家的科研體制和從事科學(xué)研究的方式。

「其實(shí)我本人能感受到國(guó)內(nèi)外學(xué)術(shù)科研的差距,因此也一直希望能夠擁有一段國(guó)外科研經(jīng)歷。而在此之前,我最長(zhǎng)的一段國(guó)外科研經(jīng)歷便是曾到紐約大學(xué)訪問(wèn)過(guò)兩個(gè)月,這其實(shí)算不了真正的國(guó)外科研經(jīng)歷,所以我自己也比較遺憾。此外,我的英文不夠好,也不是很有語(yǔ)言天賦的人,因此我認(rèn)為要想提高自己的英文能力,必須要在國(guó)外真正生活一段時(shí)間。

當(dāng)時(shí),都柏林城市大學(xué)和我此前一直有合作的一位老師那邊正好空出一個(gè)教授的崗位,他們通過(guò)獵頭找到我問(wèn)我是否有興趣,我當(dāng)時(shí)也覺(jué)得這是一個(gè)比較好的機(jī)會(huì)。與此同時(shí),這段期間我正好拿到了一個(gè)比較大的項(xiàng)目,經(jīng)費(fèi)足以支撐團(tuán)隊(duì)至少兩三年的時(shí)間,所以當(dāng)時(shí)我就比較放心地將課題組的負(fù)責(zé)權(quán)交給了課題組的其他老師。」

基于這段從國(guó)內(nèi)到國(guó)外的任職經(jīng)歷,劉群教授也指出了相比于國(guó)外,國(guó)內(nèi)科研環(huán)境所存在的一些問(wèn)題,包括:

  • 第一是科研經(jīng)費(fèi)的管理問(wèn)題。正如劉群教授在前面所提到的,經(jīng)費(fèi)壓力乃至生存壓力大的問(wèn)題是國(guó)內(nèi)科研人員(特別是中科院的研究人員)面臨的一大難題,「這一問(wèn)題近些年來(lái)可能有所好轉(zhuǎn),我不太了解現(xiàn)在的情況,但在我當(dāng)年是非常嚴(yán)重的問(wèn)題。另外,我認(rèn)為國(guó)內(nèi)行政權(quán)力對(duì)科研經(jīng)費(fèi)的審批和管理的干預(yù)過(guò)大,也是一個(gè)比較嚴(yán)重的問(wèn)題。而在這方面做得最好的應(yīng)該是自然科學(xué)基金,但是其他一些部門的科研經(jīng)費(fèi)審批和管理中,行政干預(yù)的力度都比較大,我認(rèn)為這是比較不好的一個(gè)方面。」

  • 第二是博士導(dǎo)師資格問(wèn)題?!竾?guó)外高校是沒(méi)有博士導(dǎo)師資格這一說(shuō)的,只要老師本人具有博士學(xué)位,又有科研經(jīng)費(fèi),就可以招收博士生,然而在國(guó)內(nèi),很多優(yōu)秀的年輕老師因?yàn)闆](méi)有導(dǎo)師資格而無(wú)法招收博士學(xué)生,而實(shí)際上剛博士畢業(yè)的年輕老師正處在處在學(xué)術(shù)生命力最旺盛的時(shí)期,然而他們沒(méi)有學(xué)生就無(wú)法很好的開展科研工作,這是國(guó)內(nèi)體制下的一個(gè)不那么合理的規(guī)定?!?/p>

  • 第三是博士生待遇過(guò)低的問(wèn)題?!竾?guó)外的一個(gè)博士生一般情況下可以憑借他的工資養(yǎng)一個(gè)小家庭,然而國(guó)內(nèi)博士生的待遇連自身的基本生活都無(wú)法保障,又怎么讓他們安安心心地搞科研呢?」

  • 第四是國(guó)內(nèi)科研環(huán)境整體比較浮躁的問(wèn)題?!肝艺J(rèn)為相比于國(guó)外而言,國(guó)內(nèi)整體的科研環(huán)境還是有些浮躁和急功近利,具體表現(xiàn)在有很多人著急發(fā)論文,雖然表面上看上去做得很漂亮,但是深究下去會(huì)發(fā)現(xiàn)很多明顯的問(wèn)題。就比如說(shuō)我們?cè)谝恍﹪?guó)際頂會(huì)上,中國(guó)學(xué)者發(fā)表的論文數(shù)量幾乎和美國(guó)差不多了,但是真正有影響力的、原創(chuàng)性的工作相對(duì)來(lái)說(shuō)還比較少。不過(guò)針對(duì)這一點(diǎn)我也不想把問(wèn)題說(shuō)得太嚴(yán)重,因?yàn)閲?guó)內(nèi)科研正在高速發(fā)展,出現(xiàn)一點(diǎn)浮躁現(xiàn)象也在所難免,但希望這種情況在以后得以慢慢改善?!?/p>

在都柏林城市大學(xué)任職 6 年以后,劉群教授的研究生涯又迎來(lái)了第三個(gè)階段:加入華為,正式從學(xué)術(shù)界轉(zhuǎn)到工業(yè)界。

從學(xué)術(shù)界到工業(yè)界:與華為「惺惺相惜」

加入華為存在歷史淵源

2018 年 7 月,劉群教授加入華為,成為 AI 領(lǐng)域?qū)W者跨界工業(yè)界的又一大重磅消息。對(duì)此,劉群教授給出了 4 點(diǎn)原因:

  • 第一,他自身在科研工作中就一直都非常重視應(yīng)用,「包括在培養(yǎng)學(xué)生過(guò)程中,我都非常強(qiáng)調(diào)應(yīng)用意識(shí),雖然很多學(xué)生都會(huì)比較抗拒這一點(diǎn),我認(rèn)為這對(duì)于他們而言是好事而不是壞事,比如現(xiàn)在國(guó)內(nèi)幾個(gè)巨頭企業(yè)的機(jī)器翻譯研究基本都有我的學(xué)生擔(dān)任負(fù)責(zé)人?!?/p>

  • 第二,現(xiàn)在的企業(yè)越來(lái)越注重學(xué)術(shù)性的研究,而不是做純應(yīng)用的研究,這就為學(xué)術(shù)界希望將研究成果付諸應(yīng)用但又不愿意做純應(yīng)用的學(xué)者提供了一個(gè)很好的機(jī)會(huì),所以這一點(diǎn)對(duì)于劉群教授而言,同樣具有很大的吸引力;

  • 第三,企業(yè)能提供高校所望塵莫及的數(shù)據(jù)、算力以及人才資源?!副热缯f(shuō)人才,我在學(xué)校里面帶的學(xué)生是沒(méi)有什么經(jīng)驗(yàn)的,而企業(yè)中的人才實(shí)踐能力非常強(qiáng),很多我在學(xué)術(shù)界無(wú)法實(shí)現(xiàn)的大項(xiàng)目在企業(yè)這里都能夠?qū)崿F(xiàn)?!?/p>

  • 第四,他加入工業(yè)界也有一些個(gè)人原因。「實(shí)際上,我是一個(gè)非常愿意接受挑戰(zhàn)的人,而且我認(rèn)為一個(gè)人的一生要豐富多彩些,老是呆在一個(gè)地方可能會(huì)錯(cuò)過(guò)很多此前沒(méi)見過(guò)的風(fēng)景?!?/p>

那為什么單單選擇加入華為呢?對(duì)于劉群教授給出的答案,我們可以用與華為的「惺惺相惜」來(lái)概括

  • 一方面是華為對(duì)于劉群教授本身的極大認(rèn)可?!肝腋A為之間有長(zhǎng)期合作的歷史淵源。實(shí)際上我以前在計(jì)算所就跟華為有過(guò)合作,而且在我到愛(ài)爾蘭都柏林城市大學(xué)任職以后,華為依舊跑到愛(ài)爾蘭去繼續(xù)跟我合作。我在國(guó)內(nèi)任職的時(shí)候,跟我合作的單位也不少,但是我到愛(ài)爾蘭后還保持跟我合作、并一直持續(xù)合作這么久時(shí)間的,基本上也就數(shù)華為了。所以,經(jīng)過(guò)這么久時(shí)間的合作和互相了解,我很確定華為對(duì)于我個(gè)人能力以及研究方式的認(rèn)可。」

  • 而另一方面,則是劉群教授對(duì)于華為在國(guó)際化和研究理念等方面的認(rèn)可?!甘紫?,我認(rèn)為華為真的是一家國(guó)際化公司,而它的這種國(guó)際化都是靠自己一步步打下來(lái)的,既體現(xiàn)在業(yè)務(wù)布局的全球化,也體現(xiàn)在人才的國(guó)際化。其中,華為為了吸引和招攬全球當(dāng)?shù)貎?yōu)秀的科學(xué)家而直接將研究機(jī)構(gòu)建設(shè)到當(dāng)?shù)厝サ淖龇ê陀^念,我認(rèn)為非常有意思也非常先進(jìn)?,F(xiàn)在有很多國(guó)內(nèi)企業(yè)也在國(guó)外建立研究機(jī)構(gòu),比如說(shuō)百度和騰訊都在美國(guó)建立了當(dāng)?shù)氐难芯繖C(jī)構(gòu),但是鮮有公司像華為一樣,在歐洲、加拿大、俄羅斯等國(guó)家都設(shè)立當(dāng)?shù)匮芯繖C(jī)構(gòu)的。其次,華為對(duì)于基礎(chǔ)研究是非常重視的,也投入了非常多的資金去做基礎(chǔ)研究,當(dāng)然現(xiàn)在還不是那種純理論的基礎(chǔ)研究,但是相對(duì)于其他公司而言,華為在基礎(chǔ)研究的投入以及實(shí)力都是較高的。」

在加入華為之后,劉群教授在工作內(nèi)容和工作方式等方面無(wú)疑也會(huì)面臨著一些轉(zhuǎn)變,用他的話來(lái)說(shuō),便是挑戰(zhàn)與機(jī)遇并存。

  • 挑戰(zhàn)主要體現(xiàn)在研究范圍和管理的團(tuán)隊(duì)規(guī)模都更大了?!肝以趯W(xué)術(shù)界主要是集中做機(jī)器翻譯,幾乎不會(huì)完全脫離機(jī)器翻譯這個(gè)研究領(lǐng)域,而我現(xiàn)在負(fù)責(zé)的語(yǔ)音語(yǔ)義實(shí)驗(yàn)室,除了機(jī)器翻譯以外,還涉及到在自然語(yǔ)言處理技術(shù)在工業(yè)界方方面面的應(yīng)用,包括語(yǔ)音、對(duì)話、問(wèn)答等等。與此同時(shí),我目前領(lǐng)導(dǎo)的團(tuán)隊(duì)有 70 多個(gè)人,而我原來(lái)帶的團(tuán)隊(duì)最多的時(shí)候都不到 30 人。這是目前對(duì)于我而言,挑戰(zhàn)比較大的地方?!?/p>

  • 而與之對(duì)應(yīng)的機(jī)遇則是,華為為其研究所提供的平臺(tái)支持。「原來(lái)我在學(xué)術(shù)界所無(wú)法實(shí)現(xiàn)的很多有趣的想法,在華為提供的算力、數(shù)據(jù)、研究隊(duì)伍等方面的支持下,我都能夠一一去嘗試。這是讓我感覺(jué)非常幸福的一件事?!?/p>

諾亞方舟實(shí)驗(yàn)室的整體布局和未來(lái)規(guī)劃

自 2012 年成立至今,華為諾亞方舟實(shí)驗(yàn)室一直以來(lái)都是一個(gè)相對(duì)低調(diào)的存在。在本次采訪中,劉群教授也跟我們聊了聊其負(fù)責(zé)的諾亞方舟語(yǔ)音語(yǔ)義實(shí)驗(yàn)室的整體布局以及未來(lái)規(guī)劃。

諾亞方舟語(yǔ)音語(yǔ)義實(shí)驗(yàn)室整體布局主要為三大塊:語(yǔ)音、對(duì)話和翻譯。而除此之外,現(xiàn)在實(shí)驗(yàn)室還有一個(gè)比較重要的研究方向——多模態(tài)。他指出,隨著深度學(xué)習(xí)等技術(shù)的引入,自然語(yǔ)言處理技術(shù)與計(jì)算機(jī)視覺(jué)等其他技術(shù)從完全隔離的狀態(tài)逐漸走向互相打通,多模態(tài)也從不可能走向易于實(shí)現(xiàn),并且未來(lái)還會(huì)有很大的研究空間,因而實(shí)驗(yàn)室對(duì)于該研究方向也非常重視。

而談到實(shí)驗(yàn)室未來(lái)的規(guī)劃,劉群教授表示,除了以上四個(gè)方向,他還在主導(dǎo)實(shí)驗(yàn)室抓另一研究方向,即語(yǔ)言模型。「它其實(shí)是自然語(yǔ)言處理的一項(xiàng)基礎(chǔ)技術(shù),針對(duì)這一研究方向,我們目前正在從事的一項(xiàng)具體的研究工作,叫做預(yù)訓(xùn)練語(yǔ)言模型,近期實(shí)驗(yàn)室也投入了很多的力量來(lái)深耕這個(gè)方向,因?yàn)槲覀兿M軌蛟谶@一非?;A(chǔ)的工具上占據(jù)先導(dǎo)地位?!?/p>

與此同時(shí),加強(qiáng)國(guó)際人才合作也是實(shí)驗(yàn)室在今后非常重視的一個(gè)方面?!冈诩夹g(shù)研發(fā)上,我們并不是任何事情都要自主去做,而是希望能夠借助外腦,跟世界上最好的研究者合作,然后對(duì)他們予以最大的支持去開展科研項(xiàng)目。」

針對(duì)國(guó)際合作,我們也聊到了當(dāng)下的中美摩擦是否會(huì)對(duì)華為的國(guó)際科研合作造成影響,劉群教授非??隙ǖ鼗卮穑翰粫?huì)。他表示,中美摩擦其實(shí)屬于特殊情況,包括美國(guó)在內(nèi)的世界范圍內(nèi)的絕大多數(shù)科學(xué)家其實(shí)都反對(duì)美國(guó)的這一行為,雖然現(xiàn)在中國(guó)和美國(guó)的科研合作出現(xiàn)一些問(wèn)題,但中國(guó)與其他國(guó)家之間幾乎不會(huì)出現(xiàn)這種情況,因而當(dāng)前美國(guó)與華為的沖突會(huì)更多地影響到產(chǎn)品供貨方面,而科研方面的國(guó)際交流很大程度上都是通過(guò)公開發(fā)表學(xué)術(shù)論文和開放源代碼等形式進(jìn)行的,因此限制合作的影響相對(duì)來(lái)說(shuō)小得多,幾乎不會(huì)影響甚至?xí)龠M(jìn)華為與美國(guó)以外地區(qū)的國(guó)際合作。

NLP 當(dāng)前發(fā)展超出預(yù)期,未來(lái)又將走向何處?

劉群教授作為自然語(yǔ)言處理領(lǐng)域的領(lǐng)先專家,AI 科技評(píng)論與他的對(duì)話自然免不了談到自然語(yǔ)言處理目前的發(fā)展現(xiàn)狀以及未來(lái)發(fā)展方向。

當(dāng)問(wèn)及如何看待自然語(yǔ)言處理目前的發(fā)展現(xiàn)狀,劉群教授表示:超出預(yù)期。「我以前基于規(guī)則研究機(jī)器翻譯的時(shí)候,覺(jué)得有很多問(wèn)題都太難了,有生之年都不一定能看到這些問(wèn)題得以解決,但是現(xiàn)在,很多問(wèn)題都被很好地解決了。因此以前一些我不敢去做的研究,比如說(shuō)語(yǔ)義問(wèn)題,我現(xiàn)在都可以考慮去做了?!?/p>

同時(shí),劉群教授還指出了近年來(lái)自然語(yǔ)言處理領(lǐng)域出現(xiàn)的兩大革命性成果:一個(gè)是神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)的出現(xiàn)變革了自然語(yǔ)言處理研究的范式,把自然語(yǔ)言處理問(wèn)題的定義和求解從離散的符號(hào)域搬到了連續(xù)的數(shù)值域,導(dǎo)致整個(gè)問(wèn)題的定義和所使用的數(shù)學(xué)工具與以前完全不同,使得該領(lǐng)域發(fā)生了極具革命性的變化;第二個(gè)是從去年開始出現(xiàn)的預(yù)訓(xùn)練語(yǔ)言模型,能夠一定程度上實(shí)現(xiàn)「一個(gè)模型包打天下」,能夠解決自然語(yǔ)言處理領(lǐng)域相關(guān)的所有問(wèn)題,由此就克服了此前一個(gè)問(wèn)題就要設(shè)計(jì)一套方法的難題,將該領(lǐng)域研究提升到了一個(gè)新的水平。

而關(guān)于自然語(yǔ)言處理未來(lái)的研究方向,劉群教授認(rèn)為語(yǔ)義問(wèn)題是今后值得重點(diǎn)關(guān)注的研究方向。

他指出,語(yǔ)言問(wèn)題一般分為兩類,一類是形式問(wèn)題,一類是語(yǔ)義問(wèn)題(即意義問(wèn)題),目前神經(jīng)網(wǎng)絡(luò)能夠比較好地解決形式問(wèn)題,但是語(yǔ)義問(wèn)題還是一個(gè)待攻克的難題。而語(yǔ)義問(wèn)題中最難的地方,實(shí)際上是對(duì)現(xiàn)實(shí)世界進(jìn)行建模,而現(xiàn)實(shí)世界有包括物理世界(客觀世界)和主觀世界。

以物理世界為例,其實(shí)我們用語(yǔ)言來(lái)描述一個(gè)物理世界是一種非常粗糙的建模,因此自然語(yǔ)言處理即便從語(yǔ)料庫(kù)中學(xué)到了某個(gè)東西的相關(guān)語(yǔ)言描述,但它依舊無(wú)法理解某個(gè)東西在物理世界中呈現(xiàn)的樣子。但人不一樣,我們每個(gè)人腦子里都有一個(gè)世界模型,根據(jù)一句話就能在腦海中想象出這句話在物理世界或主觀世界中的呈現(xiàn)面貌。

對(duì)現(xiàn)實(shí)世界建模在具體的自然語(yǔ)言處理研究方向上,包括兩個(gè)部分:一是讓自然語(yǔ)言處理研究與知識(shí)圖譜結(jié)合,嘗試圖神經(jīng)網(wǎng)絡(luò)、概率圖模型等新的研究方向,將圖與語(yǔ)言結(jié)合起來(lái)研究;二是在自然語(yǔ)言處理研究中結(jié)合多模態(tài),實(shí)現(xiàn)語(yǔ)言、視覺(jué)等多種模態(tài)的互通。

「目前我的很多研究工作都在往這個(gè)方向走,也認(rèn)為未來(lái)幾年會(huì)有一些成果出來(lái),但是這一研究方向具體的實(shí)現(xiàn)程度以及何時(shí)能夠達(dá)到一個(gè)理想的狀態(tài),我目前還不敢說(shuō),因?yàn)槲夷壳斑€很難想象到一個(gè)機(jī)器能夠完全跟人一樣,對(duì)現(xiàn)實(shí)世界中的萬(wàn)事萬(wàn)物都有一個(gè)認(rèn)知和理解?!?/p>

給后輩研究者的經(jīng)驗(yàn)分享和建議

無(wú)論是作為一位科學(xué)家在自然語(yǔ)言處理領(lǐng)域的研究工作上,還是作為一位教育者在培育人才方面,劉群教授都可以說(shuō)是結(jié)出了累累碩果,對(duì)于后輩研究者,能從他身上借鑒的經(jīng)驗(yàn)自然很多,其中非常重要的一點(diǎn)便是從研究問(wèn)題出發(fā)、熱于擁抱新技術(shù)的科研品質(zhì),而這一點(diǎn)更是劉群教授一直堅(jiān)持的一套研究方法論。

一方面,一直以來(lái)我做研究的一個(gè)特點(diǎn)就是從問(wèn)題出發(fā),這跟很多研究者強(qiáng)調(diào)方法的研究思路不一樣,因此在研究工作中,我最大的目標(biāo)就是解決問(wèn)題,而不在乎用什么方法,這也讓我形成了一個(gè)很好的心態(tài),就是非常愿意擁抱新技術(shù),比如我一開始用規(guī)則方法在機(jī)器翻譯領(lǐng)域深耕,發(fā)現(xiàn)統(tǒng)計(jì)方法的優(yōu)勢(shì)后,我很快就轉(zhuǎn)向統(tǒng)計(jì)方法,后來(lái)神經(jīng)網(wǎng)絡(luò)方法出現(xiàn)后,為機(jī)器翻譯提供了全新的視角和可能性,我又轉(zhuǎn)到神經(jīng)網(wǎng)絡(luò)方法來(lái)研究機(jī)器翻譯。無(wú)論是從規(guī)則方法轉(zhuǎn)到統(tǒng)計(jì)方法,還是從統(tǒng)計(jì)方法轉(zhuǎn)到神經(jīng)網(wǎng)絡(luò)方法,都是研究方法上的巨大變化,在早期新的研究方法效果還不是很明朗的時(shí)候,這種轉(zhuǎn)移是比較困難,而且需要冒較大風(fēng)險(xiǎn)的。但我總是能夠比較敏銳地意識(shí)到這種新方法在解決問(wèn)題上的優(yōu)勢(shì),從而比較早地實(shí)現(xiàn)這種轉(zhuǎn)移,因此也能較早地做出一些有影響力的成果。

另一方面,我從來(lái)不去做填坑式的研究。所謂填坑式的研究,就是一旦機(jī)器學(xué)習(xí)領(lǐng)域提出一種新的方法,總有人很快把這種新方法在各種 NLP 問(wèn)題上都刷一遍,然后宣稱自己是第一個(gè)用某種方法來(lái)解決某個(gè)問(wèn)題的人。我的研究都有比較強(qiáng)烈的問(wèn)題背景,目的是為了解決某個(gè)具體問(wèn)題,有比較明確的 insight,而不是為了采用某種方法去做一個(gè)研究。在我看來(lái),只要能解決問(wèn)題,不管采用什么方法,不管采用的方法是否時(shí)髦,都是好的研究?!?/p>

與此同時(shí),基于目前國(guó)內(nèi)整體較為浮躁的科研現(xiàn)狀,劉群教授也特別針對(duì)后輩研究者強(qiáng)調(diào)了一點(diǎn):切勿急于求成!

「現(xiàn)在有些學(xué)生都在急著提出一個(gè)新的想法,然而這些想法實(shí)際上并沒(méi)有什么影響力,就算發(fā)表了論文也沒(méi)有什么太大的意義。相比之下,一些雖小但存在實(shí)際價(jià)值的想法反而以后可能成為重要、有影響力的研究方向,這是很難說(shuō)的的。所以我建議他們還是要多去看看問(wèn)題,而不是一開始就著急去看一大堆論文,在沒(méi)有抓住問(wèn)題的本質(zhì)的情況下就去嘗試去提出新的東西。」

附:獲 ACL 2019 最佳長(zhǎng)論文獎(jiǎng)感言

針對(duì)劉群教授本次獲得 ACL 2019 最佳長(zhǎng)論文獎(jiǎng)這一重磅獎(jiǎng)項(xiàng),AI 科技評(píng)論也第一時(shí)間向劉群教授表示了祝賀,并邀請(qǐng)他為大家分享了獲獎(jiǎng)感言:

這次獲獎(jiǎng)我們感到非常榮幸,感謝大會(huì)對(duì)我們工作的高度認(rèn)可。這篇論文的主要工作是對(duì)神經(jīng)機(jī)器翻譯中長(zhǎng)久以來(lái)一直存在的暴露偏差問(wèn)題提出了一種有效的解決辦法。


論文的第一作者是我在中科院計(jì)算所的博士生張文,他今年剛剛通過(guò)博士答辯,這個(gè)工作是他的博士論文工作之一。說(shuō)實(shí)話,張文同學(xué)入學(xué)時(shí)的基礎(chǔ)并不很強(qiáng),不過(guò)通過(guò)他在讀博這些年的刻苦努力,研究能力和學(xué)術(shù)水平都有了大幅度提高,近兩年來(lái)發(fā)表了多篇高水平的學(xué)術(shù)論文,這次獲獎(jiǎng)也是實(shí)至名歸。


論文的第二作者馮洋老師,是現(xiàn)在中科院計(jì)算所自然語(yǔ)言處理研究組組長(zhǎng),也就是我原來(lái)的計(jì)算所課題組如今的負(fù)責(zé)人,她對(duì)這篇論文也付出了大量的心血。而馮洋老師原來(lái)也是我的博士生,她博士畢業(yè)后在英國(guó)、美國(guó)做過(guò)多年博士后研究,后來(lái)回國(guó)又分別在百度公司和清華大學(xué)各工作過(guò)一段時(shí)間,在學(xué)術(shù)界和企業(yè)界都有豐富的研究經(jīng)歷,此外她也在 ACL、EMNLP 等頂級(jí)會(huì)議上發(fā)表過(guò)很多篇高水平論文。此次獲獎(jiǎng)更是對(duì)她的研究水平和團(tuán)隊(duì)領(lǐng)導(dǎo)能力的有力證明。


非常感謝張文同學(xué)和馮洋老師,也感謝其他合作者。


與此同時(shí),我也非常高興看到我原來(lái)的課題組在馮洋老師帶領(lǐng)下能夠再次取得這樣出色的成績(jī)。而諾亞方舟實(shí)驗(yàn)室目前也正在跟馮洋老師啟動(dòng)一個(gè)合作項(xiàng)目,并期待與計(jì)算所的合作能夠取得更豐碩的成果。

(完)   雷鋒網(wǎng)雷鋒網(wǎng)雷鋒網(wǎng) 

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

獨(dú)家專訪華為諾亞方舟劉群:從 26 年學(xué)術(shù)生涯到執(zhí)掌華為語(yǔ)音語(yǔ)義團(tuán)隊(duì)

分享:
相關(guān)文章
當(dāng)月熱門文章
最新文章
請(qǐng)?zhí)顚懮暾?qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說(shuō)