0
本文作者: 我在思考中 | 2021-11-24 18:31 |
近日EMNLP 2021在多米尼加共和國閉幕,今年EMNLP收到有效投稿3717篇,中國大陸投稿1137篇,接收207篇,接受率為18%。作為NLP四大頂會(huì)之一,EMNLP備受國內(nèi)學(xué)者青睞,投稿量連續(xù)多年超過美國位居榜首。
EMNLP 由國際自然語言學(xué)會(huì)(ACL)下屬的 SIGDAT 數(shù)據(jù)小組創(chuàng)辦,在全球NLP頂會(huì)排行榜上位居第二,會(huì)議質(zhì)量僅次于ACL。比較而言,ACL會(huì)議歷史悠久,兼顧語言探索與經(jīng)驗(yàn)方法,是綜合質(zhì)量最高的會(huì)議;EMNLP更聚焦NLP算法在各個(gè)領(lǐng)域解決方案的學(xué)術(shù)探討,定位更加強(qiáng)調(diào)工程化,二者可謂互補(bǔ)。
隨著AI頂會(huì)投稿量的持續(xù)增長,EMNLP的審稿質(zhì)量和公平性問題成為學(xué)者們關(guān)心的話題。近日,AI科技評(píng)論對(duì)話EMNLP 2021程序主席黃萱菁教授,圍繞EMNLP投稿趨勢,審稿流程與標(biāo)準(zhǔn)、學(xué)生應(yīng)該如何投稿”等話題與之進(jìn)行了交流。
AI科技評(píng)論:EMNLP 2021的審稿流程是怎樣的,您作為程序主席主要負(fù)責(zé)哪些工作?
實(shí)際上EMNLP 2020 結(jié)束后,2021年的籌備工作就已經(jīng)開始了。整整一年下來工作量還是非常大的,尤其是Deadline和錄用前后,是最忙的兩個(gè)時(shí)間段。今年我們有三位共同程序主席,除了我之外,還有倫敦帝國理工學(xué)院的Lucia Specia教授,F(xiàn)acebook高級(jí)研究員Scott Yih。在前期準(zhǔn)備工作上,第一項(xiàng)任務(wù)就是發(fā)布征稿通知,包括確定投稿領(lǐng)域、時(shí)間節(jié)點(diǎn)等具體事項(xiàng)。
在投稿領(lǐng)域上,我們的基本原則是領(lǐng)域范圍要適中,具有多樣性和新穎性。比如機(jī)器學(xué)習(xí)、自然語言處理應(yīng)用近兩年非常熱門,投稿量很大,有些會(huì)議會(huì)拆分成預(yù)訓(xùn)練和分類兩塊小領(lǐng)域。另外,我們也會(huì)拓展一些小眾的前沿領(lǐng)域,比如自然語言處理的倫理和效率,這些領(lǐng)域是需要鼓勵(lì)的,我們希望引導(dǎo)學(xué)者做綠色NLP,做環(huán)境友好的NLP。
征稿通知發(fā)布后,開始邀請(qǐng)高級(jí)領(lǐng)域主席,確定EMNLP委員會(huì)結(jié)構(gòu)。一般小領(lǐng)域會(huì)安排1位領(lǐng)域主席,大領(lǐng)域安排3-4位。先是從世界范圍內(nèi)評(píng)選出一批知名的NLP學(xué)者,然后綜合性別平衡、區(qū)域平衡、學(xué)術(shù)與產(chǎn)業(yè)平衡等指標(biāo)進(jìn)行二次篩選,確保SAC人選的多樣性。在區(qū)域平衡這里,我們覆蓋了三大洲,包括美洲(北美、南美)、亞太(中國、澳大利亞、新西蘭等地區(qū))、歐洲和非洲。然后重新修訂審稿規(guī)范和指南,這是初期準(zhǔn)備階段最重要的一項(xiàng)工作。
征稿流程啟動(dòng)后,從作者投稿、審稿人評(píng)審、author response、最終決策等整個(gè)流程我們都會(huì)介入。按照領(lǐng)域劃分,我們?nèi)怀绦蛑飨?,大概每人分?000份論文左右(共提交3000+篇)。進(jìn)入錄用階段后,AC和SAC會(huì)向我們提交綜合評(píng)價(jià)和推薦意見。在這些評(píng)審結(jié)果中,我們會(huì)重點(diǎn)關(guān)注那些AC和SAC認(rèn)為“可上可下”的論文,也就說,一篇論文是被頂會(huì)收錄,還是進(jìn)入Findings;是入選Findings,還是被拒,這個(gè)主要由我們來決定的。因?yàn)楦呒?jí)領(lǐng)域主席只關(guān)注特定領(lǐng)域,我們能從更全局視角,平衡所有論文的情況。
AI科技評(píng)論:EMNLP如何評(píng)選審稿人和保證審稿質(zhì)量?您如何看待投稿量與審稿人不平衡的問題?
EMNLP 2021有將近4000名審稿人。我們先是參考ACL等其它頂會(huì)創(chuàng)建了一個(gè)9000人的審稿人池子,大概有4000多人接受了審稿邀請(qǐng),然后高級(jí)領(lǐng)域主席根據(jù)其他客觀指標(biāo)做了一些增刪處理,確定了最終的審稿人名單。
我們邀請(qǐng)的審稿人除了NLP領(lǐng)域知名的教授、學(xué)者,還有一些在讀博士生和碩士生,當(dāng)然他們都需要在頂會(huì)上至少發(fā)表3-4篇文章。今年整體評(píng)審下來,我們發(fā)現(xiàn)很多初次評(píng)審的博士生很活躍,審稿質(zhì)量不比其他人差。
其實(shí)不僅是EMNLP,很多頂會(huì)都面臨審稿人緊缺的問題。投稿量每年都在增加,如果不增加審稿人,現(xiàn)有審稿人的工作量和壓力就會(huì)非常大,也會(huì)影響審稿的質(zhì)量。所以在保證專業(yè)能力的基礎(chǔ)上,擴(kuò)大審稿人的評(píng)選范圍是一個(gè)不錯(cuò)的選擇。
今年EMNLP收到3000多篇有效論文,每篇論文會(huì)分配3-4名審稿人。我們會(huì)根據(jù)審稿人所在的高校、職位、論文發(fā)表數(shù)量等指標(biāo)判定其資深程度,然后合理分配審稿人,基本可以保證每篇論文都有資深學(xué)者參與。
對(duì)于評(píng)審質(zhì)量,領(lǐng)域主席會(huì)進(jìn)行人工評(píng)估,推薦一批優(yōu)秀的審稿人。我們也會(huì)采用自動(dòng)化程序評(píng)判審稿質(zhì)量,比如哪篇審稿意見過于簡短,綜合評(píng)價(jià)是否全面等等。另外,審稿人和領(lǐng)域主席也會(huì)評(píng)估論文是不是有潛在的倫理風(fēng)險(xiǎn)。有潛在風(fēng)險(xiǎn)并且作者在論文中沒有給出倫理和影響力聲明的論文會(huì)提交給專門的倫理委員會(huì)評(píng)審,今年接受倫理評(píng)審的論文大概有200多篇。
AI科技評(píng)論:EMNLP如何匹配審稿人與論文?對(duì)于社交媒體上存在的“審稿人不專業(yè)”的質(zhì)疑,您怎么看?
過去很多會(huì)議的論文分配方式都是審稿人自己去競標(biāo),這里面存在的一個(gè)問題就是,審稿人可能會(huì)出于興趣選擇論文,而不是自己的研究方向,這在一定程度上會(huì)影響評(píng)審質(zhì)量。所以近幾年我們?nèi)∠苏撐耐稑?biāo)的方式,利用NLP技術(shù)去自動(dòng)化匹配審稿人和論文。
凡是被邀請(qǐng)的審稿人已經(jīng)發(fā)表了不少頂會(huì)文章,我們采用的NLP算法會(huì)搜集和分析這些文章的標(biāo)題和摘要,并訓(xùn)練出一個(gè)語義表示模型,這樣我們就可以了解審稿人擅長的研究方向。用這些特長再去和投稿論文的摘要做匹配,可以最大限度地避免“不匹配”的問題,提高審稿的公平性。
自動(dòng)分配只是一個(gè)基礎(chǔ),領(lǐng)域主席和高級(jí)領(lǐng)域主席還會(huì)做進(jìn)一步的調(diào)整,剛剛我們提到,一篇論文的審稿人不能全是資歷淺的年輕人,為了兼顧比例平衡,他們會(huì)推薦一些資深學(xué)者,因?yàn)椴煌?jīng)驗(yàn)的審稿人看文章的角度是不一樣的。這項(xiàng)工作之所以由領(lǐng)域主席來負(fù)責(zé),是因?yàn)樗麄兣c審稿人是小同行,更能做出精準(zhǔn)的調(diào)整。
另外,論文作者、審稿人以及領(lǐng)域主席對(duì)于高級(jí)領(lǐng)域主席來說都是公開的,所以他們也會(huì)檢查這些人是否來自同一個(gè)大學(xué)或者存在合作關(guān)系,避免利益沖突的問題??傊?/span>系統(tǒng)自動(dòng)分配結(jié)合領(lǐng)域主席調(diào)整的方式分配論文,基本能夠解決審稿人推薦不對(duì)口,不公平的問題。
AI科技評(píng)論:EMNLP是否存在“SOTA決定論”的現(xiàn)象,就是說只要論文沒有超過現(xiàn)有研究的SOTA就會(huì)被拒掉,或者打低分。您如何看待這種性能指標(biāo)對(duì)論文質(zhì)量的影響?
我們之前在審稿規(guī)范上就有提出不能搞SOTA論,不能因?yàn)檫@項(xiàng)研究沒有超過現(xiàn)有研究的性能就打低分。在這方面,我們首先定義投稿之前三個(gè)月內(nèi)的文章屬于同期工作,作者可能會(huì)不了解。另一方面,如果工作只收錄在arxiv上,也不一定需要進(jìn)行比較,因?yàn)樗粚儆谕性u(píng)議的正式出版物。另外,對(duì)于那些結(jié)果不錯(cuò),數(shù)據(jù)可靠,但方法又不是特別新穎的論文,我們從去年起設(shè)置了Findings類別。所以我們在這方面做了很多的工作,SOTA并不是一個(gè)特別強(qiáng)調(diào)的指標(biāo)。
但存在的一個(gè)問題是,我們設(shè)計(jì)的審稿規(guī)范,不能保證審稿人能夠嚴(yán)格按照規(guī)范去操作,這方面還需要去持續(xù)優(yōu)化。
AI科技評(píng)論:今年字節(jié)跳動(dòng)的一篇ICLR拒稿投了ACL,成了最佳論文,您如何看待這種“轉(zhuǎn)投中稿”的現(xiàn)象?NLP領(lǐng)域四大頂級(jí)會(huì)議,學(xué)生應(yīng)該如何選投,能否給出一些建議?
很多人知道NLP領(lǐng)域有四大頂會(huì)ACL、EMNLP、NAACL和COLING。ACL是公認(rèn)綜合質(zhì)量最高的國際計(jì)算機(jī)語言學(xué)會(huì),語言探索與經(jīng)驗(yàn)方法兼容并收。COLING與ACL類似,是歷史悠久的NLP學(xué)術(shù)會(huì)議,但不屬于ACL協(xié)會(huì)旗下。NAACL偏重?cái)?shù)據(jù)驅(qū)動(dòng)方法,與EMNLP風(fēng)格接近,更符合美國學(xué)者的口味。
早期整個(gè)人工智能,包括自然語言處理都不是很火熱,ACL每年只有幾百篇的投稿量。后來,基于規(guī)則的機(jī)器學(xué)習(xí)方法開始出現(xiàn),自然語言處理領(lǐng)域才開始活躍起來。SIGDAT是ACL協(xié)會(huì)下設(shè)的一個(gè)語言學(xué)數(shù)據(jù)工作組,他們建議創(chuàng)建一個(gè)自然語言處理經(jīng)驗(yàn)方法會(huì)議,也就是EMNLP。
EMNLP對(duì)經(jīng)驗(yàn)方法的定義,包括模型設(shè)計(jì)和實(shí)現(xiàn),語料庫構(gòu)建與標(biāo)注,還有評(píng)價(jià)方法。所以定量實(shí)驗(yàn)和數(shù)據(jù)分析,做得多做得好,更容易受到EMNLP認(rèn)可。我們今年評(píng)選的最佳長、短論文都與數(shù)據(jù)集有關(guān)。
雖然會(huì)議在定位和設(shè)計(jì)上各有特色,慢慢還是會(huì)出現(xiàn)一些同質(zhì)化的傾向。因?yàn)槌薈OLING外,EMNLP、ACL和NAACL都是由ACL組織運(yùn)作的,審稿人、SAC/AC、PC基本來自于同一個(gè)群體,各會(huì)議在審稿要求和規(guī)范方面也會(huì)相互參考和借鑒。所以學(xué)生在投稿的時(shí)候,不見得要緊盯一個(gè)會(huì)議,在DDL之前所有NLP相關(guān)會(huì)議都可以去嘗試。對(duì)于初次投稿的學(xué)生來說,這個(gè)過程中收到的反饋和意見更重要,字節(jié)跳動(dòng)“轉(zhuǎn)投中稿”的事也印證了這個(gè)事情。另外,現(xiàn)在NLP的投稿量越來越多,有了idea和好結(jié)果再不投,可能就被別人搶先了。
AI科技評(píng)論:EMNLP被拒論普遍存在共性問題是什么?您認(rèn)為真正好的論文應(yīng)該具備哪些特質(zhì),能否給學(xué)生一些建議?
整體來看,EMNLP投稿論文的下限相比以前有所提高,因?yàn)樘峤桓袷讲灰?guī)范被拒的情況少了很多。現(xiàn)在存在比較重要的問題是:過于關(guān)注SOTA。很多作者覺得只要我的模型有好的結(jié)果,上傳了coding,就可以發(fā)表了。但對(duì)于一篇真正好的論文來講,模型性能只是一方面。我們更關(guān)注的是作者的研究動(dòng)機(jī),文章的論證邏輯,以及實(shí)驗(yàn)方法的新穎性。
作者要明確地提出科學(xué)問題和解決方法,在這之前,他們需要做好充分的文獻(xiàn)調(diào)研,我們發(fā)現(xiàn),很多作者提出的實(shí)驗(yàn)方法其實(shí)早就被驗(yàn)證過了,所以研究的創(chuàng)新性、新穎性是很關(guān)鍵的。我們還要看作者的邏輯表達(dá),是否能把以往的工作梳理清楚,從分析、研究到驗(yàn)證的整個(gè)過程是否嚴(yán)謹(jǐn),有理論支撐。另外,在實(shí)驗(yàn)環(huán)節(jié),我們不僅看實(shí)驗(yàn)結(jié)果,更關(guān)注設(shè)計(jì)過程是否合理,實(shí)驗(yàn)結(jié)果是否充分可靠。
我經(jīng)常跟自己組里的學(xué)生說,不要覺得科研論文是記敘文,寫在敘事。既然是“論”文,就一定要以說理為主,要以理論和實(shí)驗(yàn)為依據(jù),在有限的篇幅內(nèi)把研究觀點(diǎn)立起來。實(shí)驗(yàn)只是驗(yàn)證結(jié)論的一個(gè)手段,不能只關(guān)注SOTA,從發(fā)現(xiàn)問題到解決問題的邏輯演繹更為重要。
AI科技評(píng)論:EMNLP獲獎(jiǎng)?wù)撐氖侨绾芜M(jìn)行評(píng)選的,今年評(píng)選過程中是否有一些有趣的故事?
其實(shí)獲獎(jiǎng)?wù)撐脑u(píng)選工作在初級(jí)審稿階段就已經(jīng)開始了。審稿人、領(lǐng)域主席到高級(jí)領(lǐng)域主席都會(huì)在審稿表單中推薦最佳論文、,這些建議會(huì)提交給我們進(jìn)行二次篩選,差不多篩選出一半后再提交給最佳論文評(píng)選委員會(huì),由他們做最終的決定。
我印象比較深的是情感分析領(lǐng)域推薦的一篇論文,獲得了今年的最佳短文。當(dāng)時(shí)200多篇論文中,負(fù)責(zé)相關(guān)領(lǐng)域的SAC只推薦了這一篇,也沒有推薦最佳長文。審稿人、領(lǐng)域主席和高級(jí)主席都認(rèn)為這篇是最佳短文的候選。這項(xiàng)研究提出了一個(gè)幽默感知模型CHoRaL,用來檢測Facebook上的消息貼是否幽默。他們收集了 78.5 萬篇與 COVID-19 相關(guān)的帖子,通過從帖子中提取語義詞匯和情感特征,分析社交媒體的幽默表達(dá),還創(chuàng)建了帶標(biāo)簽的大規(guī)模數(shù)據(jù)集。
看了這篇論文后,我們認(rèn)為在深陷疫情漩渦的背景下,從“幽默”角度切入,提高語言理解能力的研究主題非常新穎,多少也有些苦中作樂的意味。因?yàn)榻衲暌咔樵谌蚍秶鷥?nèi)仍造成了不小的沖擊,包括今年EMNLP會(huì)議采用的也是線上線下結(jié)合的方式,很多學(xué)者因?yàn)橐咔闊o法到現(xiàn)場參會(huì)。
AI科技評(píng)論:Findings和ARR的實(shí)施效果如何?今年在審稿方面還做了哪些方面的改進(jìn)?
每年EMNLP會(huì)議都會(huì)總結(jié)往年經(jīng)驗(yàn),做一些新的嘗試和改進(jìn)。比如去年EMNLP提出Findings類別,接收那些不足以被頂會(huì)錄用,但實(shí)驗(yàn)方法有創(chuàng)新,實(shí)驗(yàn)結(jié)果好的論文。今年是引入ARR滾動(dòng)審稿機(jī)制,讓論文投稿和評(píng)審更及時(shí)高效。整體來看,F(xiàn)indings共接收了419篇高質(zhì)量的論文,ARR投稿量截至10月份已經(jīng)有上千篇,并且在明年的ACL、EMNLP等會(huì)議中廣泛使用。
在審稿規(guī)范方面,我們今年重新修訂了短論文的評(píng)審標(biāo)準(zhǔn),以前很多作者抱怨短文的拒稿率太高,可能審稿人覺得研究方法不夠新穎,實(shí)驗(yàn)不夠透徹。今年我們要求短文不能采用長文的評(píng)選標(biāo)準(zhǔn),短論文只要問題聚焦,驗(yàn)證了方法的有效性,即使是階段性的貢獻(xiàn)也是有價(jià)值的。
另外其他會(huì)議也有相應(yīng)的改進(jìn),比如ACL-IJCNLP 2021開設(shè)了審稿人培訓(xùn)系統(tǒng);NAACL 2021改善了倫理評(píng)審機(jī)制,不過這種改進(jìn)都是漸進(jìn)式的。
AI科技評(píng)論:您認(rèn)為碩博生要在頂會(huì)發(fā)表論文,需要掌握哪些能力?
很多學(xué)生都希望在科研上做出一些有影響力的工作。做科研的第一步要學(xué)會(huì)發(fā)現(xiàn)問題。其實(shí),博士與碩士在科研能力的培養(yǎng)和要求上有很大的不同,碩士階段可能我們只需要閱讀大量文獻(xiàn),在前人研究的基礎(chǔ)上去探討一些新問題,但博士生要獨(dú)立地?cái)U(kuò)展一個(gè)新的研究領(lǐng)域,要自己去想idea。
其實(shí)很多時(shí)候,不是研究問題很難找,是我們?nèi)鄙勹b別問題的能力,我經(jīng)常告訴學(xué)生,讀論文要學(xué)會(huì)“挑刺”,你不能順著作者的邏輯,要換個(gè)角度嘗試去反駁它,就像審稿人一樣,要能夠找出這篇論文的優(yōu)缺點(diǎn)、有哪些改進(jìn)的空間,這樣才能在相對(duì)成熟的研究中發(fā)現(xiàn)新問題。另外,我們很多學(xué)生在碩博期間會(huì)去工業(yè)界實(shí)習(xí),除了為將來職業(yè)規(guī)劃做準(zhǔn)備外,從實(shí)際的落地場景中也更容易挖掘一些感興趣的問題。
AI科技評(píng)論:從進(jìn)入NLP領(lǐng)域以來,您的研究方向經(jīng)歷了哪些變化,現(xiàn)在的主要研究方向和成果是什么?
我在讀博的時(shí)候恰好趕上了NLP走向數(shù)據(jù)驅(qū)動(dòng)的機(jī)器學(xué)習(xí)的過程,經(jīng)歷了從一開始的統(tǒng)計(jì)方法,到基于規(guī)則的方法,再到現(xiàn)在的深度學(xué)習(xí)。其實(shí)做科研就是這樣,只要技術(shù)一直在更新,你就要一直去追熱點(diǎn)方向。當(dāng)然如果能夠像Bengio, Hinton那樣引領(lǐng)熱點(diǎn)是最偉大的。我現(xiàn)在的研究方向主要與社會(huì)媒體有關(guān),包括趨勢分析、情感分析、可理解分析以及內(nèi)容推薦。
除了社會(huì)媒體,我們也在做新聞方面的NLP,一開始做這個(gè)方向主要是興趣,我自己就是深度網(wǎng)民,以前經(jīng)常在BBS、天涯,新浪微博這些社區(qū)潛水。當(dāng)然從科研角度來講,社交媒體上有很好的數(shù)據(jù)資源,我們利用這些天然的數(shù)據(jù)訓(xùn)練語言模型,測試它在不同的領(lǐng)域的魯棒性,在遷移學(xué)習(xí)方面有更多探索的空間。
另外,深度學(xué)習(xí)把我們從特征挖掘時(shí)代帶到了結(jié)構(gòu)工程時(shí)代,這個(gè)過程帶來了很多新的問題,比如如何選擇適配特殊任務(wù)特殊數(shù)據(jù)集的結(jié)構(gòu);可理解分析如何增加模型的可信賴性;如何更好地判斷模型是否過擬合等。所以,可解釋性也是我們目前研究的重點(diǎn)方向。
AI科技評(píng)論:您認(rèn)為NLP發(fā)展經(jīng)歷了哪幾個(gè)重要的階段,當(dāng)下的研究趨勢和面臨的瓶頸是什么?
1950 年艾倫·圖靈在《計(jì)算機(jī)與智能》論文中提出機(jī)器翻譯算法,第一次研究了自然語言的形態(tài)學(xué)、句法和語義問題。這項(xiàng)成果被看做是自然語言發(fā)展的源頭。在這之后,如果回溯整個(gè)NLP發(fā)展歷程,大概可以分為三階段;第一個(gè)階段是上個(gè)世紀(jì),NLP在機(jī)器翻譯領(lǐng)域經(jīng)歷了漫長的發(fā)展歷程。第二階段是本世紀(jì)初,基于規(guī)則和數(shù)據(jù)驅(qū)動(dòng)的機(jī)器學(xué)習(xí)技術(shù)開始興起,NLP進(jìn)入蓬勃發(fā)展期;第三階段就是現(xiàn)在以深度學(xué)習(xí)為主的NLP時(shí)代。
細(xì)分下來,目前整個(gè)NLP發(fā)展的熱點(diǎn)趨勢,可以總結(jié)為幾個(gè)關(guān)鍵詞:預(yù)訓(xùn)練,多模態(tài),低資源、低功耗、可解釋,科技向善。大火的GPT-3就是預(yù)訓(xùn)練模型,這項(xiàng)研究獲得了NeurIPS 2020最佳論文,EMNLP-IJCNLP 2019 的最佳論文也與預(yù)訓(xùn)練有關(guān)。之所以成為學(xué)術(shù)熱點(diǎn),主要就是它在ImageNet等大規(guī)模數(shù)據(jù)集上達(dá)到了很高的性能水平。然后是可解釋性,不僅是NLP領(lǐng)域,整個(gè)以深度學(xué)習(xí)為核心的人工智能都面臨模型可解釋的問題,如今AI開始大規(guī)模走向落地,有關(guān)可解釋的研究也越來越緊迫。這些熱點(diǎn)研究方向百花齊放,但現(xiàn)階段都都存在一些難以逾越的瓶頸,比如預(yù)訓(xùn)練在工業(yè)界的落地開銷太大,如何在醫(yī)療、金融等領(lǐng)域發(fā)揮實(shí)際價(jià)值,能否實(shí)現(xiàn)小樣本學(xué)習(xí)等等。
AI科技評(píng)論:EMNLP從最早的興趣小組成為了僅次于ACL的第二大NLP會(huì)議,投稿量也在逐年上漲,華人學(xué)者連續(xù)多年占據(jù)投稿量榜首,您認(rèn)為EMNLP的崛起對(duì)NLP發(fā)展有哪些作用?
不止是EMNLP,我覺得各類NLP頂會(huì)對(duì)自然語言處理的發(fā)展起著重要的引領(lǐng)性作用。從EMNLP來說,我們會(huì)試圖挖掘有價(jià)值的研究,引導(dǎo)學(xué)者形成正確的價(jià)值觀,推動(dòng)NLP的全面發(fā)展。比如通過開設(shè)自然語言處理效率、可解釋性等小眾領(lǐng)域,促進(jìn)研究的多樣性;通過制定各種規(guī)范和指南,影響審稿人和作者的價(jià)值判斷;通過最佳論文評(píng)選,為研究者樹立標(biāo)桿。
另外,今年在會(huì)議安排上,我們邀請(qǐng)了MIT腦與認(rèn)知科學(xué)系的Evelina Fedorenko教授,就大腦的語言系統(tǒng)做相關(guān)主題報(bào)告,他們的工作有助于推動(dòng)NLP與多學(xué)科的交叉融合。同時(shí)我們還邀請(qǐng)澳大利亞查爾斯達(dá)爾文大學(xué)的Steven Bird教授,分享用NLP幫助新西蘭土著居民的科研項(xiàng)目,傳遞科技向善的理念。所以從整個(gè)人工智能圈來講,希望引導(dǎo)學(xué)者利用NLP技術(shù)去做一些真正提升社會(huì)價(jià)值的工作。
下一屆EMNLP程序主席
AI科技評(píng)論了解到,EMNLP組委會(huì)已公布下一屆會(huì)議的程序主席,其中,西湖大學(xué)張?jiān)澜淌?/strong>位列其中,這是自EMNLP成立以來第四位內(nèi)地學(xué)者出現(xiàn)在大會(huì)程序委員會(huì)的行列。
作為國內(nèi)早期從事自然語言處理研究的學(xué)者之一,張?jiān)览蠋?span style="font-size: 15px;letter-spacing: 0.5px;">研究方向側(cè)重自然語言的解析、生成和翻譯、文本挖掘、機(jī)器學(xué)習(xí),已發(fā)表相關(guān)國際期刊論文30余篇,CCF列表 A、B 類國際會(huì)議論文百余篇,獲得過CCF2018中文計(jì)算與自然語言處理青年新銳獎(jiǎng)、SemEval2020(honorable mention)COLING2018和IALP2017最佳論文獎(jiǎng)等獎(jiǎng)項(xiàng)。
盤點(diǎn)EMNLP歷年的組委會(huì)成員,除了張?jiān)篮忘S萱菁教授外,還有字節(jié)跳動(dòng)李航博士、北京大學(xué)萬小軍等國內(nèi)學(xué)者,以及新加坡管理大學(xué)Jing Jiang、德克薩斯大學(xué)Vincent Ng等多名華人學(xué)者出任EMNLP程序主席。
張?jiān)览蠋熑脒xEMNLP2022程序主席,意味著他本人及其團(tuán)隊(duì)的學(xué)術(shù)成就和地位得到了國際同行的認(rèn)可,而越來越多的華人面孔出現(xiàn)國際會(huì)議的組委會(huì)行列,標(biāo)志著我國計(jì)算語言學(xué)和自然語言處理研究領(lǐng)域在國際學(xué)術(shù)舞臺(tái)擁有更多的話語權(quán)。
雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))雷峰網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。