0
本文作者: 楊曉凡 | 2019-07-29 22:49 | 專(zhuān)題:ACL 2019 |
雷鋒網(wǎng) AI 科技評(píng)論按:7 月 29 日,ACL 2019 進(jìn)入正會(huì)第一天,密集的論文演講、海報(bào)展示即將開(kāi)始。今天的佛羅倫薩依然涼爽。(28 日 Tutorial 日的有趣見(jiàn)聞?wù)堃?jiàn)這篇文章)
上午 8 點(diǎn) 30,ACL2019 開(kāi)幕式在大禮堂舉行。(我們?cè)缭绲竭_(dá)現(xiàn)場(chǎng),占一個(gè)好位子)
ACL2019 大會(huì)主席 Lluís Màrquez 首先上臺(tái),從參會(huì)人數(shù)角度介紹了本屆 ACL 的會(huì)議概況。本屆 ACL 的注冊(cè)參會(huì)人數(shù)達(dá)到了 3160 人,比去年增加一倍還有余(有趣的是 ACL2018 的參會(huì)人數(shù)比之前兩年都要少)。
在網(wǎng)上購(gòu)買(mǎi) ACL2019 參會(huì)門(mén)票時(shí)可以告知主辦方自己感興趣參與的 workshop 和 tutorial,如今這些數(shù)據(jù)統(tǒng)計(jì)出來(lái),workshop 和 tutorial 都有好幾個(gè)場(chǎng)次的參與人數(shù)同時(shí)超過(guò)了此前。這都展示出了這個(gè)領(lǐng)域的快速發(fā)展以及研究人員們的積極參與。
Lluís Màrquez 介紹 ACL2019 大會(huì)組委會(huì)成員、感謝工作人員和各級(jí)別贊助商,以及感謝在會(huì)議籌備組織過(guò)程中給與建議和幫助的其它 NLP 頂會(huì)的主席后,由大會(huì)副主席 Anna Korhonen 與 David Traum 介紹論文接收情況。
意料之中地,ACL2019 的論文數(shù)量也大幅增長(zhǎng),論文投稿數(shù)量從 ACL2018 的 1544 篇接近翻番到了今年的 2905 篇,共接收 660 篇論文,其中 447 篇長(zhǎng)論文、213 篇短論文;總接受率為 22.7%,其中長(zhǎng)論文接受率為 25.7%,短論文接受率為 18.2%。雷鋒網(wǎng) AI 科技評(píng)論記者猜測(cè)這可能是因?yàn)橛性S多論文作者都抱著試一試的心態(tài)向 ACL2019 投稿短論文,讓短論文的競(jìng)爭(zhēng)變得更激烈了。隨著論文數(shù)量增長(zhǎng),審稿人的數(shù)量也從 1610 增加到了 2281,領(lǐng)域主席(Area Chair)的數(shù)量更是從 61 增加到了 230。
實(shí)際上審稿人和 AC 的數(shù)量并不是簡(jiǎn)單增加而已,根據(jù) ACL2019 組委會(huì)介紹,為了應(yīng)對(duì)如此之多的論文投稿,ACL 從 2018 年開(kāi)始也采用了資深領(lǐng)域主席(Senior AC)+領(lǐng)域主席(AC)的雙層結(jié)構(gòu),今年由 46 位 SAC 為 AC 分配論文和審稿人、為對(duì)應(yīng)的領(lǐng)域做出一些整體性的推薦,184 位 AC 中的每位則只負(fù)責(zé)各自領(lǐng)域內(nèi)的一部分論文,然后組織審稿人們進(jìn)行討論、為審稿意見(jiàn)撰寫(xiě)意見(jiàn)(meta-review),并做出論文選擇推薦。這樣的做法也是為了嘗試彌補(bǔ)這個(gè)正在快速發(fā)展的領(lǐng)域中必定會(huì)出現(xiàn)的問(wèn)題:缺少學(xué)識(shí)和經(jīng)驗(yàn)豐富的審稿人。在雙層結(jié)構(gòu)下,每個(gè) AC 負(fù)責(zé)的論文數(shù)量更少,他們就可以更多地關(guān)注審稿過(guò)程。在數(shù)據(jù)上的體現(xiàn)就是,相對(duì)于 ACL2018,審稿人的數(shù)量增加不多,但 AC 的數(shù)量增加了接近三倍。
更多的論文需要更長(zhǎng)的審稿時(shí)間,針對(duì)這一點(diǎn),ACL2019 也采取了一些措施來(lái)加快審稿過(guò)程,包括取消論文選擇過(guò)程(不再讓 AC 選擇自己自己感興趣的論文來(lái)審)、取消作者回復(fù)階段(這當(dāng)然也引起了一些爭(zhēng)議,ACL2019 中做出的權(quán)衡是讓 AC 花更多時(shí)間參與到審稿和討論過(guò)程中,也讓 PC 更多參與討論)、采用了更簡(jiǎn)潔快速的審稿流程。與其它會(huì)議(比如 2019 年的 NAACL、EMNLP-IJCNLP)的舉辦時(shí)間沒(méi)能拉開(kāi)足夠間隔給 ACL2019 的審稿過(guò)程增加了一些額外的麻煩;實(shí)際上論文作者們自己也希望不同會(huì)議之間能間隔得久一點(diǎn),能夠有時(shí)間把被拒的論文做修改后再投下一個(gè)會(huì)議。ACL 也希望未來(lái)不同學(xué)術(shù)會(huì)議之間可以多考慮一下協(xié)調(diào)舉辦日期,給各個(gè)環(huán)節(jié)的學(xué)者和工作人員們都留下更充沛的時(shí)間。
不同領(lǐng)域的投稿數(shù)量分布和 ACL2018 類(lèi)似,沒(méi)有占據(jù)特別高比例的領(lǐng)域,前 5 高的領(lǐng)域是信息提取和文本挖掘、機(jī)器翻譯、機(jī)器閱讀、對(duì)話和交互系統(tǒng)、文本生成。給人驚喜的是,有一些領(lǐng)域有很明顯的增長(zhǎng),投稿數(shù)量比 ACL 2018 增加了好幾倍,比如文本生成,以及語(yǔ)言學(xué)理論、認(rèn)知建模以及心理語(yǔ)言學(xué)。
不同領(lǐng)域論文的接受率略有區(qū)別??梢哉f(shuō)競(jìng)爭(zhēng)最激烈的領(lǐng)域是文檔分析(Document Analysis,18.5%接受率)、句子級(jí)別語(yǔ)義(Sentence-level Semantics,19.8%)、信息抽取和文本挖掘(Information Extraction and Text Mining 20.6%)、詞級(jí)別語(yǔ)義(Word-level Semantics,20.7%)、以及音韻學(xué),形態(tài)學(xué)和單詞分割(Phonology, Morphology and Word Segmentation,20.9%),這幾個(gè)領(lǐng)域的論文接受率都很低。
ACL 的慣例是早早公布最佳論文候選名單,并在正會(huì)最后的頒獎(jiǎng)環(huán)節(jié)揭曉各個(gè)論文獎(jiǎng)項(xiàng),今年也不例外。今年共有八個(gè)論文獎(jiǎng)項(xiàng),包含一篇最佳長(zhǎng)論文、一篇最佳短論文、五篇杰出論文、一篇最佳 Demo 論文。候選名單可以在 http://www.acl2019.org/EN/nominations-for-acl-2019-best-paper-awards.xhtml 查看,獎(jiǎng)項(xiàng)名單在 31 日晚揭曉后我們也將第一時(shí)間為大家?guī)?lái)消息。
最后,三位本地組織主席向大家介紹了會(huì)議場(chǎng)館情況、餐飲安排、信息查詢(xún)方式,以及邀請(qǐng)大家參與 30 日的晚宴。
這張圖大概最好地概括了本屆 ACL 的規(guī)模,以及從一個(gè)角度展現(xiàn)了大會(huì)組委會(huì)、AC & PC、審稿人們的辛苦勞動(dòng)。我們應(yīng)當(dāng)向他們感謝、致敬。
會(huì)議與論文情況介紹完畢后,ACL 學(xué)會(huì)主席、微軟亞洲研究院副院長(zhǎng)周明博士帶來(lái)了一場(chǎng)全體演講,演講主題是「ACL/NLP 的光明未來(lái)」。
演講內(nèi)容分為兩部分,ACL 學(xué)會(huì)的工作狀況匯報(bào),以及 NLP 技術(shù)發(fā)展概覽。
在第一部分中,周明談到「ACL 學(xué)會(huì)的發(fā)展史就印證了 NLP 領(lǐng)域的發(fā)展史」,如今隨著 NLP 領(lǐng)域的發(fā)展壯大,ACL 也已經(jīng)有了 EACL、NAACL、AACL 三個(gè)分會(huì),都積極推動(dòng)著 NLP 整個(gè)領(lǐng)域的進(jìn)步。
接著,周明介紹了 ACL 學(xué)會(huì)的職責(zé)、目前的執(zhí)行委員會(huì)成員情況,以及 2018 年當(dāng)選的 5 位 ACL Fellow。
周明接下來(lái)介紹了目前遇到的「憂(yōu)」和「喜」。
「憂(yōu)」在于,不同國(guó)家和地區(qū)的論文接受程度有明顯的高低之分,這顯示出了發(fā)展的不平衡;以及,快速大幅增長(zhǎng)的論文投稿數(shù)量為審稿過(guò)程帶來(lái)了許多挑戰(zhàn),ACL 學(xué)會(huì)馬上就會(huì)召開(kāi)特別會(huì)議討論如何應(yīng)對(duì)這個(gè)問(wèn)題。
「喜」,則是在亞太地區(qū)有大量 NLP 相關(guān)的學(xué)術(shù)組織,他們組織了大量的學(xué)術(shù)會(huì)議、夏令營(yíng)、教學(xué)講座,極大程度地推動(dòng)了亞太地區(qū)學(xué)者們的 NLP 水準(zhǔn)發(fā)展,
近幾年有數(shù)屆 ACL 會(huì)議在亞太地區(qū)召開(kāi)。來(lái)自亞太地區(qū)的 ACL 學(xué)會(huì)成員比例,2018 時(shí)也相比 2013 年有了顯著提高。
2018 年,ACL 的亞太地區(qū)分部 AACL 也已經(jīng)宣告成立,在服務(wù)亞太地區(qū) 57 個(gè)國(guó)家和地區(qū)的 ACL 成員的同時(shí),更是為亞太地區(qū)的所有 NLP 相關(guān)學(xué)會(huì)提供一個(gè)新的橋梁。
ACL 學(xué)會(huì)最終的目標(biāo),是通過(guò)更好的成員服務(wù)、更多的培養(yǎng)培訓(xùn)計(jì)劃、更多差異化的會(huì)議和活動(dòng)、對(duì)缺少資源的語(yǔ)言的更多支持、對(duì)代表弱勢(shì)群體的學(xué)術(shù)組織的更多支持、對(duì)學(xué)術(shù)組織和會(huì)議的更好的系統(tǒng)建設(shè)和協(xié)調(diào),促進(jìn) ACL 以及整個(gè) NLP 領(lǐng)域向更均衡、更具包容性、更豐富多彩的方向持續(xù)進(jìn)步。
在第二部分,周明對(duì)深度學(xué)習(xí)影響下的 NLP 技術(shù)進(jìn)行了大視角的總體介紹?;谏疃葘W(xué)習(xí)的 NLP 技術(shù)已經(jīng)走過(guò)了詞嵌入、句子嵌入、帶有注意力的編解碼器模型、Transformer(完全使用注意力)的這四個(gè)技術(shù)節(jié)點(diǎn),預(yù)訓(xùn)練模型+針對(duì)具體任務(wù)的精細(xì)調(diào)節(jié)也已經(jīng)成為了當(dāng)前 NLP 實(shí)踐的新范式。
下面,周明以富語(yǔ)料任務(wù)、低資源任務(wù)、多輪對(duì)話任務(wù)三類(lèi)典型的任務(wù)為例,討論了我們是否應(yīng)當(dāng)滿(mǎn)足于當(dāng)前的技術(shù)路線、目前已經(jīng)能看到的問(wèn)題有哪些。周明最終提出,未來(lái)的 NLP 不會(huì)只是基于規(guī)則的模型,同樣不會(huì)只是基于 DNN 的模型;它應(yīng)當(dāng)是可解釋的、有知識(shí)的、有道德的、有經(jīng)濟(jì)效益的、終生學(xué)習(xí)的模型。未來(lái),深度學(xué)習(xí)和語(yǔ)言學(xué)研究應(yīng)該互相幫助,多模態(tài)信息處理也大有可為。
整個(gè) NLP 科研共同體的努力可以具體細(xì)化到計(jì)算能力、數(shù)據(jù)、模型、人才、合作、應(yīng)用這六個(gè)方面,做出更多的努力,我們也就可以期待擁抱一個(gè)更光明的未來(lái)。
演講結(jié)束后,29 日上午的開(kāi)幕儀式全部?jī)?nèi)容就結(jié)束了。短暫的茶歇后,ACL2019 接受論文的論文演講很快就會(huì)在多個(gè)不同的會(huì)議廳中分別開(kāi)始。
在過(guò)去的一年中,我們見(jiàn)證了谷歌的 BERT 以一己之力刷新了眾多 NLP 任務(wù)中的最好成績(jī)(SOTA)、成為了新的基準(zhǔn)模型并改寫(xiě)了 NLP 模型的研究風(fēng)氣,也參與了 OpenAI GPT-2「是生成還是記憶」、「是否夸大了危害」的討論。還有其它許多值得紀(jì)念的學(xué)術(shù)成果和令人印象深刻的實(shí)踐方法,我們將在接下來(lái)幾天內(nèi)更多地觀察、更多地認(rèn)識(shí)它們,也希望可以和現(xiàn)場(chǎng)的參會(huì)學(xué)者們一同捕捉、品評(píng)未來(lái)的學(xué)術(shù)趨勢(shì)走向。各位讀者如果有感興趣的話題和領(lǐng)域,歡迎留下線索,或者留言與我們一同討論。
雷鋒網(wǎng) AI 科技評(píng)論報(bào)道。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。
本專(zhuān)題其他文章