0
雷鋒網(wǎng) AI 科技評論按:7 月 29 日,ACL 2019 進入正會第一天,密集的論文演講、海報展示即將開始。今天的佛羅倫薩依然涼爽。(28 日 Tutorial 日的有趣見聞請見這篇文章)
上午 8 點 30,ACL2019 開幕式在大禮堂舉行。(我們早早到達現(xiàn)場,占一個好位子)
ACL2019 大會主席 Lluís Màrquez 首先上臺,從參會人數(shù)角度介紹了本屆 ACL 的會議概況。本屆 ACL 的注冊參會人數(shù)達到了 3160 人,比去年增加一倍還有余(有趣的是 ACL2018 的參會人數(shù)比之前兩年都要少)。
在網(wǎng)上購買 ACL2019 參會門票時可以告知主辦方自己感興趣參與的 workshop 和 tutorial,如今這些數(shù)據(jù)統(tǒng)計出來,workshop 和 tutorial 都有好幾個場次的參與人數(shù)同時超過了此前。這都展示出了這個領域的快速發(fā)展以及研究人員們的積極參與。
Lluís Màrquez 介紹 ACL2019 大會組委會成員、感謝工作人員和各級別贊助商,以及感謝在會議籌備組織過程中給與建議和幫助的其它 NLP 頂會的主席后,由大會副主席 Anna Korhonen 與 David Traum 介紹論文接收情況。
意料之中地,ACL2019 的論文數(shù)量也大幅增長,論文投稿數(shù)量從 ACL2018 的 1544 篇接近翻番到了今年的 2905 篇,共接收 660 篇論文,其中 447 篇長論文、213 篇短論文;總接受率為 22.7%,其中長論文接受率為 25.7%,短論文接受率為 18.2%。雷鋒網(wǎng) AI 科技評論記者猜測這可能是因為有許多論文作者都抱著試一試的心態(tài)向 ACL2019 投稿短論文,讓短論文的競爭變得更激烈了。隨著論文數(shù)量增長,審稿人的數(shù)量也從 1610 增加到了 2281,領域主席(Area Chair)的數(shù)量更是從 61 增加到了 230。
實際上審稿人和 AC 的數(shù)量并不是簡單增加而已,根據(jù) ACL2019 組委會介紹,為了應對如此之多的論文投稿,ACL 從 2018 年開始也采用了資深領域主席(Senior AC)+領域主席(AC)的雙層結構,今年由 46 位 SAC 為 AC 分配論文和審稿人、為對應的領域做出一些整體性的推薦,184 位 AC 中的每位則只負責各自領域內(nèi)的一部分論文,然后組織審稿人們進行討論、為審稿意見撰寫意見(meta-review),并做出論文選擇推薦。這樣的做法也是為了嘗試彌補這個正在快速發(fā)展的領域中必定會出現(xiàn)的問題:缺少學識和經(jīng)驗豐富的審稿人。在雙層結構下,每個 AC 負責的論文數(shù)量更少,他們就可以更多地關注審稿過程。在數(shù)據(jù)上的體現(xiàn)就是,相對于 ACL2018,審稿人的數(shù)量增加不多,但 AC 的數(shù)量增加了接近三倍。
更多的論文需要更長的審稿時間,針對這一點,ACL2019 也采取了一些措施來加快審稿過程,包括取消論文選擇過程(不再讓 AC 選擇自己自己感興趣的論文來審)、取消作者回復階段(這當然也引起了一些爭議,ACL2019 中做出的權衡是讓 AC 花更多時間參與到審稿和討論過程中,也讓 PC 更多參與討論)、采用了更簡潔快速的審稿流程。與其它會議(比如 2019 年的 NAACL、EMNLP-IJCNLP)的舉辦時間沒能拉開足夠間隔給 ACL2019 的審稿過程增加了一些額外的麻煩;實際上論文作者們自己也希望不同會議之間能間隔得久一點,能夠有時間把被拒的論文做修改后再投下一個會議。ACL 也希望未來不同學術會議之間可以多考慮一下協(xié)調舉辦日期,給各個環(huán)節(jié)的學者和工作人員們都留下更充沛的時間。
不同領域的投稿數(shù)量分布和 ACL2018 類似,沒有占據(jù)特別高比例的領域,前 5 高的領域是信息提取和文本挖掘、機器翻譯、機器閱讀、對話和交互系統(tǒng)、文本生成。給人驚喜的是,有一些領域有很明顯的增長,投稿數(shù)量比 ACL 2018 增加了好幾倍,比如文本生成,以及語言學理論、認知建模以及心理語言學。
不同領域論文的接受率略有區(qū)別??梢哉f競爭最激烈的領域是文檔分析(Document Analysis,18.5%接受率)、句子級別語義(Sentence-level Semantics,19.8%)、信息抽取和文本挖掘(Information Extraction and Text Mining 20.6%)、詞級別語義(Word-level Semantics,20.7%)、以及音韻學,形態(tài)學和單詞分割(Phonology, Morphology and Word Segmentation,20.9%),這幾個領域的論文接受率都很低。
ACL 的慣例是早早公布最佳論文候選名單,并在正會最后的頒獎環(huán)節(jié)揭曉各個論文獎項,今年也不例外。今年共有八個論文獎項,包含一篇最佳長論文、一篇最佳短論文、五篇杰出論文、一篇最佳 Demo 論文。候選名單可以在 http://www.acl2019.org/EN/nominations-for-acl-2019-best-paper-awards.xhtml 查看,獎項名單在 31 日晚揭曉后我們也將第一時間為大家?guī)硐ⅰ?/p>
最后,三位本地組織主席向大家介紹了會議場館情況、餐飲安排、信息查詢方式,以及邀請大家參與 30 日的晚宴。
這張圖大概最好地概括了本屆 ACL 的規(guī)模,以及從一個角度展現(xiàn)了大會組委會、AC & PC、審稿人們的辛苦勞動。我們應當向他們感謝、致敬。
會議與論文情況介紹完畢后,ACL 學會主席、微軟亞洲研究院副院長周明博士帶來了一場全體演講,演講主題是「ACL/NLP 的光明未來」。
演講內(nèi)容分為兩部分,ACL 學會的工作狀況匯報,以及 NLP 技術發(fā)展概覽。
在第一部分中,周明談到「ACL 學會的發(fā)展史就印證了 NLP 領域的發(fā)展史」,如今隨著 NLP 領域的發(fā)展壯大,ACL 也已經(jīng)有了 EACL、NAACL、AACL 三個分會,都積極推動著 NLP 整個領域的進步。
接著,周明介紹了 ACL 學會的職責、目前的執(zhí)行委員會成員情況,以及 2018 年當選的 5 位 ACL Fellow。
周明接下來介紹了目前遇到的「憂」和「喜」。
「憂」在于,不同國家和地區(qū)的論文接受程度有明顯的高低之分,這顯示出了發(fā)展的不平衡;以及,快速大幅增長的論文投稿數(shù)量為審稿過程帶來了許多挑戰(zhàn),ACL 學會馬上就會召開特別會議討論如何應對這個問題。
「喜」,則是在亞太地區(qū)有大量 NLP 相關的學術組織,他們組織了大量的學術會議、夏令營、教學講座,極大程度地推動了亞太地區(qū)學者們的 NLP 水準發(fā)展,
近幾年有數(shù)屆 ACL 會議在亞太地區(qū)召開。來自亞太地區(qū)的 ACL 學會成員比例,2018 時也相比 2013 年有了顯著提高。
2018 年,ACL 的亞太地區(qū)分部 AACL 也已經(jīng)宣告成立,在服務亞太地區(qū) 57 個國家和地區(qū)的 ACL 成員的同時,更是為亞太地區(qū)的所有 NLP 相關學會提供一個新的橋梁。
ACL 學會最終的目標,是通過更好的成員服務、更多的培養(yǎng)培訓計劃、更多差異化的會議和活動、對缺少資源的語言的更多支持、對代表弱勢群體的學術組織的更多支持、對學術組織和會議的更好的系統(tǒng)建設和協(xié)調,促進 ACL 以及整個 NLP 領域向更均衡、更具包容性、更豐富多彩的方向持續(xù)進步。
在第二部分,周明對深度學習影響下的 NLP 技術進行了大視角的總體介紹?;谏疃葘W習的 NLP 技術已經(jīng)走過了詞嵌入、句子嵌入、帶有注意力的編解碼器模型、Transformer(完全使用注意力)的這四個技術節(jié)點,預訓練模型+針對具體任務的精細調節(jié)也已經(jīng)成為了當前 NLP 實踐的新范式。
下面,周明以富語料任務、低資源任務、多輪對話任務三類典型的任務為例,討論了我們是否應當滿足于當前的技術路線、目前已經(jīng)能看到的問題有哪些。周明最終提出,未來的 NLP 不會只是基于規(guī)則的模型,同樣不會只是基于 DNN 的模型;它應當是可解釋的、有知識的、有道德的、有經(jīng)濟效益的、終生學習的模型。未來,深度學習和語言學研究應該互相幫助,多模態(tài)信息處理也大有可為。
整個 NLP 科研共同體的努力可以具體細化到計算能力、數(shù)據(jù)、模型、人才、合作、應用這六個方面,做出更多的努力,我們也就可以期待擁抱一個更光明的未來。
演講結束后,29 日上午的開幕儀式全部內(nèi)容就結束了。短暫的茶歇后,ACL2019 接受論文的論文演講很快就會在多個不同的會議廳中分別開始。
在過去的一年中,我們見證了谷歌的 BERT 以一己之力刷新了眾多 NLP 任務中的最好成績(SOTA)、成為了新的基準模型并改寫了 NLP 模型的研究風氣,也參與了 OpenAI GPT-2「是生成還是記憶」、「是否夸大了危害」的討論。還有其它許多值得紀念的學術成果和令人印象深刻的實踐方法,我們將在接下來幾天內(nèi)更多地觀察、更多地認識它們,也希望可以和現(xiàn)場的參會學者們一同捕捉、品評未來的學術趨勢走向。各位讀者如果有感興趣的話題和領域,歡迎留下線索,或者留言與我們一同討論。
雷鋒網(wǎng) AI 科技評論報道。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉載。詳情見轉載須知。