丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
人工智能 正文
發(fā)私信給叢末
發(fā)送

0

2018 年度 ML、NLP 會議論文大盤點:周明、張潼、孫茂松數(shù)據(jù)亮眼

本文作者: 叢末 2019-01-13 00:13
導語:統(tǒng)計數(shù)據(jù)覆蓋 ACL、EMNLP、COLING、TACL、NeurIPS、ICML、ICLR、 AAAI 等 12 個會議/期刊。

雷鋒網(wǎng) AI 科技評論按:隨著 2018 年的結束,劍橋大學高級研究員 Marek Rei 再度更新了過去一年機器學習和自然語言處理領域的論文發(fā)表統(tǒng)計數(shù)據(jù),本次,他選擇了ACL、EMNLP、NAACL、EACL、COLING、TACL、CL、CoNLL、NeurIPS、ICML、ICLR 以及 AAAI 12 個主要的會議/期刊進行數(shù)據(jù)統(tǒng)計,從會議、作者、第一作者以及組織機構四個維度進行了論文發(fā)表數(shù)量的排名。雷鋒網(wǎng) AI 科技評論編譯如下。

今年,又到了更新過去一年機器學習和自然語言處理領域的論文發(fā)表統(tǒng)計數(shù)據(jù)的時候了。這兩個領域依舊在快速發(fā)展,無論是發(fā)表論文數(shù)量還是參會人員數(shù)量都打破了往年的記錄。今年學術會議界最轟動的事件莫過于「NeurIPS 大會正會門票 11 分鐘售罄」了。在本文中,我將針對這些數(shù)據(jù)提供詳細的統(tǒng)計,顯示在特定會議上作者或者組織機構所發(fā)表論文的數(shù)量。

2018 年,我統(tǒng)計了以下會議/期刊的數(shù)據(jù):ACL、EMNLP、NAACL、EACL、COLING、TACL、CL、CoNLL、NeurIPS、ICML、ICLR 以及 AAAI。這種選擇是為了覆蓋機器學習和語言技術領域論文發(fā)表的最知名和高排名的會議。與去年相比,我去掉了 SemEval,因為它主要關注共享任務相關的論文,而我在其它會議中也沒有統(tǒng)計該領域的論文發(fā)表數(shù)據(jù)。同時,我添加上了 作為頂級會議之一但在過去的排名中被遺漏的 AAAI。NeurIPS(原名為 NIPS)在 2018 年改名了,為了保持名稱的一致性,我在這里將使用最新的名稱。

這個分析是通過我多年來一直在不斷改進的一系列腳本自動完成的。該論文列表抓取自在線會議錄,在那里通常也可以找到作者的姓名。組織機構的名稱則需要直接從 PDF 中提取,這就可能會帶來相當多的噪聲。我開發(fā)了各種方法來檢查各類不同的名稱并對其進行分組,但是如果你在文中發(fā)現(xiàn)了任何剩下的錯誤,請告知我。

雖然這篇文章重點介紹了近年來發(fā)表論文數(shù)最多的研究者和組織機構,但我想指出的是,我不認為論文發(fā)表數(shù)量是一個領域應該追逐或贊揚的東西。如下圖所示,該領域正變得越來越熱門,并且論文數(shù)量的快速增長也伴隨著論文質(zhì)量的參差不齊。寫 1 篇獨具開創(chuàng)性的論文總比發(fā)布 10 篇通通都容易被遺忘的充量性的論文要好。這篇文章旨在從更清晰、更高的視角來看待發(fā)表論文的研究者、組織機構以及他們在各會議上發(fā)表論文的現(xiàn)狀,或許能為有好想法的新的研究者帶來一些靈感。

會議論文發(fā)表數(shù)量排名

首先,我們來看一下所有會議在 2012-2018 年間的論文發(fā)表數(shù)量。大多數(shù)機器學習會議的論文發(fā)表數(shù)量保持繼續(xù)增長,其中 AAAI 和 NeurIPS 超過了 1000 篇論文;EMNLP 和 NAACL 的論文發(fā)表數(shù)量與往年相比也有大幅增長; ACL 和 COLING 的論文發(fā)表數(shù)量則與往年差不多;EACL 在今年沒有舉行;而 TACL 和 CL 的論文發(fā)表數(shù)量多年來一直保持相對平穩(wěn)的狀態(tài)。

2018 年度 ML、NLP 會議論文大盤點:周明、張潼、孫茂松數(shù)據(jù)亮眼

(注:圖中論文發(fā)表數(shù)量為零的點,都表示會議在該年份沒有舉行。)

作者論文發(fā)表數(shù)量排名

接下來,我們來看看 2018 年在這些會議上發(fā)表論文數(shù)量最多的個人作者。其中,有三位作者的論文發(fā)表數(shù)量驚人,為 22 篇,他們分別是周明(微軟)、Graham Neubig(卡耐基梅隆大學)和 Sergey Levine(UC 伯克利)。緊隨其后的是張潼(騰訊 AI,近期離職)、孫茂松(清華大學)和 Iryna Gurevych(達姆施塔特工業(yè)大學),其中,張潼的論文發(fā)表數(shù)為為 21 篇,孫茂松和 Iryna Gurevych 則各自發(fā)表了 20 篇論文。

2018 年度 ML、NLP 會議論文大盤點:周明、張潼、孫茂松數(shù)據(jù)亮眼

從 2012-2018 年的論文發(fā)表總數(shù)來看,Chris Dyer(DeepMind)仍以 97 篇論文位居榜首。緊隨其后的是周明(微軟)、Yoshua Bengio(蒙特利爾大學)、(西湖大學)和 Noah A. Smith(華盛頓大學),發(fā)表的論文總數(shù)分別為 90 篇、84 篇、80 篇、79 篇。大部分作者都明確地偏愛某個領域的會議——要么偏愛 NLP 領域的會議,要么偏愛核心 ML 領域,大概只有 Percy Liang 算是個例外,他對這兩個領域都不偏不倚。

2018 年度 ML、NLP 會議論文大盤點:周明、張潼、孫茂松數(shù)據(jù)亮眼

我們還可以查看每位作者在不同年份發(fā)表的論文數(shù)量。與其他作者相比,Chris Dyer 在 2015、2016 這兩年發(fā)表的論文數(shù)量引人注目,雖然張岳(西湖大學)和周明(微軟)之后也迎頭趕上了。

2018 年度 ML、NLP 會議論文大盤點:周明、張潼、孫茂松數(shù)據(jù)亮眼

第一作者論文發(fā)表數(shù)量排名

然后,來看一下關于第一作者的統(tǒng)計數(shù)據(jù)。前面所提到的作者大部分都是團隊領導者,而通常第一作者才是那個實際執(zhí)行、進行實驗和撰寫論文大部分內(nèi)容的人。這類作者當中的佼佼者當屬 Yi Tay(南洋理工大學),他就讀博士三年級,2018 年以第一作者在幾個重要大會上共發(fā)表 10 篇優(yōu)秀的論文。之后是微軟研究院的朱澤園,以第一作者共發(fā)表 6 篇論文。緊隨其后的是 Mikel ArtetxeJiatao Gu(香港大學),Dinghan Shen(杜克大學)和 Nathan Kallus(康奈爾大學),他們以第一作者各發(fā)表 5 篇論文。

2018 年度 ML、NLP 會議論文大盤點:周明、張潼、孫茂松數(shù)據(jù)亮眼

再看看 2012-2018 年的論文發(fā)表總量,李紀為(香儂科技)發(fā)表了 22 篇一作論文。其后是朱澤園(微軟)、Young-Bum Kim(亞馬遜)、Ryan Cotterell(劍橋大學)和 Ivan Vuli?(劍橋大學),其中朱澤園以第一作者發(fā)表的論文數(shù)量為 18 篇,Young-Bum Kim、Ryan Cotterell 、Ivan Vuli? 均為 17 篇。

2018 年度 ML、NLP 會議論文大盤點:周明、張潼、孫茂松數(shù)據(jù)亮眼

組織機構論文發(fā)表數(shù)量排名

接著,看一下關于組織機構的統(tǒng)計數(shù)據(jù)。和前兩年一樣,2018 年 CMU 再度位居榜首,其在 NLP 和核心 ML 兩個領域發(fā)表的論文數(shù)量旗鼓相當。谷歌和微軟依舊是業(yè)界領導企業(yè),緊隨其后的是清華大學、斯坦福大學、北京大學、MIT 和伯克利大學。

2018 年度 ML、NLP 會議論文大盤點:周明、張潼、孫茂松數(shù)據(jù)亮眼

此排名中,中國上榜的組織機構有清華大學、北京大學、中國科學院大學、中國科學院、上海交通大學以及香港中文大學,其中清華大學位列第四,北京大學位列第六,中國科學院大學位列第九,中國科學院位列第十一,上海交通大學以及香港中文大學則分別排在第十六、第二十四。

我們再來看一下 2012-2018 年的組織機構排名,情況類似。CMU 仍然占據(jù)榜首,微軟和谷歌分列占據(jù)第二、第三的寶座。普林斯頓大學、法國國家信息與自動化研究所(INRIA)、杜克大學的關注度似乎主要聚焦在核心 ML 領域,它們在 NLP 領域發(fā)表的論文幾乎沒有。與他們相反,清華、中科院和愛丁堡大學則主要聚焦于語言應用領域,在 NeurIPS/ICML 會議上發(fā)表了大量論文。

2018 年度 ML、NLP 會議論文大盤點:周明、張潼、孫茂松數(shù)據(jù)亮眼

從下圖的時間線來看,我們可以看到 CMU 多年來都保持了大量的論文輸出,且論文輸出數(shù)量仍在繼續(xù)增長。谷歌和微軟競爭激烈,不過目前看來谷歌似乎稍占上風。清華、北大等中國的大學目前的論文輸出數(shù)量也正在劇烈增長。

2018 年度 ML、NLP 會議論文大盤點:周明、張潼、孫茂松數(shù)據(jù)亮眼

主題分類

最后,我對作者和組織機構進行了主題分類。我收集了與特定作者/組織機構相關的所有論文,將它們轉換為小寫并進行令牌化(tokenized),然后用 LDA 處理,并用 t-SNE 對這些論文進行可視化。排名靠前的論文字符實體可視化效果非常好,顯示了他們的論文內(nèi)容與圖中其他論文內(nèi)容的相似度。

2018 年度 ML、NLP 會議論文大盤點:周明、張潼、孫茂松數(shù)據(jù)亮眼

2018 年度 ML、NLP 會議論文大盤點:周明、張潼、孫茂松數(shù)據(jù)亮眼

以上就是今年機器學習和自然語言處理領域的論文發(fā)表統(tǒng)計數(shù)據(jù)及排名。如果你在文中發(fā)現(xiàn)了任何錯誤,或者你對明年的文章有什么建議,通過留言或者發(fā)送郵件讓我知道。

via: http://www.marekrei.com/blog/ml-and-nlp-publications-in-2018/ 雷鋒網(wǎng)AI 科技評論編譯 雷鋒網(wǎng)

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉載。詳情見轉載須知

2018 年度 ML、NLP 會議論文大盤點:周明、張潼、孫茂松數(shù)據(jù)亮眼

分享:
相關文章
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設置密碼以方便用郵箱登錄
立即設置 以后再說