0
雷鋒網(wǎng) AI 科技評論按:國際語言學(xué)會(ACL)下屬的 SIGDAT 小組主辦的自然語言處理頂級會議 EMNLP 2018 即將于 10 月 31 日到 11 月 4 日在比利時布魯塞爾舉行,另一個也有不小影響力的會議,ACL 下屬的 SIGNLL 主辦的計算自然語言學(xué)習(xí)會議 CoNLL 2018 也將與 EMNLP 共同召開,時間為 10 月 31 日到 11 月 1 日。
10 月 30 日(美國時間 10 月 29 日),CoNLL 2018 大會公布了論文獎。雷鋒網(wǎng) AI 科技評論介紹如下。
最佳論文獎
Uncovering Divergent Linguistic Information in Word Embeddings with Lessons for Intrinsic and Extrinsic Evaluation
從本征評價和外部評價的對比中學(xué)習(xí),揭開詞嵌入中包含的多樣化語言信息
論文摘要:隨著單詞嵌入(word embeddings)近年來獲得巨大的成功,有人提出「并不存在完美的單詞表征」的觀點(diǎn),因?yàn)椴煌哪P涂倳A向于捕捉不同的語言成分,有時候甚至是互相沖突的成分, 比如語義還是句法,以及相似度還是關(guān)聯(lián)性。在這篇論文中,作者們表明了每種詞嵌入模型捕捉的信息實(shí)際上都比直接體現(xiàn)出的要多。無需任何額外的資源,一個改變模型的相似性順序的線性變換就可以讓它在這些方面展現(xiàn)出更好的表現(xiàn),這為我們提供了新的視角來理解嵌入對多種語言信息的共同編碼。除此之外,作者們也探索了本征評價方法與外部評價方法之間的關(guān)系,他們發(fā)現(xiàn)所用的線性變換對后續(xù)任務(wù)產(chǎn)生的影響中,對于無監(jiān)督學(xué)習(xí)系統(tǒng)產(chǎn)生的影響比有監(jiān)督學(xué)習(xí)系統(tǒng)更大。
特別獎 - 受人類語言學(xué)習(xí)和處理啟發(fā)法的最佳研究論文
Sequence Classification with Human Attention
利用人類注意力的序列分類
論文摘要:學(xué)習(xí)注意力函數(shù)需要非常大規(guī)模的數(shù)據(jù),不過有很多自然語言處理任務(wù)都是對人類行為的模擬,在這篇論文中作者們就表明人類的注意力確實(shí)可以為 NLP 中的許多注意力函數(shù)提供一個不錯的歸納偏倚。具體來說,作者們根據(jù)人類閱讀語料時的眼睛動作追蹤數(shù)據(jù)估計出了「人類注意力」,然后用它對 RNN 網(wǎng)絡(luò)中的注意力函數(shù)進(jìn)行正則化。作者們的實(shí)驗(yàn)表明,人類注意力在大量不同的任務(wù)中都帶來了顯著的表現(xiàn)提升,包括情感分析、語法錯誤檢測以及暴力語言檢測。
更多 CoNLL 2018 及 EMNLP 2018 報道,請繼續(xù)關(guān)注雷鋒網(wǎng) AI 科技評論。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。