0
本文作者: 奕欣 | 2017-07-31 13:20 | 專題:ACL 2017 |
雷鋒網(wǎng)AI科技評(píng)論按:計(jì)算機(jī)語(yǔ)言學(xué)和自然語(yǔ)言處理最頂尖的會(huì)議之一ACL 將于2017年7月30日至8月4日在加拿大溫哥華舉行。雷鋒網(wǎng) AI 科技評(píng)論將赴前線帶來(lái)一手報(bào)道,并對(duì)論文及大會(huì)概況進(jìn)行梳理。
今天是預(yù)熱 tutorial 環(huán)節(jié),也是 ACL 會(huì)議延續(xù)至今的傳統(tǒng),旨在幫助研究領(lǐng)域的新手們了解計(jì)算機(jī)語(yǔ)言學(xué)與自然語(yǔ)言處理的核心技術(shù),同時(shí)也會(huì)介紹目前這些分領(lǐng)域的一些前沿內(nèi)容。
今年的 Tutorial 主席是科羅拉多大學(xué)的 Jordan Boyd-Grabe 和柏林洪堡大學(xué)的 Maja Popovic,他們經(jīng)與組委會(huì)甄選和分析,最終定下了 7 月 30 日 tutorial 的六個(gè)主議程。
早上的三個(gè) tutorial 分別是自然語(yǔ)言處理于精準(zhǔn)醫(yī)療的應(yīng)用、多模式機(jī)器學(xué)習(xí)及深度學(xué)習(xí)于語(yǔ)義合成的研究;下午的三個(gè) tutorial 則分別為深度學(xué)習(xí)在對(duì)話系統(tǒng)上的應(yīng)用;深度學(xué)習(xí)在多詞表達(dá)與組合的研究、以及眾包問(wèn)題的探討。
Tutorial 1: Natural Language Processing for Precision Medicine
在本次 tutorial 中,研究者將圍繞精準(zhǔn)醫(yī)療這個(gè)機(jī)遇巨大的領(lǐng)域,對(duì) NLP 目前存在的數(shù)據(jù)集、醫(yī)療資源和實(shí)際問(wèn)題進(jìn)行了解,并降低 NLP 研究人員在醫(yī)學(xué)領(lǐng)域應(yīng)用的門檻。
Tutorial 2 : Multimodal Machine Learning
多模式機(jī)器學(xué)習(xí)通過(guò)整合多種交互模型(語(yǔ)言、聲學(xué)、視覺(jué)信息),初步解決了一些人工智能的想法。不過(guò),由于數(shù)據(jù)的結(jié)構(gòu)多樣化及數(shù)據(jù)間可能存在的偶然性,給該研究領(lǐng)域帶來(lái)了挑戰(zhàn)。該 Tutorial 基于 CMU2016 年的春季課程,以及 CVPR 2016 和 ICMI 2016 的兩個(gè) tutorial 整合而成,對(duì)機(jī)器學(xué)習(xí)和深度神經(jīng)網(wǎng)絡(luò)的基本概念進(jìn)行了講解,并描述了多模態(tài)機(jī)器學(xué)習(xí)的五大挑戰(zhàn),包括:1)多模式表示;2)翻譯和映射;3)模態(tài)對(duì)齊;4)多模態(tài)融合;5)共同學(xué)習(xí)。
Tutorial 3: Deep Learning for Semantic Composition
NLP 的一大核心問(wèn)題在于通過(guò)習(xí)得表征建模文本的含義。近幾年來(lái),研究者們對(duì)分布式方法表示出了極大的興趣,不同粒度的文本被編碼為數(shù)值向量。因此在本次 Tutorial 上,Xiaodan Zhu 和 Edward Grefenstette 組織大家一起了解了神經(jīng)網(wǎng)絡(luò)的語(yǔ)義組合建模知識(shí)。
Tutorial 4: Deep Learning for Dialogue Systems
在過(guò)去十年的研究中,口語(yǔ)對(duì)話系統(tǒng)最為人熟知的應(yīng)用莫過(guò)于虛擬助手了。一個(gè)經(jīng)典的對(duì)話系統(tǒng)通常非常復(fù)雜,或是流程呈現(xiàn)模塊化的特點(diǎn)。盡管近年來(lái),深度學(xué)習(xí)的發(fā)展助推了對(duì)話系統(tǒng)的發(fā)展,但在本次 tutorial 上,除了介紹它所取得的成果,Yun-Nung Chen, Asli Celikyilmaz 和 Dilek Hakkani-Tur 也提及了深度學(xué)習(xí)在應(yīng)用于對(duì)話系統(tǒng)的困難與挑戰(zhàn)。
相關(guān)介紹可參考: http://deepdialogue.miulab.tw.
Tutorial 5: Beyond Words: Deep Learning for Multi-word Expressions and Collocations
深度學(xué)習(xí)在 NLP 上的應(yīng)用呈現(xiàn)令人驚喜的成果。以往大多數(shù)研究都采用稀疏詞袋模型的表征方式,但現(xiàn)在有很多工作采用了分布式表示,通過(guò)構(gòu)造「神經(jīng)嵌入」的方式對(duì)每個(gè)單詞或文檔用向量表示,這個(gè) Tutorial 介紹了一種名為「MWEs」(Multiword Expressions)的表達(dá)方式。
Tutorial 6: Making Better Use of the Crowd
NLP 社區(qū)是應(yīng)用眾包模式的早期領(lǐng)域之一。但實(shí)際上研究者對(duì)這個(gè)領(lǐng)域中的工作者依然有著很多誤解和不了解。在這個(gè) tutorial 上,組織者 Jennifer Wortman Vaughan 從多個(gè)方面向觀眾們闡述眾包平臺(tái)的成員組成,并且打破大家對(duì)他們所形成的刻板印象。
從上面幾個(gè)Tutorial的概況不難看出,本屆 ACL 的 tutorial 對(duì)深度學(xué)習(xí)在各項(xiàng)技術(shù)上的應(yīng)用尤為關(guān)注。人言 tutorial 可謂是研究者們最為關(guān)心的前沿問(wèn)題,看來(lái)所言非虛。
而今天唯一一個(gè)workshop的議題也非常有意思——“WiNLP:Women & Underrepresented Minorities in Natural Language Processing”,主要探討的是對(duì)女性或少數(shù)群體在 NLP 研究中的狀況。實(shí)際上,女性作為研究人員的“稀有動(dòng)物”,設(shè)立這樣一個(gè) workshop 也毫不為奇。以 AAAI 2017 為例,就有關(guān)注女性群體的議程出現(xiàn),甚至還有專門針對(duì)女性學(xué)者的早餐會(huì)。這從一定程度上反映了女性群體依然在研究領(lǐng)域上享有較少的話語(yǔ)權(quán)——如果不是這樣,也就不會(huì)有“關(guān)注女性研究者”的呼聲存在了。
不過(guò)有意思的是,當(dāng)天下午的 workshop 中,在座的不乏女性,也有“萬(wàn)紅叢中一點(diǎn)綠”的男性嘉賓。
在當(dāng)天的議程結(jié)束后,進(jìn)行了非常愉快的 welcome reception 晚宴。第一天的議程就此結(jié)束,正會(huì)明天即將拉開(kāi)帷幕,敬請(qǐng)期待雷鋒網(wǎng) AI 科技評(píng)論帶來(lái)的報(bào)道。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。
本專題其他文章