
大家關(guān)注已久的“CCF-NLP走進(jìn)高?!毕盗懈咝LP研究分享報(bào)告會(huì)第三期,11月8日 18:30-21:35精彩繼續(xù)!為了促進(jìn)更多師生對(duì)自然語(yǔ)言處理前沿進(jìn)展的了解,幫助在校計(jì)算機(jī)及相關(guān)專(zhuān)業(yè)大學(xué)生成長(zhǎng)和發(fā)展,CCF-NLP致力于讓領(lǐng)域內(nèi)的權(quán)威大牛們走進(jìn)更多的高校,與師生進(jìn)行溝通和交流。自然語(yǔ)言處理專(zhuān)委會(huì)為此將舉辦一系列 CCF-NLP走進(jìn)高校系列活動(dòng)。 在“CCF-NLP走進(jìn)高校”前兩期:走進(jìn)“華南理工大學(xué)”和走進(jìn)“鄭州大學(xué)”的分享會(huì)上,專(zhuān)家們圍繞自然語(yǔ)言處理做了精彩報(bào)告,在AI研習(xí)社、Bilibili等平臺(tái)上觀看超過(guò)8萬(wàn)人次,報(bào)告會(huì)反響熱烈。往期活動(dòng)回顧請(qǐng)見(jiàn)以下網(wǎng)頁(yè)CCF-NLP走進(jìn)華南理工大學(xué):https://www.yanxishe.com/blogDetail/20930CCF-NLP走進(jìn)鄭州大學(xué):https://www.yanxishe.com/blogDetail/2143011月8日“CCF-NLP走進(jìn)高?!钡谌趯⒆哌M(jìn)美麗的“河北科技大學(xué)”,為同學(xué)們帶來(lái)NLP領(lǐng)域最前沿的研究成果和未來(lái)發(fā)展趨勢(shì)。本次活動(dòng)邀請(qǐng)到三位NLP領(lǐng)域的資深權(quán)威學(xué)者,分別是:· 南京大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系副教授-黃書(shū)劍· 浙江大學(xué)計(jì)算機(jī)學(xué)院副教授-趙洲· 西湖大學(xué)特聘研究員-張?jiān)?/span>嘉賓們將圍繞機(jī)器翻譯中的注意力機(jī)制及其控制、非自回歸多模態(tài)翻譯、對(duì)話系統(tǒng)的兩個(gè)挑戰(zhàn)三大主題展開(kāi)分享,為同學(xué)們接觸NLP前沿資訊提供新穎的解讀視角。本期活動(dòng)由中國(guó)計(jì)算機(jī)學(xué)會(huì)自然語(yǔ)言處理專(zhuān)業(yè)委員會(huì)(CCF-NLP)主辦,河北科技大學(xué)、AI研習(xí)社聯(lián)合承辦,AI科技評(píng)論和機(jī)器學(xué)習(xí)算法與自然語(yǔ)言處理作為戰(zhàn)略媒體,活動(dòng)將結(jié)合線上直播分享和河北科技大學(xué)線下分享方式舉行。AI研習(xí)社直播地址:https://www.yanxishe.com/events/ccf-nlp-hduB站直播地址:http://live.bilibili.com/2249483103 / 分享主題:機(jī)器翻譯中的注意力機(jī)制及其控制
分享環(huán)節(jié):40分鐘主題分享+10分鐘互動(dòng)問(wèn)答深度學(xué)習(xí)方法在機(jī)器翻譯和自然語(yǔ)言處理中取得了巨大的成功。注意力機(jī)制通過(guò)參數(shù)的自動(dòng)學(xué)習(xí)進(jìn)行有選擇的信息獲取,在復(fù)雜任務(wù)的學(xué)習(xí)過(guò)程中起到了非常重要的作用。本次報(bào)告簡(jiǎn)單介紹注意力機(jī)制,以及本實(shí)驗(yàn)室三個(gè)與注意力機(jī)制相關(guān)的工作,分別關(guān)注于注意力機(jī)制和位置建模的關(guān)系、多注意力頭控制對(duì)翻譯的影響以及篇章機(jī)器翻譯中的注意力。相關(guān)論文發(fā)表于ACM/IEEE TASLP、AAAI2020和IJCAI2020上。分享環(huán)節(jié):40分鐘主題分享+10分鐘互動(dòng)問(wèn)答多模態(tài)翻譯任務(wù)是指在不同模態(tài)的數(shù)據(jù)(包括文本、語(yǔ)音、圖像或視頻等)之間進(jìn)行互相轉(zhuǎn)化的任務(wù),例如:語(yǔ)音合成、語(yǔ)音識(shí)別和唇語(yǔ)識(shí)別等,它們旨在通過(guò)機(jī)器學(xué)習(xí)或深度學(xué)習(xí)的方法理解源模態(tài)信息并生成目標(biāo)模態(tài)數(shù)據(jù)。當(dāng)前,多模態(tài)翻譯具有以下挑戰(zhàn):1、不同模態(tài)數(shù)據(jù)之間通常具有語(yǔ)意(信息量)差異,例如:在語(yǔ)音合成中,語(yǔ)音比文本包含更多的韻律和情感信息,而在唇語(yǔ)識(shí)別中,文本比視頻包含更明確和清晰的語(yǔ)音信息,這使得多模態(tài)翻譯模型具有預(yù)測(cè)和填補(bǔ)缺失的信息的能力;2、不同模態(tài)數(shù)據(jù)之間通常具有長(zhǎng)度差異,例如:語(yǔ)音和視頻的序列通常會(huì)比文本長(zhǎng)得多,因此多模態(tài)翻譯模型需要解決數(shù)據(jù)之間長(zhǎng)度不匹配問(wèn)題,并找到其中的映射關(guān)系。針對(duì)以上挑戰(zhàn),最近的工作提出了一些較為有效的解決思路:基于編碼器-解碼器的序列生成自回歸模型、基于時(shí)長(zhǎng)預(yù)測(cè)模型和脈沖神經(jīng)網(wǎng)絡(luò)的非自回歸架構(gòu)均可以較好地預(yù)測(cè)和填補(bǔ)缺失的信息,并解決長(zhǎng)度不匹配問(wèn)題。本報(bào)告將首先介紹當(dāng)今主流的多模態(tài)翻譯任務(wù),然后介紹幾個(gè)具有啟發(fā)意義的多模態(tài)翻譯工作,最后對(duì)未來(lái)可能的研究方向進(jìn)行思考與展望。05 / 分享主題:對(duì)話系統(tǒng)的兩個(gè)挑戰(zhàn)
分享環(huán)節(jié):40分鐘主題分享+10分鐘互動(dòng)問(wèn)答對(duì)話系統(tǒng)是自然語(yǔ)言處理的重要應(yīng)用之一,近兩年隨著深度學(xué)習(xí)技術(shù)的進(jìn)步而受到越來(lái)越多關(guān)注。然而,實(shí)際應(yīng)用的對(duì)話系統(tǒng),包括閑聊對(duì)話和任務(wù)對(duì)話都面臨著許多尚未解決的挑戰(zhàn)。在這次報(bào)告中,我將介紹兩個(gè)具體挑戰(zhàn)和實(shí)驗(yàn)室的初步研究。具體而言,對(duì)于閑聊對(duì)話,社會(huì)常識(shí)和場(chǎng)景的識(shí)別具有重要意義,只有理解對(duì)話情境,才能做出有理有據(jù)地回答。然而,當(dāng)前的閑聊對(duì)話系統(tǒng)對(duì)社會(huì)常識(shí)少有探討。我們近期和微軟亞洲研究院合作,標(biāo)注了一套相關(guān)數(shù)據(jù)及,并且對(duì)上下文表示進(jìn)行了初步測(cè)試。對(duì)于任務(wù)對(duì)話,當(dāng)前方法采用端到端的機(jī)器學(xué)習(xí)策略,從手工標(biāo)注中識(shí)別特定領(lǐng)域的對(duì)話狀態(tài)。然而,世界上應(yīng)用領(lǐng)域繁多而層出不窮,手工標(biāo)注過(guò)程復(fù)雜,質(zhì)量難以保證。我們嘗試研究利用隱變量深度學(xué)習(xí),自動(dòng)探究客服對(duì)話記錄中所隱藏的用戶意圖和對(duì)話狀態(tài),對(duì)這個(gè)挑戰(zhàn)進(jìn)行了開(kāi)始嘗試。河北科技大學(xué)信息科學(xué)與工程學(xué)院院長(zhǎng)南京大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系副教授,博導(dǎo)浙江大學(xué)計(jì)算機(jī)學(xué)院副教授,博導(dǎo)北京大學(xué)教授,CCF-NLP秘書(shū)長(zhǎng)進(jìn)群獲取更多信息
請(qǐng)掃描下方二維碼進(jìn)入交流群
群滿,需入群請(qǐng)?zhí)砑又侄S碼
本期活動(dòng)為CCF-NLP走進(jìn)高校系列分享活動(dòng)第三期,第四期將在11月29日,走進(jìn)“新疆大學(xué)”,敬請(qǐng)期待~更多分享信息請(qǐng)持續(xù)關(guān)注AI科技評(píng)論。
雷鋒網(wǎng)雷鋒網(wǎng)雷鋒網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。