0
本文作者: 汪思穎 | 2018-07-09 10:22 | 專題:SMP 2018 |
由中國中文信息學(xué)會社會媒體處理專委會主辦、哈爾濱工業(yè)大學(xué)承辦的第七屆全國社會媒體處理大會(SMP2018)將于 2018 年 8 月 2-4 日在哈爾濱召開啦。目前購票注冊即享早鳥優(yōu)惠,7 月 11 日將恢復(fù)原價,詳情請戳 http://smp2018.cips-smp.org/register.html
SMP 專注于以社會媒體處理為主題的科學(xué)研究與工程開發(fā),為傳播社會媒體處理最新的學(xué)術(shù)研究與技術(shù)成果提供廣泛的交流平臺,旨在構(gòu)建社會媒體處理領(lǐng)域的產(chǎn)學(xué)研生態(tài)圈,成為中國乃至世界社會媒體處理的風向標。
在去年的會議上,來自金融、情感、傳播學(xué)、教育等多個領(lǐng)域的專家就大數(shù)據(jù)、人工智能在該領(lǐng)域的革命性研究做出了精彩報告。主題報告幾乎場場爆滿,每場報告都能給聽眾帶來很多富有啟發(fā)的觀念。
今年的大會已經(jīng)邀請到多位國內(nèi)外著名專家學(xué)者和業(yè)界翹楚進行大會主題報告,另外還邀請到情感分析和社會科學(xué)領(lǐng)域的著名專家學(xué)者進行分論壇報告。
目前,大會議程已經(jīng)出爐,包含 4 場講習班報告、6 場特邀報告、9 場專題論壇、2 場口頭報告,相信在三天的時間內(nèi),勢必為現(xiàn)場聽眾帶來多種學(xué)科上的碰撞與啟發(fā)。議程安排如下:
大會議程
8 月 2 日(周四)《前沿技術(shù)講習班》第十期 ATT10
09:00-10:30 報告人:宋國杰(北京大學(xué))
題 目:動態(tài)網(wǎng)絡(luò)表示學(xué)習11:00-12:30 報告人:黃民烈(清華大學(xué))
題 目:自然語言處理中的強化學(xué)習14:00-15:30 報告人:孟天廣(清華大學(xué))
題 目:計算社會學(xué)16:00-17:30 報告人:曹楠(同濟大學(xué))
題 目:大數(shù)據(jù)可視化分析19:00-21:00 專委會會議
8 月 3 日(周五) 主會
08:30-09:00 開幕式
09:00-09:40 特邀報告:李宇明(北京語言大學(xué))
09:40-10:20 特邀報告:林學(xué)民(新南威爾士大學(xué))
10:50-11:30 特邀報告:林鴻飛(大連理工大學(xué))
11:30-12:10 特邀報告:張洪忠(北京師范大學(xué))
13:30-15:30 智能金融論壇 計算社會學(xué)論壇
16:00-18:00 技術(shù)評測論壇 口頭報告分會場 1 口頭報告分會場 2
18:00-19:00 Poster 環(huán)節(jié)
8 月 4 日(周六)
08:30-09:10 特邀報告:胡曉華(美國德雷賽爾大學(xué))
09:10-09:50 特邀報告:李兵(中央財經(jīng)大學(xué))
10:20-12:20 情感分析論壇 數(shù)據(jù)挖掘論壇
13:30-15:30 計算傳播學(xué)論壇 智能司法論壇
16:00-18:00 計算歷史學(xué)論壇 智能教育論壇
18:00-18:30 閉幕式
情感分析分論壇議程
目前,情感分析分論壇的議程已經(jīng)出爐。近年來,情感分析在自然語言處理領(lǐng)域引起廣泛關(guān)注,特別是隨著深度學(xué)習技術(shù)的發(fā)展,如何更加精準的判別文本中的情感仍舊是一個挑戰(zhàn)性的問題。在這次會議上,來自南京理工大學(xué)、復(fù)旦大學(xué)和騰訊 AI Lab 的三位專家講者將分別從情感分析中的極性轉(zhuǎn)移和領(lǐng)域適應(yīng)問題,論辯文本的質(zhì)量評估和細粒度情感識別與抽取等三個方面展現(xiàn)情感分析研究的前沿動態(tài)。
論壇嘉賓
嘉賓簡介:
夏睿,南京理工大學(xué)計算機學(xué)院教授、博導(dǎo)。2011 年畢業(yè)于中科院自動化所,獲得工學(xué)博士學(xué)位。一直從事自然語言處理、機器學(xué)習、數(shù)據(jù)挖掘、人工智能等方面的研究工作,在領(lǐng)域知名學(xué)術(shù)期刊和會議(IEEE TKDE, ACM TKDD, IEEE TAFFC, IEEE IS, INS, IPM, IJCAI, AAAI, ACL, EMNLP, COLING等)發(fā)表論文 30 余篇,其中以第一作者身份發(fā)表 CCF A 類、B 類論文 10 余篇、ESI 高被引論文 2 篇,一作論文他引 800 余次。主持國家自然科學(xué)基金面上項目、青年基金,江蘇省優(yōu)青、教育部博士點基金等各類縱向課題和企事業(yè)合作項目 10 余項。2014 年入選南京理工大學(xué)紫金之星人才計劃,2016 年獲得首屆江蘇省優(yōu)青項目資助,2017 年入選南京理工大學(xué)青年拔尖人才選聘計劃并破格晉升為教授。兼任武漢烽火普天信息技術(shù)有限公司人工智能技術(shù)總監(jiān),并入選 2017 年武漢「3551光谷人才計劃」短期創(chuàng)新人才。
報告主題:情感分析中的極性轉(zhuǎn)移和領(lǐng)域適應(yīng)問題
報告摘要:
一方面,在當前的情感分析研究中,情感分析大多被當作一種文本分類任務(wù),套用包括深度神經(jīng)網(wǎng)絡(luò)在內(nèi)的文本分類框架進行解決,卻往往忽視了情感分析的一些特殊語言學(xué)現(xiàn)象(如極性轉(zhuǎn)移問題),使得情感分析的研究和討論并不深刻。極性轉(zhuǎn)移是指由于一些特殊的語言結(jié)構(gòu),使得文本中的情感發(fā)生轉(zhuǎn)移的一種語言現(xiàn)象,包含否定、轉(zhuǎn)折、加強、削弱等語言結(jié)構(gòu)。
另一方面,統(tǒng)計機器學(xué)習常常存在領(lǐng)域依賴的問題,即在某一領(lǐng)域(我們稱之為源領(lǐng)域)標注樣本上學(xué)習得到的分類器通常只在相同領(lǐng)域的測試樣本上表現(xiàn)較好,換到其他領(lǐng)域(我們稱之為目標領(lǐng)域),尤其是目標領(lǐng)域與源領(lǐng)域的分布相差較大的情況下,算法性能會大打折扣。這一領(lǐng)域依賴問題在情感分析任務(wù)中表現(xiàn)得尤為突出。
本報告圍繞這兩個特殊問題,回顧學(xué)術(shù)界的相關(guān)工作,并簡介南京理工大學(xué)文本挖掘研究組在這兩個問題上的一些工作進展。
嘉賓簡介:
魏忠鈺,復(fù)旦大學(xué)大數(shù)據(jù)學(xué)院青年副研究員,碩士生導(dǎo)師,香港中文大學(xué)博士學(xué)位,美國德州大學(xué)達拉斯分校博士后,中國中文信息學(xué)會青年工作委員會委員,中文信息學(xué)會社交媒體處理專委會委員,入選 2017 年度上海市青年科技英才揚帆計劃。主要研究領(lǐng)域為社交媒體分析,自動文本生成和論辯挖掘等,在相關(guān)領(lǐng)域的國際會議、期刊如 ACL,SIGIR,EMNLP,IJCAI, COLING 等發(fā)表學(xué)術(shù)論文 20 余篇。
報告主題:論辯文本的質(zhì)量評估方法研究
報告摘要:
近年來,計算論辯學(xué)在自然語言處理領(lǐng)域得到越來越多的關(guān)注,當前的研究課題包括論辯內(nèi)容檢索、論辯文本結(jié)構(gòu)分析、論辯策略研究以及論辯質(zhì)量研究等。
論辯質(zhì)量研究旨在對于論辯的質(zhì)量進行量化分析,它主要包括單體論辯質(zhì)量 (monological argumentation ) 判別以及對話式論辯質(zhì)量判別(dialogical argumentation)。單體論辯質(zhì)量判別的一大應(yīng)用場景是學(xué)生議論文自動評估,這對于互聯(lián)網(wǎng)教育至關(guān)重要;而對話式論辯質(zhì)量判別則面向多參與者的論辯研究。
本報告將簡單回顧當前對于論辯質(zhì)量研究的一些基本任務(wù)設(shè)定以及主流的計算模型,并且重點介紹復(fù)旦大學(xué)自然語言處理組在論辯文本質(zhì)量評估方面的一些工作,包括采用多重注意力機制的對話式論辯質(zhì)量評估模型和結(jié)合了話題內(nèi)容的單體式論辯質(zhì)量評估模型。
嘉賓簡介:
邴立東,香港中文大學(xué)博士,卡內(nèi)基梅隆大學(xué)博士后?,F(xiàn)任騰訊人工智能實驗室高級研究員,從事自然語言處理領(lǐng)域的研究,如情感分析、文本生成、知識庫等。發(fā)表論文 50 余篇,如 ACL、EMNLP、AAAI、IJCAI、SIGIR、KDD、TOIS 等。個人主頁:http://www.cs.cmu.edu/~lbing/
報告主題:Target Sentiment Analysis: Extraction, Classification, and Sentiment-Aware Embeddings
報告摘要:
隨著人工智能的深入發(fā)展,情感分析任務(wù)的重要性越來越凸顯。該報告將介紹主講人及合作者最近的幾項工作。
(1)面向目標的情感分類(Target Sentiment Prediction)框架RAM和TNet:RAM提出了一個基于多次注意力機制的模型,把每次注意力捕獲到的情感信息進行非線性融合,再進行情感預(yù)測。TNet則使用卷積神經(jīng)網(wǎng)絡(luò)(CNN)替代基于注意力機制的循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)去提取最重要的分類特征,并引入了“特征變換”組件來利用目標信息和“上下文保留”機制利用上下文信息。RAM和TNet分別取得了EMNLP 2017和ACL 2018的最佳效果;
(2)評論目標抽?。∣pinion Target/Aspect Extraction)框架HAST:該框架利用了兩個有用的線索:Opinion Summary是基于當前預(yù)測的token提煉于整個輸入句子,其有助于當前 token是否為aspect的預(yù)測。另一個線索是從之前token預(yù)測提取的預(yù)測歷史,此線索利用同位詞關(guān)系和BIO約束來提升效果。HAST取得了該任務(wù)的當前最佳效果;
(3)多領(lǐng)域情感詞表示學(xué)習框架DSE:提出了一種學(xué)習領(lǐng)域適應(yīng)和情感感知的詞嵌入的新方法,能夠同時捕獲詞的情感語義和領(lǐng)域信息,自動生成領(lǐng)域無關(guān)和領(lǐng)域相關(guān)的詞向量,并且捕獲來自不同領(lǐng)域的領(lǐng)域相關(guān)詞的不同語義。得到的詞向量提高了句子級和詞匯級的情感分類性能。
去年雷鋒網(wǎng)作為大會獨家戰(zhàn)略合作媒體,對會議精華、重點演講、最佳論文等第一時間進行跟蹤報導(dǎo)。此外,會議還專門設(shè)置技術(shù)評測環(huán)節(jié)——CSDN 用戶畫像技術(shù)評測、中文人機對話技術(shù)評測。CSDN 用戶畫像技術(shù)評測共有來自全球 200 多家單位的 757 名選手報名,中文人機對話評測環(huán)節(jié)也吸引到多所高校和企業(yè)的研究人員參賽,最終冠軍被華南農(nóng)業(yè)大學(xué)口語對話系統(tǒng)研究室(scau_SIGSDS)團隊和深思考人工智能(iDeepWise)獲得。(雷鋒網(wǎng)也對冠軍方案做了詳細報道)
今年的技術(shù)測評更加豐富,會議期間將并行舉辦三個競賽單元,獲獎隊伍將在會議現(xiàn)場帶來方案分析,雷鋒網(wǎng)也將在第一時間報導(dǎo)。
技術(shù)測評
用戶畫像技術(shù)評測(The Evaluation of User Profiling Technology,SMP-EUPT)
中文人機對話技術(shù)評測(The Evaluation of Chinese Human-Computer Dialogue Technology,SMP-ECDT)
文本溯源技術(shù)評測(The Evaluation of Text Sourcing Technology,SMP-ETST)
用戶畫像技術(shù)評測(SMP-EUPT)
隨著機器創(chuàng)作能力越來越強,今后社會媒體上將會產(chǎn)生越來越多的機器創(chuàng)作者自動生產(chǎn)的內(nèi)容。有效識別出哪些是人類作者生產(chǎn)的內(nèi)容,哪些是機器作者生產(chǎn)的內(nèi)容,對于媒體內(nèi)容的審核、分發(fā)、推薦等,具有十分重要的意義。
本屆用戶畫像技術(shù)評測聚焦于媒體內(nèi)容創(chuàng)作者畫像問題,由北京字節(jié)跳動科技有限公司(今日頭條)提供豐富的媒體內(nèi)容數(shù)據(jù)集,進行作者身份的自動識別。
中文人機對話技術(shù)評測(SMP-ECDT)
人機對話技術(shù)近年來受到了學(xué)術(shù)界和產(chǎn)業(yè)界的廣泛關(guān)注。學(xué)術(shù)上,人機對話是人機交互最自然的方式之一,其發(fā)展影響并推動著語音識別與合成、自然語言理解、對話管理以及自然語言生成等研究的進展;產(chǎn)業(yè)上,眾多產(chǎn)業(yè)界巨頭相繼推出了人機對話技術(shù)相關(guān)產(chǎn)品,如個人事務(wù)助理、虛擬情感陪護機器人、娛樂型聊天機器人等等,并將人機對話技術(shù)作為其公司的重點研發(fā)方向。
本屆中文人機對話技術(shù)評測將聚焦于用戶意圖的識別和響應(yīng)問題,以科大訊飛股份有限公司提供的數(shù)據(jù)集為基礎(chǔ),分別開展用戶意圖領(lǐng)域分類和特定領(lǐng)域任務(wù)型人機對話在線評測。
文本溯源技術(shù)評測(SMP-ETST)
文本溯源的目標是判斷一個文本的內(nèi)容是否復(fù)制或改編于另外一個或者多個文件。文本溯源技術(shù)在學(xué)術(shù)誠信檢測、搜索引擎優(yōu)化等領(lǐng)域有廣泛應(yīng)用。
本屆文本溯源技術(shù)評測以科研立項或成果創(chuàng)新型審查為應(yīng)用背景,以著名的學(xué)術(shù)搜索系統(tǒng) AMiner 提供的大量中文論文摘要數(shù)據(jù)為基礎(chǔ),進行句子溯源技術(shù)評測。
SMP2018 將為大家?guī)砩鐣襟w領(lǐng)先技術(shù)、交叉應(yīng)用等多個方向的精彩內(nèi)容。目前購買會議門票,即享受 300-600 元優(yōu)惠,7 月 11 日將恢復(fù)原價。詳細信息請戳下圖,快快抓緊這一波福利吧。
會議時間:2018 年 8 月 2~4 日
報到時間:2018 年 8 月 1 日至 8 月 4 日
報到地點:哈爾濱友誼宮
地址: 哈爾濱市道理區(qū)友誼路 263 號(近友誼路與高誼街交叉口)
電話:0451-84880888
注冊購票:http://smp2018.cips-smp.org/register.html
會議官網(wǎng):http://smp2018.cips-smp.org/index.htm
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。