丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
人工智能 正文
發(fā)私信給楊曉凡
發(fā)送

0

哈工大秦兵:機(jī)器智能中的文本情感計(jì)算 | CCF-GAIR 2018

導(dǎo)語(yǔ):文本情感計(jì)算的六個(gè)維度

雷鋒網(wǎng) AI 科技評(píng)論按:2018 全球人工智能與機(jī)器人峰會(huì)(CCF-GAIR)在深圳召開(kāi),峰會(huì)由中國(guó)計(jì)算機(jī)學(xué)會(huì)(CCF)主辦,雷鋒網(wǎng)、香港中文大學(xué)(深圳)承辦,得到了寶安區(qū)政府的大力指導(dǎo),是國(guó)內(nèi)人工智能和機(jī)器人學(xué)術(shù)界、工業(yè)界及投資界三大領(lǐng)域的頂級(jí)交流盛會(huì),旨在打造國(guó)內(nèi)人工智能領(lǐng)域最具實(shí)力的跨界交流合作平臺(tái)。

CCF-GAIR 2018 延續(xù)前兩屆的「頂尖」陣容,提供 1 個(gè)主會(huì)場(chǎng)和 11 個(gè)專場(chǎng)(仿生機(jī)器人,機(jī)器人行業(yè)應(yīng)用,計(jì)算機(jī)視覺(jué),智能安全,金融科技,智能駕駛,NLP,AI+,AI 芯片,IoT,投資人)的豐富平臺(tái),意欲給三界參會(huì)者從產(chǎn)學(xué)研多個(gè)維度,呈現(xiàn)出更富前瞻性與落地性相結(jié)合的會(huì)議內(nèi)容與現(xiàn)場(chǎng)體驗(yàn)。

哈工大秦兵:機(jī)器智能中的文本情感計(jì)算 | CCF-GAIR 2018

秦兵,女,哈爾濱工業(yè)大學(xué)計(jì)算機(jī)學(xué)院教授、博士生導(dǎo)師。哈爾濱工業(yè)大學(xué)社會(huì)計(jì)算與信息檢索中心副主任。中國(guó)中文信息學(xué)會(huì)理事、中國(guó)中文信息學(xué)會(huì)語(yǔ)言與知識(shí)計(jì)算專委會(huì)副主任、社會(huì)媒體處理專委會(huì)情感分析工作組組長(zhǎng)、信息檢索專委會(huì)常委,國(guó)家重點(diǎn)基金項(xiàng)目負(fù)責(zé)人。在頂級(jí)國(guó)際會(huì)議 ACL、COLING、EMNLP、IEEE TKDE、IEEE TASLP等國(guó)內(nèi)外重要期刊及會(huì)議上發(fā)表論文60余篇,擔(dān)任多個(gè)會(huì)議領(lǐng)域主席以及多個(gè)期刊和會(huì)議的審稿人。主持多項(xiàng)國(guó)家自然科學(xué)基金以及國(guó)家科技部863項(xiàng)目。同時(shí)和多家互聯(lián)網(wǎng)企業(yè)開(kāi)展合作,多項(xiàng)研究成果進(jìn)入企業(yè)產(chǎn)品。獲中文信息學(xué)會(huì)錢偉長(zhǎng)中文信息處理科學(xué)技術(shù)獎(jiǎng)一等獎(jiǎng)、黑龍江省技術(shù)發(fā)明二等獎(jiǎng)。

秦兵教授的現(xiàn)場(chǎng)演講內(nèi)容雷鋒網(wǎng) AI 科技評(píng)論回顧如下。

主持人 劉挺:CCF-GAIR 大會(huì)我去年也參加過(guò),今年辦得比去年更成功、規(guī)模更大,已經(jīng)成為中國(guó)人工智能風(fēng)向標(biāo),每個(gè)會(huì)場(chǎng)的參會(huì)人數(shù)也說(shuō)明這個(gè)方向的火爆程度,今天是第三天開(kāi)會(huì)還能坐滿整個(gè)會(huì)場(chǎng),說(shuō)明大家對(duì)自然語(yǔ)言處理的關(guān)注。

自然語(yǔ)言處理自起步以來(lái),一直做事實(shí)型文本,特別是以新聞報(bào)道為主要處理對(duì)象,最近這十多年來(lái),由于社交媒體的興起,越來(lái)越多學(xué)者開(kāi)始研究人在互聯(lián)網(wǎng)上表達(dá)的情感,今天我們請(qǐng)來(lái)哈爾濱工業(yè)大學(xué)社會(huì)計(jì)算與信息檢索中心副主任秦兵教授。秦老師多年從事自然語(yǔ)言處理的研究,獲得國(guó)內(nèi)第一個(gè)關(guān)于文本情感分析方面的自然科學(xué)基金重點(diǎn)項(xiàng)目。作為社會(huì)媒體處理專委會(huì)情感分析專業(yè)組的組長(zhǎng),秦兵教授擔(dān)任今年SMP 2018大會(huì)程序委員會(huì)主席,這個(gè)大會(huì)也會(huì)和雷鋒網(wǎng)合作,歡迎大家 8月2-4日去哈爾濱。

下面我們以熱烈的掌聲歡迎秦老師作文本情感分析方面的報(bào)告。

秦兵:大家上午好!感謝雷鋒網(wǎng)和劉挺教授的邀請(qǐng),今天我報(bào)告的題目是:機(jī)器智能中的文本情感。

哈工大秦兵:機(jī)器智能中的文本情感計(jì)算 | CCF-GAIR 2018

大家也知道,人工智能目前已進(jìn)入迅猛發(fā)展階段,總體可以分為三個(gè)階段,第一個(gè)階段是計(jì)算智能的階段,這個(gè)階段計(jì)算機(jī)和人類相比是能存會(huì)算,它的超大存儲(chǔ)量、超高計(jì)算速度,這方面完勝人類。第二個(gè)階段是感知智能,以語(yǔ)音識(shí)別、圖像識(shí)別為代表的技術(shù)迅猛發(fā)展。大家也看過(guò)很多電視節(jié)目,包括“機(jī)智過(guò)人”、“最強(qiáng)大腦”;人和機(jī)器比圖象識(shí)別,機(jī)器已經(jīng)可以和人類相媲美甚至在某些方面超過(guò)人類。第三個(gè)階段是認(rèn)知智能,這個(gè)階段需要機(jī)器能夠思考,能夠具有情感,這個(gè)階段考驗(yàn)的是智能是否有情商,也就是說(shuō)情感在人工智能認(rèn)知階段還是非常重要的。

人工智能中的情感計(jì)算也不是現(xiàn)階段才提出來(lái)的,最早在人工智能之父明斯基就提過(guò)“我們的問(wèn)題不是怎樣才能讓機(jī)器智能有情感,而是機(jī)器智能怎么能沒(méi)有情感。”微軟全球執(zhí)行副總裁沈向洋說(shuō)“我們的智能不光有IQ,還需要有情感”。斯坦福人工智能實(shí)驗(yàn)室主任李飛飛也曾說(shuō)過(guò)“情緒和情感是人工智能的未來(lái)”。

何為情感?嚴(yán)格定義來(lái)講就是情感是人對(duì)客觀事物是否滿足自己需要而產(chǎn)生的態(tài)度體驗(yàn)。機(jī)器對(duì)于情感的要求就是機(jī)器情感計(jì)算,也就是機(jī)器理解人類的情感和生成情感的能力。所以賦予計(jì)算機(jī)情感計(jì)算能力的研究引起了學(xué)術(shù)界和企業(yè)界的廣泛關(guān)注。很多人都看過(guò)電影《她》,人機(jī)戀愛(ài)出現(xiàn)在科幻電影中,未來(lái)也許會(huì)出現(xiàn)在我們的生活當(dāng)中。

哈工大秦兵:機(jī)器智能中的文本情感計(jì)算 | CCF-GAIR 2018

機(jī)器情感怎么獲得?怎么和人進(jìn)行交流?它首先要獲取人類的情感資源,比如它要去了解或?qū)W習(xí)如何識(shí)別情感、產(chǎn)生情感。社會(huì)媒體是觀察人類情感的有效窗口,也就是說(shuō)我們每天在社交媒體上的各種活動(dòng),包括購(gòu)物、聊天、社區(qū)、資訊、生活等等,這些都流露出人在某些方面的情感資源。我們可能平時(shí)沒(méi)有意識(shí)到,實(shí)際上這種資源大量存在,而且社交媒體中不僅有大量的文本資源,還有大量的情感資源。比如微博、大眾點(diǎn)評(píng),微博上經(jīng)常出現(xiàn)一些喜怒哀樂(lè)情緒的發(fā)布,大眾點(diǎn)評(píng)中經(jīng)常是我們對(duì)產(chǎn)品、服務(wù)的評(píng)價(jià),這里面有大量豐富的情感文本資源。社會(huì)媒體中的文本情感計(jì)算就是要結(jié)合社會(huì)媒體中除了文本,還有用戶和群體信息,然后對(duì)文本情感進(jìn)行分析、處理和歸納,使得情感分析具有更好的針對(duì)性和精準(zhǔn)性。

今天的報(bào)告主要從情感計(jì)算的六個(gè)維度來(lái)講:

哈工大秦兵:機(jī)器智能中的文本情感計(jì)算 | CCF-GAIR 2018

一、情感分類

首先從情感分類的角度出發(fā),比如說(shuō)人類的情感是多樣性的,我們經(jīng)常能想起來(lái)的詞或者看到的詞,比如喜極而泣、抱頭痛哭、捶胸頓足、七情六欲、五味雜陳等等,表達(dá)了我們的喜怒哀樂(lè)。實(shí)際上多年來(lái)也有很多人在這方面做了很多研究,比如七情六欲分為好、惡、樂(lè)、怒、哀、懼、欲等。此外,還有人從高興、悲傷、憤怒、恐懼、厭惡、驚奇等進(jìn)行分類。

對(duì)于情感分類,一般來(lái)講有粗粒度情感分類,粗粒度情感分類主要用來(lái)判斷文本整體情感傾向,表明一個(gè)人對(duì)某件事或?qū)δ硞€(gè)物體的整體評(píng)價(jià)。情感計(jì)算中大多采用兩種,一種是傾向性分類,即褒、貶、中的分類,還有一種是微博中經(jīng)常出現(xiàn)的情緒分類,表示個(gè)人主觀情緒的喜、怒、悲、恐、驚。

哈工大秦兵:機(jī)器智能中的文本情感計(jì)算 | CCF-GAIR 2018

有了這么多類別體系,又有傾向性分類或情緒分類,分別針對(duì)我們對(duì)不同的產(chǎn)品、不同的服務(wù),甚至表達(dá)的是我們個(gè)人的不同情感,無(wú)論它怎么劃分或者劃分的顆粒度有多細(xì),總體來(lái)講它是一個(gè)分類任務(wù),也就是說(shuō)傳統(tǒng)的文本分類任務(wù)適用于情感分類,文本的情感分類可以看成是一種特殊的文本分類任務(wù)。那么傳統(tǒng)文本分類是通過(guò)訓(xùn)練樣本、特征提取+機(jī)器學(xué)習(xí)模型,訓(xùn)練好參數(shù),對(duì)未知樣本進(jìn)行分類預(yù)測(cè)。對(duì)于情感分類,考慮到特定的情感資源,相對(duì)于傳統(tǒng)文本分類,有了更多可利用的知識(shí)。

隨著深度學(xué)習(xí)的發(fā)展,也給文本情感分類帶來(lái)很多生機(jī)。這些年出現(xiàn)很多關(guān)于深度學(xué)習(xí)和情感分析相結(jié)合的情感類別預(yù)測(cè)任務(wù)。在深度學(xué)習(xí)過(guò)程當(dāng)中可以加入情感資源,包括語(yǔ)言學(xué)的約束、情感辭典的信息,加入之后可以使情感分類和深度學(xué)習(xí)結(jié)合得更充分。

剛才講的是粗粒度分類,便于我們從整體上把握用戶對(duì)情感、對(duì)世界、對(duì)產(chǎn)品的整體傾向。還有一種分類叫細(xì)粒度情感分類,所謂細(xì)粒度即針對(duì)評(píng)價(jià)對(duì)象及其屬性的情感傾向,比如“iPhone10很不錯(cuò),除了貴,買不起,新的 iWatch 可以買一個(gè),跑步就不要帶手機(jī)了”。這里面有兩個(gè)評(píng)價(jià)對(duì)象,第一個(gè)評(píng)價(jià)對(duì)象的評(píng)價(jià)是 iPhone 很不錯(cuò),但是很貴,在購(gòu)不購(gòu)買上持否定態(tài)度,對(duì)于 iWatch 來(lái)講,評(píng)價(jià)對(duì)象認(rèn)為跑步時(shí)可以不用帶手機(jī),所以相對(duì)于 iPhone 來(lái)講,更傾向于買 iWatch。我們做細(xì)粒度情感分析時(shí)就要分別把不同的評(píng)價(jià)對(duì)象抽取出來(lái),把評(píng)價(jià)詞語(yǔ)、情感類別分別判定出來(lái),這樣我們就可以細(xì)粒度分析一個(gè)產(chǎn)品、服務(wù)甚至情感。

當(dāng)然,這種分類任務(wù)要結(jié)合文本當(dāng)中不同的評(píng)價(jià)對(duì)象,所以面向評(píng)價(jià)對(duì)象的情感分類有很多種方法,比較典型的可以利用上下文信息,采用神經(jīng)網(wǎng)絡(luò)中的注意力機(jī)制,使某個(gè)評(píng)價(jià)對(duì)象和詞語(yǔ)能更好地尋找到搭配,從而來(lái)判斷。我們在 EMNLP2016 上發(fā)表的一篇論文就介紹了我們的成果。

哈工大秦兵:機(jī)器智能中的文本情感計(jì)算 | CCF-GAIR 2018

面向評(píng)價(jià)對(duì)象的情感分類,可以落地很多應(yīng)用,比如現(xiàn)在網(wǎng)絡(luò)上有很多文本,海量的評(píng)論,比如評(píng)論手機(jī),具體來(lái)講是華為手機(jī),我們?cè)谠u(píng)論時(shí)按照細(xì)粒度分類,可以把評(píng)價(jià)對(duì)象、評(píng)價(jià)詞、屬性抽取出來(lái),進(jìn)一步構(gòu)建出評(píng)價(jià)手機(jī)體系的維度空間,也就是說(shuō)你可能事先對(duì)某一個(gè)產(chǎn)品或某一個(gè)分類不知道從哪些角度去了解它,或者從哪些維度去分析它,但我們可以通過(guò)細(xì)粒度情感分類把這個(gè)體系歸納出來(lái),同時(shí)對(duì)每一個(gè)粒度進(jìn)行打分,比如圖中紅色和藍(lán)色的區(qū)別就是褒貶,顏色的不同表示它們打分值,這樣用戶可以在購(gòu)買時(shí)進(jìn)行評(píng)價(jià),比如華為手機(jī)、蘋果手機(jī)或其他類型的手機(jī)。同時(shí)我們還可以把這些評(píng)論總結(jié)出來(lái),比如評(píng)論的極性分布,剛才是細(xì)粒度的,總體來(lái)講有多少人是評(píng)價(jià)正面的,有多少人評(píng)價(jià)是負(fù)面的,這是粗粒度的,這些都可以給用戶提供全方位評(píng)價(jià)體驗(yàn)。

粗粒度情感分類是為商家了解用戶對(duì)產(chǎn)品的評(píng)論,政府了解公眾輿情提供參考。細(xì)粒度情感分類可以提供所評(píng)價(jià)的產(chǎn)品或服務(wù)的精準(zhǔn)畫像,為商家和用戶提供不同的評(píng)估。

二、隱式情感

無(wú)論是你聽(tīng)別人的話,還是自己表達(dá)情感時(shí),可能未必會(huì)使用情感詞。情感表達(dá)中有20%-30%是沒(méi)有情感詞的,它屬于隱式情感,而隱式情感多使用事實(shí)型陳述和語(yǔ)言修辭表達(dá),從隱式情感分布來(lái)講,有事實(shí)型,有比喻型,有反問(wèn)型,其中事實(shí)型情感占72%。采用事實(shí)型情感,比如一個(gè)人住到酒店,他在發(fā)微博時(shí)說(shuō)“桌子上有一層灰”,這沒(méi)有任何情感詞,但實(shí)際上已經(jīng)表達(dá)了他的不滿,這就是事實(shí)型表述。再看褒義描述,“從下單到收到貨不到24小時(shí)”,表明他稱贊快遞速度很快,但沒(méi)有明顯的表達(dá)詞,這些都屬于事實(shí)型表述。

哈工大秦兵:機(jī)器智能中的文本情感計(jì)算 | CCF-GAIR 2018

這種事實(shí)型描述怎么挖掘?這種事實(shí)型表述出現(xiàn)很頻繁,這個(gè)時(shí)候我們可以采用上下文,比如我說(shuō)“桌子上有一層灰,很不高興”,就可以把“桌子上有一層灰”定義為貶義的?;蛘哒也坏缴舷挛牡脑挘部梢栽谄渌漠?dāng)中找到跟它相似的語(yǔ)句,再判定情感,通過(guò)借助周圍上下文的分析進(jìn)行推理,得到這句話的情感,這是一種解決策略。同時(shí),我們也可以借助某種知識(shí),比如快遞多長(zhǎng)時(shí)間算快,或者說(shuō)這個(gè)人身高1.8米,我們有個(gè)常識(shí),一米幾以上就算高個(gè)兒,類似這樣的知識(shí)可以幫助我們進(jìn)行隱式情感分析。

除了事實(shí)型之外,還有一種是修辭型的,修辭型的更難區(qū)分,“拿機(jī)器人和人相比,“你咋這么聰明呢?”平常你可以聽(tīng)到別人這么夸你或者這么諷刺你,但有的時(shí)候光看語(yǔ)言的話,我們很難判定是夸你聰明還是笨。此外,還有隱喻的方式,比如一個(gè)人去旅游勝地愛(ài)琴海,他在描述中說(shuō)“此乃西方文明的搖籃”,這就是一種比喻,這種比喻包含很多贊賞,這種修辭型怎么表達(dá)出來(lái)?或者怎么把大量的存在于我們生活當(dāng)中的隱式情感挖掘出來(lái),這需要很多知識(shí),從資源的角度來(lái)講,大連理工大學(xué)林鴻飛老師有一些隱喻語(yǔ)料庫(kù),山西大學(xué)王素格老師有一些隱式情感語(yǔ)料庫(kù),分別對(duì)事實(shí)型和修辭型隱式情感提供了一定幫助。當(dāng)然,語(yǔ)料庫(kù)只是提供某些支持,隱式情感是一種含蓄的表達(dá)方式,隱式情感表達(dá)因?yàn)槿鄙偾楦性~的指引,所以需要尋找新的特征與表示方法。而且要結(jié)合目標(biāo),比如我們說(shuō)到玫瑰花、紅豆、月亮,說(shuō)到這些詞的時(shí)候會(huì)聯(lián)想到哪些情感,這些和知識(shí)和上下文都會(huì)通過(guò)分析推理獲得隱式情感的語(yǔ)義。

三、情感溯因

哈工大秦兵:機(jī)器智能中的文本情感計(jì)算 | CCF-GAIR 2018

分析情感的目的是什么?這些情感產(chǎn)生的原因又是什么?比如他是因?yàn)槭裁锤吲d、因?yàn)槭裁磦摹⒁驗(yàn)槭裁磻嵟?,我們需要情感溯因,也為了大家更好地觀察產(chǎn)品、體會(huì)服務(wù)以及體察對(duì)方的情感。從原因來(lái)看,一般是“情”出有因,這里有一個(gè)例子看著懂事的女兒每天被病痛折磨著,自己卻不能為她捐腎,想到自己無(wú)能為力,張志英泣不成聲”。我們可以進(jìn)行溯因,也就是要知其然,也要知其所以然,知道了原因之后,比如你知道一個(gè)人有潔癖,忍受不了桌子上有一層灰,下次她再看到一個(gè)地方的桌子上有一層灰,可能她沒(méi)有表達(dá)出來(lái),但你能預(yù)期到她會(huì)生氣。

文本情感的原因發(fā)現(xiàn)方法,比如哈工大深圳研究院的徐睿峰老師做過(guò)一些工作,也有語(yǔ)料庫(kù),一般是按照類似問(wèn)答系統(tǒng)研究的方式,這里面有情感詞、有原文,通過(guò)記憶網(wǎng)絡(luò)判別這個(gè)文章中哪句話是原因,通過(guò)類別判斷是或不是。

哈工大秦兵:機(jī)器智能中的文本情感計(jì)算 | CCF-GAIR 2018

另外一種是群體,除了文本情感原因,社交媒體上也有很多值得我們發(fā)掘的原因,比如長(zhǎng)江郵輪傾覆這件事中有很多悲哀的情緒,但是為什么還會(huì)有喜悅的成分呢?大家也會(huì)疑惑,我們通過(guò)此事件分析,對(duì)長(zhǎng)江郵輪傾覆事件的喜悅實(shí)際上是由于沉船內(nèi)部有生命跡象和載客458人,救起8人,由這些子事件導(dǎo)致大家覺(jué)得有希望的情感,所以表達(dá)出來(lái)了喜悅,這也是情感原因的發(fā)現(xiàn)方法,從社交媒體上通過(guò)子事件進(jìn)行分析。

四、個(gè)性化

通過(guò)進(jìn)一步分析我們可以知道人和人是不同的,同一對(duì)象,不同人立場(chǎng)不同,可能表達(dá)出不同情感;相同對(duì)象,不同人表達(dá)相同情感,用詞風(fēng)格不同。比如男生和女生對(duì)待某一件事的時(shí)候可能分歧很大,所以在情感計(jì)算中要加入用戶特征,比如用戶畫像技術(shù),這里面包括自然屬性、社會(huì)屬性、興趣屬性、心理屬性等。一般立場(chǎng)不同,情感可能會(huì)不同,比如去年廣為人知的“青島38元大蝦”和“哈爾濱天價(jià)魚(yú)”事件,關(guān)于青島38元大蝦,“在南方的東北妹子”評(píng)價(jià)說(shuō)“米飯按粒賣,我不得不傾家蕩產(chǎn)么!”關(guān)于哈爾濱天價(jià)魚(yú)中的評(píng)價(jià)是“北方人覺(jué)得南方小小氣氣,南方人覺(jué)得北方人沒(méi)素質(zhì)”。此外,人們的用詞風(fēng)格也會(huì)不同,這里有兩個(gè)人,一個(gè)人很容易用非??鋸埖脑~,比如“這個(gè)車太漂亮了”,另一個(gè)人會(huì)說(shuō)“還行吧”,他所說(shuō)的“還行吧”對(duì)他來(lái)講就是很好了。我們用兩個(gè)人發(fā)表的文章進(jìn)行對(duì)比,不同的人發(fā)表的文章在情感分值差異性上會(huì)有不同,用詞風(fēng)格也如此,同一篇文檔,比如這個(gè)人發(fā)表的文檔相似度很高,他評(píng)價(jià)車、評(píng)價(jià)服裝時(shí)都會(huì)使用很夸張的詞。如果跟另外一個(gè)人來(lái)比較,文章用詞的相似度就很低。

我們?cè)谏窠?jīng)網(wǎng)絡(luò)分類中融入用戶和產(chǎn)品的向量和矩陣表示信息,然后把它融入已有神經(jīng)網(wǎng)絡(luò)框架,應(yīng)用到文本情感分類任務(wù),這一部分內(nèi)容的論文發(fā)表在 2015 年的 ACL 上。

五、領(lǐng)域問(wèn)題

我們?cè)诓煌念I(lǐng)域都存在遷移的問(wèn)題,以圖書和電子領(lǐng)域?yàn)槔總€(gè)領(lǐng)域的評(píng)價(jià)對(duì)象都不同,不同領(lǐng)域的評(píng)價(jià)表達(dá)千差萬(wàn)別,不同領(lǐng)域中的同一情感表達(dá)極性不同。比如“簡(jiǎn)單”這一詞,情節(jié)簡(jiǎn)單和上手簡(jiǎn)單表達(dá)的情感就不一樣。這需要我們進(jìn)行跨領(lǐng)域的情感研究,也就是進(jìn)行模型遷移過(guò)程,通常在情感分析領(lǐng)域的遷移,一是利用領(lǐng)域無(wú)關(guān)的詞和領(lǐng)域相關(guān)詞的鏈接關(guān)系,再進(jìn)行分別聚類。在神經(jīng)網(wǎng)絡(luò)當(dāng)中,通過(guò)神經(jīng)網(wǎng)絡(luò)的隱層參數(shù)盡量提取與情感相關(guān)、但與領(lǐng)域無(wú)關(guān)的詞的特征來(lái)分類。

六、情感生成

實(shí)際上我們一直分析的是人類的情感,我們一直很期待機(jī)器是不是能產(chǎn)生情感,也就是說(shuō)機(jī)器有情感嗎?有三觀嗎?目前機(jī)器是沒(méi)有自主意識(shí)的,而指定情感類別的情感生成可以做到,比如說(shuō)我們可以根據(jù)指定的情感類別生成情感表達(dá),也可以在聊天機(jī)器人當(dāng)中根據(jù)轉(zhuǎn)移概率進(jìn)行變換,此外也可以對(duì)情感表達(dá)進(jìn)行潤(rùn)色和風(fēng)格轉(zhuǎn)換。

評(píng)論文本生成很簡(jiǎn)單,只要你輸入一個(gè)用戶名、產(chǎn)品名,輸入打分、偏好,就可以生成相應(yīng)的文本情感表達(dá),大家可能會(huì)經(jīng)常會(huì)在產(chǎn)品評(píng)論中看到一些機(jī)器生成的評(píng)論,有些時(shí)候可以判別出是機(jī)器生成的,有的時(shí)候判別不出來(lái)。

在聊天系統(tǒng)中可以情感回復(fù)生成,例如上一句話說(shuō)“我的狗丟了”,然后生成一個(gè)生氣的回復(fù),我們?cè)谶@一部分加入情感類別因素,向量和矩陣疊加起來(lái),生成新詞帶入到下面,所以生成的下文是“誰(shuí)讓你不管好!”這是明顯的表達(dá)生氣情感回復(fù)。

哈工大秦兵:機(jī)器智能中的文本情感計(jì)算 | CCF-GAIR 2018

哈工大秦兵:機(jī)器智能中的文本情感計(jì)算 | CCF-GAIR 2018

此外,我們可以進(jìn)行文本的情感極性變換及潤(rùn)色,比如原句是“服務(wù)不周,而且極其粗魯”,可以修改為“服務(wù)到位,而且非常清爽”。還可以進(jìn)行文章的潤(rùn)色,比如“兩只狗在樹(shù)邊玩?!?,我們可以把它修改為“兩只狗在樹(shù)邊玩耍,享受童年的快樂(lè)”。

哈工大秦兵:機(jī)器智能中的文本情感計(jì)算 | CCF-GAIR 2018

情感文本生成邁出機(jī)器發(fā)出情感的第一步,在聊天系統(tǒng)中可以進(jìn)行情感互動(dòng),自動(dòng)生成評(píng)論文本可以豐富用戶的表達(dá)方式,比如一個(gè)人不善表達(dá),但他對(duì)這個(gè)東西打分非常好,我們可以幫助他生成一段文字,豐富他的表達(dá)方式。

總的來(lái)講,情感分析已經(jīng)發(fā)展了很多年,已經(jīng)落地產(chǎn)生了很多應(yīng)用,產(chǎn)生巨大價(jià)值,比如在社會(huì)輿情方面、電子商務(wù)方面,如大家經(jīng)常看到的淘寶網(wǎng)等等,再比如在傳統(tǒng)行業(yè)方面,比如幫助ZARA進(jìn)行服裝設(shè)計(jì)改進(jìn),此外在金融等特定領(lǐng)域都發(fā)揮了巨大的作用,這是一個(gè)很接地氣的方向,同時(shí)也具有很多技術(shù)挑戰(zhàn)。

哈工大秦兵:機(jī)器智能中的文本情感計(jì)算 | CCF-GAIR 2018

我們來(lái)看一下能否進(jìn)行詩(shī)詞鑒賞。例如一個(gè)高考題目,關(guān)于一首杜甫的詩(shī),“韋曲花無(wú)賴,家家惱煞人”,描寫春色的美。“綠樽須盡日,白發(fā)好禁春”是說(shuō)在這樣的日子需要喝酒,需要好好享受春天的氣息?!笆倾^衣破,藤梢刺眼新”描述他已經(jīng)不顧衣服被石角鉤破,欣賞藤梢冒出的新芽?!昂螘r(shí)占叢竹,頭戴小烏巾”表達(dá)什么時(shí)候能頭戴小烏巾歸隱山林。問(wèn)題是談?wù)勗?shī)的最后兩句表達(dá)了詩(shī)人怎樣的思想感情。參考答案是對(duì)于春色的描述表達(dá)出作者的喜愛(ài)之情,因此產(chǎn)生對(duì)歸隱山林的隱士生活的向往。情感分析中用了很多其他技術(shù),包括古詩(shī)詞、隱喻等等,能表達(dá)情感和背后隱藏的歸隱山林的心情,什么時(shí)候·機(jī)器的情感分析也能進(jìn)一步分析出這種情感,同時(shí)又能像剛才孫茂松老師介紹的古詩(shī)詞一樣,能夠生成帶有指定情感的古詩(shī)詞也是情感分析未來(lái)需要探索的。

最后總結(jié)一下。情感是人類的高級(jí)思維方式;機(jī)器可以通過(guò)學(xué)習(xí)理解人類的情感模式,了解人類的情感;情感溯因可以幫助更深入理解人類情感動(dòng)機(jī);機(jī)器可以借助指定情感類別方式生成情感文本;鑒賞類或文學(xué)作品賞析情感計(jì)算值得我們繼續(xù)探索。真正具有自主意識(shí)的情感智能還未到來(lái)。謝謝大家!

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知

哈工大秦兵:機(jī)器智能中的文本情感計(jì)算 | CCF-GAIR 2018

分享:
相關(guān)文章

讀論文為生

日常笑點(diǎn)滴,學(xué)術(shù)死腦筋
當(dāng)月熱門文章
最新文章
請(qǐng)?zhí)顚懮暾?qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說(shuō)