0
本文作者: 奕欣 | 2017-09-23 15:46 |
雷鋒網 AI 科技評論按:以微軟小冰為代表的聊天機器人已經滲透到我們的日常生活中,雖然小冰會賣萌懂幽默,但距離真正的共情、理解人類的情緒還是有一定的距離。清華大學計算機系朱小燕、黃民烈老師團隊今年的一項研究工作希望讓聊天機器人具備這樣的能力。
在這個名為 ECM(Emotional Chatting Machine:情緒化聊天機器人)、基于深度學習的情感對話模型中,團隊首次將情感因素引入了基于深度學習的生成模型中。
相關論文可查看《Emotional Chatting Machine: Emotional Conversation Generation with Internal and External Memory》,作者周昊、黃民烈、張?zhí)鞊P、朱小燕、劉兵。
9 月份,黃民烈博士也帶領清華的兩位學生,聯合搜狗搜索團隊一舉獲得了全球唯一開放域對話評測比賽 NTCIR-STC2 的冠軍。雷鋒網 AI 科技評論與黃民烈博士取得聯系,與他交流了近期的一些研究工作,并探討了聊天機器人的情緒機制設計。
黃民烈,清華大學計算機系副教授。研究興趣主要集中在深度學習、機器學習方法與應用,自然語言處理如自動問答、人機對話系統(tǒng)、情感分析等。已超過 40 篇 CCF A/B 類論文發(fā)表在 ACL、IJCAI、AAAI、EMNLP、KDD 等國際主流會議及 ACM TOIS、Bioinformatics 等期刊上,SCI 他引超過 300 次。曾擔任多個國際會議的領域主席或高級程序委員,如 IJCAI 2017高級程序委員, ACL 2016、EMNLP 2014/2011、IJCNLP 2017 等國際會議領域主席,擔任多個國際頂級期刊的審稿人。
目前對話系統(tǒng)有兩種主要模式,一種基于信息檢索,即在數據庫或語料庫中找尋相近內容的答復作為返回答復,現在有很多工作及實際應用也采用的是這種方法。而隨著深度學習的發(fā)展,另一種方法——基于深度學習的生成式對話系統(tǒng)也受到了越來越多的關注。從去年開始,NTCIR-STC2 在基于檢索的任務上又新增了一項基于生成的任務評測,其重要程度可見一斑。
黃民烈博士告訴雷鋒網 AI 科技評論,有不少生成式對話系統(tǒng)的工作都將關注點集中于提升生成語句的語言質量,但往往忽略了對人類情感的理解。因此,團隊著手研究如何讓計算機通過文字方式表達情緒,也是希望能在人機對話系統(tǒng)中加入感知情緒的成分,能從語言和情感兩個維度上生成恰當的回復。
根據論文的介紹,ECM 在傳統(tǒng)的 Sequence to Sequence 模型的基礎上,采用靜態(tài)的情感向量嵌入表示,動態(tài)的情感狀態(tài)記憶網絡和情感詞外部記憶的機制,讓 ECM 得以根據用戶的輸入,并基于指定的情感分類(包括快樂、傷感、憤怒、厭煩、好感等五種情緒)輸出相應的回復。
在這項研究中,ECM 首次將情感因素與深度學習方法相融合。盡管自然語言處理領域本身早在深度學習快速發(fā)展前就已經能順利做出商業(yè)化的產品,但在 ACL 2017 上,雷鋒網 AI 科技評論也非常明顯地感受到深度學習的滲透。不可否認的是,深度學習對自然語言處理的影響力不可小覷。在黃民烈老師的理解中,語言本身的復雜性有很多方面,比如情緒、風格、結構等等,而且語言經過高度抽象后往往只字之差意義去相去甚遠,這種符號上表達的含義很難用模型進行表述和定義。而深度學習更擅長的是做概率性的一些推理?!笇τ谡Z言來說,深度學習目前還是比較難以解決包括符號、知識及推理層面的問題的?!?/p>
ECM 的主要數據來源是新浪微博。但微博作為一個非?;钴S的社交媒體,也有非常多涉及網絡用語、反語、雙關的帖子或評論,目前有不少學者在做相關的研究,包括網絡新詞、反語檢測、雙關檢測等,黃民烈博士自己也有相關的研究工作。比如在自然語言處理領域頂級會議 ACL 2014 上,黃民烈博士有一篇第一作者的收錄論文《情感分析中的新詞發(fā)現》(New Word Finding for Sentiment Analysis),基于微博數據提出了一種數據驅動、不依賴知識、非監(jiān)督的新詞發(fā)現算法。那么在 ECM 中,是否也會對新詞進行發(fā)現并做情感分析,輔助進行生成式的回復呢?
對此,黃民烈博士告訴雷鋒網 AI 科技評論,在 ECM 的研究中,這類數據并沒有很多,也不影響研究者們基于數據獲取生成內容。他認為,這類工作在判斷輿情或是大眾觀點上會更受關注些,但其中最重要的是對背景知識的了解?!副热缒阒S刺一個什么事情,其實人類是知道關于這個內容或這個事件的背景信息的,因此你很容易理解這是一個反諷,但現在計算機系統(tǒng)還不太能做到這一點。如果模型不能很好地利用這種背景知識和信息的話,確實會得到一個相反的結論。」
「ECM 的研究只是非常初步的一個嘗試,聊天機器人的回復目前是建立在給定情感分類的基礎上做出的,還沒有涉及到如何評判用戶情緒的研究?!裹S民烈博士表示,后續(xù)可以通過設計共情機制,或是通過上下文、情境等信息判斷合適的回復,不過這非常復雜和具有挑戰(zhàn)性。
機器要擁有「情緒」,能夠更加智能,在黃民烈博士看來需要有兩個方面的內容。首先是語義理解,另一個則是身份設定。語義理解不難懂,現在有很多公司及研究機構都在做類似的工作。但身份設定,則是要在聊天進行的過程中嵌入機器人的身份和屬性。
「比如現在我們可以和小冰聊天,但很快你會意識到它不是一個『人』,除了語義理解的問題外,更多的是因為它缺少一個固定的人格和屬性。比如當你問小冰,它的性別是什么時,這個回答是前后不一致的。」黃民烈博士表示,如何讓機器人具有特定的說話風格,實際上也是一個非常重要的問題,在未來,當我們設定機器人是一個三歲的小男孩,會彈鋼琴時,那么結合這樣的屬性再去和它對話,它應該生成跟它自己身份、個性相符合的答復。在這方面,黃民烈博士也進行了初步探索,詳見論文《Assigning personality/identity to a chatting machine for coherent conversation generation》。
黃民烈博士表示,一個符合情境的交談或對話需要符合多個因素。首先是交談的話題;其次,交談的對象是什么,是在和誰說話;再者,雙方的情緒甚至心理活動狀態(tài)是怎樣的。除此之外,還需要考慮用戶的背景和對話中扮演的角色,甚至多方面綜合的感知信息如語音、語調、姿態(tài)和表情等?!改壳拔覀兯龅难芯窟€只是從文字上來判斷。有時候我們在設計模型時并沒有辦法完全地考慮到這些變量,因此只能在研究的基礎上做大幅的簡化?!?/p>
除了身份設定的研究外,黃民烈博士也正在進行更多的關于「解決任務導向對話系統(tǒng)、聊天機器人、自動問答中最具挑戰(zhàn)性」的研究工作?,F在的人機對話要實現像人一樣的自主交談依然具有很大難度,而其中涉及的最根本的便是理解的問題。「平時做一個相對容易的分類問題,(準確率)可能做到百分之七八十,而且這些結果也能夠用在實際的系統(tǒng)里面。但人機對話實際上需要的是深層次的理解,所以現在的系統(tǒng)還存在很多邏輯上的問題?!裹S民烈博士及其團隊雖然在近年也做出了不少嘗試,也取得了一定的進步,但他認為,實際上在開放領域及開放話題上的聊天依然有很多問題亟待解決,比如如何利用客觀世界的知識,或是背景信息,并結合記憶、聯想和推理,才能實現符合情境的交談與對話。
在黃民烈博士看來,在特定任務場景的生成式對話才更具有商業(yè)應用的前景。目前,黃民烈博士及團隊在商業(yè)化應用上也做了不少嘗試,比如和一家機器人公司合作研發(fā)了一款點餐機器人。從 Demo 上看,這款機器人能夠清楚地理解各種上下文的指代,如「這道菜」、「剛剛那個魚」等語句,且不會被臨時的其它提問所打斷。
「家用聊天機器人的語境要寬泛得多,因為我們并不知道對方會和你聊些什么,因此目前開放式的聊天系統(tǒng)距離真正的實用還有一定距離?!贡M管如此,黃民烈博士表示,語音交互作為一個新的入口,作為人機交流的一種范式,開放式聊天對于情感陪護而言依然是非常重要的互動環(huán)節(jié)?!笍漠a品的角度來講,一方面它確實可以提供更好的用戶體驗,另一方面如果積累大量的實際對話數據,也可以進一步促進技術的發(fā)展?!?/p>
有著深厚研究成果的黃民烈博士,實際上在自然語言處理的研究經歷了跨專業(yè)、跨學科的歷程,「半路出家」的他原本就讀的是清華大學工程物理專業(yè),關于數學、計算機的課程給他轉向自然語言處理研究打下了扎實的基礎,并憑借出色的研究成果獲得了 2006 年清華大學優(yōu)秀博士論文,被授予「清華大學優(yōu)秀博士畢業(yè)生」,隨即留校任教。
回顧就學經歷,黃民烈博士告訴雷鋒網 AI 科技評論,他非常看重學生的基礎課程和知識是否扎實,也強調了打好基礎知識的重要性。他認為,「語言理解的難點在于,首先它經過了高度的抽象,其次需要綜合利用的信息非常多,要理解一句話需要充足的背景知識才能明白真正的含義?!苟谒裕匀徽Z言處理最大的魅力就在于所具備的挑戰(zhàn)性,作為人類日常使用的交流方式,語言理解的很多問題依然非常困難。而目前,黃民烈博士及其團隊也正試圖從理解的角度出發(fā),進行更多復雜問題回答、人機對話、情感理解方面的相關研究。
雷峰網原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知。