0
雷鋒網(wǎng) AI 科技評論按:隨著語音識別 ASR 的進步,對話機器人從簡單的指令式的語音助手,進化到關(guān)鍵詞交互方式,人們能夠使用較為完整的句子來表達意圖,機器人從中截取關(guān)鍵詞判斷用戶意圖。
現(xiàn)階段利用 NLP 、NLU 技術(shù),以及機器學習方式,慢慢脫離關(guān)鍵詞的束縛,可以更聰明的去理解用戶意圖以做出正確的回應。再下一步是否能脫離一問一答的回應方式?是否機器人能主動的跟人產(chǎn)生互動?沒有情緒情感的機器人真的算是智能機器人嗎?情緒情感又有哪些可能的應用?
近日,在雷鋒網(wǎng) AI 研習社公開課上,竹間智能 CTO 翁嘉頎分享了人機交互技術(shù)探索。公開課回放視頻網(wǎng)址:http://www.mooc.ai/open/course/587?=aitechtalkwengjiaxin
翁嘉頎 Phantom Weng:竹間智能 CTO,作為 AI 領域的技術(shù)專家,他帶領團隊負責竹間在 AI 領域產(chǎn)品研發(fā)與技術(shù)規(guī)劃,領域主要涵蓋對話機器人、計算機視覺、金融科技等領域。此前,翁嘉頎在中國大陸及臺灣的多個科技類創(chuàng)新企業(yè)擔任 CTO、首席架構(gòu)師等職位,帶領團隊進行 AI 及大數(shù)據(jù)領域的研究開發(fā)。他畢業(yè)于臺灣大學資訊工程學系,此后就讀于紐約州立大學。熟悉算法、編程語言、搜索引擎、網(wǎng)絡安全以及郵件安全,使用過的語言超過 35 種。
分享主題:人機交互技術(shù)探索
分享提綱:情感計算、意圖、主題、上下文、中文 NLP 應用、多輪對話、算法與數(shù)據(jù)的關(guān)系
雷鋒網(wǎng) AI 研習社將其分享內(nèi)容整理如下:
今天講的主題是人機交互技術(shù)探索,我會著重講這些技術(shù)的應用以及怎樣解決當前的問題。
先看一下人機交互目前的現(xiàn)況:第一個,雙十一快到了,我在系統(tǒng)推薦了三件 T 恤后,回答「要黑色的」,結(jié)果因為不理解上下文,變成在解釋黑色的基本定義。跟各種機器人交互也常常會有類似答非所問的事情發(fā)生。
為什么現(xiàn)況是這樣的?這是因為大部分人機交互都使用關(guān)鍵詞匹配和模板的方式,沒有上下文,語料都是從網(wǎng)絡上爬來的——根本無法控制質(zhì)量,怎么清洗基本上都沒法使用。
一個理想中的機器人是貼心的,是能夠有情感、有記憶、懂你的,是能夠陪伴你的。機器人應該避免攻擊性的回答。
使用模板的機器人沒有情商,也無法進行多輪對話。Siri 曾在美國做過一個測驗,測驗結(jié)果顯示它的智商為 2 歲,其他的機器人也差不多。而對于成年人來說,智商達到 16-18 歲的機器人,才是我們需要的機器人,然而,如何做到這種程度?
在此之前,我先介紹一下竹間智能這家公司。
我們似乎可以發(fā)現(xiàn),目前在人工智能的文本分析和語義理解領域,很多公司的技術(shù)人員都是做搜索引擎出身的。
我們公司的 EMOTIBOT 是一個情感機器人,光文字情緒就做了 22 種,人臉表情 9 種,語音情緒 4 種,此外,還做了多模態(tài)情感識別。
做到較好的人機交互,需要哪些技術(shù)呢?
第一個是上下文理解技術(shù),有三種方式:補全、指代消解和對話主題式補全。
第二個是主題、Speech Act &情感以及 Memory 的運用:
一是利用主題做對話控制;人類對話是有固定的主題,有時候會有主題的轉(zhuǎn)換,但是至少不是東一句「天氣」西一句「體育」,這是無法聊下去的。尤其機器人回答的答案更要跟原本的對話主題相契合,不然就是答非所問文不對題。
除了對話主題以外,句法句式,根據(jù)對話中記憶下用戶的屬性,做出好的回答。例如我不喜歡看恐怖片,當問到「最近有什么好看的電影」,就不應該出現(xiàn)恐怖片。然后也可以用生成的方式來產(chǎn)生回答,直接生成方式要產(chǎn)生高質(zhì)量的回答需要大量的數(shù)據(jù)訓練,所以也可以考慮先生成些細節(jié) (句法、關(guān)鍵詞、主題 等等),再用造句的方式生成整個句子。
此外人機交互目前在特定場景內(nèi)比較能表現(xiàn)好,因此需要針對場景做深,需要場景專家以及現(xiàn)有的場景語料,才能做到準確率超過 95%。
我們再來講 NLP 的重要性,剛剛所提到的技術(shù)有一個自然語言處理平臺,能夠提供我需要的線索。而我們底下其實做了大量苦工,做得模塊較多,就有更多機會,讓各個模塊在匹配時能夠 Cover 對方的弱點。
那我們?nèi)绾卫?NLU 的基礎信息呢?
然后講到一個中控中心的問題,這就涉及到剛剛所提到的多輪對話問題。那多輪之間能不能切換?下面是幾個例子:
最后我分享一下竹間智能的實戰(zhàn)經(jīng)驗。
一是算法。單一算法在圖像識別上的應用表現(xiàn)可能還好,但在文本和語義理解上基本不可能獲得好的準確率,下面是其無法解決的一些問題:
二是語言學家與數(shù)據(jù)質(zhì)量。數(shù)據(jù)標注上必須非常嚴謹,尤其必須有專業(yè)的語言學家加入標準準則的設計,或是標注質(zhì)量的把控。建議任何一筆數(shù)據(jù)都有多個標注人員做到交叉審查,當幾個標注人員意見不一致的時候,由語言學家 / 領域?qū)<易鲎詈蟮呐卸?。不然垃圾的?shù)據(jù)只會訓練出垃圾的模型。
未來會不會存在這么一個世界:每個人都有一個機器人,機器人會懂你,就像好朋友和閨蜜一樣;每家企業(yè)也會有機器人,會幫助員工完成訂餐等事宜。這是一個理想的狀態(tài),雖然現(xiàn)在還有一段距離,但是也有很大的希望,不過我們只有將技術(shù)底層做好,才能一步步走到這個理想狀態(tài)。
以上就是本期嘉賓的全部分享內(nèi)容。更多公開課視頻請到雷鋒網(wǎng) AI 研習社社區(qū)觀看,關(guān)注微信公眾號:AI 研習社(okweiwu),可獲取最新公開課直播時間預告。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。