0
本文作者: 叢末 | 2019-01-20 17:50 |
雷鋒網(wǎng) AI 科技評(píng)論按:近年來,無論是聊天機(jī)器人技術(shù),還是相關(guān)產(chǎn)品,都發(fā)展的非常迅速。近日,在雷鋒網(wǎng) AI 研習(xí)社公開課上,深圳狗尾草智能科技有限公司 AI Lab 主任邵浩系統(tǒng)性闡述聊天機(jī)器人的技術(shù)挑戰(zhàn),討論聊天機(jī)器人理論的最新進(jìn)展,介紹如何從零構(gòu)建一款可用的聊天機(jī)器人,以及打造聊天機(jī)器人落地產(chǎn)品中需要注意的技術(shù)細(xì)節(jié)。
公開課回放視頻網(wǎng)址:
http://www.mooc.ai/open/course/585?=shaohao
分享嘉賓:
邵浩:深圳狗尾草智能科技有限公司 AI Lab 主任,日本國立九州大學(xué)博士,中國中文信息學(xué)會(huì)青工委委員,中國計(jì)算機(jī)學(xué)會(huì) YOCSEF 上海學(xué)術(shù)委員會(huì)委員,研究方向?yàn)槿斯ぶ悄芎蜋C(jī)器學(xué)習(xí),發(fā)表論文四十余篇。
分享主題:從 0 到 1 構(gòu)建聊天機(jī)器人
分享提綱:
1、聊天機(jī)器人關(guān)鍵技術(shù)及挑戰(zhàn)
2、從 0 到 1 構(gòu)建可用的聊天機(jī)器人
3、從認(rèn)知到感知:知識(shí)圖譜的核心作用
4、Gowild AI lab 簡介,總結(jié)與討論
雷鋒網(wǎng) AI 研習(xí)社將其分享內(nèi)容整理如下:
雖然《從 0 到 1 構(gòu)建聊天機(jī)器人》這個(gè)公開課標(biāo)題起得有點(diǎn)唬人,但是還是希望大家通過這堂課了解我們公司相關(guān)團(tuán)隊(duì)在做聊天機(jī)器人時(shí)所遇到的一些問題和挑戰(zhàn),及相應(yīng)的解決方案。
本次的分享分為三個(gè)部分,包括:
了解 Chatbot 的技術(shù)體系
如何從零構(gòu)建一個(gè)可用的 Chatbot
討論一些主流的理論技術(shù)及挑戰(zhàn)——主要與深度學(xué)習(xí)相關(guān)
首先看一下為什么要做聊天機(jī)器人,這要從上世紀(jì) 80 年代起我們所經(jīng)歷過的四個(gè)時(shí)代說起:
第一個(gè)時(shí)代是 IT 時(shí)代,這是個(gè)人電腦出現(xiàn)的時(shí)代,它的特點(diǎn)是「運(yùn)算力改變生活」,當(dāng)時(shí)最具代表性的公司是微軟和 IBM;
第二個(gè)時(shí)代是互聯(lián)網(wǎng)時(shí)代,這個(gè)時(shí)代最典型的特征就是「連接顛覆一切」,當(dāng)時(shí)最具代表性的公司就是 Google;
第三個(gè)時(shí)代是移動(dòng)互聯(lián)網(wǎng)時(shí)代,其最典型的特點(diǎn)是「數(shù)據(jù)利用效率的提升,和交互方式的改變」:數(shù)據(jù)利用效率方面的典型應(yīng)用場景就是我們可以通過手機(jī)點(diǎn)外賣、叫車,這在以前是無法實(shí)現(xiàn)的事情;交互方式則從按鍵式交互變化到觸屏交互。這個(gè)時(shí)代的代表性公司是蘋果。
自從 Alpha Go 戰(zhàn)勝李世石,我們就進(jìn)入了最新的一個(gè)時(shí)代——AI 時(shí)代。這個(gè)時(shí)代所對(duì)應(yīng)的入口就是語音對(duì)話產(chǎn)品。微軟在 2016 年開發(fā)者大會(huì)上提出了「對(duì)話即平臺(tái)」的口號(hào),他們認(rèn)為對(duì)話是人類最自然的交互方式,這也是為什么各大科技巨頭都在競相發(fā)力聊天機(jī)器人領(lǐng)域的原因。
那 2016 年到 2018 年兩年的時(shí)間過去了,聊天機(jī)器人市場發(fā)生了什么?有句話叫做「忽如一夜春風(fēng)來,千樹萬樹梨花開」,我們可以看到市場上出現(xiàn)了大量的聊天機(jī)器人,有大家熟悉的 Echo、小米音響、天貓精靈以及我們公司的公子小白等等。其中,小米還出了一款 49 元的音箱,這肯定是不盈利的,那為什么各大廠商還是大力投入呢?主要是因?yàn)樗鼈兌枷胪ㄟ^聊天機(jī)器人搶占 AI 時(shí)代的主入口——有了入口和流量,才能在上面做很多文章。
做聊天機(jī)器人的第一步就是選擇想做什么類型的機(jī)器人。我們這里分為兩個(gè)層次、四種類型:
主動(dòng)交互是每個(gè)廠商都希望能做到的,它指機(jī)器人能在合適的時(shí)間和地點(diǎn),以合適的方式進(jìn)行主動(dòng)的對(duì)話,實(shí)現(xiàn)信息共享與推薦。
被動(dòng)交互則是目前大家接觸最多的一種交互方式,主要有三種類型:
第一種是聊天(閑聊)機(jī)器人,比如小冰;
第二種是問答系統(tǒng),如 IBM 的 Watson,可以回答一些事實(shí)型和非事實(shí)型的問題;
第三種是面向任務(wù)/目標(biāo)的對(duì)話系統(tǒng),比如當(dāng)用戶需要訂機(jī)票、點(diǎn)外賣時(shí),機(jī)器人就需要在對(duì)話中確定某項(xiàng)目標(biāo)或任務(wù)。
后兩類交互方式的一個(gè)主要區(qū)別在于:問答系統(tǒng)通常是單輪的,而面向任務(wù)/目標(biāo)的對(duì)話系統(tǒng)通常是多輪的。
那又怎樣區(qū)別聊天(閑聊)和面向任務(wù)/目標(biāo)的對(duì)話系統(tǒng)呢?
(關(guān)于區(qū)別聊天(閑聊)和面向任務(wù)/目標(biāo)的對(duì)話系統(tǒng)的具體講解,請(qǐng)回看視頻 00:12:00 處)
下面看一下怎樣真正地從 0 到 1 去構(gòu)建聊天機(jī)器人。我們以圣斗士的不同階段為例進(jìn)行闡述。
第一個(gè)階段是圣斗士候補(bǔ)階段,這個(gè)階段我們強(qiáng)調(diào)的是,你可以沒有 NLP 基礎(chǔ)、工程能力、機(jī)器學(xué)習(xí)能力以及知識(shí)圖譜能力,但你依舊可以搭建一個(gè)非常簡單的聊天機(jī)器人。我們可以通過一些現(xiàn)有的平臺(tái)去實(shí)現(xiàn)機(jī)器人的閑聊能力和其他技能。(實(shí)操平臺(tái):http://ruyi.ai)
第二個(gè)階段是青銅圣斗士階段,這個(gè)階段不要求你具備很多算法知識(shí),但需要你對(duì) NLP 有所了解。你可以通過復(fù)雜平臺(tái)去構(gòu)建任務(wù)型對(duì)話,其中就涉及到「多輪」和「詞槽」的概念。(實(shí)操平臺(tái):https://ai.baidu.com/unit/home)
第三個(gè)階段是白銀圣斗士階段,這個(gè)階段要求有一定代碼能力,對(duì) NLP 有了解,可以自己動(dòng)手去構(gòu)建聊天機(jī)器人。
首先,自己可以創(chuàng)建一個(gè)對(duì)話語料庫,然后使用 Python 進(jìn)行文本處理,其中可以用到的一個(gè)比較經(jīng)典的框架是 IR 框架:
其中,在匹配模型的構(gòu)建方面,可以使用深度學(xué)習(xí)的方法去實(shí)現(xiàn)匹配:
一個(gè)方法是基于表達(dá)的——Weak interaction models
另一個(gè)方法是基于交互的——Strong interaction models
第四個(gè)階段是黃金圣斗士階段,這個(gè)階段要求你可以使用代碼完全實(shí)現(xiàn)一個(gè)文字型的對(duì)話機(jī)器人。
這里就需要有一個(gè)非常明確的架構(gòu)設(shè)計(jì):
目標(biāo)就是綜合各種手段去實(shí)現(xiàn)聊天機(jī)器人 NLU、對(duì)話管理,NLG 以及各種功能:
第五個(gè)階段是掌管者階段,需要更加深層的能力,包括構(gòu)建生成模型和語言模型。
第六個(gè)階段是神的階段,這個(gè)階段除了對(duì) NLP、工程、機(jī)器學(xué)習(xí)以及知識(shí)圖譜能力方面有要求,還要求具備強(qiáng)大的團(tuán)隊(duì)實(shí)力。一個(gè)好的產(chǎn)品是各方面的妥協(xié),需要從產(chǎn)品、性能以及成本等維度進(jìn)行綜合考量。
(關(guān)于從 0 到 1 去構(gòu)建聊天機(jī)器人的每個(gè)階段的具體講解以及每個(gè)階段所對(duì)應(yīng)的實(shí)操演示,請(qǐng)回看視頻 00:15:00—00:49:40 處)
事實(shí)上,很多創(chuàng)業(yè)公司都是「A 輪死」,為什么?在 A 輪前,創(chuàng)業(yè)公司獲取現(xiàn)金流有兩種方式:一種是通過創(chuàng)始人、團(tuán)隊(duì)和技術(shù)來賣「期望」拿投資;另一種是將「期望」轉(zhuǎn)化為「產(chǎn)品」,賣「現(xiàn)實(shí)」拿收入。而 A 輪之后,投資人更看中的是技術(shù)變現(xiàn)能力,看具體的營收數(shù)字。
然后聊天機(jī)器人創(chuàng)業(yè)團(tuán)隊(duì)還要考量的問題是,機(jī)器人要不要考慮多輪對(duì)話,這就涉及到多輪架構(gòu)的構(gòu)建,一般難度比較大。
最后跟大家介紹一下我們公司,Gowild 是 AI 公司里面娛樂實(shí)力比較強(qiáng)的公司,也是娛樂公司中 AI 實(shí)力比較強(qiáng)的公司。
分享結(jié)束后,嘉賓還對(duì)聽眾的提問進(jìn)行了解答,大家可回看視頻 00:55:00 處
以上就是本期嘉賓的全部分享內(nèi)容。更多公開課視頻請(qǐng)到雷鋒網(wǎng)(公眾號(hào):雷鋒網(wǎng)) AI 研習(xí)社社區(qū)(http://ai.yanxishe.com/)觀看。關(guān)注微信公眾號(hào):AI 研習(xí)社(okweiwu),可獲取最新公開課直播時(shí)間預(yù)告。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。