狗尾草智能科技邵浩：從 0 到 1 構(gòu)建聊天機器人 | 職播間第 7 期

本文作者：叢末

2019-01-20 17:50

導語：Gowild 是 AI 公司里面娛樂實力比較強的公司，也是娛樂公司中 AI 實力比較強的公司~

雷鋒網(wǎng) AI 科技評論按：近年來，無論是聊天機器人技術(shù)，還是相關(guān)產(chǎn)品，都發(fā)展的非常迅速。近日，在雷鋒網(wǎng) AI 研習社公開課上，深圳狗尾草智能科技有限公司 AI Lab 主任邵浩系統(tǒng)性闡述聊天機器人的技術(shù)挑戰(zhàn)，討論聊天機器人理論的最新進展，介紹如何從零構(gòu)建一款可用的聊天機器人，以及打造聊天機器人落地產(chǎn)品中需要注意的技術(shù)細節(jié)。

公開課回放視頻網(wǎng)址：

http://www.mooc.ai/open/course/585？=shaohao

分享嘉賓：

邵浩：深圳狗尾草智能科技有限公司 AI Lab 主任，日本國立九州大學博士，中國中文信息學會青工委委員，中國計算機學會 YOCSEF 上海學術(shù)委員會委員，研究方向為人工智能和機器學習，發(fā)表論文四十余篇。

分享主題：從 0 到 1 構(gòu)建聊天機器人

分享提綱：

1、聊天機器人關(guān)鍵技術(shù)及挑戰(zhàn)
2、從 0 到 1 構(gòu)建可用的聊天機器人
3、從認知到感知：知識圖譜的核心作用
4、Gowild AI lab 簡介，總結(jié)與討論

雷鋒網(wǎng) AI 研習社將其分享內(nèi)容整理如下：

雖然《從 0 到 1 構(gòu)建聊天機器人》這個公開課標題起得有點唬人，但是還是希望大家通過這堂課了解我們公司相關(guān)團隊在做聊天機器人時所遇到的一些問題和挑戰(zhàn)，及相應的解決方案。

本次的分享分為三個部分，包括：

了解 Chatbot 的技術(shù)體系
如何從零構(gòu)建一個可用的 Chatbot
討論一些主流的理論技術(shù)及挑戰(zhàn)——主要與深度學習相關(guān)

Chatbot 的技術(shù)體系

首先看一下為什么要做聊天機器人，這要從上世紀 80 年代起我們所經(jīng)歷過的四個時代說起：

第一個時代是 IT 時代，這是個人電腦出現(xiàn)的時代，它的特點是「運算力改變生活」，當時最具代表性的公司是微軟和 IBM；

第二個時代是互聯(lián)網(wǎng)時代，這個時代最典型的特征就是「連接顛覆一切」，當時最具代表性的公司就是 Google；

第三個時代是移動互聯(lián)網(wǎng)時代，其最典型的特點是「數(shù)據(jù)利用效率的提升，和交互方式的改變」：數(shù)據(jù)利用效率方面的典型應用場景就是我們可以通過手機點外賣、叫車，這在以前是無法實現(xiàn)的事情；交互方式則從按鍵式交互變化到觸屏交互。這個時代的代表性公司是蘋果。

自從 Alpha Go 戰(zhàn)勝李世石，我們就進入了最新的一個時代——AI 時代。這個時代所對應的入口就是語音對話產(chǎn)品。微軟在 2016 年開發(fā)者大會上提出了「對話即平臺」的口號，他們認為對話是人類最自然的交互方式，這也是為什么各大科技巨頭都在競相發(fā)力聊天機器人領(lǐng)域的原因。

那 2016 年到 2018 年兩年的時間過去了，聊天機器人市場發(fā)生了什么？有句話叫做「忽如一夜春風來，千樹萬樹梨花開」，我們可以看到市場上出現(xiàn)了大量的聊天機器人，有大家熟悉的 Echo、小米音響、天貓精靈以及我們公司的公子小白等等。其中，小米還出了一款 49 元的音箱，這肯定是不盈利的，那為什么各大廠商還是大力投入呢？主要是因為它們都想通過聊天機器人搶占 AI 時代的主入口——有了入口和流量，才能在上面做很多文章。

做聊天機器人的第一步就是選擇想做什么類型的機器人。我們這里分為兩個層次、四種類型：

狗尾草智能科技邵浩：從 0 到 1 構(gòu)建聊天機器人 | 職播間第 7 期

主動交互是每個廠商都希望能做到的，它指機器人能在合適的時間和地點，以合適的方式進行主動的對話，實現(xiàn)信息共享與推薦。

被動交互則是目前大家接觸最多的一種交互方式，主要有三種類型：

第一種是聊天（閑聊）機器人，比如小冰；
第二種是問答系統(tǒng)，如 IBM 的 Watson，可以回答一些事實型和非事實型的問題；
第三種是面向任務/目標的對話系統(tǒng)，比如當用戶需要訂機票、點外賣時，機器人就需要在對話中確定某項目標或任務。

后兩類交互方式的一個主要區(qū)別在于：問答系統(tǒng)通常是單輪的，而面向任務/目標的對話系統(tǒng)通常是多輪的。

那又怎樣區(qū)別聊天（閑聊）和面向任務/目標的對話系統(tǒng)呢？

狗尾草智能科技邵浩：從 0 到 1 構(gòu)建聊天機器人 | 職播間第 7 期

（關(guān)于區(qū)別聊天（閑聊）和面向任務/目標的對話系統(tǒng)的具體講解，請回看視頻 00：12：00 處）

從 0 到 1 構(gòu)建可用的聊天機器人

下面看一下怎樣真正地從 0 到 1 去構(gòu)建聊天機器人。我們以圣斗士的不同階段為例進行闡述。

第一個階段是圣斗士候補階段，這個階段我們強調(diào)的是，你可以沒有 NLP 基礎(chǔ)、工程能力、機器學習能力以及知識圖譜能力，但你依舊可以搭建一個非常簡單的聊天機器人。我們可以通過一些現(xiàn)有的平臺去實現(xiàn)機器人的閑聊能力和其他技能。（實操平臺：http://ruyi.ai）

狗尾草智能科技邵浩：從 0 到 1 構(gòu)建聊天機器人 | 職播間第 7 期

第二個階段是青銅圣斗士階段，這個階段不要求你具備很多算法知識，但需要你對 NLP 有所了解。你可以通過復雜平臺去構(gòu)建任務型對話，其中就涉及到「多輪」和「詞槽」的概念。（實操平臺：https://ai.baidu.com/unit/home）

狗尾草智能科技邵浩：從 0 到 1 構(gòu)建聊天機器人 | 職播間第 7 期

第三個階段是白銀圣斗士階段，這個階段要求有一定代碼能力，對 NLP 有了解，可以自己動手去構(gòu)建聊天機器人。

狗尾草智能科技邵浩：從 0 到 1 構(gòu)建聊天機器人 | 職播間第 7 期

首先，自己可以創(chuàng)建一個對話語料庫，然后使用 Python 進行文本處理，其中可以用到的一個比較經(jīng)典的框架是 IR 框架：

狗尾草智能科技邵浩：從 0 到 1 構(gòu)建聊天機器人 | 職播間第 7 期

其中，在匹配模型的構(gòu)建方面，可以使用深度學習的方法去實現(xiàn)匹配：

一個方法是基于表達的——Weak interaction models
另一個方法是基于交互的——Strong interaction models

第四個階段是黃金圣斗士階段，這個階段要求你可以使用代碼完全實現(xiàn)一個文字型的對話機器人。

這里就需要有一個非常明確的架構(gòu)設計：

狗尾草智能科技邵浩：從 0 到 1 構(gòu)建聊天機器人 | 職播間第 7 期

目標就是綜合各種手段去實現(xiàn)聊天機器人 NLU、對話管理，NLG 以及各種功能：

狗尾草智能科技邵浩：從 0 到 1 構(gòu)建聊天機器人 | 職播間第 7 期

第五個階段是掌管者階段，需要更加深層的能力，包括構(gòu)建生成模型和語言模型。

狗尾草智能科技邵浩：從 0 到 1 構(gòu)建聊天機器人 | 職播間第 7 期

第六個階段是神的階段，這個階段除了對 NLP、工程、機器學習以及知識圖譜能力方面有要求，還要求具備強大的團隊實力。一個好的產(chǎn)品是各方面的妥協(xié)，需要從產(chǎn)品、性能以及成本等維度進行綜合考量。

狗尾草智能科技邵浩：從 0 到 1 構(gòu)建聊天機器人 | 職播間第 7 期

（關(guān)于從 0 到 1 去構(gòu)建聊天機器人的每個階段的具體講解以及每個階段所對應的實操演示，請回看視頻 00：15：00—00：49：40 處）

事實上，很多創(chuàng)業(yè)公司都是「A 輪死」，為什么？在 A 輪前，創(chuàng)業(yè)公司獲取現(xiàn)金流有兩種方式：一種是通過創(chuàng)始人、團隊和技術(shù)來賣「期望」拿投資；另一種是將「期望」轉(zhuǎn)化為「產(chǎn)品」，賣「現(xiàn)實」拿收入。而 A 輪之后，投資人更看中的是技術(shù)變現(xiàn)能力，看具體的營收數(shù)字。

然后聊天機器人創(chuàng)業(yè)團隊還要考量的問題是，機器人要不要考慮多輪對話，這就涉及到多輪架構(gòu)的構(gòu)建，一般難度比較大。

狗尾草智能科技邵浩：從 0 到 1 構(gòu)建聊天機器人 | 職播間第 7 期