0
本文作者: 叢末 | 2019-07-21 23:31 |
雷鋒網(wǎng) AI 科技評(píng)論按:如今,已滲透到人類生活方方面面的對(duì)話 AI ,成為了連接人們的社會(huì)生活與 AI 技術(shù)最緊密的一根紐帶。然而,自然語(yǔ)言對(duì)話技術(shù)目前存在的難以克服的挑戰(zhàn),也常讓對(duì)話 AI 在與人類的交互過(guò)程中發(fā)生一些令人啼笑皆非的故事。目前距離類人智能還差上那么一截的對(duì)話 AI,到底該如何尋求發(fā)展與突破?
在 7 月 19 日召開(kāi)的「市北·GMIS 2019 全球數(shù)據(jù)智能峰會(huì)」上,字節(jié)跳動(dòng)人工智能實(shí)驗(yàn)室負(fù)責(zé)人、IEEE 會(huì)士、ACM 杰出科學(xué)家李航教授在主題為《自然語(yǔ)言對(duì)話:未來(lái)技術(shù)發(fā)展的機(jī)遇與挑戰(zhàn)》的演講中,基于自然語(yǔ)言對(duì)話技術(shù)目前面臨的挑戰(zhàn),分享了該領(lǐng)域未來(lái)技術(shù)的發(fā)展機(jī)遇以及可以尋求突破的發(fā)展方向。與此同時(shí),李航教授還特別強(qiáng)調(diào)了研發(fā)者在設(shè)計(jì)對(duì)話 AI 系統(tǒng)時(shí)需要遵循的原則之一:不要讓系統(tǒng)假裝智能。
我們來(lái)看李航教授都說(shuō)了什么。
語(yǔ)音對(duì)話系統(tǒng)按技術(shù)來(lái)劃分,主要有兩類較為常用的技術(shù)——命令和問(wèn)答,目前這兩種技術(shù)相對(duì)來(lái)說(shuō)較為成熟,在多個(gè)不同的場(chǎng)景中得到了應(yīng)用。然而,現(xiàn)在開(kāi)放域?qū)υ挼膶?shí)現(xiàn),整體而言還存在比較大的挑戰(zhàn),即目前聊天機(jī)器人還無(wú)法做到與人類自由對(duì)話。
對(duì)此,李航教授指出了自然語(yǔ)言對(duì)話主要面臨的兩大挑戰(zhàn):
其一是自然語(yǔ)言理解問(wèn)題,由于語(yǔ)言理解涉及到人類智能的所有方面,因而要想讓機(jī)器真正精通語(yǔ)言理解是非常困難的。
其二是任務(wù)完成問(wèn)題,因?yàn)閷?duì)話實(shí)際上一種交互任務(wù),雙方彼此需要交換信息、交流情感來(lái)完成某個(gè)既定目標(biāo),而同樣以完成交互任務(wù)為目標(biāo)的對(duì)話系統(tǒng)在與人交互時(shí),需要人類干預(yù)進(jìn)行設(shè)置、終止或恢復(fù),所以目前人工智能技術(shù)還無(wú)法獨(dú)自完成整個(gè)交互任務(wù)。
雖然現(xiàn)在的強(qiáng)化學(xué)習(xí)、規(guī)則方法能夠幫助機(jī)器做完成某些事情,但機(jī)器要想像人類一樣去定義、產(chǎn)生并最終自主完成任務(wù),同樣也涉及到人類智能的所有方面,同樣極具挑戰(zhàn)性。
「語(yǔ)言理解和任務(wù)完成,其實(shí)也是整個(gè)人工智能領(lǐng)域最有挑戰(zhàn)的問(wèn)題,因?yàn)樗鼈兌际恰竿耆斯ぶ悄堋箚?wèn)題?!?/p>
針對(duì)以上提出的兩點(diǎn)主要挑戰(zhàn),李航教授也從未來(lái) 5 到 10 年的維度,為未來(lái)尋求自然語(yǔ)言對(duì)話的發(fā)展突破指出了兩條出路:
一方面是要做對(duì)話技術(shù)的突破。實(shí)際上我們?nèi)嗽趯?duì)話時(shí),不僅有語(yǔ)言上的信息交互,彼此間還有情感的分享,過(guò)程中會(huì)有一些社會(huì)習(xí)俗的因素在對(duì)話中體現(xiàn)出來(lái),所以我們需要構(gòu)建的對(duì)話系統(tǒng),不僅要求它能夠在不同場(chǎng)景中與人進(jìn)行信息交流,還需要進(jìn)行情感方面的交互。
另一方面是實(shí)現(xiàn)市場(chǎng)創(chuàng)新(商業(yè)化角度)。如果我們要實(shí)現(xiàn)真正的創(chuàng)新,核心點(diǎn)還在于思考能給市場(chǎng)用戶帶來(lái)多大的價(jià)值。技術(shù)的發(fā)明其實(shí)并不是一個(gè)想法的簡(jiǎn)單實(shí)現(xiàn),而是需要能夠幫助用戶解決實(shí)際問(wèn)題的,這樣的發(fā)明創(chuàng)造才是通過(guò)市場(chǎng)檢驗(yàn)的有價(jià)值的創(chuàng)造。
與此同時(shí),李航教授還分享了一個(gè)他曾在其他演講中提到過(guò)多次的觀點(diǎn):我們的技術(shù)永遠(yuǎn)在不斷進(jìn)度,但是什么時(shí)候能夠真正滿足用戶的需求,還不確定。
在這個(gè)觀點(diǎn)的闡述中,李航教授提到了兩個(gè)重要的概念:技術(shù)的上界和使用的下界。以對(duì)話系統(tǒng)在與人交互時(shí)的理解準(zhǔn)確率為例,隨著對(duì)話技術(shù)的不斷提高,對(duì)話系統(tǒng)的理解準(zhǔn)確率上界在不斷提高;而用戶決定是否愿意使用這個(gè)對(duì)話系統(tǒng)則取決于準(zhǔn)確率的下界,即如果準(zhǔn)確率達(dá)不到某個(gè)水平,用戶是不愿意使用的。同時(shí),用戶使用的下界絕對(duì)值不一定非常高,很可能準(zhǔn)確率達(dá)到 50 % 就夠了,但是在某些特殊的場(chǎng)景,技術(shù)的準(zhǔn)確率可能要求達(dá)到 95%。
因此,李航教授認(rèn)為,該領(lǐng)域的研發(fā)人員和從業(yè)者在尋求自然語(yǔ)言對(duì)話的發(fā)展突破時(shí),要綜合考量每個(gè)技術(shù)能達(dá)到的上界以及用戶使用的下界。
基于前面對(duì)于整個(gè)對(duì)話技術(shù)的現(xiàn)狀、挑戰(zhàn)以及發(fā)展的突破方向的分析,李航教授認(rèn)為自然語(yǔ)言對(duì)話目前也存在不錯(cuò)的發(fā)展機(jī)遇,在這里,他從產(chǎn)品設(shè)計(jì)的視角出發(fā)分享了四個(gè)他認(rèn)為可以重點(diǎn)考慮的機(jī)會(huì),包括:
第一,任務(wù)驅(qū)動(dòng)的對(duì)話機(jī)器人。這一類機(jī)器人大家現(xiàn)在接觸得比較多,現(xiàn)在的語(yǔ)音助手幾乎都屬于這類機(jī)器人。
第二,信息類機(jī)器人。人類獲取信息的方式主要有兩種,一種是搜索,一種是推薦,而信息類機(jī)器人則給人類提供了另一種新的信息獲取方式——以聊天的方式獲得信息。以亞馬遜最近組織的 ALEXA 比賽為例,就是讓參賽者設(shè)計(jì)對(duì)話機(jī)器人從社交媒體上找到各類有意思的信息去與用戶對(duì)話,以對(duì)話的方式去幫助用戶獲取信息。
第三,情感類機(jī)器人。這類機(jī)器人并非是一個(gè)單純的對(duì)話機(jī)器人,而是一種陪伴型機(jī)器人。以日本去年推出的一款叫做 LOVOT 的機(jī)器人為例,它在智能方面的實(shí)現(xiàn)程度并沒(méi)有那么高,但是能夠與用戶進(jìn)行情感上的互動(dòng),幫助用戶發(fā)現(xiàn)自我。比如說(shuō)它看到人以后會(huì)張開(kāi)雙臂讓用戶去擁抱它,同時(shí)用戶還能夠給它換衣服,所以人類在使用這類機(jī)器人時(shí),更多地會(huì)將其當(dāng)做一個(gè)寵物,并非常愿意與其進(jìn)行互動(dòng)。「未來(lái)的機(jī)器人應(yīng)該也能夠具備這樣的互動(dòng)和情感交流能力?!?/p>
第四,游戲類機(jī)器人。以一款叫做 FACEDE 的經(jīng)典游戲?yàn)槔?,游戲中有一?duì)夫婦住在一個(gè)公寓中,他們正在吵架,玩家可以進(jìn)入公寓,并通過(guò)鍵盤以打字的方式與這對(duì)夫婦對(duì)話,有可能能幫助他們和好,也有可能讓兩人分手,同時(shí)也有可能同時(shí)得罪了他們被趕出公寓。在這個(gè)過(guò)程中,怎樣設(shè)計(jì)對(duì)話技術(shù)是比較有發(fā)揮余地的地方,有時(shí)候你設(shè)計(jì)出來(lái)的對(duì)話可能并不能為系統(tǒng)和游戲所理解,但是如果用戶覺(jué)得很有趣味性,也是值得考慮的方向。
李航教授表示,總體而言,對(duì)話機(jī)器人未來(lái)還有很多可以發(fā)揮的場(chǎng)景,該領(lǐng)域的研究者完全可以在不同的場(chǎng)景中做出好的成果。
最后,李航教授也基于自身在華為和字節(jié)跳動(dòng)的研發(fā)經(jīng)驗(yàn),總結(jié)出了一套研發(fā)者在設(shè)計(jì)對(duì)話系統(tǒng)時(shí)應(yīng)該遵循的四項(xiàng)原則:
第一,要讓對(duì)話機(jī)器人在某個(gè)場(chǎng)景中能夠做到「自封閉」?!肝抑霸谧鲎匀徽Z(yǔ)言接口,即將自然語(yǔ)言轉(zhuǎn)化為數(shù)據(jù)庫(kù)語(yǔ)句時(shí),當(dāng)時(shí)大家都有一個(gè)非常清晰的共識(shí),就是用戶非常討厭限制他在與機(jī)器對(duì)話時(shí)能說(shuō)什么以及不能說(shuō)什么,因此,在某個(gè)場(chǎng)景中,一定要讓對(duì)話系統(tǒng)能夠比較完整地理解用戶的基本句法,從而保持與用戶對(duì)話的流暢性和完整性。針對(duì)這點(diǎn),我們也有一個(gè) 80%、20% 的定律,即系統(tǒng)不可能能夠 100% 地理解用戶,在某個(gè)場(chǎng)景中覆蓋用戶百分之八九十的基本句法就差不多了。」
第二,「失敗的時(shí)候也要保持優(yōu)雅」,即一旦系統(tǒng)無(wú)法理解用戶,就一定要給用戶提示。這樣的話,即便系統(tǒng)在某些時(shí)候無(wú)法很好地理解用戶的句法,用戶在收到來(lái)自系統(tǒng)的提示后,心里上也會(huì)相對(duì)舒服些。同時(shí),研發(fā)者還要為系統(tǒng)設(shè)計(jì)一個(gè)類似于「Home」的功能,即當(dāng)對(duì)話系統(tǒng)沒(méi)法完成與用戶對(duì)話,用戶可以通過(guò)這個(gè)功能重新與對(duì)話系統(tǒng)建立對(duì)話。
第三,要在對(duì)話系統(tǒng)中加入情感、文化的因素。對(duì)話系統(tǒng)與人類用戶進(jìn)行的不僅僅是語(yǔ)言上的對(duì)話,還應(yīng)該包括情感和文化的因素在里面。因此,如何讓系統(tǒng)在對(duì)話過(guò)程中更加富有情感和文化因素,也是研發(fā)人員需要重點(diǎn)關(guān)注的地方。
第四,「不要讓系統(tǒng)假裝智能」。如果將某個(gè)對(duì)話系統(tǒng)的智能定位得過(guò)高,其一旦在與用戶的對(duì)話中無(wú)法做到靈活應(yīng)變,就會(huì)讓用戶產(chǎn)生更大的心理落差,讓人覺(jué)得這種智能不過(guò)是很傻的智能。
「我們都希望對(duì)話系統(tǒng)越來(lái)越智能,用戶用起來(lái)也越來(lái)越方便,最終對(duì)話系統(tǒng)能像真人一樣與人交互。但在此之前,我們還是需要一步步腳踏實(shí)地地去朝著這個(gè)目標(biāo)邁進(jìn),而不是在系統(tǒng)還沒(méi)有達(dá)到類人水平的時(shí)候,硬讓系統(tǒng)假裝智能,這不是一個(gè)正確的做法?!?/p>
雷鋒網(wǎng) AI 科技評(píng)論報(bào)道。 雷鋒網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。