1
本文作者: 宗仁 | 2016-05-28 21:34 |
最近Bot這種虛擬機(jī)器人成為了國(guó)際新熱點(diǎn),但于有些人而言,它們已經(jīng)做了十幾年。
長(zhǎng)期以來(lái),語(yǔ)音交互領(lǐng)域的公司,我們對(duì)語(yǔ)音識(shí)別的公司(諸如科大訊飛,云知聲,思必馳)非常熟悉,但對(duì)于只專(zhuān)注于其背后更深一個(gè)層次的語(yǔ)義識(shí)別公司卻知之甚少,當(dāng)然這并不是我們孤陋寡聞,而是語(yǔ)義識(shí)別的屬性決定它會(huì)更多地躲在背后干實(shí)事。
以本次在貴陽(yáng)數(shù)博會(huì)發(fā)布2.0平臺(tái)的小i機(jī)器人CEO袁暉的比方為例,“當(dāng)用戶對(duì)Siri講一句話時(shí),語(yǔ)音識(shí)別分析出這句話說(shuō)的是什么,語(yǔ)義識(shí)別分析出這句話是什么意思。語(yǔ)音和語(yǔ)義兩部分技術(shù)在Siri中所占的比例分別是20%和80%。也就是說(shuō),要正確理解用戶的意思并作出反應(yīng),語(yǔ)義識(shí)別實(shí)際上更為關(guān)鍵?!?/p>
不過(guò),當(dāng)最近FB,Google,微軟爭(zhēng)相推出自己的Bots虛擬機(jī)器人,越來(lái)越多的人認(rèn)識(shí)到之前的語(yǔ)音識(shí)別還不能滿足大眾對(duì)生活中各種各樣的語(yǔ)音交互,語(yǔ)義識(shí)別這時(shí)候就被迫登上公眾舞臺(tái)去繼續(xù)推動(dòng)語(yǔ)音交互的發(fā)展,小i機(jī)器人最強(qiáng)大腦平臺(tái)2.0就是在這個(gè)時(shí)候發(fā)布的。
小i機(jī)器人過(guò)去一直潛心于虛擬機(jī)器人中的智能客服機(jī)器人,在通信,金融,電子商務(wù),政務(wù)等行業(yè)沉淀了大量知識(shí)庫(kù)和語(yǔ)義庫(kù),服務(wù)用戶超過(guò)2億,所以順勢(shì)在去年成立了自家的智能機(jī)器人云服務(wù)平臺(tái)——最強(qiáng)大腦平臺(tái)1.0,相比去年5月2億用戶數(shù)的小i機(jī)器人最強(qiáng)大腦1.0平臺(tái),2.0平臺(tái)主要強(qiáng)調(diào)和增加了新特性:
*和Nuance語(yǔ)音識(shí)別進(jìn)行深度合作
*從智能客戶機(jī)器人增加到智能IVR機(jī)器人
*從Bot整體云細(xì)分到私有云,公眾云和行業(yè)云
*從軟件屬性的iBot OS到發(fā)布iBot OS硬件開(kāi)發(fā)套件
*從專(zhuān)注國(guó)內(nèi)的語(yǔ)義識(shí)別到目前支持英文,繁體的智能交互
* 用戶數(shù)從2億到5億 (主要分布在App, 微信,微博,QQ,飛信,易信,WEB,短信,電話,車(chē)載,思考,聽(tīng)覺(jué),視覺(jué)領(lǐng)域) 客戶分布見(jiàn)下圖
發(fā)布會(huì)上,小i著重介紹了上面5個(gè)新特性中的IVR(智能呼叫機(jī)器人),雷鋒網(wǎng)之前去各種語(yǔ)音識(shí)別公司發(fā)布會(huì)的時(shí)候,他們刷存在感的重要方式,就是和他們的合作伙伴聯(lián)合發(fā)布一款機(jī)器人內(nèi)置其語(yǔ)音識(shí)別,或者一款智能音響內(nèi)置其麥克風(fēng)降噪技術(shù),讓小白用戶們瞬間明白它們的技術(shù)是個(gè)什么東西,小i機(jī)器人這次也學(xué)聰明了,主持人現(xiàn)場(chǎng)用它演示了用語(yǔ)音撥打銀行的呼叫中心,下面主持人簡(jiǎn)稱h,
你好,我是你們的語(yǔ)音秘書(shū)小i,我有什么可以幫您的?
h: 剛才我買(mǎi)個(gè)東西刷卡為什么沒(méi)成功啊?
為您查詢到,您的卡片可用額度不足。是否需要申請(qǐng)為您調(diào)高額度呢?
h: 額度不足,可以啊,看看能調(diào)到多少?
請(qǐng)問(wèn),您是需要調(diào)整臨時(shí)額度還是固定額度呢?
h: 額,調(diào)固定額度吧
您目前可申請(qǐng)調(diào)固定額度至人民幣5萬(wàn)元,您要調(diào)到多少呢?
h: 那就先調(diào)到5萬(wàn)吧!
正在為您處理,請(qǐng)稍候,您的固定額度已調(diào)整成功。你目前的可用額度為人民幣2萬(wàn)1000元,還有什么可幫您的?
h: 智商額度也幫我升級(jí)下~呵呵,開(kāi)玩笑啦,一會(huì)記得短信通知我!
檢查到您這邊還未開(kāi)通短信通知服務(wù),短信通知服務(wù)是否需要開(kāi)通呢?
h: 開(kāi)通,馬上幫我開(kāi)通。
每月只要四元,為了您的用卡安全,建議您開(kāi)通。
h: 可以,沒(méi)問(wèn)題。
好的,請(qǐng)稍后,已經(jīng)為您開(kāi)通,稍后會(huì)短信提醒您。
h: 好的謝謝。
好的,再見(jiàn)~
會(huì)后雷鋒網(wǎng)追問(wèn)小i機(jī)器人CTO朱頻頻,作為一家自2004年就開(kāi)始耕耘語(yǔ)義識(shí)別的AI公司,不加持語(yǔ)音做通吃者,為什么反而要和Nuance這家語(yǔ)音識(shí)別公司合作,朱頻頻表示:
語(yǔ)音和語(yǔ)意的技術(shù)路線還是稍微有一些差別,深度學(xué)習(xí)技術(shù)就是現(xiàn)在最先進(jìn)的人工智能技術(shù),就是深度學(xué)習(xí)的技術(shù),在圖像和語(yǔ)音方面取得非常大的進(jìn)展。這種進(jìn)展把語(yǔ)音識(shí)別的技術(shù)門(mén)檻拉低,大家的能力越來(lái)越接近。
但是深度學(xué)習(xí)在自然語(yǔ)言的應(yīng)用上沒(méi)那么明顯,為什么呢?這個(gè)跟它核心的機(jī)理有關(guān)系,因?yàn)樽罱K做一種機(jī)器自動(dòng)尋找特征,而對(duì)于圖像和語(yǔ)音來(lái)說(shuō)尋找特征是機(jī)器學(xué)習(xí)非常重要的一個(gè)點(diǎn),以前的門(mén)檻和核心技術(shù)都在于說(shuō)我該定義什么特征對(duì)最后的結(jié)果最大。所以深度學(xué)習(xí)的出現(xiàn)降低了門(mén)檻,讓大家趨同。
在自然語(yǔ)言里其實(shí)不一樣,因?yàn)槊恳粋€(gè)詞、每一個(gè)句子本身的特征就已經(jīng)很明顯,這些特征究竟有什么含義,是跟我們的積累,跟我們對(duì)這個(gè)的認(rèn)識(shí)有關(guān)系。這個(gè)在自然語(yǔ)言的處理過(guò)程中是屬于認(rèn)真智能的范疇,在圖像和語(yǔ)音識(shí)別是感覺(jué)智能的創(chuàng)新發(fā)展,所以認(rèn)知智能里需要大量的按創(chuàng)新積累。這些積累不僅僅是符號(hào)表示方法的積累,也包括對(duì)大量領(lǐng)域語(yǔ)料這樣一些學(xué)習(xí)模型。
在語(yǔ)義方面我們已經(jīng)提前跑了很久,我現(xiàn)在跑得還很快,我還加速我跑得過(guò)程,可能比我們的行業(yè)伙伴或者競(jìng)爭(zhēng)對(duì)手走得更遠(yuǎn)。所以我們在語(yǔ)音識(shí)別方面我們有選擇最好的技術(shù)來(lái)合作,其實(shí)語(yǔ)音識(shí)別是一個(gè)非常綜合的技術(shù),不但用到聲音層面的模型,也用到語(yǔ)言層面的模型,所以我們雙方不僅僅是在產(chǎn)品層的合作,也是在核心技術(shù)層面有更深的動(dòng)作,這是我們重要的差異。
整個(gè)發(fā)布會(huì)下來(lái),雖然小i機(jī)器人也展示了自己浮出水面的決心,包括跟Nao機(jī)器人的合作,以及展示了其i Bot OS開(kāi)發(fā)套件,但看到它齊刷刷的合作客戶名單,依然很難一下子改觀它過(guò)去一直在2B領(lǐng)域“沉默馳騁”的標(biāo)簽,不過(guò)拉上Nuance這樣“聽(tīng)得見(jiàn)” “叫得響”的語(yǔ)音識(shí)別公司合作,企圖迅速打開(kāi)自己在市場(chǎng)的知名度,目前來(lái)看是沒(méi)有捷徑的捷徑。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。