1
本文作者: 張莉 | 2018-07-24 17:14 |
如今,人們對智能語音交互驅動的產品已不再陌生,「語音」也正在由一種前沿科技逐漸成為具有普適性的「基石技術」,開始到更廣泛的應用場景中,發(fā)揮作用。在實現(xiàn)了消費級領域的經驗積累之后,出門問問正在探索,如何從為產品賦能,到為產業(yè)賦能,進而驅動更大價值的創(chuàng)造。
在極客公園Rebuild科技商業(yè)峰會上,出門問問 CEO 李志飛分享了出門問問在語音方面的技術以及產品落地的趨勢。
據(jù)李志飛介紹,出門問問在語音交互行業(yè)做了很久,早在2012年,大家對人工智能還不是很了解的時候,出門問問就做了很多這方面的前沿技術探索。包括語音識別技術本身的研發(fā),把聲音轉成文字,到怎么理解文字,再到后面怎么跟服務對接。
早期,出門問問在語音交互的落地場景方面,做了很多探索。主要是把語音交互放到消費電子場景下面,過去幾年基本每年出一個新的品類:智能手表、智能車載設備、音箱、耳機,每一個設備都在站在消費者的角度做決策。目前由于很多技術的限制,體驗還做不到最優(yōu),但李志飛相信,在未來的消費場景里面,可穿戴、車載、家居、還有路面場景基本上會覆蓋語音交互。
雷鋒網(wǎng)注:出門問問發(fā)布的4條產品線
經過前期的一些探索,更多是需求更加清晰了,技術也越來越成熟,當語音交互變成基石技術,整個市場又會有什么樣的變化?
雷鋒網(wǎng)注:語音交互市場規(guī)模增長趨勢
首先,在數(shù)據(jù)增長方面,無論是用戶的使用規(guī)模,比如語音搜索量,可能從現(xiàn)在的20%,未來變成50%。也就是說,未來每搜十次搜索引擎的時候,有5次是語音的交互方式。不一定是在手機上,可能是在音箱上,也可能在車里,都是用語音交互做。但是主要是為了搜索內容。包括智能音箱市場從無到有,現(xiàn)在全球市場規(guī)模達到了幾千萬。
其次,從設備場景的角度去看,語音交互可能有幾大類,一個是2C,一個是2B,另外還有一個2G。2C前即面對消費者,各種各樣的交互設備變更人與機器的交互方式。比如車里面,家里面,在路上的時候,現(xiàn)在可能更多是鍵盤和觸摸屏,但是未來語音交互也會成為非常重要的交互方式。
2B更多是幫助企業(yè)去提供更好的工具,提高他們的效率。同時因為你工具更加個性化人性化,也可以幫他們的用戶提供更好的用戶體驗。
2G跟2B比較類似,只是行業(yè)不太一樣,比如政法、公安、教育可以有很多應用,比如高考教育的打分,英語的打分,還有醫(yī)療,都是偏政府的行業(yè),通過語音提供更有效率、更好的用戶交互方式。
接著,李志飛介紹了出門問問在過去一年,把語音交互落地到各種場景方面的探索。主要有兩個方向,一是上游跟芯片深度的集成,二是和下游垂直行業(yè)的深度綁定。
上游側,發(fā)布問芯,是AI語音的芯片模組。解決了現(xiàn)在的智能電視不能遠場喚醒的問題。芯片跟杭州國芯一起合作,但是把麥克風技術、信號處理技術,包括低功耗的喚醒技術都做到了芯片模組里面。用一個usb線跟芯片模組連接,電視即成為一個可以遠程語音交互的智能電視。
另外,未來還會發(fā)布一個專門面對IoT設備控制的AI語音芯片模組。現(xiàn)在控制空調也有,但都是通過智能音箱作為控制臺,后臺控制設備。不好的一點就是每次都要把音箱喚醒,然后把后面的設備喚醒。李志飛表示,希望未來芯片模組可以直接放在燈泡里面,回家直接說開燈關燈就可以打開,而不是現(xiàn)在先要把音箱喚醒才能交互。此外,在回聲消除方面,出門問問也做了一些改進,已經在跟合作伙伴洽談,準備落地到一些智能電視或者機頂盒場景下面的應用。
在下游測的應用場景方面,主要做了四大場景的探索,包括:消費電子、金融、保險、地產。
金融方面,做了名為“問真”的AI金融反欺詐系統(tǒng)。當顧客找金融機構貸款的時候,可以進行身份驗證和真話鑒別。系統(tǒng)會自動問客戶一些問題,根據(jù)回答的答案和系統(tǒng)答案是不是一致,就可以判斷是不是真話。此外,還會用到人臉識別技術,識別是不是本人,是真實的才會進行貸款操作。
在保險行業(yè),利用2C的經驗,跟保險后臺數(shù)據(jù)系統(tǒng)結合起來,提供更好的用戶體驗,使他們的用戶服務更加滿意。在智能家居或者房地產行業(yè)跟合作伙伴做了一整套解決方案,提供樣板間。
總的來說,當語音交互變成基石技術以后如何進一步落地,出門問問的答案是往上游跟芯片深度集成,下游跟場景深度綁定。
近年來,語音芯片領域玩家眾多,作為推動AI發(fā)展的三大關鍵因素之一,巨頭和初創(chuàng)公司都爭先自主研發(fā)AI芯片,布局語音和視覺芯片。僅國內,Rokid、云之聲、出門問問、思必馳等都已經或者即將推出AI語音芯片,不僅說明了AI的火熱,更體現(xiàn)了自主研發(fā)芯片對于語音產品的重要性。
當雷鋒網(wǎng)問到出門問問打造的語音芯片優(yōu)勢體現(xiàn)在哪里,與其他廠商的語音芯片有何不同時,李志飛掏出隨身攜帶的硬幣大小的芯片,解釋道:“我們做了兩件事情。芯片是其中這一塊,我們是第一個做了模組的公司,芯片以外,還有連接器。第二件事情,我們把最核心的算法整合到了芯片里面,把它整合成DSP的代碼,還有神經網(wǎng)絡單元計算的NPU,我們做了整個的電路板整合,做了整個軟件算法的集成,因為我們有一整套的語音交互,所以我們在電視上有還有軟件SDK可以連到云端。”
“你說跟市場有什么不一樣的話,坦白講,我們的芯片模組早已量產,這段時間已經有電視廠商在應用我們的芯片模組在做產品了,你剛才說的這些公司應該還沒有我們這么快,這個是我們比較確定的。當然訊飛也有模組,但是他們不是基于這種AI芯片做的,他們的特別大,而且價格很貴?!?/p>
此外,跟其他AI語音交互公司的區(qū)別,李志飛說道:“首先我們有時間差,而且我們有軟硬結合的能力。這個對我們來說是最簡單的事情,對他們來說,可能就不行。他們很大的問題就是磨合需要很長的時間,我們是外接的模組,所以沒有需要磨合的過程,智能電視廠商花三個星期就可以完成?!?/p>
作為一家探索智能語音交互應用的創(chuàng)業(yè)公司,出門問問卻面臨著被巨頭夾擊的“高級”待遇——北美市場,面對Amazon與Google發(fā)起的價格戰(zhàn);國內市場,面對阿里天貓精靈99元、京東49元的超低價格打擊。
面臨這樣“尷尬”的境地,為什么出門問問還要堅持做音箱,李志飛說:“因為我們有這種使命感,下一代的人機交互重要的場景之一就是家里面。家庭在我看來是一個不可以缺失的場景,它要打磨的技術跟車內場景不一樣,家庭場景需要遠場交互,比如3米5米,車內是0.5米。家里有小孩、老人,所以對于一個語音交互的東西來說,怎么把家內的語音交互去打造好,在我看來是必須要做的一件事情?!?/p>
“商業(yè)上的話,確實智能音箱會受到一些挑戰(zhàn),但是就是因為我們做了智能音箱的算法、降噪,才有后來的把這個算法整合到AI語音芯片模組里用于智能電視。做智能音箱雖然短期的收入沒有那么明顯,但是對公司技術的打磨,對產品的開拓等等,都是很有意義的?!?/p>
目前市場上智能音箱產品眾多,談到智能音箱最主要的核心競爭力是什么,李志飛無奈地說到,“現(xiàn)在最核心的就是誰有錢誰就有核心競爭力,這是很可悲的一個現(xiàn)狀,尤其是大公司。這個在美國,比如說Google、亞馬遜他們還是比較有節(jié)操的,還是希望自己來打磨技術;中國市場主要的玩家,都是用其他公司的技術集成?!?/p>
最后,李志飛透露,出門問問正在計劃新一輪融資,至于上市計劃,今年應該不會有。
相關文章:
出門問問李志飛:智能音箱市場價格戰(zhàn)已經拐偏了消費者
雷峰網(wǎng)原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知。