0
人機交互經(jīng)歷了三個階段鍵鼠、觸屏和語音交互。在國外,谷歌、亞馬遜、蘋果等巨頭的競爭已經(jīng)到達白熱化狀態(tài);在國內(nèi),百度的DuerOS正是這方面的一位大玩家。
在技術(shù)發(fā)展的各個時代中,提前入局的廠商,必然能夠第一時間享受紅利,也會有更多的機會。
百度智能生活事業(yè)群(SLG)百度銷售商務(wù)部總經(jīng)理趙鵬在小度藍牙聯(lián)盟峰會上表示,百度的DuerOS如今已經(jīng)成為最大、最活躍的對話式人工智能操作系統(tǒng)。
同樣是在此次峰會上,百度成立小度藍牙聯(lián)盟,通過「DMA+小度App」打造藍牙語音落地方案,同時也想要打造又一個風口。
趙鵬之前在亞馬遜負責Echo,之后又到谷歌負責谷歌智能助手(Google Assistant),“回國后,由于百度擁有開放的生態(tài),所以認為百度更有機會,選擇加入了百度?!?/p>
峰會上,趙鵬也公布了百度DuerOS最新的數(shù)據(jù):現(xiàn)在DuerOS設(shè)備激活量達2億臺,另外,合作伙伴數(shù)量300+,落地主控設(shè)備數(shù)量160+,技能開發(fā)者數(shù)量24000+。
趙鵬表示,在移動場景、家居場景和車載場景等短距離傳輸應(yīng)用場景中,藍牙會有更多的機會。
DuerOS在核心技術(shù)上主要做了三方面工作:
聽清。運用語音和聲學技術(shù)在各種復(fù)雜環(huán)境中充分應(yīng)用;
聽懂。利用自然語言理解、機器學習算法、海量知識圖譜和大數(shù)據(jù)全面理解需求;
內(nèi)容。內(nèi)容是趙鵬特別強調(diào)的部分,包括百度的愛奇藝視頻內(nèi)容,以及特別的兒童內(nèi)容等。
在百度開發(fā)者大會上,百度推出了DMA藍牙設(shè)備解決方案,其中特別強調(diào),“在11月1日公測時,1分鐘售罄;追加數(shù)量后,1分鐘又售罄?!?/p>
趙鵬表示,百度做支架是一種嘗試,是秉持對技術(shù)和方案負責的態(tài)度發(fā)布的一款方案。百度的初衷并非通過這款支架占領(lǐng)市場,而是將百度的方案推薦給大家。“中國汽車保有量2.17億輛,汽車支架將會是一個剛需,將有更大更新的機遇有待眾多廠商發(fā)現(xiàn)。”
由此來看,傳統(tǒng)藍牙音頻市場現(xiàn)在面臨更多新機遇。
DOSS智能音箱是小度藍牙解決方案較早的落地廠商,其制造商正是深圳萬德仕科技發(fā)展有限公司。
深圳萬德仕科技發(fā)展有限公司副總裁屈執(zhí)勤特別提到,在車載場景中,基于藍牙基礎(chǔ)上,在方向盤上做了一個控制設(shè)備,現(xiàn)在已經(jīng)到了量產(chǎn)階段,春節(jié)后將會推向市場。
屈執(zhí)勤也分析了現(xiàn)在企業(yè)借助智能語音技術(shù)轉(zhuǎn)型過程中面臨的機遇和挑戰(zhàn)。
機遇方面,智能語音交互已經(jīng)成為人工智能的解決方案,智能交互類產(chǎn)品多樣化,愿意接受語音交互類產(chǎn)品的用戶越來越多,DuerOS/AVS/DMA/AMA賦能,圍繞智能語音生態(tài)正在建立;
挑戰(zhàn)方面,智能語音產(chǎn)品設(shè)計難度大,開發(fā)周期長,產(chǎn)品同質(zhì)化與用戶需求的多樣化,APP開發(fā)、升級維護成本高,內(nèi)容整合難度大,價格戰(zhàn)也是把雙刃劍。
另外,屈執(zhí)勤認為藍牙作為DuerOS的一個補充,隨著DMA的完善和功能拓展,2019年將會帶來更多的應(yīng)用。
之后,丹麥捷波朗大中華區(qū)總經(jīng)理侯智星介紹了與百度在耳機方面的合作并表示,從數(shù)字化到IoT,到現(xiàn)在的AI,整個過程也經(jīng)歷了從兩只手的PC到一只手的手機,再到現(xiàn)在解放雙手的語音,捷波朗現(xiàn)在已經(jīng)有三款耳機(Elite 45e,Elite 65t和Active 65t,Elite 65e)采用了百度的方案。
百度智能生活事業(yè)群創(chuàng)新業(yè)務(wù)負責人劉悅認為,在過去智能設(shè)備發(fā)展過程中,藍牙的潛能并沒有完全激發(fā)出來,2019年讓更多設(shè)備擁有藍牙和AI。
打造一款智能對話藍牙設(shè)備會遇到很多問題,劉悅從市場、產(chǎn)品、技術(shù)、落地四個方面解讀了其中遇到的問題。
市場。藍牙結(jié)合智能語音是否會被用戶認可?2018年12月10日,小度語音車載支架5萬臺設(shè)備50分鐘售罄。由此可見,用戶對藍牙智能語音設(shè)備的接收度還是很好的。在任何場景下,激活時,百度通過用戶與語音助手的每次交互做場景「使用需求」的積累,DuerOS的2億臺設(shè)備激活量,意義正在于此。
產(chǎn)品功能。DuerOS現(xiàn)在擁有800+技能,包括愛奇藝的視頻內(nèi)容、百度的搜索內(nèi)容、音樂內(nèi)容等。
技術(shù)。傳統(tǒng)藍牙是單向音頻,百度通過DMA藍牙協(xié)議+小度App,使得設(shè)備具有雙向交互能力。在使用時,DMA協(xié)議支持雙向通信,小度App滿足設(shè)備(用戶)內(nèi)容需求。
落地。一體化解決方案,DMA協(xié)議+小度App免費開放給廠商。
雷鋒網(wǎng)注意到,其中關(guān)鍵部分在于「DMA協(xié)議」和「小度App」,這也是此次峰會百度對外推的關(guān)鍵兩個能力。
現(xiàn)在用戶基本上有三大場景下的訴求比較清晰:在家中的休閑娛樂和家居控制等功能,在路上的音樂有聲和信息接收等功能,以及在車內(nèi)的導(dǎo)航周邊和音樂有聲等功能。
如此看來,用戶在使用時,在家中以娛樂訴求為主,在路上則需要加入通訊訴求,在車內(nèi)還需要再加入導(dǎo)航訴求。正因如此,百度在2018年百度開發(fā)者大會上推出小度App,百度智能生活事業(yè)部創(chuàng)新產(chǎn)品負責人錢慶庚表示,經(jīng)過半年的打磨,現(xiàn)在小度App能夠帶來更多的能力。
娛樂能力。包括千萬曲庫、32家有聲資源合作伙伴,以及千萬小時有聲內(nèi)容等。
地圖能力。語音查詢路線及地圖,滿足10+項通勤場景,包括擴可設(shè)置常用地址,可查詢限行信息,周邊地點隨口問等。
通訊能力。便捷錄入通訊錄,可以通過小度App實現(xiàn)語音呼叫和撥打電話,錢慶庚表示,百度注重用戶隱私,在隱私方面并不會出現(xiàn)數(shù)據(jù)泄露問題。
錢慶庚強調(diào),百度現(xiàn)在通過一整套的服務(wù),對接給藍牙設(shè)備廠商,提供針對性(定制化)的服務(wù)和支持。
通過對小度車載語音支架產(chǎn)品發(fā)布兩個月數(shù)據(jù)分析,整個音樂需求占比為33%,有聲收聽大類11+,設(shè)備平均使用時長為33分鐘(通勤時長為45.8分鐘)。由此,錢慶庚歸結(jié)了三點結(jié)論:
音樂成為用戶新剛需;
有聲資源潛力無限大;
使用時長不斷增加。
目前絕大多數(shù)藍牙語音設(shè)備面臨很多問題,包括需要觸碰或按鍵觸發(fā),因而在車載上使用并不方便;在使用語音交互設(shè)備時,語音輸入延時明顯,甚至存在App串擾等問題。這也使得現(xiàn)在基于藍牙協(xié)議的語音設(shè)備備受詬病。
百度智能生活事業(yè)群主任架構(gòu)師陳果果對于這些現(xiàn)象做出了解釋:大多沒有引入喚醒詞,沒有Hands-free體驗;利用A2DP和HFP實現(xiàn)播放和語音輸入;語音輸入過程中占用手機錄音通道等。為了更好的語音交互體驗,百度帶來了DMA藍牙協(xié)議。
DMA(DuerOS Mobile Accessory)協(xié)議在優(yōu)化語音技術(shù)方案選型方案上包括三個方面:藍牙傳輸協(xié)議選用BLE、RFCOMM雙模,音頻壓縮推薦使用不影響語音交互效果的POUS壓縮,喚醒方式,支持觸碰、按鍵、喚醒詞多種交互方式。
當外設(shè)收到請求會反饋版本等信息,如果手機只支持BLE,則通過BLE配對;如果支持RFCOMM,則選用RFCOMM配對。
DMA交互模式1:該模式下,外設(shè)端一直處在監(jiān)聽狀態(tài),檢測到喚醒事件后,將麥克風打開錄音,并傳輸?shù)绞謾C,手機在將語音數(shù)據(jù)傳送到云端做語音識別、語義理解、WAD等,最后返回信息資源給手機。
DMA交互模式2:與模式1有所不同的是,由手機發(fā)送請求給外設(shè)端,外設(shè)接收到請求后打開麥克風,接收語音數(shù)據(jù)。
DMA交互模式3:關(guān)鍵點在于外設(shè)端會持續(xù)發(fā)送音頻數(shù)據(jù)給手機,手機端持續(xù)跑喚醒算法。也因此,手機耗電量會相對較大,因而,百度推薦使用該模式的場景為車載等手機處于充電狀態(tài)的場景。
陳果果解釋,DMA有效解決了經(jīng)典藍牙協(xié)議的三個痛點:
觸碰和按鍵觸發(fā)問題。 支持語義喚醒,優(yōu)化后的模型,在復(fù)雜環(huán)境下喚醒率也能達到97%以上;
語音輸入延時明顯問題。使用BLE/RFCOMM通道,和A2DP可以同時使用,延時從500ms~2000ms下降到200ms~300ms;
App串擾問題。使用BLE/RFCOMM通道傳輸數(shù)據(jù),不影響占用錄音通道的App。
最后陳果果通過小度語音車載支架技術(shù)方案(具體方案如下圖),百度該方案已經(jīng)擁有20多項專利。
據(jù)雷鋒網(wǎng)了解,早在2018年百度開發(fā)者大會上,百度發(fā)布的DuerOS3.0的藍牙設(shè)備解決方案已經(jīng)解決了傳統(tǒng)藍牙只有單向傳輸能力的問題,此次百度通過將DMA SDK開放給廠商及開發(fā)者以降低廠商或開發(fā)者的開發(fā)成本。
百度智能生活群組銷售與商務(wù)部智能家居商務(wù)負責人虞小偉表示,百度通過小度App提供內(nèi)容,通過DMA SDK和源代碼提供設(shè)備相關(guān)定制方案及能力支持。
基礎(chǔ)版:通過車載藍牙方案解釋了合作方面,首先提供一塊PCBA板,合作伙伴可以基于此進行開發(fā),廠商如果只需要小度相關(guān)的語音交互功能的基礎(chǔ)能力和5W無線充電,通過這一方案,幾天時間就可以實現(xiàn);
定制版:如果用戶需要更多定制功能,百度提供基于DMA協(xié)議的功能底板和藍牙模組,提供開放接口的功能底板,以做定制功能開發(fā)。
藍牙語音是風口?
根據(jù)SIG 2018年藍牙市場報告分析,至2022年,將有52億藍牙設(shè)備廣泛應(yīng)用到各個行業(yè)。百度正是看準了這樣的一個市場,在2019年繼續(xù)發(fā)力。在峰會現(xiàn)場,百度宣布“小度藍牙聯(lián)盟”成立,未來將打通上下游產(chǎn)業(yè),通過將藍牙設(shè)備升級為可對話的人工智能設(shè)備,實現(xiàn)產(chǎn)業(yè)鏈升級,為藍牙語音市場開辟出更大的空間,將藍牙語音提升為更重要的角色。
小度藍牙聯(lián)盟現(xiàn)在是怎樣的陣容?
雖然會上并沒有公布聯(lián)盟成員數(shù)量,但是據(jù)虞小偉介紹,現(xiàn)在整個小度藍牙聯(lián)盟已經(jīng)涵蓋聲學、芯片、模組、系統(tǒng)集成、ODM、產(chǎn)品設(shè)計、設(shè)備商、技術(shù)支持、開發(fā)者、技能商、內(nèi)容商全產(chǎn)業(yè)鏈。
據(jù)雷鋒網(wǎng)在會場上了解內(nèi)容顯示,目前小度藍牙解決方案的合作伙伴已有包括Qualcomm高通在內(nèi)的芯片商,包括悟空科技、芯中芯、Synaptics在內(nèi)的方案集成商,以及包括Jabra捷波朗、DOSS德仕、Edifier漫步者在內(nèi)的品牌商;而在此次峰會上百度一再強調(diào)的車載支架,目前已產(chǎn)出途馬、倍思、飛利浦、安耐佳等相關(guān)合作品牌產(chǎn)品。
小度藍牙聯(lián)盟在百度內(nèi)部處于怎樣的地位?
會后,在交流過程中,陳果果向雷鋒網(wǎng)表示,現(xiàn)在小度藍牙聯(lián)盟歸屬百度智能生活事業(yè)群(SLG)下的創(chuàng)新業(yè)務(wù)部分,小度藍牙聯(lián)盟更注重融合整個產(chǎn)業(yè),進行場景化方案落地。
而當談到百度一度在會上談到的小度車載支架會不會在百度產(chǎn)品陣營中成為像小度智能音箱一樣的角色時,陳果果表示,百度認為小度車載支架是剛需,將會進一步推動小度車載支架的產(chǎn)品升級,并積極與第三方合作,推出更多第三方定制方案。
相關(guān)文章:
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。