0
本文作者: 彭賽瓊 | 2017-07-08 16:19 | 專題:GAIR 2017 |
雷鋒網(wǎng)消息,7月7日,中國計算機學會(CCF)主辦,雷鋒網(wǎng)與香港中文大學(深圳)承辦的第二屆CCF-GAIR全球人工智能與機器人峰會在深圳如期開幕。大會很快過去了一半,在今日機器人專場的下半場,聲智科技創(chuàng)始人兼CEO,中科院聲學所博士陳孝良先生為我們介紹了人機語音交互的技術趨勢與商業(yè)機遇。陳先生在雷鋒網(wǎng)亦有專欄文章,歡迎讀者前往閱讀。
以下是雷鋒網(wǎng)整理的演講主要內容:
從全球上看,智能音響引起了許多巨頭關注,它很可能是人工智能的下一個入口。
從交互的方式上看,PC到互聯(lián)網(wǎng)在到AI,人機交互的方式也發(fā)生變化,從鼠標轉向觸摸屏,現(xiàn)在AI將以語音作為主要輸入方式,與其他方式相互融合。
從商業(yè)模式上看,市場是確定的,從藍牙音響升級到智能音響,決策成本低,可以用原來的市場重構。
從創(chuàng)新角度上看,遠場語音交互能帶動全球智能鏈條的創(chuàng)新。大概分為四個層次的創(chuàng)新:底層包括器件、芯片、模組,上一層包括VOS、網(wǎng)絡,然后是產(chǎn)品,后面跟著內容服務,都需要根據(jù)語音交互的變革來進行相應的改變。
從技術方面看,智能音響還面臨著一些問題:
1. 遠場的語音識別的問題:遠場指的是復雜的實際環(huán)境。聲源與麥克風的距離較遠,會出現(xiàn)其他聲音干擾的情況
2. 矢量麥克風的技術提高:矢量麥克風是下一步的麥克風,更遙遠一點。中間會加一層智能麥克風。國內的矢量麥克風技術還比較落后
3. 芯片:在偏重人工智能的芯片上,國內技術競爭力還比較低
4. 算法:聲學的技術比較封閉,如何保持國內的技術領先,也是個比較大的挑戰(zhàn)
此外,智能音響還面臨著商業(yè)化挑戰(zhàn),在產(chǎn)品、內容和服務,以及知識產(chǎn)權上,我國都面臨著挑戰(zhàn)。
陳先生還預測了智能音響發(fā)展趨勢:
1. 智能麥克風
2. 解決芯片架構
3. 多傳感融合,麥克風和視頻、雷達三者融合
4. 算法和模型需要進一步研究
最后陳先生還對比了國內外產(chǎn)品定位的差異:
國內的產(chǎn)品大多會命名為音箱,而國外的產(chǎn)品則避免使用Speaker。
陳先生還提到了在智能音響上,一些巨頭對產(chǎn)業(yè)生態(tài)的影響力還是不可忽視的。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉載。詳情見轉載須知。
本專題其他文章