0
本文作者: 彭賽瓊 | 2017-07-08 16:19 | 專題:GAIR 2017 |
雷鋒網(wǎng)消息,7月7日,中國計(jì)算機(jī)學(xué)會(huì)(CCF)主辦,雷鋒網(wǎng)與香港中文大學(xué)(深圳)承辦的第二屆CCF-GAIR全球人工智能與機(jī)器人峰會(huì)在深圳如期開幕。大會(huì)很快過去了一半,在今日機(jī)器人專場的下半場,聲智科技創(chuàng)始人兼CEO,中科院聲學(xué)所博士陳孝良先生為我們介紹了人機(jī)語音交互的技術(shù)趨勢與商業(yè)機(jī)遇。陳先生在雷鋒網(wǎng)亦有專欄文章,歡迎讀者前往閱讀。
以下是雷鋒網(wǎng)整理的演講主要內(nèi)容:
從全球上看,智能音響引起了許多巨頭關(guān)注,它很可能是人工智能的下一個(gè)入口。
從交互的方式上看,PC到互聯(lián)網(wǎng)在到AI,人機(jī)交互的方式也發(fā)生變化,從鼠標(biāo)轉(zhuǎn)向觸摸屏,現(xiàn)在AI將以語音作為主要輸入方式,與其他方式相互融合。
從商業(yè)模式上看,市場是確定的,從藍(lán)牙音響升級到智能音響,決策成本低,可以用原來的市場重構(gòu)。
從創(chuàng)新角度上看,遠(yuǎn)場語音交互能帶動(dòng)全球智能鏈條的創(chuàng)新。大概分為四個(gè)層次的創(chuàng)新:底層包括器件、芯片、模組,上一層包括VOS、網(wǎng)絡(luò),然后是產(chǎn)品,后面跟著內(nèi)容服務(wù),都需要根據(jù)語音交互的變革來進(jìn)行相應(yīng)的改變。
從技術(shù)方面看,智能音響還面臨著一些問題:
1. 遠(yuǎn)場的語音識別的問題:遠(yuǎn)場指的是復(fù)雜的實(shí)際環(huán)境。聲源與麥克風(fēng)的距離較遠(yuǎn),會(huì)出現(xiàn)其他聲音干擾的情況
2. 矢量麥克風(fēng)的技術(shù)提高:矢量麥克風(fēng)是下一步的麥克風(fēng),更遙遠(yuǎn)一點(diǎn)。中間會(huì)加一層智能麥克風(fēng)。國內(nèi)的矢量麥克風(fēng)技術(shù)還比較落后
3. 芯片:在偏重人工智能的芯片上,國內(nèi)技術(shù)競爭力還比較低
4. 算法:聲學(xué)的技術(shù)比較封閉,如何保持國內(nèi)的技術(shù)領(lǐng)先,也是個(gè)比較大的挑戰(zhàn)
此外,智能音響還面臨著商業(yè)化挑戰(zhàn),在產(chǎn)品、內(nèi)容和服務(wù),以及知識產(chǎn)權(quán)上,我國都面臨著挑戰(zhàn)。
陳先生還預(yù)測了智能音響發(fā)展趨勢:
1. 智能麥克風(fēng)
2. 解決芯片架構(gòu)
3. 多傳感融合,麥克風(fēng)和視頻、雷達(dá)三者融合
4. 算法和模型需要進(jìn)一步研究
最后陳先生還對比了國內(nèi)外產(chǎn)品定位的差異:
國內(nèi)的產(chǎn)品大多會(huì)命名為音箱,而國外的產(chǎn)品則避免使用Speaker。
陳先生還提到了在智能音響上,一些巨頭對產(chǎn)業(yè)生態(tài)的影響力還是不可忽視的。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。
本專題其他文章