丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
人工智能 正文
發(fā)私信給陳孝良
發(fā)送

0

反思仿制Echo的熱潮:為什么國(guó)外巨頭要布局AI交互?

本文作者: 陳孝良 2017-03-09 18:34
導(dǎo)語(yǔ):語(yǔ)音交互涉及了非常復(fù)雜的技術(shù)鏈條,美國(guó)頂尖的科技公司,INTEL、ARM、谷歌、亞馬遜、Facebook等都紛紛牽頭成立了自己的產(chǎn)業(yè)聯(lián)盟。

雷鋒網(wǎng)按:本文作者常樂(lè),來(lái)自微信公眾號(hào)“聲學(xué)在線(xiàn)”(ID:soundonline)。

美國(guó)調(diào)查公司VoiceLabs在本年初發(fā)布了《2017年語(yǔ)音報(bào)告》,報(bào)告中對(duì)目前美國(guó)智能語(yǔ)音市場(chǎng)進(jìn)行了調(diào)查,特別是亞馬遜Alexa和谷歌Google Home的開(kāi)發(fā)者和消費(fèi)者。報(bào)告中預(yù)測(cè)2017年將有2450萬(wàn)臺(tái)以語(yǔ)音為主要交互方式的智能硬件產(chǎn)品發(fā)貨,市場(chǎng)總量將達(dá)到3300萬(wàn)臺(tái),市場(chǎng)規(guī)模超過(guò)200億美元。

反思仿制Echo的熱潮:為什么國(guó)外巨頭要布局AI交互?

↑ 語(yǔ)音為主的智能硬件產(chǎn)品

隨著亞馬遜的智能音箱Echo銷(xiāo)量逼近千萬(wàn),蘋(píng)果的智能耳機(jī)AirPods登頂美國(guó)無(wú)線(xiàn)耳機(jī)市場(chǎng)榜首,亞馬遜Alexa在美國(guó)CES展上大放異彩,國(guó)內(nèi)各個(gè)科技公司也紛紛開(kāi)始了進(jìn)入語(yǔ)音交互領(lǐng)域。

無(wú)論是IT科技巨頭阿里、百度、騰訊、科大訊飛等,還是陸續(xù)出現(xiàn)的思必馳、聲智科技、云知聲、三角獸、驀然、Rokid等創(chuàng)業(yè)公司,智能語(yǔ)音產(chǎn)品和語(yǔ)音助手成為競(jìng)相追隨的熱門(mén)話(huà)題,儼然形成了一股全行業(yè)研究亞馬遜Echo的熱潮。根據(jù)聲智科技提供的數(shù)據(jù),國(guó)內(nèi)已經(jīng)有超過(guò)200多家公司正在研發(fā)類(lèi)似Echo的智能音箱。

然而,就在國(guó)內(nèi)科技公司還在模仿Echo之時(shí),國(guó)外的科技巨頭已經(jīng)開(kāi)始進(jìn)一步搶奪全球語(yǔ)音交互市場(chǎng)的控制權(quán)。無(wú)論是行業(yè)標(biāo)準(zhǔn)的定制,還是戰(zhàn)略專(zhuān)利的布局,抑或是音頻數(shù)據(jù)集的開(kāi)放,以及各種產(chǎn)業(yè)生態(tài)聯(lián)盟的搭建,一切都在悄然的進(jìn)行中。

智能語(yǔ)音交互的行業(yè)標(biāo)準(zhǔn)之爭(zhēng)拉開(kāi)帷幕

3月6日,微軟在其官網(wǎng)上發(fā)布了新版本的語(yǔ)音平臺(tái)測(cè)試標(biāo)準(zhǔn),即2.1版本。微妙的是,就在微軟發(fā)布消息的同時(shí),我們驚喜的發(fā)現(xiàn),亞馬遜的官方網(wǎng)站上也已經(jīng)推出了其語(yǔ)音測(cè)試的最新標(biāo)準(zhǔn),智能語(yǔ)音交互的行業(yè)標(biāo)準(zhǔn)之爭(zhēng)已經(jīng)開(kāi)始“漸入佳境”。

微軟指出,目前語(yǔ)音平臺(tái)支持Windows 10中的所有語(yǔ)音體驗(yàn),如Cortana和Dictation,而其最新的測(cè)試標(biāo)準(zhǔn)適用于所有使用微軟語(yǔ)音平臺(tái)的音頻輸入設(shè)備。其中,直接影響的設(shè)計(jì)參數(shù),包括語(yǔ)音識(shí)別精度和語(yǔ)音處理算法的性能。目前,微軟還沒(méi)有把該測(cè)試標(biāo)準(zhǔn)作為設(shè)備認(rèn)證必不可少的環(huán)節(jié)。然而,隨著測(cè)試標(biāo)準(zhǔn)日益規(guī)范化,平臺(tái)用戶(hù)數(shù)增多,未來(lái)的結(jié)果一切都不言而喻。

反思仿制Echo的熱潮:為什么國(guó)外巨頭要布局AI交互?

↑ 測(cè)試環(huán)境搭建圖

區(qū)別于微軟,亞馬遜也為其所有采用Alexa開(kāi)發(fā)的智能語(yǔ)音產(chǎn)品設(shè)立了相應(yīng)測(cè)試標(biāo)準(zhǔn),然而,此測(cè)試并未公開(kāi),還是采用黑盒測(cè)試的方式,用戶(hù)需提交產(chǎn)品給亞馬遜進(jìn)行相應(yīng)測(cè)試。其產(chǎn)品通過(guò)認(rèn)證測(cè)試后,搭載Alexa的智能語(yǔ)音交互產(chǎn)品才可獲得Alexa認(rèn)證,并在Alexa Smart Home商店出售。

反思仿制Echo的熱潮:為什么國(guó)外巨頭要布局AI交互?

↑ 目前通過(guò)測(cè)試獲得認(rèn)證的企業(yè)

語(yǔ)音交互市場(chǎng)專(zhuān)利布局競(jìng)爭(zhēng)更為激烈

一直以來(lái),一旦掌握行業(yè)標(biāo)準(zhǔn)制定的主導(dǎo)權(quán)也就掌握了整個(gè)市場(chǎng)的控制權(quán)。與其有同樣魅力的便是專(zhuān)利。當(dāng)今的激烈市場(chǎng)競(jìng)爭(zhēng)中,專(zhuān)利早已經(jīng)成為市場(chǎng)競(jìng)爭(zhēng)的一柄利劍。

從1月19日國(guó)家知識(shí)產(chǎn)權(quán)局公布的數(shù)據(jù)顯示:過(guò)去的2016年,我國(guó)國(guó)家知識(shí)產(chǎn)權(quán)局共受理發(fā)明專(zhuān)利申請(qǐng)133.9萬(wàn)件,同比增長(zhǎng)21.5%,這已經(jīng)是我國(guó)第6個(gè)年頭專(zhuān)利受理量居世界首位。同時(shí),國(guó)外專(zhuān)利的申請(qǐng)情況也保持良好的增長(zhǎng)勢(shì)頭,2016年通過(guò)《專(zhuān)利合作條約》(PCT)途徑提交的國(guó)際申請(qǐng)4.50萬(wàn)件。然而,雖然專(zhuān)利整體保持良好的發(fā)展態(tài)勢(shì),但是,在語(yǔ)音交互領(lǐng)域國(guó)內(nèi)的專(zhuān)利布局與國(guó)外尚存差距。

眾所周知,語(yǔ)音交互涉領(lǐng)域廣泛,是一門(mén)多項(xiàng)技術(shù)融合的交叉學(xué)科,涉及到信號(hào)處理、模式識(shí)別、概率論與信息論、發(fā)聲機(jī)理和聽(tīng)覺(jué)機(jī)理、神經(jīng)網(wǎng)絡(luò),語(yǔ)音識(shí)別,機(jī)器學(xué)習(xí)等。其中,語(yǔ)音以及音頻的編解碼(G10L),電數(shù)字?jǐn)?shù)據(jù)處理(G06F),電話(huà)通信(H04M),這三個(gè)領(lǐng)域?qū)@鄯e數(shù)量最多,比例高達(dá)80%。

從德溫特世界專(zhuān)利索引數(shù)據(jù)庫(kù)平臺(tái)收錄的自1963年以來(lái)全世界40多個(gè)專(zhuān)利機(jī)構(gòu)的基本發(fā)明的數(shù)據(jù)來(lái)看,語(yǔ)音識(shí)別的相關(guān)專(zhuān)利約2萬(wàn)件。

反思仿制Echo的熱潮:為什么國(guó)外巨頭要布局AI交互?

↑ 根據(jù)CNKI自1985年后收錄的中國(guó)專(zhuān)利的數(shù)據(jù)來(lái)檢索關(guān)鍵詞語(yǔ)音識(shí)別情況

其中,截止到2015年,僅“語(yǔ)音識(shí)別”累積專(zhuān)利申請(qǐng)量方面來(lái)看,前五位的為IBM,NEC,微軟,Nuance和東芝,分別為749件,508件,506件,415件,406件。而從2010年至2015年的語(yǔ)音識(shí)別專(zhuān)利的申請(qǐng)量來(lái)看,除了IBM被Google替代,降至第7名,其他幾位仍然保有專(zhuān)利數(shù)量的優(yōu)勢(shì),排名順序是Nuance,谷歌,微軟,東芝,NEC,分別為206件,178件,141件,102件。

巨頭形成的專(zhuān)利防御攻勢(shì)仍然迅猛,而業(yè)界所關(guān)心的后起之秀也來(lái)勢(shì)洶洶,2010至2015年,僅“語(yǔ)音識(shí)別”方面,谷歌布局專(zhuān)利178件、蘋(píng)果布局專(zhuān)利25件、亞馬遜布局專(zhuān)利33件。

對(duì)于國(guó)外的科技公司來(lái)說(shuō)專(zhuān)利之間的斗法更加劍拔弩張,專(zhuān)利壁壘正在逐漸形成。從《中國(guó)知識(shí)產(chǎn)權(quán)報(bào)》發(fā)布的數(shù)據(jù)來(lái)看,截止至2017年1月,蘋(píng)果公司在語(yǔ)音領(lǐng)域的專(zhuān)利申請(qǐng)量為695件,而谷歌公司為1261件。從語(yǔ)音領(lǐng)域?qū)@季址矫婵?,兩家公司在語(yǔ)音領(lǐng)域的技術(shù)除了自主研發(fā)外,還通過(guò)并購(gòu)語(yǔ)音類(lèi)相關(guān)企業(yè)或者收購(gòu)語(yǔ)音技術(shù)相關(guān)專(zhuān)利來(lái)加強(qiáng)專(zhuān)利儲(chǔ)備。

2013年蘋(píng)果公司收購(gòu)語(yǔ)音識(shí)別公司NovaurisTechnologies。經(jīng)過(guò)收購(gòu),蘋(píng)果公司獲取了該公司的4件語(yǔ)音專(zhuān)利。通過(guò)這4件專(zhuān)利,蘋(píng)果Siri由可通過(guò)簡(jiǎn)單識(shí)別單個(gè)詞句來(lái)理解上下文,發(fā)展到通過(guò)識(shí)別超過(guò)2.45億個(gè)短語(yǔ)來(lái)輔助理解上下文的功能,從而大幅度提升語(yǔ)音系統(tǒng)的理解力。

為了應(yīng)對(duì)蘋(píng)果公司帶來(lái)的激烈競(jìng)爭(zhēng),谷歌公司采用了專(zhuān)利“圍剿”戰(zhàn)術(shù)。2013年,谷歌公司收購(gòu)了Wavii公司的一件專(zhuān)利,該專(zhuān)利技術(shù)使得谷歌公司的語(yǔ)音搜索識(shí)別正確率提高了25%。同年,又收購(gòu)了SR Tech Group公司的兩件關(guān)于語(yǔ)音識(shí)別的專(zhuān)利,并購(gòu)入雅虎公司的一件名為“背景會(huì)話(huà)上下文搜索技術(shù)”的專(zhuān)利,通過(guò)購(gòu)買(mǎi)專(zhuān)利,谷歌公司擁有了完整的語(yǔ)音識(shí)別引擎。

目前,中國(guó)的語(yǔ)音識(shí)別企業(yè)專(zhuān)利布局還主要是在國(guó)內(nèi),國(guó)際領(lǐng)域的專(zhuān)利布局情況和國(guó)外企業(yè)對(duì)比,確實(shí)還存在巨大差距。不過(guò),國(guó)內(nèi)企業(yè)的知識(shí)產(chǎn)權(quán)意識(shí)也越來(lái)越強(qiáng)烈,百度,科大訊飛,聲智科技等在近幾年的專(zhuān)利申請(qǐng)上也有不錯(cuò)的作為。

對(duì)比于市場(chǎng)銷(xiāo)量帶來(lái)的直接經(jīng)濟(jì)效益,知識(shí)產(chǎn)權(quán)的價(jià)值還不能充分體現(xiàn)。然而,在提高公司效益,搶占市場(chǎng),保持公司可持續(xù)發(fā)展時(shí),知識(shí)產(chǎn)權(quán)的價(jià)值不可小覷,專(zhuān)利作為企業(yè)不得不向公眾透露以獲取獨(dú)占權(quán)的關(guān)鍵信息,對(duì)其進(jìn)行詳細(xì)、周密、綜合的分析,可以從中獲得巨大的商業(yè)價(jià)值,特別是在國(guó)際市場(chǎng)競(jìng)爭(zhēng)中。

谷歌開(kāi)放音頻數(shù)據(jù)集,用意不言而喻

3月8日,谷歌開(kāi)放了一個(gè)大規(guī)模的音頻數(shù)據(jù)集 AudioSet。該數(shù)據(jù)集包含了 632 類(lèi)的音頻類(lèi)別,收集了2084320 條人工標(biāo)記的每段 10 秒的YouTube視頻中的聲音剪輯片段(包括 527 個(gè)標(biāo)簽)。

反思仿制Echo的熱潮:為什么國(guó)外巨頭要布局AI交互?

這些特定音頻是使用基于元數(shù)據(jù),上下文(例如,鏈接)和內(nèi)容分析的搜索來(lái)標(biāo)記的。聲音內(nèi)容十分廣泛,包括人類(lèi)的聲音和動(dòng)物的聲音,各種類(lèi)別樂(lè)曲的聲音和每天日常環(huán)境中的各種聲音等。谷歌聲稱(chēng):此次開(kāi)放這個(gè)數(shù)據(jù)庫(kù)的目的就是為了滿(mǎn)足學(xué)術(shù)研究的需求。

從此前ImageNet廣泛數(shù)據(jù)集的開(kāi)放效果來(lái)看,大部分識(shí)別圖像中的目標(biāo)研究已經(jīng)從中獲益。而此次,對(duì)于利用AudioSet公開(kāi)數(shù)據(jù)集訓(xùn)練機(jī)器學(xué)習(xí)模型的語(yǔ)音識(shí)別研究者或者技術(shù)公司來(lái)說(shuō),無(wú)疑是獲益匪淺。然而目前,國(guó)內(nèi)的科技巨頭還沒(méi)有開(kāi)源音頻數(shù)據(jù)集的動(dòng)作,哪家公司可以有魄力的貢獻(xiàn)資源,我們還要翹首以待?

組建產(chǎn)業(yè)聯(lián)盟,試圖瓜分市場(chǎng)蛋糕

毫無(wú)疑問(wèn),通過(guò)語(yǔ)言交流獲取知識(shí)是人類(lèi)最有效的學(xué)習(xí)方式。從PC時(shí)代的鍵盤(pán)鼠標(biāo)過(guò)渡到移動(dòng)互聯(lián)網(wǎng)的觸屏操控,下一個(gè)AI時(shí)代,無(wú)疑將會(huì)是以語(yǔ)音、體感等多種感知融合的新的獲取方式,而語(yǔ)音交互作為天然的人機(jī)交互入口,勢(shì)必是對(duì)信息生態(tài)與未來(lái)生活的一種重構(gòu)。

誠(chéng)然,語(yǔ)音交互涉及了非常復(fù)雜的技術(shù)鏈條,包括了聲學(xué)處理、語(yǔ)音識(shí)別、語(yǔ)義理解和語(yǔ)音合成等核心技術(shù)。需要產(chǎn)業(yè)鏈上下游相互合作,需要產(chǎn)業(yè)伙伴相互合作。目前,美國(guó)頂尖的科技公司,INTEL、ARM、谷歌、亞馬遜、Facebook等都紛紛牽頭成立了自己的產(chǎn)業(yè)聯(lián)盟。

隨著智能語(yǔ)音交互領(lǐng)域不斷發(fā)展,國(guó)際化的競(jìng)爭(zhēng)也會(huì)日趨激烈。如何積極搶占全球智能語(yǔ)音交互的主導(dǎo)權(quán)?必然是組成產(chǎn)業(yè)技術(shù)創(chuàng)新聯(lián)盟,把握國(guó)際標(biāo)準(zhǔn)的制定、積極做好專(zhuān)利戰(zhàn)略布局,才能緊抓國(guó)內(nèi)外同步創(chuàng)新的契機(jī),不再重復(fù)PC和移動(dòng)互聯(lián)網(wǎng)時(shí)代的遺憾。

雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

反思仿制Echo的熱潮:為什么國(guó)外巨頭要布局AI交互?

分享:
相關(guān)文章

專(zhuān)欄作者

聲智科技創(chuàng)始人兼CEO,中科院聲學(xué)所博士
當(dāng)月熱門(mén)文章
最新文章
請(qǐng)?zhí)顚?xiě)申請(qǐng)人資料
姓名
電話(huà)
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶(hù)安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說(shuō)