3
本文作者: 左芬 | 2016-10-27 17:54 |
雷鋒網(wǎng)按:本文作者清風(fēng),技術(shù)工程師一枚。
亞馬遜和谷歌等大公司先后推出智能家居中樞產(chǎn)品,并且都選擇了智能音箱作為切入點(diǎn),推進(jìn)人工智能落地的戰(zhàn)略。這方面已經(jīng)有很多文章涉及。這一次,我們從比較專業(yè)的聲學(xué)麥克風(fēng)陣列的角度對(duì)比一下這二者的高下,進(jìn)而引出生態(tài)布局的思考。
亞馬遜Echo(左)谷歌Home(右)
在剛剛過去的Google秋季發(fā)布會(huì)上,谷歌正式推出了Google Home智能音箱。它是Google Home將自己的兩大技術(shù):Google Now(智能語音系統(tǒng))與最新版本的Google Assistant(智能服務(wù)平臺(tái))結(jié)合打造出的一款智能音箱。Google Home作為谷歌最為看重的智能中控出生,并采用了雙麥克風(fēng)的硬件配置, 售價(jià)定為129美元。
眾所周知,2014年亞馬遜推出了第一款智能音箱Amazon Echo,從推出起至今已熱銷超過400萬臺(tái),儼然成為了最新一代的科技寵兒。據(jù)悉,蘋果也即將推出Siri智能音箱。各大巨頭和創(chuàng)業(yè)企業(yè),紛紛看中智能家居中控這塊“肥肉”,由此也拉開了人工智能領(lǐng)域新一輪戰(zhàn)役的序幕。
Google Home和Amazon Echo都代表了行業(yè)巨頭通過智能WiFi音箱為入口,推進(jìn)人工智能落地的戰(zhàn)略。這方面已經(jīng)有很多文章涉及。這一次,我們從比較專業(yè)的聲學(xué)麥克風(fēng)陣列的角度對(duì)比一下這二者的高下,進(jìn)而引出生態(tài)布局的思考。
雙麥克 vs 多麥克陣列 技術(shù)上各有高下
談及Google Home的硬件配置,不難發(fā)現(xiàn)它和Amazon Echo相比有一個(gè)最大的差異,那就是少用了5個(gè)麥克風(fēng)。Amazon Echo采用的是環(huán)形6+1麥克風(fēng)陣列,而Google Home只采用了2個(gè)麥克風(fēng)陣列。
圖 Amazon Echo采用6+1麥克風(fēng)陣列
麥克風(fēng)陣列是什么呢?就是放置在空間中不同位置的多個(gè)麥克風(fēng)。根據(jù)聲波傳導(dǎo)理論,利用多個(gè)麥克風(fēng)收集到的信號(hào)可以將某一方向傳來的聲音增強(qiáng)或抑制。利用這種方法,麥克風(fēng)陣列可以將噪聲環(huán)境中特定聲音信號(hào)有效的增強(qiáng)。由于麥克風(fēng)陣列技術(shù)具有很好的抑制噪聲和語音增強(qiáng)的能力,又不需要麥克風(fēng)時(shí)刻指向聲源方向,因此在語音處理領(lǐng)域具有非常好的前景,可以用在非常廣的應(yīng)用領(lǐng)域。
根據(jù)麥克風(fēng)數(shù)量不同,麥克風(fēng)陣列具有不同的特點(diǎn)。行業(yè)采用的以雙麥克居多,比如幾乎所有中高端手機(jī)都采用雙麥克降噪技術(shù)來提升通話效果。四麥克、六麥克、八麥克線性陣列和環(huán)形陣列在行業(yè)內(nèi)也有應(yīng)用,但還遠(yuǎn)遠(yuǎn)達(dá)不到雙麥克應(yīng)用的數(shù)量級(jí)。
首先,雙麥克和多麥克陣列的一個(gè)重要區(qū)別,是成本的不同。顯然,雙麥克的成本相對(duì)比多麥克低得多,除了可以直觀觀察到的麥克風(fēng)數(shù)量不同之外,為了支持多麥克通道而必須具備的硬件電路、為了處理更多的信號(hào)數(shù)據(jù)而額外需要的計(jì)算能力,都使得成本體現(xiàn)較大的差異。所以我們看到兩者的差價(jià)體現(xiàn)得極為明顯,Google Home為129美元,Amazon Echo售價(jià)為179.99美元,差價(jià)約50美元。值得注意的是,這兩家的硬件產(chǎn)品的戰(zhàn)略沒有多大區(qū)別,都是硬件基本不賺錢。
其次,雙麥克和多麥克的技術(shù)路線區(qū)別較大。雙麥克和多麥克采用的技術(shù)路線雖然有類似之處,但算法體系存在較大區(qū)別。顯然,麥克風(fēng)越多越容易實(shí)現(xiàn)更好的降噪和語音增強(qiáng)效果,所以為了達(dá)到同樣或者類似的效果,雙麥克陣列技術(shù)相對(duì)多麥克陣列的技術(shù)挑戰(zhàn)性更高。但因?yàn)槌杀締栴},采用雙麥克陣列的技術(shù)挑戰(zhàn)雖然大,但從應(yīng)用普及的角度上卻是大勢(shì)所趨。
另外,從效果上看,如果技術(shù)優(yōu)化足夠好,在3~5米的家庭環(huán)境中,雙麥克陣列雖然可以和多麥克陣列做到幾乎一樣的降噪和語音增強(qiáng)效果。但雙麥克有個(gè)缺點(diǎn),就是聲源定位只能定位180°內(nèi)的范圍,而環(huán)形麥克風(fēng)陣列(不管是4Mic、6Mic還是8Mic)都可以做到360°全角度范圍內(nèi)的定位。所以Google Home只能有四個(gè)LED燈來顯示狀態(tài),而Amazon Echo可以用LED燈顯示說話人的方向。當(dāng)然,這個(gè)差別僅對(duì)具有聲源定位需求的產(chǎn)品存在影響,而且對(duì)一些本來就需要靠墻擺放的設(shè)備如空調(diào)、電視機(jī)等是沒有任何問題的。對(duì)于類似機(jī)器人等擺放在室內(nèi)中央的產(chǎn)品,如果希望它能定位說話人位置,那就只能采用多麥克方案了。
最后,從產(chǎn)品的角度,雙麥克方案簡(jiǎn)單更易落地。多麥克陣列最大的問題是,無論線性陣列還是環(huán)形陣列,其對(duì)產(chǎn)品的外觀、結(jié)構(gòu)設(shè)計(jì)都有極為嚴(yán)苛的要求,因?yàn)辂溈孙L(fēng)是要求必須在空間上均勻分布的。而雙麥克顯然就不必考慮這些因素。
基于雙麥克陣列的產(chǎn)品生態(tài)構(gòu)建更具優(yōu)勢(shì)
麥克風(fēng)陣列作為實(shí)現(xiàn)智能語音的必備硬件,可以說是人工智能感知的硬件基礎(chǔ)。因此,麥克風(fēng)陣列的布局,將深深影響人工智能產(chǎn)品的生態(tài)布局。
首先,眾所周知的是,谷歌是以生態(tài)見長的公司。比如,Android構(gòu)建了整個(gè)移動(dòng)互聯(lián)網(wǎng)的生態(tài)基礎(chǔ)。在谷歌從移動(dòng)互聯(lián)網(wǎng)向AI轉(zhuǎn)型的時(shí)候,提出了“AI First”的口號(hào),并推出了開源深度學(xué)習(xí)系統(tǒng)TensorFlow,這個(gè)系統(tǒng)被認(rèn)為是人工智能領(lǐng)域的Android。
那么,谷歌為什么在如此重視AI戰(zhàn)略的時(shí)候,推出這款Google Home的智能家居產(chǎn)品,并且采用雙麥克的方案呢?相信對(duì)于谷歌這樣的公司,成本和技術(shù)絕不會(huì)是阻礙他們采用更好技術(shù)的原因。
據(jù)業(yè)內(nèi)人士分析,最關(guān)鍵的就是上面提到的廣泛的適用性和落地的便捷性,可能讓谷歌最后選擇了雙麥克方案。谷歌布局整個(gè)智能硬件產(chǎn)業(yè)鏈,而非只打造一款爆款產(chǎn)品。現(xiàn)在做Google Home智能音響,以后也可能做電視、汽車等等,所以在軟硬件選擇上都會(huì)考慮更通用、更長遠(yuǎn)的方案。多麥克陣列對(duì)外觀和結(jié)構(gòu)的嚴(yán)苛要求,使得該方案的應(yīng)用場(chǎng)景極為有限,不具備廣泛的適用性,以Google的遠(yuǎn)大抱負(fù),顯然會(huì)選擇適應(yīng)性更強(qiáng)的雙麥克方案。
目前,谷歌明確表示會(huì)部分開放對(duì)接的子系統(tǒng),包括燈控、溫控器、開關(guān)三大類。媒體分析,谷歌隨后還會(huì)提供針對(duì)家庭第三方設(shè)備的免費(fèi)軟件開發(fā)包,以方便鼓勵(lì)第三方開發(fā)商增加新的服務(wù)功能,提升Google Home的兼容性。同時(shí)對(duì)抗出貨量400萬臺(tái)的Echo營造的生態(tài)體系,因?yàn)镋cho對(duì)接的名單已經(jīng)是很長一大串,其中就包括了Nest。
雙麥克陣列在智能家居領(lǐng)域落地最為廣泛
雖然多麥克陣列方案在業(yè)內(nèi)炒得如火如荼,但在落地過程中,雙麥克方案卻成為家電產(chǎn)業(yè)中出貨量最大的方案。據(jù)了解,目前國內(nèi)主流家電廠商應(yīng)用語音交互技術(shù)的產(chǎn)品中,包括樂視電視、海信電視、格力空調(diào)、美的空調(diào)、華帝煙機(jī)等,出貨量最大的產(chǎn)品搭載的都是雙麥克方案。
另外,國內(nèi)的主流人工智能企業(yè)也都在雙麥克方案上重點(diǎn)布局。據(jù)悉,僅云知聲一家企業(yè),目前搭載雙麥克的芯片模組每月的出貨量就超過幾萬片,而科大訊飛也在緊鑼密鼓研發(fā)雙麥克方案,爭(zhēng)奪智能家居市場(chǎng)。
據(jù)家電行業(yè)資深技術(shù)人士介紹,從2012年開始,行業(yè)內(nèi)就開始尋求語音交互技術(shù)在家電產(chǎn)品中的應(yīng)用,并明確要求:第一、用戶直接通過語音方式控制產(chǎn)品,且不受產(chǎn)品自身噪聲影響;第二、一定距離的遠(yuǎn)場(chǎng)語音交互得以實(shí)現(xiàn);第三、方案成熟,成本控制。遠(yuǎn)場(chǎng)語音交互是關(guān)鍵中的關(guān)鍵。當(dāng)時(shí)市場(chǎng)上普遍解決方案都是八個(gè)麥克風(fēng)收音,雖然語音識(shí)別準(zhǔn)度得以提高,但實(shí)施成本、結(jié)構(gòu)難度、生產(chǎn)安裝等問題卻接踵而來。然而像空調(diào)、電視這類家電產(chǎn)品,它永遠(yuǎn)都是貼墻放,八個(gè)麥克風(fēng)在實(shí)際應(yīng)用上是多余的。雙麥克技術(shù)在任何產(chǎn)品上均可自然適配。
該人士稱,雙麥克風(fēng)陣列的結(jié)構(gòu)簡(jiǎn)單、成本低、容易實(shí)施、功耗低等特點(diǎn)讓它更容易在家電產(chǎn)品中實(shí)現(xiàn)落地。相信在未來一段時(shí)間內(nèi),雙麥克都將成為智能家居產(chǎn)品中的主流配置。
不同應(yīng)用場(chǎng)景下自由配置
雖然雙麥克有性價(jià)比和結(jié)構(gòu)簡(jiǎn)單的種種優(yōu)勢(shì),但并不能完全覆蓋所有場(chǎng)景下的產(chǎn)品需求。
比如,在機(jī)器人領(lǐng)域里,對(duì)聲源定位的要求比較高,所以一般都會(huì)使用環(huán)形多麥克方案。這兩年國內(nèi)比較火的Rokid機(jī)器人就采用了8麥克的陣列。
未來人工智能領(lǐng)域還需要更多適配的硬件,以滿足不同智能產(chǎn)品的需求。因此,國內(nèi)像科大訊飛、云知聲等行業(yè)領(lǐng)軍企業(yè)都相繼推出了6+1麥克、4麥克陣列方案,滿足智能音響、機(jī)器人領(lǐng)域的產(chǎn)品需求。
從長遠(yuǎn)來看,麥克風(fēng)陣列解決的只是感知這一塊,更快的落地(雙麥克更有優(yōu)勢(shì))、更多種的形態(tài)(雙麥克和多麥克陣列可配置),是建設(shè)人工智能生態(tài)的第一步。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。