2
本文作者: 趙青暉 | 2017-03-17 23:34 | 專題:雷峰網(wǎng)公開課 |
在今年的AWE 2017中國家電及消費(fèi)電子博覽會上,雷鋒網(wǎng)觀察到,除了傳統(tǒng)的家電廠商循規(guī)蹈矩的參展之外,各家家電巨頭以及新興廠商都使出了渾身解數(shù),讓自己的家電產(chǎn)品向「智能家居」方向靠攏。
在這些參展的「智能家居」企業(yè)中,絕大多數(shù)在做智能家居產(chǎn)品時,大多數(shù)都放棄了幾年前「用手機(jī)APP控制家電」的智能家居概念,集體轉(zhuǎn)向了「人工智能」概念的路子。其中人工智能在智能家居的運(yùn)用中,語音控制和交互成為了智能家居的主要控制方式。其中,不乏有一些家電廠商推出了作為中樞控制的語音盒、機(jī)器人等產(chǎn)品,以追趕亞馬遜Echo的腳步。
從目前的趨勢來看,隨著人工智能的快速發(fā)展,未來語音交互將成為智能家居產(chǎn)品必不可少的一種操作方式,那么未來語音交互會發(fā)展到什么狀態(tài)?為什么語音交互將成為智能家居產(chǎn)品的標(biāo)配?在發(fā)展過程中中國的市場將會有哪些機(jī)遇和挑戰(zhàn)?
本期的硬創(chuàng)公開課,雷鋒網(wǎng)請來了海知智能CEO謝殿俠來跟我們聊一聊未來智能家居的語音控制/交互的趨勢。
謝殿俠:海知智能 CEO,畢業(yè)于北京大學(xué),從事過文字處理、知識管理等工作;創(chuàng)辦海知智能,打造個性化聊天機(jī)器人開放技術(shù)服務(wù)平臺,為智能硬件、智能機(jī)器人以及企業(yè)智能化提供語義理解 API,即基于自然語言理解和知識圖譜的技術(shù)接口,使得「人人會做機(jī)器人」,最終可以「人人能有機(jī)器人」。
公開課視頻:
以下是經(jīng)雷鋒網(wǎng)精編的謝殿俠演講實錄,關(guān)注雷鋒網(wǎng)旗下微信公眾號「新智造」,回復(fù)「PPT」可獲取嘉賓完整PPT。
2017年是一個非常有意思的一年,從年初的拉斯維加斯CES展到剛剛結(jié)束的中國家電展上,我們都可以看到一個非常有意思的現(xiàn)象:大大小小的家電廠商都在擁抱智能,或者說,都在擁抱語音交互,一些傳統(tǒng)的智能硬件也在往新型的智能交互方式躍遷,我們來看一些具體的情況。
圖中都是一些非常新型的智能設(shè)備,比如左上角這個智能燈,你可以用語音交互的方式用它來控制家里的智能設(shè)備,下面是一個智能語音的鬧鐘,沒有了傳統(tǒng)設(shè)備那么多的按鍵,而是使用語音交互的方式來操控。
在這些設(shè)備中,目前最大的贏家是亞馬遜的Alexa,雖然他們沒有來參加這次CES展會, 但是目前國外有很多的設(shè)備都已經(jīng)接入了Alexa,包括上面的所有的設(shè)備。
雖然Alexa沒有參展,但是我們中國自己制造的智能音箱參展了,就是圖中這款聯(lián)想智能音箱,這款面向北美產(chǎn)品目前也接入了Alexa,可以像Echo一樣接入一些智能產(chǎn)品,也獲得了一些相應(yīng)的資源。
圖中這個智能廚房,包括冰箱、抽油煙機(jī)等等,這些所有的設(shè)備都具備了語音交互的能力,當(dāng)然背后的主角仍然是Alexa。
我們把目光移回中國上海,剛剛過去的智能家居展也展出了一些具有黑科技的產(chǎn)品,比如帶語音交互的攝像頭、桌面機(jī)器人、智能臺燈等一些常用的智能設(shè)備,還有別具中國特色的智能后視鏡,這個后視鏡的主要交互方式也是語音。傳統(tǒng)家電廠商海爾已經(jīng)包了整個N1場館,在里面展出了一些海爾的智能家居的產(chǎn)品,這些產(chǎn)品體現(xiàn)出海爾在家居方面的智能化戰(zhàn)略發(fā)展方向。
假設(shè)我們從五年后回頭看今天,究竟什么樣的產(chǎn)品在語音交互上,能讓傳統(tǒng)的家電設(shè)備變成真正的智能家居,真正的走入智慧家庭?
其實用語音控制設(shè)備這個事情很多年前已經(jīng)玩過了,比如最早前還沒有Siri的iPhone就可以用語音來控制,用戶可以對它說一些簡單的命令詞,讓它來執(zhí)行一些任務(wù),但是它能執(zhí)行的任務(wù)非常有限,本質(zhì)上只能稱之為「語音控制」,而不是「語音交互」。
所以說語音控制對語音交互來講是一個非常非常初級的狀態(tài),目前很多的智能設(shè)備都具備了語音交互的能力和聯(lián)網(wǎng)的能力,但是從很大程度上來說,它只是一種語音輸入法,其原理是將聲音變成文本,然后用文本來對設(shè)備進(jìn)行控制。
此前業(yè)內(nèi)做過這方面的人應(yīng)該知道,帶有語音控制的產(chǎn)品做出來之后看起來很好,雖然這些產(chǎn)品都具備了語音控制的能力,可以用語音控制各種家用電器,用「命令詞」來替代以前的遙控器,從而做智能化的嘗試。但是數(shù)據(jù)是會說話的,這些產(chǎn)品普遍賣得都不是很理想。原因是雖然到今天語音識別已經(jīng)有了很大的突破,但是仍然達(dá)不到百分之百的準(zhǔn)確。
和傳統(tǒng)的遙控器相比,用戶用傳統(tǒng)的按遙控器控制家電,可能按十次會有九次對,一次手滑按錯了,但是用語音控制遙控器,十次可能只有八次是對的,所以語音控制并沒有比傳統(tǒng)遙控器更加的快捷、高效,這就是目前的具體的一個現(xiàn)狀。我作為一個語義理解公司的創(chuàng)始人,目前在控制空調(diào)的時候,都是更喜歡使用按鍵遙控器。在這種情況下,很多語音控制的的功能就會變成一個擺設(shè),在最初的時候大家可能會嘗鮮玩兒一下,但是過一段時間之后就會放棄了。
另外,我們看下傳統(tǒng)意義上的智能家庭的智能設(shè)備的遙控器,比如之前很火的nest,它采用了觸摸屏+旋鈕的方式來實現(xiàn)對家庭智能設(shè)備的控制。用戶既可以手動用它來控制家電,另外它內(nèi)部帶有大數(shù)據(jù),可以用來學(xué)習(xí),也可以自動地完成一些自動化的控制,比如你什么時候在家、什么時候出門,當(dāng)你出門自動幫你關(guān)掉某些電氣設(shè)備等等。在這種情況下,它仍然要比語音控制交互更加直接,更加準(zhǔn)確。但是如果你問它今天出門要帶傘嗎?那么強(qiáng)大的nest就傻了。
關(guān)于真正的產(chǎn)品智能化,這里有三個關(guān)鍵詞,就是你要做的到底是個「道具」還是個「工具」還是個「玩具」?
當(dāng)我們把語音控制的功能,作為替代遙控器功能的控制器來做,那么很大程度上它的意義就是個道具或是個玩具。因為它不能帶來更加直接更加有效,或者更多功能上的附加值,也許就是大家新鮮一下玩一玩就完了。那么怎么才能讓語音控制成為一個工具,讓大家用了之后離不開、有粘性呢?
那我們從大的方向來看一個變遷。
PC到機(jī)器人
鍵盤鼠標(biāo)是PC時代的產(chǎn)物,眾所周知,當(dāng)初我們學(xué)鍵盤的時候需要很高的學(xué)習(xí)成本,而到了觸屏機(jī)時代,也就是移動互聯(lián)網(wǎng)時代,我們學(xué)習(xí)智能手機(jī)的成本就會降低很多。由此看來,設(shè)備的提升和相應(yīng)的使用學(xué)習(xí)是應(yīng)該趨于越來越簡單易用的。
從PC時代到智能手機(jī)時代,我們用了差不多二十年,而從智能手機(jī)觸摸屏?xí)r代到現(xiàn)在的Echo之類的語音交互設(shè)備,我們用了差不多十年。
Echo這個產(chǎn)品在北美的市場非常的成功,而在中國,類似的設(shè)備卻還在探索的過程當(dāng)中。這里面非常非常重要的一點(diǎn),就是我們現(xiàn)在的產(chǎn)品更多是語音控制為主。而Echo更多意義上來講它是一個智能的機(jī)器人。
之前我們所說的機(jī)器人,更多是那種電影里面有胳膊有腿的人形機(jī)器,但實際上,目前很多「機(jī)器人」產(chǎn)品能動、能跳舞,那是因為這些機(jī)器人是通過程序控制的,它并不能聽懂你的話,只是一個玩具而已。真正能被稱作機(jī)器人的應(yīng)該是它具有區(qū)別于動物或植物的本質(zhì)特征——能聽得懂人話,并且能夠以自然語言跟人交流。另外,它有信息、有知識、有服務(wù),他能夠聽懂人的話,而且能滿足人的要求。這些才是機(jī)器能被稱作「人」的本質(zhì)的特征。那么Echo和其背后的Alexa就具備了這些特點(diǎn),這也是我們稱其為機(jī)器人的原因。
智能音箱和音箱智能
左邊的這款產(chǎn)品是羅技的智能音箱,右邊的是Echo,以這兩個為對比,普通的「智能音箱」需要連接手機(jī)使用,手機(jī)播放的音樂可以從智能音箱中放出來。雖然Echo也可以連接手機(jī),但多數(shù)時候它并不需要手機(jī)去控制,你只要在連接WiFi的情況下跟它說話,它就能去滿足一些要求,比如說播放音樂、幫你打車、查詢天氣、聽書等功能。它能聽懂用戶的話,可以提供用戶所需要的各種各樣的服務(wù),在這種情況下它儼然成為了家庭的一個成員。在初期的時候,它的能力只覆蓋了二十多個領(lǐng)域,而現(xiàn)在它開放了平臺之后已經(jīng)覆蓋了超過1萬個領(lǐng)域。也許以后就會出現(xiàn)像App Store一樣的各種應(yīng)用庫,在里面有很多個插件,來滿足人們各種各樣的需求。
下面我們來看一看真正的語音交互和傳統(tǒng)的語音控制在設(shè)計上有什么區(qū)別。
以前我們是把機(jī)器人當(dāng)作一種工具,叫做人機(jī)交互,現(xiàn)在我們把機(jī)器人當(dāng)作人來看,就成了人“人”交互。
舉一個具體場景的事例。
普通的語音控制情況下,早上鬧鐘響了之后我們會說:「關(guān)閉鬧鐘吧」,「把鬧鐘關(guān)掉」等等,「關(guān)閉」這個關(guān)鍵詞總是在用,但是在日常生活中,人說話的語境是不一樣的,有的時候我們會說「我想多睡一會兒」、「別吵了」等等,這樣機(jī)器缺少了關(guān)鍵詞就很難理解了。當(dāng)然這個也可以設(shè)置多種多樣的關(guān)鍵詞來解決,但終究是有限的,因為人們的說法會多種多樣。真正的智能設(shè)備應(yīng)該像有一個人在那里一樣,它能夠聽懂你的意思、知道你的意圖。
一個真正的智能家居或智慧家庭里的一個場景應(yīng)該是,設(shè)備上沒有限定,只要有麥克風(fēng)能把你的聲音進(jìn)行收取和分析即可,它的形態(tài)可以是鬧鐘、可以是冰箱,也可以是其他的東西,這些東西能使用云端的大腦來跟你交流。
拿天氣預(yù)報來舉例,比如說以前的語音控制之類的軟件,會抓住你的關(guān)鍵詞,來向你播報天氣,其出現(xiàn)的結(jié)果就會像第一張圖一樣,出現(xiàn)日期、地點(diǎn)、天氣等所有的結(jié)果。但是實際生活中我們所說的話是非??谡Z化的,一句話有多種多樣的說法,一個真正的智能設(shè)備應(yīng)該是能夠聽懂人各種各樣的說法,并給出既定答案。比如問「今天北京有霧霾嗎?」,他就會告訴你北京的霧霾指數(shù)有多少。你問「今天風(fēng)大嗎?」,它只會跟你說外面風(fēng)力的情況,而不是把所有的數(shù)據(jù)都報出來。你問「今天出門需要帶傘嗎?」,它也能夠聽得懂這是一句問天氣的話,而不是問其他的。就好像你有一個氣象管家一樣。
再拿音樂來舉例,雖然很多設(shè)備可以實現(xiàn)語音控制的方式來搜一首歌,但實際情況是用語音搜索,還不如打開一個app來得快捷。而且很多音樂APP的推薦也很多、很準(zhǔn)。在這種情況下,用戶更喜歡用手機(jī)來搜索,然后用手機(jī)連著音響來聽。
而在理想的語音交互層面來說,不管我的音箱、電視甚至冰箱、空調(diào),都可以為我們搜索歌曲,不管我走到哪個房間,只要我想聽歌張嘴說話就可以。這里面需要一個關(guān)鍵點(diǎn),就是說語音交互的方式,能不能比傳統(tǒng)的方式,更便捷更好,讓人放棄傳統(tǒng)的方式去搜索。
如果以后能夠發(fā)展到每一個房間都有相應(yīng)的智能設(shè)備,那么語音交互的方式應(yīng)該是什么樣呢?就如下圖所示,光搜索還不夠,比如跟機(jī)器說「我想聽劉德華最火的歌」、「我今天累了,給我放一些舒緩的音樂」等等,機(jī)器都能夠滿足你的條件。只要有足夠的曲庫、所有的設(shè)備里面都能聽懂你說的話并且還能給你結(jié)果,就達(dá)到了真正的語音交互的方式。除了音樂之外還有其他的場景,比如聽書、廚房應(yīng)用等等。
在這種情況下,冰箱不僅僅是冰箱,空調(diào)也不僅僅是空調(diào)。他們首先都是一個機(jī)器人。
當(dāng)智能家居具備了語音交互的能力,而不僅僅是語音控制的能力之后。就意味著每一臺家用電器都變成了機(jī)器人。這些機(jī)器人都能聽懂你的話,并且具備一些相應(yīng)的能力。拿冰箱為例,一旦打通了交互的能力就會有音樂的功能、菜譜的功能等等,如果你在使用中有什么問題也可以通過冰箱去連接相應(yīng)的客服。這樣一來,就把很多傳統(tǒng)的業(yè)務(wù)的邊界給打破了。
比如說,家用電器和音樂服務(wù)、電商服務(wù)等等這些服務(wù)相融合。另外一邊,一些具備服務(wù)能力的人也多了一種可能性。他們可以利用這些設(shè)備進(jìn)入更多的家庭。
比如說,有個朋友在北京某個飯店吃了一個某個法國大廚做的非常好吃的面包,當(dāng)他回到家里之后,他就可以直接問烤箱,XXX廚師的XXX面包怎么做?除此之外,那個法國大廚的面包做法和配料需要付錢才能得到,智能設(shè)備也會打通一些支付服務(wù),付幾塊錢,然后教你如何做這個面包。
這種方式的好處就是用戶的使用成本降低了,比如說我在廚房做一件事物的時候,我只要去跟冰箱、烤箱等電器說說話就能把食物做出來,而不是坐到電腦面前或用手機(jī)APP去查詢,在支付上非常的方便。這個就會改變過去APP、網(wǎng)頁時代的整體的業(yè)務(wù)模式。
上面是通過一些具體的場景來描述語音交互為傳統(tǒng)的家居家電產(chǎn)品帶來的一些變化。其實語音交互未來會成為家電的標(biāo)配是一種趨勢。
從2017的CES展上我們就可以看到,的的確確有很多的最新的智能家居設(shè)備都打通了Alexa的功能/聯(lián)網(wǎng)的功能,具備了機(jī)器人最基本的智能。當(dāng)這些使用場景穩(wěn)定了之后,這些智能設(shè)備就會變成一個家庭的新成員。家里面雖然智能設(shè)備不同,比如說,廚房有冰箱、微波爐,客廳有空調(diào)、電視、音箱,但其背后可能都是同一個機(jī)器人。而且不同的家庭成員之間有不同的機(jī)器人,每個人在使用機(jī)器人的時候可以把自己的機(jī)器人調(diào)用出來,并體現(xiàn)在不同的設(shè)備上。
這個場景的實現(xiàn)取決于三個條件。
第一是硬件成本的降低,比如說WiFi模塊、各種聲音處理的芯片等硬件模組成本的降低。隨著市場的火熱,現(xiàn)在已經(jīng)降低了很多,再過個幾年,沒準(zhǔn)兒這些硬件成本會降到幾十塊,到時候,幾十塊對于一臺家用電器整體來說,將會是一個很低的成本占比。等硬件成本降低到一定程度,用戶體驗也達(dá)到一定的程度,達(dá)到一個臨界點(diǎn)之后,那么這個領(lǐng)域就會被引爆了,規(guī)模越大,硬件成本降得越低,這是一個良性循環(huán)。
第二是內(nèi)容資源和服務(wù)的豐富。當(dāng)硬件具備了語音交互的支撐能力之后,技術(shù)提供商在內(nèi)容資源和服務(wù)方面就可以發(fā)力了,比如去簽一些內(nèi)容版權(quán)等等。而內(nèi)容提供商也可以把他們的內(nèi)容打包成基本插件,來把這些內(nèi)容變成機(jī)器人的基本能力。其實,這一塊隨著智能硬件接入的越來越多,也會給內(nèi)容服務(wù)帶來更多的流量。更多的流量會刺激更多的內(nèi)容提供商,去接入這些服務(wù)。也會成為一個良性循環(huán)。
第三個是一個非常關(guān)鍵的點(diǎn),就是需要語音識別非常的準(zhǔn),語義理解也非常的準(zhǔn)。而在這一塊,語音識別的速度發(fā)展得非???,應(yīng)該會在兩三年內(nèi),甚至在今年,就達(dá)到非常非常高的水準(zhǔn),甚至?xí)咏蜻_(dá)到人的水平。但是語義理解方面,會挑戰(zhàn)得更大一些。
在限定的條件下,只能為我們的家庭用戶,在廚房或客廳等場景中解決有限的部分問題,但是在上述三個條件邊界明確的情況下,實際上現(xiàn)在產(chǎn)品是可以做的十分成熟的。所以,語音交互成為智能家居的標(biāo)配是一種必然。
接下來我們說說中國市場的情況。
市場剛剛覺醒
當(dāng)硬件成本降低,語音語義技術(shù)的容錯率達(dá)到人們可接受的范圍之內(nèi)之后。那么,智能家居這個市場就偏向成熟了。想達(dá)到這個程度,對于中國的市場來講不是今年就是明年,而對于北美市場來說,一般認(rèn)為是2016年,因為Alexa的的確確已經(jīng)賣了1000萬臺,而且有很多家庭都已經(jīng)形成了使用習(xí)慣,將其變成了用戶家里面一個不可缺少的部分。
之前在這一方面,中國市場坐了很長時間的冷板凳,所以大家覺悟都比較慢,甚至在2014年和2015年,這時候人們還對這個有爭議,甚至懷疑Echo數(shù)據(jù)有水分,現(xiàn)在已經(jīng)沒有這個爭議了,而且各廠家都開始朝這個方向去發(fā)展,市場已經(jīng)開始覺醒、開始嘗試。
芯片的成熟
未來芯片和板卡都會相應(yīng)地成熟起來,成本也會降低,屆時的市場就會崛起。但這一塊還有一個巨大挑戰(zhàn),比如說我們要把產(chǎn)品的出貨訂到具體的幾個月能不能搞得定?目前還是不能保證的,供應(yīng)鏈良莠不齊,真正具備承受能力的、成本可控的解決方案商還是有限的。 但是在這方面對于中國的智能制造的能力來講,還是沒什么問題的。我們希望,會有更多的原來做手機(jī)做平板等智能芯片板卡的供應(yīng)商加入到這個里面來。
內(nèi)容生態(tài)鏈尚需完善
相對于國內(nèi)來講,內(nèi)容生態(tài)鏈方面在國外確實做得相對完善一些。而國內(nèi)也在逐步的完善,近兩年有聲資源版權(quán)意識都有所增加。但是我們目前國內(nèi)的情況也有一個問題,就是資源過于集中了,并且都集中到了幾家巨頭手上,然后他們對目前智能家居等新興產(chǎn)業(yè)這塊支持力度不夠,內(nèi)容的成本也比較高。這些內(nèi)容版權(quán)商如何開放、如何降低成本、如何能讓更多的智能設(shè)備來接入,這也是一個挑戰(zhàn)。
另外的挑戰(zhàn)基本就是語音識別語音理解的成熟這一塊,國內(nèi)也有在努力,有很多企業(yè)在做,但是這樣的企業(yè)還需要更多。
總的來說,市場非常的大,未來就在眼前,前途是光明的,道路是坎坷的。還有許多具體的問題要克服,只有把這些問題都克服了,才能夠打造一款大家都喜歡的產(chǎn)品、一款有粘性的產(chǎn)品,而不只是一個概念、一個Demo、一個玩幾天就不玩了的玩具。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。