1
本文作者: 叨叨 | 2017-06-19 18:14 |
雷鋒網(wǎng)新智造按:2015年, Amazon Echo 橫空出世,一年多時(shí)間出貨量達(dá)到500萬臺(tái)。eMarketer 的數(shù)據(jù)顯示,在2017年一季度美國(guó)語音助手市場(chǎng)中,Amazon Echo 的市場(chǎng)份額達(dá)到 70.6%,遠(yuǎn)遠(yuǎn)超過了 Google、Apple、Microsoft 等巨頭和一批新進(jìn)入的創(chuàng)業(yè)公司。但絕對(duì)領(lǐng)先的市場(chǎng)份額,并不會(huì)讓后來者望而卻步就,競(jìng)爭(zhēng)的激烈程度在明顯加劇。但是,留給其他廠商和投資人的時(shí)間還多么?
本篇文章為雷鋒網(wǎng)新智造向星河互聯(lián)人工智能事業(yè)部管理合伙人劉瑋瑋的約稿,主要梳理了智能語音領(lǐng)域的一些熱點(diǎn)問題,進(jìn)行分享。劉瑋瑋同時(shí)也是「新智造成長(zhǎng)榜 2017」的評(píng)委,將會(huì)參加 CCF-GAIR 2017——2017 年全球人工智能與機(jī)器人大會(huì),并在 AI 創(chuàng)投專場(chǎng)發(fā)表主題演講。
智能語音領(lǐng)域被認(rèn)為是通用人工智能最先落地的領(lǐng)域。而語音交互也是繼手機(jī)觸控后,被業(yè)界看作下一代交互方式,將會(huì)帶動(dòng)相關(guān)千億市場(chǎng)。關(guān)于智能語音助手類產(chǎn)品,目前行業(yè)仍舊不能給出一個(gè)清晰的定義,但卻不影響這個(gè)品類創(chuàng)業(yè)的火熱。特別是 Amazon Echo 在2015年的橫空出世,Google、Apple 等互聯(lián)網(wǎng)巨頭的跟進(jìn),國(guó)內(nèi)的京東、阿里,以及一批創(chuàng)業(yè)公司也都看到機(jī)會(huì),紛紛試水。
今天將會(huì)梳理智能語音領(lǐng)域的一些熱點(diǎn)問題,分享給大家。
Alexa 是預(yù)裝在亞馬遜 Echo 內(nèi)的個(gè)人虛擬助手,可以接收及相應(yīng)語音命令,Alexa 可以被看成是亞馬遜版的 Siri 語音助手。亞馬遜在2015年6月開放了 Alexa 的語音技術(shù),供第三方開發(fā)者免費(fèi)使用,實(shí)現(xiàn)了 Alexa 與開發(fā)者的對(duì)接。而 Echo 則是一款搭載智能助手 Alexa 的智能音箱,也是目前為止最為成功的一款智能音箱。
幾天前,蘋果終于推出了自己的智能音響—— HomePod。HomePod 支持用戶通過 Siri 控制音箱播放 Apple Music 音樂,并實(shí)現(xiàn)新聞推送、事項(xiàng)提醒、鬧鐘設(shè)置、翻譯等智能語音助手功能。HomePod 將于年底在美國(guó)、英國(guó)和澳大利亞與我們見面,售價(jià)349美元。
有人將Echo、HomePod、Google Home 三個(gè)產(chǎn)品進(jìn)行互相對(duì)比,發(fā)現(xiàn)三個(gè)產(chǎn)品側(cè)重點(diǎn)并不太一樣。從人工智能技術(shù)的儲(chǔ)備方面,我認(rèn)為 Google(Google Assistant) 和蘋果(Siri)都有成為通用人工智能助手的潛質(zhì)。Google Home 的信息搜索質(zhì)量更高,Echo 產(chǎn)品打磨的更加成熟,商業(yè)落地最快,生態(tài)系統(tǒng)初步搭建完成。HomePod還未上市。
那么,智能助手類產(chǎn)品是不是只是巨頭的游戲?目前來看,確實(shí)有這個(gè)趨勢(shì)。產(chǎn)品并不只是一款硬件,還包含軟件平臺(tái)、算法、內(nèi)容等,是個(gè)系統(tǒng)工程。所以說,做成一款成功的智能語音產(chǎn)品,并商業(yè)落地,不是一件容易事。
另一方面,也只有大公司才能最終做成像 Alexa 類似的語音助手。Alexa 的背后是巨大的計(jì)算量、數(shù)據(jù)量,以及復(fù)雜的人工智能算法服務(wù)。項(xiàng)目對(duì)基礎(chǔ)設(shè)施、人才的需求量不是小公司可以負(fù)擔(dān)的。
我們先看一下 Amazon Echo 的全球出貨量,2016年出貨量達(dá)到了500萬臺(tái)。這個(gè)數(shù)量級(jí)在智能語音助手類音箱中絕對(duì)全球領(lǐng)先,國(guó)內(nèi)做的最好的叮咚音箱也與 Echo 相差了一個(gè)量級(jí)不止。
就像前面講的,智能助手類音箱創(chuàng)意很好,但要在國(guó)內(nèi)做成好產(chǎn)品,并且賣上量,則和很多因素(產(chǎn)品體驗(yàn)、內(nèi)容、技術(shù)、生態(tài)性等)相關(guān),不是 copy to China 這么簡(jiǎn)單。
國(guó)內(nèi)企業(yè),可以使用巨頭提供的平臺(tái)服務(wù)開發(fā)各種終端產(chǎn)品,深入巨頭不直接觸達(dá)的場(chǎng)景,或者還有機(jī)會(huì)。
根據(jù) BI 的數(shù)據(jù)統(tǒng)計(jì),可以看到排名前十的應(yīng)用是設(shè)置鬧鐘、語音遙控聽歌、聽新聞、計(jì)時(shí)器,亞馬遜電商購物業(yè)務(wù)相關(guān)的一些應(yīng)用,以及近兩年的物聯(lián)網(wǎng)應(yīng)用。這是一個(gè)非常有意思的統(tǒng)計(jì)。一個(gè)產(chǎn)品如果能有500萬臺(tái)以上的售賣,就必然不是簡(jiǎn)單的極客行為,必然有其背后的需求。
大家知道,亞馬遜主要銷售在歐美,歐美人的生活習(xí)慣和場(chǎng)景和國(guó)內(nèi)非常不一樣。歐美人的房間一般都是大 house 或者 Loft,他們對(duì)時(shí)間的規(guī)劃非常看重,每天起床后,可以聽聽音樂、新聞,開始一天的工作生活。同時(shí),歐美人對(duì)待音樂,也絕不是聽聽流行歌曲這么簡(jiǎn)單,音樂是其生命的一部分,是剛需。
而國(guó)內(nèi)的生活習(xí)慣和文化則有很大不同,這也解釋了為什么國(guó)內(nèi)很多人說類似Echo的產(chǎn)品沒有剛需,主要是因?yàn)樯罘绞降牟煌?。想不透需求,盲目跟風(fēng),不會(huì)取得長(zhǎng)久成功。
前不久,亞馬遜在其官網(wǎng)上發(fā)布了一款帶屏幕的智能音箱,這款智能音箱的名字,叫做 Echo Show。
Echo Show 機(jī)身正面配備了一塊 7.0 英寸的可觸控屏幕,屏幕上方中間則有一個(gè)五百萬像素的前置攝像頭,音箱按鍵和麥克/攝像頭控制鍵被安放在機(jī)身頂部,電源接口則被隱藏在背部下方。值得一提的是,Echo Show 配備了 8 個(gè) Mic 序列,比第一代的 Echo 多了一個(gè)。價(jià)格方面,Echo Show 的單個(gè)售價(jià)為 229.99 美元,比第一代 Echo 正式發(fā)售時(shí)的價(jià)格貴了 50 美元;不過需要說明的是,Echo Show 首先是一款內(nèi)置 Alexa 的智能音箱;與它的前輩 Echo、Echo Dot 等一樣,它可以實(shí)現(xiàn)通過語音來查詢天氣、控制家電、聆聽音樂、使用 Uber 打車服務(wù)等功能。
從官網(wǎng)的介紹來看,有了屏幕的加持 Echo Show 能夠?qū)崿F(xiàn)如下功能:
可以查看來自 YouTube 、CNN、Bloomberg 等服務(wù)商的視頻;
顯示天氣、日歷、待辦列表等諸多語音交互時(shí)伴隨的消息;
通過 Alexa 實(shí)現(xiàn)與 Echo Show 和智能手機(jī)(需要內(nèi)置 Alexa app)用戶的視頻聊天,以及與所有的 Echo 用戶實(shí)現(xiàn)語音聊天;
播放來自 Amazon Music 的音樂時(shí),在屏幕上顯示歌詞等信息。
我把 Echo Show 定義為 Echo 系列中的補(bǔ)充產(chǎn)品,這個(gè)產(chǎn)品中的屏僅起一個(gè)輔助交互作用,核心還是以語音交互為主,幫助人們完成語音交互解決不了的問題,比如購物、圖片信息的查看等等。
在產(chǎn)品方面,一些帶顯示的核心應(yīng)用一定是與 Alexa 深入集成與優(yōu)化的,這樣才能保證各種交互方式的流暢連貫性。比如,語音購物挑選某些物品,屏幕中能恰當(dāng)?shù)娘@示出來。再比如,我用語音叫車選擇目的地,屏幕中能不能快速的調(diào)出地圖等等??梢?,加入視覺顯示后,交互方面需要的工作量成倍上升。
而我們?cè)趪?guó)內(nèi)也見到了一些初創(chuàng)企業(yè),做出了“音箱+屏幕”這樣不倫不類的產(chǎn)品,服務(wù)調(diào)用與語音交互完全脫節(jié),整體體驗(yàn)非常差。
消費(fèi)級(jí)的麥克風(fēng)陣列主要面臨環(huán)境噪聲、房間混響、人聲疊加、模型噪聲、陣列結(jié)構(gòu)等問題;
整體的語義理解還處在初期,要達(dá)到通用交流還有很長(zhǎng)距離;
人機(jī)交互容易被人忽視,但好產(chǎn)品確實(shí)要求優(yōu)質(zhì)的體驗(yàn)。
智能語音助手與產(chǎn)品多是巨頭的游戲,創(chuàng)業(yè)者切忌創(chuàng)業(yè)跟風(fēng);
中國(guó)和歐美的使用場(chǎng)景很不同,創(chuàng)業(yè)者要透徹分析;
如果選擇這個(gè)領(lǐng)域創(chuàng)業(yè),請(qǐng)備足糧草,做好和行業(yè)一起成長(zhǎng)的準(zhǔn)備。
雷峰網(wǎng)特約稿件,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。