1
本文作者: 叨叨 | 2017-06-19 18:14 |
雷鋒網新智造按:2015年, Amazon Echo 橫空出世,一年多時間出貨量達到500萬臺。eMarketer 的數據顯示,在2017年一季度美國語音助手市場中,Amazon Echo 的市場份額達到 70.6%,遠遠超過了 Google、Apple、Microsoft 等巨頭和一批新進入的創(chuàng)業(yè)公司。但絕對領先的市場份額,并不會讓后來者望而卻步就,競爭的激烈程度在明顯加劇。但是,留給其他廠商和投資人的時間還多么?
本篇文章為雷鋒網新智造向星河互聯人工智能事業(yè)部管理合伙人劉瑋瑋的約稿,主要梳理了智能語音領域的一些熱點問題,進行分享。劉瑋瑋同時也是「新智造成長榜 2017」的評委,將會參加 CCF-GAIR 2017——2017 年全球人工智能與機器人大會,并在 AI 創(chuàng)投專場發(fā)表主題演講。
智能語音領域被認為是通用人工智能最先落地的領域。而語音交互也是繼手機觸控后,被業(yè)界看作下一代交互方式,將會帶動相關千億市場。關于智能語音助手類產品,目前行業(yè)仍舊不能給出一個清晰的定義,但卻不影響這個品類創(chuàng)業(yè)的火熱。特別是 Amazon Echo 在2015年的橫空出世,Google、Apple 等互聯網巨頭的跟進,國內的京東、阿里,以及一批創(chuàng)業(yè)公司也都看到機會,紛紛試水。
今天將會梳理智能語音領域的一些熱點問題,分享給大家。
Alexa 是預裝在亞馬遜 Echo 內的個人虛擬助手,可以接收及相應語音命令,Alexa 可以被看成是亞馬遜版的 Siri 語音助手。亞馬遜在2015年6月開放了 Alexa 的語音技術,供第三方開發(fā)者免費使用,實現了 Alexa 與開發(fā)者的對接。而 Echo 則是一款搭載智能助手 Alexa 的智能音箱,也是目前為止最為成功的一款智能音箱。
幾天前,蘋果終于推出了自己的智能音響—— HomePod。HomePod 支持用戶通過 Siri 控制音箱播放 Apple Music 音樂,并實現新聞推送、事項提醒、鬧鐘設置、翻譯等智能語音助手功能。HomePod 將于年底在美國、英國和澳大利亞與我們見面,售價349美元。
有人將Echo、HomePod、Google Home 三個產品進行互相對比,發(fā)現三個產品側重點并不太一樣。從人工智能技術的儲備方面,我認為 Google(Google Assistant) 和蘋果(Siri)都有成為通用人工智能助手的潛質。Google Home 的信息搜索質量更高,Echo 產品打磨的更加成熟,商業(yè)落地最快,生態(tài)系統(tǒng)初步搭建完成。HomePod還未上市。
那么,智能助手類產品是不是只是巨頭的游戲?目前來看,確實有這個趨勢。產品并不只是一款硬件,還包含軟件平臺、算法、內容等,是個系統(tǒng)工程。所以說,做成一款成功的智能語音產品,并商業(yè)落地,不是一件容易事。
另一方面,也只有大公司才能最終做成像 Alexa 類似的語音助手。Alexa 的背后是巨大的計算量、數據量,以及復雜的人工智能算法服務。項目對基礎設施、人才的需求量不是小公司可以負擔的。
我們先看一下 Amazon Echo 的全球出貨量,2016年出貨量達到了500萬臺。這個數量級在智能語音助手類音箱中絕對全球領先,國內做的最好的叮咚音箱也與 Echo 相差了一個量級不止。
就像前面講的,智能助手類音箱創(chuàng)意很好,但要在國內做成好產品,并且賣上量,則和很多因素(產品體驗、內容、技術、生態(tài)性等)相關,不是 copy to China 這么簡單。
國內企業(yè),可以使用巨頭提供的平臺服務開發(fā)各種終端產品,深入巨頭不直接觸達的場景,或者還有機會。
根據 BI 的數據統(tǒng)計,可以看到排名前十的應用是設置鬧鐘、語音遙控聽歌、聽新聞、計時器,亞馬遜電商購物業(yè)務相關的一些應用,以及近兩年的物聯網應用。這是一個非常有意思的統(tǒng)計。一個產品如果能有500萬臺以上的售賣,就必然不是簡單的極客行為,必然有其背后的需求。
大家知道,亞馬遜主要銷售在歐美,歐美人的生活習慣和場景和國內非常不一樣。歐美人的房間一般都是大 house 或者 Loft,他們對時間的規(guī)劃非??粗?,每天起床后,可以聽聽音樂、新聞,開始一天的工作生活。同時,歐美人對待音樂,也絕不是聽聽流行歌曲這么簡單,音樂是其生命的一部分,是剛需。
而國內的生活習慣和文化則有很大不同,這也解釋了為什么國內很多人說類似Echo的產品沒有剛需,主要是因為生活方式的不同。想不透需求,盲目跟風,不會取得長久成功。
前不久,亞馬遜在其官網上發(fā)布了一款帶屏幕的智能音箱,這款智能音箱的名字,叫做 Echo Show。
Echo Show 機身正面配備了一塊 7.0 英寸的可觸控屏幕,屏幕上方中間則有一個五百萬像素的前置攝像頭,音箱按鍵和麥克/攝像頭控制鍵被安放在機身頂部,電源接口則被隱藏在背部下方。值得一提的是,Echo Show 配備了 8 個 Mic 序列,比第一代的 Echo 多了一個。價格方面,Echo Show 的單個售價為 229.99 美元,比第一代 Echo 正式發(fā)售時的價格貴了 50 美元;不過需要說明的是,Echo Show 首先是一款內置 Alexa 的智能音箱;與它的前輩 Echo、Echo Dot 等一樣,它可以實現通過語音來查詢天氣、控制家電、聆聽音樂、使用 Uber 打車服務等功能。
從官網的介紹來看,有了屏幕的加持 Echo Show 能夠實現如下功能:
可以查看來自 YouTube 、CNN、Bloomberg 等服務商的視頻;
顯示天氣、日歷、待辦列表等諸多語音交互時伴隨的消息;
通過 Alexa 實現與 Echo Show 和智能手機(需要內置 Alexa app)用戶的視頻聊天,以及與所有的 Echo 用戶實現語音聊天;
播放來自 Amazon Music 的音樂時,在屏幕上顯示歌詞等信息。
我把 Echo Show 定義為 Echo 系列中的補充產品,這個產品中的屏僅起一個輔助交互作用,核心還是以語音交互為主,幫助人們完成語音交互解決不了的問題,比如購物、圖片信息的查看等等。
在產品方面,一些帶顯示的核心應用一定是與 Alexa 深入集成與優(yōu)化的,這樣才能保證各種交互方式的流暢連貫性。比如,語音購物挑選某些物品,屏幕中能恰當的顯示出來。再比如,我用語音叫車選擇目的地,屏幕中能不能快速的調出地圖等等??梢?,加入視覺顯示后,交互方面需要的工作量成倍上升。
而我們在國內也見到了一些初創(chuàng)企業(yè),做出了“音箱+屏幕”這樣不倫不類的產品,服務調用與語音交互完全脫節(jié),整體體驗非常差。
消費級的麥克風陣列主要面臨環(huán)境噪聲、房間混響、人聲疊加、模型噪聲、陣列結構等問題;
整體的語義理解還處在初期,要達到通用交流還有很長距離;
人機交互容易被人忽視,但好產品確實要求優(yōu)質的體驗。
智能語音助手與產品多是巨頭的游戲,創(chuàng)業(yè)者切忌創(chuàng)業(yè)跟風;
中國和歐美的使用場景很不同,創(chuàng)業(yè)者要透徹分析;
如果選擇這個領域創(chuàng)業(yè),請備足糧草,做好和行業(yè)一起成長的準備。
雷峰網特約稿件,未經授權禁止轉載。詳情見轉載須知。