3
本文作者: 吳德新 | 2014-12-10 09:00 |
【編者按】繼2013年三星Galaxy Gear變炮灰和大量國產(chǎn)手表亂戰(zhàn)之后,Android Wear和Apple Watch是智能手表的另一春。本文作者系出門問問的林宜立和邢赫男同學(xué),聽他們講講2014怎么玩“表”。
隨著今年Google的Android Wear以及Apple的Watchkit相繼發(fā)布,智能手表的話題越來越火。在所有關(guān)于智能手表的爭論中,一個問題顯得尤為重要:最適合智能手表的交互方式是什么?
一塊合格的智能手表,除了可以耍帥看時間外,還應(yīng)該能夠讓用戶獲得生理和心理上的自由:即使雙手不接觸設(shè)備,也能方便地啟動設(shè)備和發(fā)布指令;即使視線并不鎖定在屏幕上,也能用眼角的余光快速獲得最重要的信息。
同時,智能手表還應(yīng)能及時推送最相關(guān)的資訊,過濾垃圾信息和噪音,給予用戶隨時在線的安全感,以便用戶專注于最重要的事情。
簡而言之,智能手表不應(yīng)該是戴在手腕上的縮小版智能手機、另一個信息干擾源,而應(yīng)幫助用戶更好地活在當下,享受生命的真實和美好。
智能手表的天然限制(小屏幕、運動行進中的晃動場景)對其人機交互也提出了更高的要求:無論是用戶輸入還是最終的結(jié)果展現(xiàn),都要簡單快速、自然直接。
在這樣的約束下,沒有語音而只有觸控的“智能”手表必將會是一場災(zāi)難。智能手表的小屏幕決定了其不適合精確的鍵盤輸入及觸控手勢,試想一下,在那塊伸出兩根纖細的手指就能幾乎遮擋整個表盤的狹小屏幕上,要求用戶用指尖去進行小心翼翼的精確點擊輸入,那將會是多么尷尬;當行走在寒風(fēng)中,雙手提著大包小包的購物袋時,你不太可能騰出雙手去觸摸手表;另一些場景下,不合理的交互方式甚至?xí)<吧踩?/span>
比如在駕駛汽車的時候,用戶需要的是精神目光集中在路面,雙手隨時緊握方向盤和換擋機構(gòu)。這時候用手去操作智能設(shè)備,哪怕是多一秒種的分心,都可能換來生命的代價…… 在這種情況下,如何減少觸摸操作,解放雙手,與機器進行自然直接的交互便顯得尤為重要。
日常生活中,語言是人與人交流的最常用和直接方式。在電影《星際穿越》中男主角馬大少與機器人TARS 對話式的交互令人印象深刻。即使身陷五維空間,馬大少依然可以用自然語言向TARS咨詢信息和下達自然語音指令。電影雖然虛構(gòu),但這樣的交互著實令人神往。自然語言對話式的交互,即使是老人和小孩也無需學(xué)習(xí)。用戶可以“無感”地喚醒設(shè)備,“無縫”地獲取信息、給予指令,毫無生澀和違和感,這才是最好的智能設(shè)備交互方式。
從科幻回到現(xiàn)實,目前的智能手表大多仍以觸控交互為主,盡管Android Wear和Apple Watch都在有意簡化觸控并引導(dǎo)用戶更多地使用語音交互,但功能仍未盡善盡美,尤其在國內(nèi)Google Now和Siri的中文識別體驗更是不盡如人意。谷歌蘋果尚且如此,更不用說其它一些備受用戶“神吐槽”的各種語音交互軟硬件了。
那么問題來了,既然語音是最簡單直接的交互方式,為何現(xiàn)在難以成為主流,甚至仍被用戶詬病呢?
真正的癥結(jié)在于目前的語音交互技術(shù)尚不能達到人類的預(yù)期。由于環(huán)境噪音、網(wǎng)絡(luò)不穩(wěn)定等先天因素,使得很多時候系統(tǒng)并不能很好地接收用戶的語音輸入。即使系統(tǒng)聽到了用戶的語音并成功將其轉(zhuǎn)化為準確的文本(語音識別),目前的算法也不能完全理解用戶的真實本意(即語義識別),更不用說后續(xù)的準確搜索執(zhí)行和結(jié)果呈現(xiàn)了。
目前市面上很多所謂的人工智能語音,大部分還是要求用戶按照預(yù)置命令模板進行交互,用戶需要付出較大的學(xué)習(xí)成本來適應(yīng)機器。比如在某些所謂的“智能”車載設(shè)備上,用戶必須說先說“導(dǎo)航”啟動導(dǎo)航界面,然后說“北京”、“某區(qū)某街道”, 機器才能一步步識別找到目的地。如果用戶直接說 “我要去某地”,機器是無法識別你的意圖的。甚至有時用戶已經(jīng)按照預(yù)制模板來進行交互了,卻仍然得不到想要的結(jié)果。太多時候,機器聽不清楚,也聽不懂用戶在說什么。這樣的人工偽智能,本身技術(shù)不成熟,營銷宣傳的時候又盲目夸大,導(dǎo)致了用戶對語音交互產(chǎn)品的進一步失望。
顯然,生硬的預(yù)制語音命令肯定無法滿足用戶的需求。真正的人工智能語音交互,應(yīng)該讓機器來學(xué)習(xí)和適應(yīng)人,而不是讓人去適應(yīng)機器。比如,機器應(yīng)該可以在識別當下地點和時間的基礎(chǔ)上,基于用戶歷史操作數(shù)據(jù),進行用戶喜好學(xué)習(xí),深入地理解用戶的語音輸入,給出最佳的答案。用戶無需多說,機器便可以準確判斷用戶意圖并高效地執(zhí)行。這樣的交互,才是“心有靈犀,說到做到”,才能算真正的智能語音交互。
短期來看,智能手表交互采取的方式將是傳統(tǒng)的觸控交互與初級的智能語音交互的結(jié)合。觸控操作仍將應(yīng)用于絕大多數(shù)場景,但在一些特定場合簡單的任務(wù)下,語音交互可以讓用戶更加快捷、方便、優(yōu)雅的實現(xiàn)操作目的。第一代智能手表的領(lǐng)軍產(chǎn)品,可以沒有復(fù)雜成熟的語音交互,但至少需要有初級的語音系統(tǒng),可以做到與觸控操作并存互補。而長期來看,智能語音交互必將逐步取代觸摸等傳統(tǒng)交互方式, 實現(xiàn)人與人對話式的自然語言交互。
其實,讓用戶使用語音與機器系統(tǒng)交互并不存在習(xí)慣問題,因為自然語言交互本身的學(xué)習(xí)成本幾乎為零。關(guān)鍵在于語音交互是否真正可為用戶帶來便利,因為人的“懶惰”天性永遠會趨向選擇最小投入,最大產(chǎn)出的操作路徑。這種例子其實已經(jīng)不在少數(shù):一旦你習(xí)慣了iPhone上的TouchID指紋解鎖、Macbook上的多點手勢操作,便會覺得“輸密碼”和“點鼠標”是種非?!胺慈诵浴钡慕换ィ灰坏┠懔?xí)慣了攝像頭“掃一掃” 二維碼,便不會再喜歡“ Ctrl C + Ctrl V”的粘貼復(fù)制網(wǎng)站地址;一旦你習(xí)慣了手機支付寶上簡單快捷的支付,就會開始厭煩用銀行卡或者現(xiàn)金進行繁瑣的交易... … 未來,一旦你習(xí)慣了一抬手問“明天會下雪嗎?”,還會愿意回到手機上從無數(shù)的App中打開天氣程序去查看天氣嗎?
能否盡快的實現(xiàn)真正的智能全語音交互,在根本上還是取決于技術(shù)的進步和產(chǎn)品的完善。用戶看似簡短的一個個語音指令輸入的背后涉及到了整合優(yōu)化語音識別、自然語言處理、機器學(xué)習(xí)、大數(shù)據(jù)、精準搜索等諸多技術(shù)難點,難度可想而知。令人鼓舞的是,過去的幾年內(nèi),人工智能語言技術(shù)已經(jīng)有了長足的發(fā)展?,F(xiàn)在的語音識別技術(shù)在大多數(shù)時候已經(jīng)能夠比較準確的識別用戶的語言文字。隨著技術(shù)和產(chǎn)品的高速成熟和發(fā)展,全智能語音時代的到來絕不會太久。智能語音技術(shù)“奇點爆發(fā)”之時,便是傳統(tǒng)觸摸操作和繁瑣的App交互的終結(jié)之日。
總之,智能手表作為語音交互的最合適應(yīng)用場景之一,從誕生的第一天起,就注定離不開智能語音技術(shù)。作為狂熱的極客和理性的用戶,我們允許一塊智能手表目前暫時沒有真正的“智能語音”,但我們絕不接受因噎廢食,退而求其次的妥協(xié)。因此,沒有語音交互,別跟我談智能手表。
本文主要作者是林宜立(linyili@mobvoi.com),出門問問產(chǎn)品經(jīng)理,對智能手表有興趣的同學(xué),可以加入他們的Android Wear 智能手表QQ群369838318
出門問問是一家專注于人工智能的科技創(chuàng)業(yè)公司,它集合了世界頂尖的語音識別、語義分析和數(shù)據(jù)分析背景的技術(shù)專家,利用自主研發(fā)的語音識別、語義分析及搜索技術(shù),打造領(lǐng)先的中文智能語音交互技術(shù),重新定義人機交互方式。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。