0
本文作者: 王金許 | 2017-06-24 13:28 |
雷鋒網(wǎng)按:最近關(guān)于智能音箱的爭(zhēng)論沸沸揚(yáng)揚(yáng),在雷鋒網(wǎng)此前的智能音箱系列報(bào)道中,國(guó)內(nèi)多數(shù)業(yè)內(nèi)人士也并不看好它的發(fā)展。盡管如此,我們也應(yīng)該看到支持者發(fā)出的聲音。本篇為外媒 VentureBeat 上的文章,雷鋒網(wǎng)進(jìn)行了編譯整理。
隨著蘋果 HomePod 在 2017 年 WWDC 大會(huì)上發(fā)布后,戰(zhàn)斗已然打響——我們都在觀望看誰(shuí)能將贏得聲控智能音箱市場(chǎng)的領(lǐng)導(dǎo)者。
雖然早期采用者將這些設(shè)備應(yīng)用到了他們的生活中,而晚期采用者由于對(duì)安全性的顧慮拖了后腿,但我們?nèi)匀挥X(jué)得,這種聲控技術(shù)的趨勢(shì)沒(méi)有出現(xiàn)任何放緩跡象。盡管已經(jīng)存在了幾十年,但近年來(lái),這種技術(shù)使用在了汽車、手機(jī)、冰箱,甚至是燈具上。也許這些智能音箱和它們的虛擬助手是家庭控制的一個(gè)跡象,它表明我們正處于另一次技術(shù)革新的轉(zhuǎn)折點(diǎn)上。
畢竟,聲控技術(shù)競(jìng)賽是一個(gè)微妙而振奮的信息,它提醒和預(yù)示著屏幕時(shí)代正在遠(yuǎn)去。
為什么屏幕不能與人聲競(jìng)爭(zhēng)?
據(jù)美國(guó)語(yǔ)言學(xué)會(huì)介紹,當(dāng)我們用言語(yǔ)來(lái)傳達(dá)和收集信息的時(shí)候,利用的是人性更深層次、更原始的那部分。雖然文字出現(xiàn)了大約 6000 年,但口語(yǔ)存在的時(shí)間更為長(zhǎng)久。孩子在兩歲的時(shí)候開(kāi)始說(shuō)話,但學(xué)會(huì)寫字(尤其是清晰地書寫)則需要更長(zhǎng)時(shí)間。實(shí)際上,口語(yǔ)是人與人交流的最原始的“用戶界面”。
那么一般來(lái)說(shuō),當(dāng)我們想快速檢查天氣、運(yùn)動(dòng)成績(jī)或航班起飛的時(shí)間時(shí),我們應(yīng)該大聲詢問(wèn),而不是通過(guò)加載一個(gè)網(wǎng)頁(yè)輸入搜索,然后篩選結(jié)果來(lái)閱讀信息。
誠(chéng)然,有一些搜索詞我們并不希望大聲宣布結(jié)果(例如,“找到附近的賣訂婚戒指珠寶店”),并且希望其他結(jié)果將是可視化的(例如,“顯示我的訂婚戒指設(shè)計(jì)”)。
但是對(duì)于許多需要廣泛信息的日常任務(wù),聲控技術(shù)提供了一種快速組織信息的快捷方式,來(lái)獲取人們需要在生活中繼續(xù)使用的數(shù)據(jù)。
誰(shuí)將在智能音箱的本土市場(chǎng)中占據(jù)制高點(diǎn)?
這些設(shè)備正在為人類和技術(shù)之間的自然交互發(fā)揮作用,這意味著那些最接近真實(shí)人類交流的設(shè)備提供者將會(huì)獲勝,它具有準(zhǔn)確的結(jié)果和完善的功能。
具體來(lái)說(shuō),在于這種音箱能否分辨一個(gè)孩子和一個(gè)成年人聲音之間的差異,并相應(yīng)地調(diào)整其結(jié)果;能否將準(zhǔn)確表達(dá)意圖的書面信息(言語(yǔ)到文本)發(fā)送給其他人,并填寫正確的標(biāo)點(diǎn)符號(hào);以及用戶對(duì)這臺(tái)機(jī)器進(jìn)行互動(dòng)的欲望有多強(qiáng)烈。
亞馬遜已經(jīng)給 Alexa(Echo 智能音箱的聲音)設(shè)置了一些幽默的話語(yǔ)反饋,這種方式可以使得設(shè)備展示出“個(gè)性”并表達(dá)某類人的微妙之處。 Google 聘請(qǐng)了前 Pixel 故事板藝術(shù)家,用他的的思維來(lái)幫助 Google Assistant 創(chuàng)建其個(gè)性。同時(shí),蘋果公司已經(jīng)宣布,Siri 也在進(jìn)行一些聲音的改進(jìn) 。它甚至在 Siri 給出的反饋中添加了語(yǔ)境,這得益于機(jī)器人從手機(jī)上收集了日歷、位置和當(dāng)前活動(dòng)的數(shù)據(jù)。
這些設(shè)備不僅嘗試清除屏幕界面,而且這些公司希望讓人們會(huì)感到這種技術(shù)已經(jīng)不復(fù)存在,取而代之的是使用 AI 的真實(shí)人性化體驗(yàn)。
聲控設(shè)備未來(lái)的挑戰(zhàn)
有人認(rèn)為,沒(méi)有強(qiáng)大算法和技術(shù)增強(qiáng)能力來(lái)幫助指導(dǎo)設(shè)備做出響應(yīng)的語(yǔ)調(diào)。雖然這種的想法是愚蠢的,但需要謹(jǐn)記的是,一些設(shè)備正在使用的合成聲音所能實(shí)現(xiàn)的效果仍然存在局限性(Apple 的 Siri 目前由 Susan Bennett 配音)。
隨著聲控技術(shù)不斷發(fā)展,越來(lái)越多的公司都將使用這種新型互動(dòng)方式,品牌很可能會(huì)找出搜索時(shí)聽(tīng)起來(lái)像它們自己的聲音——不僅僅是聲音質(zhì)量,更在于風(fēng)格。
當(dāng)品牌創(chuàng)造性地設(shè)計(jì)如何將聲音自然地整合到產(chǎn)品和網(wǎng)站上時(shí),它們將掃清一切障礙。諸如 UX / UI 設(shè)計(jì)以及其操作的腳本等元素將隨著屏幕消失而變得更為重要,人類的聲音會(huì)再次回到中心舞臺(tái)。
via VentureBeat
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。