聲控技術(shù)競(jìng)賽的戰(zhàn)斗已然打響，聊天機(jī)器人如何將我們從屏幕上解放出來(lái)？

本文作者：王金許

2017-06-24 13:28

導(dǎo)語(yǔ)：畢竟，聲控技術(shù)競(jìng)賽是一個(gè)微妙而振奮的消息，它警告和預(yù)示著屏幕時(shí)代正在遠(yuǎn)去。

雷鋒網(wǎng)按：最近關(guān)于智能音箱的爭(zhēng)論沸沸揚(yáng)揚(yáng)，在雷鋒網(wǎng)此前的智能音箱系列報(bào)道中，國(guó)內(nèi)多數(shù)業(yè)內(nèi)人士也并不看好它的發(fā)展。盡管如此，我們也應(yīng)該看到支持者發(fā)出的聲音。本篇為外媒 VentureBeat 上的文章，雷鋒網(wǎng)進(jìn)行了編譯整理。

隨著蘋果 HomePod 在 2017 年 WWDC 大會(huì)上發(fā)布后，戰(zhàn)斗已然打響——我們都在觀望看誰(shuí)能將贏得聲控智能音箱市場(chǎng)的領(lǐng)導(dǎo)者。

雖然早期采用者將這些設(shè)備應(yīng)用到了他們的生活中，而晚期采用者由于對(duì)安全性的顧慮拖了后腿，但我們?nèi)匀挥X(jué)得，這種聲控技術(shù)的趨勢(shì)沒(méi)有出現(xiàn)任何放緩跡象。盡管已經(jīng)存在了幾十年，但近年來(lái)，這種技術(shù)使用在了汽車、手機(jī)、冰箱，甚至是燈具上。也許這些智能音箱和它們的虛擬助手是家庭控制的一個(gè)跡象，它表明我們正處于另一次技術(shù)革新的轉(zhuǎn)折點(diǎn)上。

畢竟，聲控技術(shù)競(jìng)賽是一個(gè)微妙而振奮的信息，它提醒和預(yù)示著屏幕時(shí)代正在遠(yuǎn)去。

為什么屏幕不能與人聲競(jìng)爭(zhēng)？

據(jù)美國(guó)語(yǔ)言學(xué)會(huì)介紹，當(dāng)我們用言語(yǔ)來(lái)傳達(dá)和收集信息的時(shí)候，利用的是人性更深層次、更原始的那部分。雖然文字出現(xiàn)了大約 6000 年，但口語(yǔ)存在的時(shí)間更為長(zhǎng)久。孩子在兩歲的時(shí)候開(kāi)始說(shuō)話，但學(xué)會(huì)寫字（尤其是清晰地書寫）則需要更長(zhǎng)時(shí)間。實(shí)際上，口語(yǔ)是人與人交流的最原始的“用戶界面”。

那么一般來(lái)說(shuō)，當(dāng)我們想快速檢查天氣、運(yùn)動(dòng)成績(jī)或航班起飛的時(shí)間時(shí)，我們應(yīng)該大聲詢問(wèn)，而不是通過(guò)加載一個(gè)網(wǎng)頁(yè)輸入搜索，然后篩選結(jié)果來(lái)閱讀信息。

誠(chéng)然，有一些搜索詞我們并不希望大聲宣布結(jié)果（例如，“找到附近的賣訂婚戒指珠寶店”），并且希望其他結(jié)果將是可視化的（例如，“顯示我的訂婚戒指設(shè)計(jì)”）。

但是對(duì)于許多需要廣泛信息的日常任務(wù)，聲控技術(shù)提供了一種快速組織信息的快捷方式，來(lái)獲取人們需要在生活中繼續(xù)使用的數(shù)據(jù)。

誰(shuí)將在智能音箱的本土市場(chǎng)中占據(jù)制高點(diǎn)？

這些設(shè)備正在為人類和技術(shù)之間的自然交互發(fā)揮作用，這意味著那些最接近真實(shí)人類交流的設(shè)備提供者將會(huì)獲勝，它具有準(zhǔn)確的結(jié)果和完善的功能。

具體來(lái)說(shuō)，在于這種音箱能否分辨一個(gè)孩子和一個(gè)成年人聲音之間的差異，并相應(yīng)地調(diào)整其結(jié)果；能否將準(zhǔn)確表達(dá)意圖的書面信息（言語(yǔ)到文本）發(fā)送給其他人，并填寫正確的標(biāo)點(diǎn)符號(hào)；以及用戶對(duì)這臺(tái)機(jī)器進(jìn)行互動(dòng)的欲望有多強(qiáng)烈。

亞馬遜已經(jīng)給 Alexa（Echo 智能音箱的聲音）設(shè)置了一些幽默的話語(yǔ)反饋，這種方式可以使得設(shè)備展示出“個(gè)性”并表達(dá)某類人的微妙之處。 Google 聘請(qǐng)了前 Pixel 故事板藝術(shù)家，用他的的思維來(lái)幫助 Google Assistant 創(chuàng)建其個(gè)性。同時(shí)，蘋果公司已經(jīng)宣布，Siri 也在進(jìn)行一些聲音的改進(jìn) 。它甚至在 Siri 給出的反饋中添加了語(yǔ)境，這得益于機(jī)器人從手機(jī)上收集了日歷、位置和當(dāng)前活動(dòng)的數(shù)據(jù)。

這些設(shè)備不僅嘗試清除屏幕界面，而且這些公司希望讓人們會(huì)感到這種技術(shù)已經(jīng)不復(fù)存在，取而代之的是使用 AI 的真實(shí)人性化體驗(yàn)。

聲控設(shè)備未來(lái)的挑戰(zhàn)

有人認(rèn)為，沒(méi)有強(qiáng)大算法和技術(shù)增強(qiáng)能力來(lái)幫助指導(dǎo)設(shè)備做出響應(yīng)的語(yǔ)調(diào)。雖然這種的想法是愚蠢的，但需要謹(jǐn)記的是，一些設(shè)備正在使用的合成聲音所能實(shí)現(xiàn)的效果仍然存在局限性（Apple 的 Siri 目前由 Susan Bennett 配音）。

隨著聲控技術(shù)不斷發(fā)展，越來(lái)越多的公司都將使用這種新型互動(dòng)方式，品牌很可能會(huì)找出搜索時(shí)聽(tīng)起來(lái)像它們自己的聲音——不僅僅是聲音質(zhì)量，更在于風(fēng)格。

當(dāng)品牌創(chuàng)造性地設(shè)計(jì)如何將聲音自然地整合到產(chǎn)品和網(wǎng)站上時(shí)，它們將掃清一切障礙。諸如 UX / UI 設(shè)計(jì)以及其操作的腳本等元素將隨著屏幕消失而變得更為重要，人類的聲音會(huì)再次回到中心舞臺(tái)。

via VentureBeat

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

0人收藏

相關(guān)文章

王金許

編輯

關(guān)注人工智能的放牛娃

掃描關(guān)注作者微信

發(fā)私信

當(dāng)月熱門文章

聲控技術(shù)競(jìng)賽的戰(zhàn)斗已然打響，聊天機(jī)器人如何將我們從屏幕上解放出來(lái)？

聲控技術(shù)競(jìng)賽的戰(zhàn)斗已然打響，聊天機(jī)器人如何將我們從屏幕上解放出來(lái)？