0
“小度助手終于有了全雙工?!辈簧贅I(yè)內(nèi)人士會后感慨道。
在今年的百度AI開發(fā)者大會上,百度創(chuàng)始人、董事長兼CEO李彥宏開場首先秀了一波小度助手的新功能——全雙工免喚醒交互。從李彥宏與小度對話演示過程中可以看到,小度智能音箱在初次被喚醒后,可以在沒有任何模式切換情況下識別出李彥宏哪些話是在和觀眾交流,哪些話是在和小度交流。
交流過程中,不再需要喚醒詞,而且在交互過程中可以識別出哪句話是和它講,并準確作出應答。
開場這一趴,李彥宏親自為小度助手(DuerOS)打了一波硬廣,小度在這一趴的表現(xiàn)也確實爭氣,沒有掉鏈子。
全雙工對于一個AI語音助手或AI引擎意味著什么?這一點其實可以從其應用上來理解。
據(jù)雷鋒網(wǎng)了解,AI語音助手就其應用而言,目前有兩大出發(fā)點:
第一,交互。
AI語音助手之所以現(xiàn)在備受推崇,最主要一點就是其有可能成為未來的主流交互方式。百度副總裁、百度智能生活事業(yè)群組總經(jīng)理景鯤在隨后接受雷鋒網(wǎng)在內(nèi)的記者采訪中談到:“據(jù)貝恩公司此前的一份調(diào)研數(shù)據(jù)顯示,未來人機交互方式中,語音交互將會占到30%左右。”
在AI語音助手的交互應用中,一個很重要的能力就是多輪對話能力,這一能力訓練較為復雜,涉及到諸如文本分析、自然語言理解等AI能力,包括小米的小愛同學、阿里的天貓精靈,以及國外谷歌的Google Assistant、亞馬遜的Alexa,都在不斷加強其AI語音助手(多輪)對話能力的訓練和應用。
值得一提的是,此前主打EQ(情商)的微軟小冰,在語音方面一直以全雙工見長。而從此次在發(fā)布會上的小度助手表現(xiàn)出的全雙工能力來看,功能性而言,也已經(jīng)很完整。
雷鋒網(wǎng)就此前體驗和會場上觀察認為,相較而言,微軟小冰的全雙工能力更注重聊天能力,小度助手的全雙工能力更偏重功能性。
當然,就以往參加發(fā)布會經(jīng)驗來看,包括智能音箱在內(nèi)的智能硬件,用戶實際體驗感要略差于現(xiàn)場演示的能力的精彩度(這一點有點類似廣告與實物的差異)。
第二,功能性。
功能性一直是當下AI語音助手中表現(xiàn)不盡人意的地方,雷鋒網(wǎng)此前也多次表示,AI語音助手至今還未能出現(xiàn)像智能手機中的微信、電話通訊等強用戶粘性的應用。當然,小度助手此次在功能性上也有幾個值得關注的升級亮點,下文將會繼續(xù)剖析。
在剖析此次小度助手升級的能力之前,值得注意的是,百度對智能語音能力,以及智能生活事業(yè)群組(SLG)有明顯的政策傾斜。
包括此前的度秘事業(yè)部升級為智能生活事業(yè)群,為智能音箱持續(xù)硬件補貼,以及此次在百度AI開發(fā)者大會上,幾乎貫穿整場、包括李彥宏、王海峰(百度大腦)、沈抖(移動生態(tài))、景鯤(智能生活)、李震宇(自動駕駛)、尹世明(智能云)各位主講嘉賓的演講內(nèi)容中都可以看到小度的身影。
也是憑借這樣的助力,借著央視春晚、持續(xù)硬件補貼在內(nèi)的這波百度內(nèi)部政策傾斜,小度智能硬件也終于如愿起飛了,2019年Q1小度系列智能音箱出貨量拿下了中國第一、全球第三的成績。此外,景鯤在大會上也給出關于小度階段性的數(shù)據(jù):
搭載小度助手的智能設備激活量超過4億臺,激活量超過800%;
截止2019年6月,小度助手月交互次數(shù)超過36億;
小度的對話式語音技能開發(fā)者社區(qū),有超過3.3萬名的開發(fā)者,超過2400項優(yōu)秀技能。
除了這些數(shù)據(jù)以外,小度助手此次升級的5.0版本的功能性也有所提升。除了前文提到的「全雙工免喚醒」外,景鯤在大會上還特別強調(diào)了家庭信息流、家庭通訊與通知、DLNA投屏功能三大功能。
全雙工免喚醒。據(jù)景鯤會上介紹稱,這項能力使得小度助手可以一次喚醒、持續(xù)交互,并能辨別出「需要執(zhí)行的指令」和「沒有意義的對話」。據(jù)現(xiàn)場介紹內(nèi)容顯示,用戶可以通過“小度小度,打開極客模式”觸發(fā)全雙工免喚醒功能,目前這一功能主要使用場景為音樂和有聲內(nèi)容場景,每次執(zhí)行完用戶命令后,屏幕左下角會出現(xiàn)彩色小度,并維持長達30秒的免喚醒連續(xù)對話。
據(jù)現(xiàn)場演示,這一新功能確實能滿足日常交互需求。但這一新功能雷鋒網(wǎng)還未實際嘗試,實際應用場景中表現(xiàn)如何還有待看隨后的用戶反饋。
家庭信息流。這一功能背后有賴于百度APP的信息流及用戶在家庭場景與小度互動數(shù)據(jù),提供個性化推薦(包括個性化音頻、視頻、消息,甚至新技能)。
這顯然是一個更聚焦家庭場景應用的技能,據(jù)雷鋒網(wǎng)了解,這一功能其實百度此前已經(jīng)在小度在家1S上悄悄上線,并運行有一段時間。就其向筆者此前推薦的內(nèi)容來看,娛樂性內(nèi)容偏多。雷鋒網(wǎng)認為,這一能力其實在新技能的推廣應用上有更多裨益。
家庭通訊與通知。小度電話通訊能力其實此前已經(jīng)具備,此次更新的則是「小度電話大全」。這一能力其實是小度助手和百度地圖的內(nèi)部“聯(lián)動”,小度電話大全集成了百度地圖所有的PUI(Public User Identity,公有用戶標識),可以讓用戶在小度設備上發(fā)現(xiàn)附近的商家、銀行、醫(yī)院等地理數(shù)據(jù)。
據(jù)大會現(xiàn)場演示來看,用戶還可以在通話過程中將自己的地理位置語音控制發(fā)送給對方。
DLNA投屏。“無需任何配件,小度智能音箱大金剛就可以秒變電視?!边@一功能其實是從筆記本、手機延伸到智能音箱中的功能,據(jù)景鯤透露,這一功能是由愛奇藝與小度兩個團隊共同經(jīng)過6-12個月研發(fā)出的新功能。
智能音箱投屏功能的難點在于系統(tǒng)的兼容性,是因為現(xiàn)在主流的智能音箱系統(tǒng)采用的是Linux系統(tǒng),但是現(xiàn)在主流的視頻網(wǎng)站都是兼容Android和iOS。
據(jù)雷鋒網(wǎng)了解,這一功能其實在實際應用中類似百度此前做的另外一項工作,通過為智能音箱配備對接傳統(tǒng)電視的紅外碼庫,進而通過智能音箱控制電視。在應用上的不同之處在于,前者針對的是智能電視的投屏功能,強調(diào)的是內(nèi)容共享;后者針對傳統(tǒng)電視的升級應用,同時更強調(diào)的是控制。
以上四項能力正是小度助手5.0版本升級帶來的能力迭代。仔細斟酌可以發(fā)現(xiàn),此次升級的能力,除了備受關注的「全雙工免喚醒」是實質性的強能力升級外,其他三項能力均可以看作是小度助手在家居場景中的能力拓展。由此可見,目前的小度助手主要仍是針對家居場景布局和能力迭代,家居場景仍是智能語音助手今后最為聚焦的應用場景之一。
值得注意的是,此次小度助手直接跳過了4.0版本,發(fā)布5.0版本。對此景鯤向雷鋒網(wǎng)表示,這主要有兩方面的原因:
一方面,根據(jù)內(nèi)部決策,小度助手版本迭代基本會是6個月的周期,小度助手4.0版本上線時,其實沒有較好的發(fā)布時機,因而成了內(nèi)部版本;
另一方面,智能投屏此類功能研發(fā)周期較長,4.0版本沒有完全更新上線,因而此次跨過4.0版本,直接發(fā)布了5.0版本。
雷鋒網(wǎng)注意到,不僅小度助手,包括百度大腦的百度整個AI體系均選擇跨過4.0,直接更新到5.0,也就有了此次百度AI開發(fā)者大會上的全面進入5.0的勢態(tài)。
小度助手的“主力”與“助攻”
小度助手的主力是“誰”?更多人認為是百度自家的智能硬件。
此次大會上,百度也再次更新了四款智能硬件:小度智能音箱大金剛、小度智能音箱PLAY、小度智能音箱PLAY青春版、小度在家1C 4G版。
智能音箱,新品而言,也是老生常談。在硬件性能上,環(huán)形麥、紅外遙控(紅外發(fā)射器)等基本已成標配;軟件性能上,則是隨著版本代系統(tǒng)一升級。四款產(chǎn)品不同之處則是在于各自目標人群或使用場景定位上。大金剛換了金屬包裝,PLAY下沉到年輕群體,1C 4G版增強通話能力,同時也是百度首款可移動的智能音箱。
對于小度助手而言,其真正主力應該是開發(fā)者生態(tài)。
經(jīng)過整個移動互聯(lián)網(wǎng)時代及智能手機的洗禮后,企業(yè)競爭,尤其是巨頭企業(yè)競爭,早已不再只是產(chǎn)品之間的競爭,而是生態(tài)之間的競爭。正如同最初手機的功能機和智能機的競爭,也早已轉變?yōu)榘沧可鷳B(tài)和iOS生態(tài)的競爭;對于當下巨頭企業(yè),包括一些有遠見或野心的中小企業(yè),身處AI時代,也越來越多地涉足開源、構建生態(tài)。
據(jù)景鯤在大會上透露數(shù)據(jù)顯示,小度的對話式語音技能開發(fā)者社區(qū)已經(jīng)有超過3.3萬名開發(fā)者,超過2400項優(yōu)秀技能。此外,景鯤也表示,小度在家智能音箱上,第三方技能已經(jīng)成為第一大應用,使用次數(shù)超過音樂和長視頻。
在小度在家上,第三方技能已經(jīng)成為第一大應用,其使用次數(shù)已經(jīng)超過了音樂和長視頻。這有點像智能手機時代,智能手機現(xiàn)在第一大應用已經(jīng)不再是打電話,我們在手機APP上找信息、購物、看視頻,這種第三方生態(tài)已經(jīng)成為智能手機的第一大應用。
據(jù)百度官方在大會上公布的數(shù)據(jù)顯示,目前小度助手已經(jīng)接入智能家居廠商329家,同時技能開放平臺5.0版本底層架構升級后,也增加或升級了諸如ER機制、內(nèi)容直達、商品庫、自動上線、穩(wěn)定性監(jiān)控等能力。在百度智能生活分論壇上,百度也邀請來生態(tài)合作廠商站臺,包括教育領域的好未來、直播領域的虎牙、閱讀社區(qū)的橙光、音頻領域的蜻蜓等。
盡管如此,據(jù)雷鋒網(wǎng)對行業(yè)的觀察,用戶對智能設備的需求太過發(fā)散,甚至沒有太明確的需求,也正是由于需求不明確,創(chuàng)新上又沒有哪一款應用能完美命中較為廣泛的消費群體,目前的生態(tài)增長仍難以為包括智能音箱在內(nèi)的以智能語音為主的硬件帶來太多的剛性應用。
對此,景鯤在接受雷鋒網(wǎng)在內(nèi)的幾家媒體采訪時談了自己的理解。
今天用戶在智能設備上的需求在發(fā)散,這是我們看到的一個很好的現(xiàn)象。有點像最開始的搜索引擎,大家用搜索引擎是用它找網(wǎng)址,后來我們發(fā)現(xiàn)這個功能很好,可以輸入更多信息,用以查天氣、股票、樓市、醫(yī)院在內(nèi)的更多信息。所以需求一旦發(fā)散,技術的用武之地就來了,這就體現(xiàn)了技術的深厚。另外,整個價值對于用戶的幫助也更大。所以我覺得,有屏幕的智能音箱已經(jīng)進入到了一個新階段。
除去硬件、生態(tài),其實整場發(fā)布會也帶來諸多與智能語音相關產(chǎn)品及應用,包括百度發(fā)布了面向遠場語音交互的鴻鵠芯片,升級了百度APP,并在小度車載上與吉利合作,這些也都成為小度助手繼續(xù)衍進的助力。
智能音箱這一硬件,甚至智能語音生態(tài)如何實現(xiàn)盈利?這是當下面臨的一個挑戰(zhàn),尤其在硬件補貼打到你死我活的中國,更是一個棘手的問題。
在今年百度AI開發(fā)者大會上,景鯤也首次對外提出進行商業(yè)化嘗試。百度首先看上的,是當下已經(jīng)相對成熟會員付費模式。具體而言,包含以下三方面:
小度VIP會員。跨界內(nèi)容、電商整合小度會員,包括將當下最熱的音樂付費(VIP曲庫)、音頻付費(聯(lián)合蜻蜓FM),以及諸如電商應用的優(yōu)惠券發(fā)放等匯集到小度VIP會員中,并聯(lián)和愛奇藝推出聯(lián)合會員制。
可以看到,小度會員現(xiàn)在更多是在對小度用戶培養(yǎng)付費服務習慣,包括與愛奇藝的聯(lián)合會員,最終售價也是以愛奇藝的會員價格進行售賣。
付費技能。小度助手上的付費技能生態(tài)目前已經(jīng)有包括美團外賣、口袋故事在內(nèi)超過了3萬個付費單品。
付費技能一方面是在為開發(fā)者生態(tài)持續(xù)供血;另一方面也是對標較為成熟的安卓、iOS生態(tài)中的應用商城,提供開源生態(tài)模式的閉環(huán)鏈路。
品牌技能。這是在智能硬件中有別于前兩種向用戶直接收費的技能,這一技能是面向品牌廠商提供定制化內(nèi)容營銷服務,類似此前電視上的廣告創(chuàng)意,只是在投放上更“AI”。
可以看出,小度此次嘗試的商業(yè)模式,無論是會員,還是品牌技能,都是相對當下已經(jīng)成熟的商業(yè)模式在智能音箱上的應用。一方面,以此種商業(yè)模式覆蓋更多生態(tài)合作伙伴;另一方面,也在培養(yǎng)用戶使用付費服務的習慣。
智能語音已經(jīng)是一個老生常談的話題,卻也是人工智能引擎三大(文本、語音、視覺)應用場景中最受關注的應用場景。尤其在國內(nèi),各類智能硬件已經(jīng)將語音助手作為標配,但語音助手由于在能力上,包括功能性、交互性上都低于用戶預期,因而,雖然智能音箱市場銷量穩(wěn)步上升,但在技術性、AI性、商業(yè)能力上仍差強人意。
國內(nèi)整個大環(huán)境仍處于一個“賣座不賣好”的困局——智能音箱銷量持續(xù)攀升,多數(shù)應用能力尚偏雞肋,用戶并不滿意。智能音箱廠商也賺不到什么錢,頭部效應也開始顯現(xiàn)。
盡管如此,小度助手跨過4.0,進入5.0時代,從整體生態(tài)布局上來看,已然初局規(guī)模。
與此同時,百度也開始聯(lián)合更多廠商布局生態(tài),并開始思考小度的商業(yè)模式。目前來看,這樣的新生態(tài)也被諸如教育、社區(qū)、音頻類內(nèi)容型產(chǎn)業(yè)看好,并形成合作互動。
蜻蜓FM創(chuàng)始人兼董事長張強在接受雷鋒網(wǎng)采訪時也表示,包括智能音箱在內(nèi)的豐富的智能終端將會是音頻市場接下來的推動力。
現(xiàn)在這個時代,手機幾乎成了唯一的內(nèi)容終端和渠道,在手機終端上,用戶所有的交互行為都是基于屏幕的視覺交互,在這樣的交互行為下,音頻作為一個內(nèi)容形態(tài)而言,它扮演的其實是配角角色,主角是視頻和文字。
下一個時代,伴隨著5G、IoT時代的來臨,會有更豐富的智能終端,同時,并不是每個智能終端都是像屏幕一樣與用戶交互,諸如智能音箱這類突出語音交互體驗的智能硬件一定會帶來音頻內(nèi)容大量消費,語音交互時代的這些終端上音頻應該是主角,也是我們最大的機會。
在這樣“未來式”生態(tài)體系下,諸如Alexa、Google Assistant、DuerOS,以及小愛同學在內(nèi)的AI引擎將會發(fā)揮出更大的能力和價值,成為各類產(chǎn)業(yè)和連通者和賦能者。
而在這樣的未來憧憬中,百度的這一“助手”,又將會成為誰的AI?
相關文章:
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉載。詳情見轉載須知。