0
本文作者: 肖漫 | 2021-10-27 14:54 |
作者 | 肖漫
編輯 | 李帥飛
2007 年 1 月 9 日,當(dāng)初代 iPhone 橫空出世的時(shí)候,躊躇滿志的喬布斯在演講臺(tái)上非常明確地指出:無論是Mac、iPod 還是 iPhone,它們的革命性創(chuàng)新都體現(xiàn)在人機(jī)交互方式的進(jìn)化。
此后,以智能手機(jī)為載體,人機(jī)交互隨著技術(shù)的發(fā)展突破不斷進(jìn)化。
比如說,在移動(dòng)互聯(lián)網(wǎng)和人工智能的融合發(fā)展浪潮中,以蘋果 Siri、Google Assistant 為代表的智能語音助手成為一時(shí)之風(fēng)尚,它們在觸控之外,開啟了一種新的交互方式——也就是更加符合人類交流方式的語音對(duì)話。這種交互方式在誕生后數(shù)年,就快速覆蓋了整個(gè)行業(yè)。
然而,語音助手并不是終點(diǎn),人們依舊在人機(jī)交互層面尋求面向未來的進(jìn)一步突破。尤其是當(dāng)下,iPhone 已誕生將近 15 年,AI/AR/VR/數(shù)字媒體等技術(shù)得到飛速發(fā)展,元宇宙概念也勃然興起。值此技術(shù)飛速變革之際,一個(gè)值得深思的問題已經(jīng)擺在整個(gè)行業(yè)面前:
語音助手逐漸走向普及之后,人機(jī)交互方式又該朝向什么樣的方式進(jìn)化?
當(dāng)然,這是一個(gè)需要整個(gè)行業(yè)通過實(shí)踐來給出答案的問題——而在諸多答題者中,讓雷鋒網(wǎng)眼前一亮的,是憑借自身 AI 實(shí)力來踐行自身對(duì)未來人機(jī)交互大方向思考的 OPPO。
截至今年 8 月,ColorOS 全球月活躍用戶達(dá)到了 4.6 億,龐大的用戶服務(wù)需要強(qiáng)大的技術(shù)能力,尤其是 AI 能力的支持。那么,OPPO 支撐全球超過 4.6 億用戶的 AI 服務(wù)是如何構(gòu)建的呢?
對(duì)于人機(jī)交互的未來,真正能夠代表 OPPO 自身思考和選擇的,是它旗下小布助手在近日 OPPO 開發(fā)者大會(huì)上的一次重要進(jìn)化。
簡單來說,就是將 OPPO 小布助手從以往基于語音交互的智能輔助工具形態(tài),進(jìn)化為基于虛擬人多模態(tài)交互的智能助手形態(tài),從而將人與智能助手之間的交互演化為人與虛擬人之間的交互。
這不難讓人理解——畢竟,基于多模態(tài)交互的 “虛擬人”,已經(jīng)成為當(dāng)前人機(jī)交互探索發(fā)展的新方向,也成為整個(gè)行業(yè)參與者的共同選擇。
比如說,在今年 6 月,中國首個(gè)原創(chuàng)虛擬學(xué)生 “華智冰” 的身份以本科生的身份進(jìn)入到清華大學(xué);而設(shè)計(jì)虛擬學(xué)生 “華智冰” 的初衷,是希望她最終能像人一樣思考,像人一樣不斷學(xué)習(xí),理解人的想法,主動(dòng)產(chǎn)生符合用戶需求的互動(dòng),直觀、全面地捕捉人類的需求——當(dāng)然,“華智冰” 誕生的背后,體現(xiàn)的正是多模態(tài)交互的成果。
除了入學(xué),“虛擬人” 也已經(jīng)在互聯(lián)網(wǎng)上 C 位站臺(tái)。
比如說在 9 月份,小紅書同時(shí)入駐了 20+ 虛擬偶像,她們化身潮流情報(bào)官,首發(fā)試穿諸多潮流品牌的新品,演繹不一樣的潮流魅力……前不久,虛擬人 AYAYI 也成為了天貓超級(jí)品牌數(shù)字主理人,并且開了個(gè)天貓雙 11 元宇宙藝術(shù)展,有趣的是,華為在今年 HDC 開發(fā)者大會(huì)上首次采用數(shù)字人全程實(shí)時(shí)手語直播。
當(dāng)然,放眼整個(gè)社會(huì)生活空間,“虛擬人” 的角色更是無縫融入其中。
比如說,新華社和騰訊聯(lián)合打造了專門面向航天主題和場景研發(fā)的數(shù)字航天員、數(shù)字記者“小諍”;日本原宿風(fēng)少女?dāng)?shù)字人 imma,在 9 月初還登上了東京殘奧會(huì)的閉幕式;浦發(fā)銀行和百度共同發(fā)布了數(shù)字員工“小浦”;湖南衛(wèi)視宣布推出了首個(gè)數(shù)字主持人小漾,而江蘇衛(wèi)視則直接開播了一檔宣傳虛擬偶像的節(jié)目《2060》……
可以看到,伴隨著當(dāng)前人工智能、虛擬現(xiàn)實(shí)等數(shù)字媒體技術(shù)的不斷發(fā)展,基于多模態(tài)交互的虛擬人已經(jīng)從互聯(lián)網(wǎng)和數(shù)字世界走向人類的實(shí)際社會(huì)場景,并且這已經(jīng)成為大趨勢——甚至有觀點(diǎn)認(rèn)為,虛擬人將會(huì)成為未來人機(jī)交互的基礎(chǔ)模態(tài)。
正是在這樣一個(gè)大背景下,OPPO 也在洞察到人機(jī)交互發(fā)展大勢的基礎(chǔ)上,不失時(shí)機(jī)地實(shí)現(xiàn)了小布助手從語音助手到“虛擬人”的新一輪進(jìn)化。
小布助手是國內(nèi)首個(gè)月活用戶數(shù)破億的手機(jī)語音助手,當(dāng)前月活已經(jīng)達(dá)到 1.3 億,是 OPPO AI應(yīng)用的集中體現(xiàn)。作為最早以智能手機(jī)為載體的人工智能助手,小布以語音交互為主體,覆蓋了 OPPO 系多個(gè)手機(jī)品牌,在后來發(fā)展過程中,它又被逐漸應(yīng)用于智能手機(jī)、電視等多個(gè)品類智能終端設(shè)備。
自 2018 年誕生以來,小布助手經(jīng)歷了多次升級(jí),不斷在功能和體驗(yàn)上推陳出新。 本次 OPPO 開發(fā)者大會(huì)上,OPPO 方面宣布,小布助手已經(jīng)正式從純粹的語音助手升級(jí)為多模態(tài)的智能助手,包含語音、建議、指令、識(shí)屏和掃一掃五大能力模塊。
多模態(tài)的需求,是智能時(shí)代智能助手的關(guān)鍵特征,智能助手需要兼容不同的軟硬件智能場景,引入更多的AI能力,并且將它們緊密地與原有的 AI 能力結(jié)合在一起,形成綜合的AI能力。
今年 9 月上線的“小布虛擬人”, 也是智能助手多模態(tài)交互形態(tài)的重要呈現(xiàn)。
作為業(yè)界首個(gè)基于虛擬人多模態(tài)交互的手機(jī)智能助手,小布虛擬人打破了交互次元方式,將人與智能助手之間的交互,演化為人與虛擬人之間的交互。
據(jù)悉,在破次元人機(jī)交互的探索中,“小布虛擬人”可以實(shí)現(xiàn)與用戶在多個(gè)場景生態(tài)下的內(nèi)容服務(wù)、實(shí)時(shí)交互以及情感化交互,其首期上線的擬人化播報(bào)新聞和天氣等功能便是直接體現(xiàn);目前這一功能已覆蓋 OPPO Reno5/6、Find X3 系列機(jī)型。
同時(shí),小布虛擬人融合了語音、語義和視覺多模態(tài)交互技術(shù),能夠提供自然流暢的虛擬數(shù)字技術(shù)交互體驗(yàn)。在多模態(tài)情感識(shí)別算法的加持下,小布虛擬人可以敏銳捕捉用戶情緒特征,打造與用戶之間的多維情感暢聯(lián)。
令人關(guān)注的是,OPPO 以小布助手為入口,開放了小布生態(tài)。
每一位開發(fā)者都能夠定制專屬的小布虛擬人。它們可以擁有不同的聲音、形象、性格、技能以及服務(wù),化身為不同的角色,例如智能客服、虛擬助手、帶貨主播等,并搭載在多個(gè)智能終端設(shè)備上。
OPPO 此番動(dòng)作,不僅是賦能開發(fā)者在人機(jī)交互層面實(shí)現(xiàn) "虛擬人" 的進(jìn)化,從而進(jìn)一步融入到整個(gè)行業(yè)的 "虛擬人" 發(fā)展大勢中。究其本質(zhì),是為了面向用戶提供更加智能化、個(gè)性化和自然真實(shí)的交互體驗(yàn)。
如果說小布的進(jìn)化是一次變身,那么 AI 技術(shù)可以說是這一變身背后的核心 "魔法彈藥"。
實(shí)際上,“萬丈高樓平地起”,無論是小布助手的蛻變升級(jí),還是 OPPO 為開發(fā)者構(gòu)建的開放平臺(tái)生態(tài),都是以 OPPO 全棧式 AI 技術(shù)生態(tài)能力為底座——畢竟,而唯有底座穩(wěn)健,高樓才能拔地而起。
從 OPPO 在 AI 上的投注來看,其在 AI 上的布局是具備規(guī)劃、結(jié)合點(diǎn)面的長線思維。其中,AI 框架是 OPPO 整體 AI 能力的重點(diǎn),也是其 AI 實(shí)力的一大體現(xiàn)。
為了構(gòu)建這一 AI 框架,OPPO 花了相當(dāng)大的精力成本打造出 OPPO 全棧式 AI 技術(shù)生態(tài),據(jù)了解,這一 AI 技術(shù)生態(tài)由 6 個(gè)部分組成,主要包括:
計(jì)算、網(wǎng)絡(luò)、中間件和數(shù)據(jù)庫的混合云基礎(chǔ)設(shè)施層;
面向海量跨系統(tǒng)數(shù)據(jù)進(jìn)行存儲(chǔ)與處理的云原生數(shù)據(jù)湖層;
端側(cè)推理、模型壓縮、大規(guī)模訓(xùn)練、AutoML 的端云一體機(jī)器學(xué)習(xí)系統(tǒng);
語音、NLP、知識(shí)圖譜、CV、推薦搜索等基礎(chǔ)能力的 AI 能力層;
跨終端、多場景落地的業(yè)務(wù)應(yīng)用層;
為企業(yè)提供安全可信的 AI 安全能力層;
眾所周知,機(jī)器學(xué)習(xí)需要大量的數(shù)據(jù)計(jì)算和驗(yàn)證。OPPO當(dāng)前已經(jīng)進(jìn)入全球50多個(gè)國家, ColorOS 月活躍用戶達(dá)到了4.6億,龐大的用戶基數(shù)也為其全棧式 AI 技術(shù)生態(tài)累積了海量數(shù)據(jù)和計(jì)算資源。
以季度為單位,視頻云調(diào)用超過 4.2 億次,新增照片超過 300 億;大數(shù)據(jù)每日新增超過 10PB,合云基礎(chǔ)設(shè)施覆蓋全球八大區(qū)域。
從機(jī)器學(xué)習(xí)系統(tǒng)來看,OPPO 全棧式 AI 技術(shù)生態(tài)提供了端側(cè)和云側(cè)兩大部分——其中,位于端側(cè)的端側(cè)算法引擎、加速框架和模型雅座提供低延時(shí)的高效相應(yīng);云側(cè)則是將上傳到云端的端側(cè)數(shù)據(jù)進(jìn)行大規(guī)模訓(xùn)練和推理,從而反過來優(yōu)化端側(cè)算法。
在海量數(shù)據(jù)和出色的算法、算力加持下,OPPO AI 不斷在業(yè)內(nèi)獲得認(rèn)可,其基于知識(shí)的大規(guī)模預(yù)訓(xùn)練,包括上下文理解、短文本相似度等語音語義的多項(xiàng)指標(biāo)多次登頂行業(yè)權(quán)威評(píng)測。
不僅如此,在世界頂級(jí)的計(jì)算機(jī)視覺會(huì)議 CVPR 上,OPPO 在 2020 年和 2021 年分別取得了極端超分辨率感知第一、手持設(shè)備視覺定位第一和多目標(biāo)行為分析少樣本分類第一的成績。
另外,從 AI 能力來看,OPPO AI 具備了語音、NLP、知識(shí)圖譜、CV、推薦搜索等基礎(chǔ)能力,其端到端生成式對(duì)話模型的人工評(píng)測滿意度已超過了 85%,屬于行業(yè)較高水平;而這一成果已應(yīng)用在小布生成式閑聊的業(yè)務(wù)場景中。
在具備強(qiáng)大的 AI 能力之外,安全性也是不可忽視的重要一環(huán)。雷鋒網(wǎng)了解到,OPPO AI 安全技術(shù)從應(yīng)用檢測、惡意防護(hù)到攻擊對(duì)抗等各個(gè)方面提供了全方位的安全保障。
官方數(shù)據(jù)顯示,在應(yīng)用檢測上,累計(jì)檢測 APP 超過 53 萬,發(fā)現(xiàn)惡意 APP 超過 1 萬款,瀏覽器每天攔截惡意下載逾300 萬條,并擁有超過 15 萬條隱私政策;在惡意防護(hù)上,為用戶過濾惡意行為超過 1140 億次,封禁惡意賬號(hào) 280 萬個(gè)。
不難看出,OPPO 全棧式 AI 技術(shù)生態(tài)是 OPPO AI 關(guān)鍵能力和技術(shù)優(yōu)勢的落地實(shí)踐,為 OPPO 海量的 AI 服務(wù)提供了夯實(shí)的架構(gòu)基礎(chǔ)、更高的資源利用效率以及安全可信的隱私保障。
當(dāng)然,僅僅有 AI 技術(shù)能力并不夠。OPPO 希望打造的 AI 生態(tài)在具備智慧之外,更重要的是有人性、有溫度。
因此,針對(duì)都市人群心理問題,OPPO 發(fā)布了 “AI 升溫計(jì)劃”,每天為超過200萬人提供暖心陪伴;同時(shí),針對(duì)手機(jī)適老化,OPPO 打造了小布助手關(guān)懷版,已經(jīng)改善了 700 萬老年用戶的手機(jī)使用體驗(yàn);針對(duì)傳統(tǒng)文化傳承,OPPO 還聯(lián)合音樂人阿朵共同推出了“我是民樂守藝人”活動(dòng),全網(wǎng)曝光量超過 28 億,以科技創(chuàng)新的形式帶動(dòng)民樂的傳承推廣。
當(dāng)然,在雷鋒網(wǎng)看來,OPPO 小布助手的進(jìn)化,在根本層面反映的是 OPPO 對(duì)于 AI 等基礎(chǔ)技術(shù)的大力投入和持續(xù)積累,對(duì)于行業(yè)新概念、新趨勢的積極擁抱和不斷探索——但更重要的是,基于對(duì)未來人機(jī)交互形態(tài)的不斷探尋,反映了 OPPO 對(duì)于每一個(gè)普通用戶的實(shí)際產(chǎn)品體驗(yàn)的極端重視。
從某種程度上來看,無論是語音助手,還是 “虛擬人”,真正優(yōu)秀的設(shè)備使用體驗(yàn),必然是建立在對(duì)用戶本身的深入理解和感知之上,并且要同時(shí)用技術(shù)的力量和人文的視角將這種理解和感知體現(xiàn)在具體好用的軟硬件產(chǎn)品之上,才能夠直抵用戶的真正需求。
這也是每一個(gè)真正面向消費(fèi)者的科技公司,都應(yīng)該如同喬布斯一樣站在科技和人文的交叉口的原因。
畢竟,科技以人為本。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。