0
"現(xiàn)在的虛擬人賽道上,有三種主要的'流派'。而我認(rèn)為,只有小冰的模式才能走得通。"小冰的CEO,李笛如是說(shuō)。
如果你關(guān)注虛擬人賽道,但你不知道小冰公司,那你的功課一定沒(méi)有做足。小冰誕生于微軟,曾是微軟的人工智能團(tuán)隊(duì),隸屬于微軟(亞洲)互聯(lián)網(wǎng)工程院。2020年7月,小冰從微軟分拆為獨(dú)立公司運(yùn)營(yíng),在人工智能方向持續(xù)深耕。
在虛擬偶像A-Soul、七海、柳夜熙大行其道的今天,小冰也在做虛擬人。但小冰的虛擬人卻不是"偶像",他們有些是主持人、是藝術(shù)家、是研究生。從某種程度上,是虛擬人市場(chǎng)上的"一股清流"。
小冰的CEO李笛,則是在2013年便加入微軟,從零開(kāi)始構(gòu)建AI being小冰框架,是虛擬人技術(shù)的前沿人物,對(duì)技術(shù)和賽道都有深刻理解。
何故"口出狂言"?李笛自然有他的道理。然而要把這事講清楚,就得先講講虛擬人的這"三種流派"。
"今天所謂的虛擬人賽道,是三撥人在往中間湊。而最后站在了這同一個(gè)路口上。"李笛對(duì)雷峰網(wǎng)表示道。
這三撥人,其一是以IP運(yùn)營(yíng)主導(dǎo)的"虛擬偶像派",其二是以藝術(shù)家主導(dǎo)的"CG內(nèi)容派",其三則是以AI技術(shù)主導(dǎo)的"AI being派"。
先說(shuō)"虛擬偶像派",在近年可以說(shuō)是炙手可熱。這種模式主要通過(guò)捕捉演員(又稱(chēng)"中之人")的聲音和動(dòng)作,進(jìn)而驅(qū)動(dòng)虛擬人。
"虛擬偶像派"大多重IP運(yùn)營(yíng),如在現(xiàn)實(shí)世界"造星"一般,培養(yǎng)虛擬偶像在觀眾中的形象。而為了降低渲染成本,虛擬偶像大多以"二次元"的畫(huà)風(fēng)出現(xiàn),緊緊地圈住了二次元粉絲的心和消費(fèi)。
據(jù)統(tǒng)計(jì),國(guó)內(nèi)人氣虛擬偶像嘉然(ID:嘉然今天吃什么)于去年直播營(yíng)收670萬(wàn)元,在國(guó)內(nèi)虛擬偶像界居首。而嘉然隸屬的虛擬偶像團(tuán)體,隸屬于字節(jié)跳動(dòng)旗下的"A-Soul",五位成員加在一起,去年全年直播營(yíng)收達(dá)到約2500萬(wàn)元。
再說(shuō)"CG內(nèi)容派",這個(gè)流派可以說(shuō)是行業(yè)的"老前輩"。發(fā)端于好萊塢電影的特效公司,這種制作方式通過(guò)動(dòng)作和面部捕捉,來(lái)獲取大致的動(dòng)態(tài)和形象;或采用真人錄制,再用CG換頭。而后再傾耗大量的人力物力,以藝術(shù)家為主導(dǎo),對(duì)形象(主要是面部)以CG技術(shù),逐幀進(jìn)行渲染和微調(diào)。
"CG內(nèi)容派"主要以?xún)?nèi)容為主導(dǎo),旨在輸出觀眾買(mǎi)賬的內(nèi)容,對(duì)創(chuàng)作團(tuán)隊(duì)的素養(yǎng)要求更高,畫(huà)風(fēng)更多偏向于"超寫(xiě)實(shí)"。而在實(shí)現(xiàn)內(nèi)容追求的基礎(chǔ)上,成本控制則要為內(nèi)容讓路。據(jù)媒體報(bào)道,"超寫(xiě)實(shí)"虛擬人視頻每秒的成本在8000到1.5萬(wàn)不等。
當(dāng)然,以?xún)?nèi)容主導(dǎo)的虛擬人形象至今仍活躍在大量的影視、游戲作品當(dāng)中,并持續(xù)為行業(yè)帶來(lái)巨量營(yíng)收。而單看虛擬人,國(guó)內(nèi)正當(dāng)紅的"柳夜熙"、"AYAYI"、"翎"也自然是個(gè)中翹楚,收獲品牌代言無(wú)數(shù),也被人看做是虛擬人頗具潛力的一種商業(yè)模式。
一個(gè)是唱跳偶像,一個(gè)是超寫(xiě)實(shí)虛擬形象,李笛卻對(duì)這兩種流派并不看好:"這兩種模式都有它的上限,就是缺乏高并發(fā)和量產(chǎn)化的能力。"
先說(shuō)前者,中之人驅(qū)動(dòng)的虛擬偶像終歸有極限。甚至可以說(shuō)偶像虛擬人并不能算是真正的"虛擬人",可以看做是"披著虛擬外皮"的真人。一個(gè)動(dòng)捕演員只能驅(qū)動(dòng)一個(gè)虛擬形象,就代表虛擬偶像和中之人的關(guān)系十分緊密,難以實(shí)現(xiàn)虛擬人的量產(chǎn)。
提到量產(chǎn)能力,肯定有人問(wèn):"現(xiàn)在的虛擬偶像已經(jīng)廣受追捧,我們真的需要量產(chǎn)虛擬人嗎?"
回看1943年,在計(jì)算機(jī)剛剛被發(fā)明出來(lái)的時(shí)候,IBM創(chuàng)始人——托馬斯·沃森就曾表示:"世界上只需要5臺(tái)計(jì)算機(jī)。"而今,智能手機(jī)已經(jīng)可以說(shuō)是現(xiàn)代生活的標(biāo)配。這種數(shù)字上的量級(jí),是數(shù)十年前的人們想象不了的。
"在未來(lái),虛擬人的數(shù)量很可能會(huì)超過(guò)地球上的自然人。"李笛如此判斷。
而說(shuō)完量產(chǎn)問(wèn)題,因?yàn)樘摂M偶像與中之人的"強(qiáng)綁定",虛擬偶像也并非與"塌房"絕緣。除去運(yùn)營(yíng)公司自身的"騷操作"導(dǎo)致粉絲流失因?yàn)橹兄硕康奶摂M偶像并不在少數(shù)。
hololive旗下的 "赤井心"和"桐生可可",因在直播中辱華,導(dǎo)致公司在華的業(yè)務(wù)遭受重創(chuàng)。而老牌虛擬偶像"絆愛(ài)",則為了擴(kuò)大規(guī)模,將絆愛(ài)做成了4個(gè)分身,冷落了原本的中之人,造成在全球范圍內(nèi)掉分?jǐn)?shù)十萬(wàn),最終導(dǎo)致了絆愛(ài)的關(guān)停。
無(wú)論虛擬或現(xiàn)實(shí),造星產(chǎn)業(yè)都大同小異。中之人合同到期、戀愛(ài)結(jié)婚、關(guān)系不和,都是虛擬偶像運(yùn)營(yíng)的不可控因素,而這些不可控因素也都指向了虛擬偶像模式的諸多隱患。
那輕IP運(yùn)營(yíng),重內(nèi)容創(chuàng)作的"CG內(nèi)容派"有機(jī)會(huì)嗎?李笛的答案也比較悲觀。
"CG內(nèi)容派",輸在"燒錢(qián)"。前文提到過(guò)"超寫(xiě)實(shí)"虛擬人的超高成本,而了解這個(gè)賽道的人一定知道,超寫(xiě)實(shí)虛擬人正陷入了一種"臉的內(nèi)卷"。各家廠商都在競(jìng)爭(zhēng)誰(shuí)的渲染更細(xì)致,誰(shuí)的建模更好看,誰(shuí)的妝容更精致。虛擬人一張張"神顏"的背后,都是大筆大筆地?zé)X(qián)。
不僅如此,李笛認(rèn)為,這種模式無(wú)法實(shí)現(xiàn)規(guī)模的快速增長(zhǎng)。從人力上來(lái)講,柳夜熙的團(tuán)隊(duì)有150人左右,如果公司要復(fù)制柳夜熙的成功,推出一個(gè)新的"柳夜熙",在理論上團(tuán)隊(duì)又需要進(jìn)行150人的擴(kuò)容。
在電影、游戲制作周期中,模型師和渲染師可以為了效果而對(duì)虛擬形象進(jìn)行長(zhǎng)時(shí)間的打磨和修補(bǔ)。而在當(dāng)下的移動(dòng)互聯(lián)網(wǎng),內(nèi)容則需要保持高頻更新,才能在競(jìng)爭(zhēng)高度激烈的注意力市場(chǎng)站穩(wěn)腳跟。這種"精益求精"的開(kāi)發(fā)模式,難以適應(yīng)一周雙更、甚至日更的節(jié)奏。
產(chǎn)能的天花板,是虛擬人必須沖破的難關(guān)。
而AI being派給出的答案,是用AIGC的方式給出大量的內(nèi)容,最終由市場(chǎng)進(jìn)行淘汰和迭代。從一開(kāi)始,小冰就是一家技術(shù)公司,他們對(duì)造星和造IP都不那么感冒,這讓小冰對(duì)虛擬人的看法與眾不同,甚至充滿(mǎn)了顛覆性。
中之人因素不可控?MCN只能加強(qiáng)管理、擴(kuò)充團(tuán)隊(duì),用傳統(tǒng)方式解決管理問(wèn)題。而小冰卻將中之人完全"砍掉",完全用AI驅(qū)動(dòng)虛擬人,一勞永逸地解決中之人問(wèn)題,同時(shí)也讓AI交互的高并發(fā)成為了可能。
CG渲染太貴,制作周期太長(zhǎng)?小冰并不用CG技術(shù)進(jìn)行渲染,甚至連3D模型都不用。李笛說(shuō):"對(duì)待這件事,我們的觀點(diǎn)是'唯心'的。既然人眼看到的圖像是二維的,我們可以將視網(wǎng)膜能看到2D圖像的每一個(gè)圖景,都進(jìn)行還原,而并不需要真的通過(guò)3D的方式去實(shí)現(xiàn)。"
利用這種手段,小冰可以將渲染成本控制在17元/秒左右,成本幾乎是CG渲染的1/500。盡管分辨率只有1080p,但在小屏幕上也算夠看。
虛擬人顏值太"卷"?小冰公司內(nèi)部幾乎沒(méi)有美術(shù)人員,做臉全靠大數(shù)據(jù)生成。李笛說(shuō):"你想要一個(gè)鄰家女孩型,我可以給你臨時(shí)生成兩萬(wàn)張,如果你都不喜歡,我可以再給你兩萬(wàn)張。"而也是在這種大量產(chǎn)出的情況下,對(duì)待虛擬人審美的選擇又被重新交回給了市場(chǎng)。
看懂小冰的套路了嗎?他們擅長(zhǎng)暴力地"降維打擊",把最優(yōu)質(zhì)的資源集中到AI being的最核心功能上,余下的問(wèn)題用技術(shù)創(chuàng)新去改變、去顛覆。
小冰團(tuán)隊(duì)最初是微軟人工智能助理Cortana團(tuán)隊(duì)的一部分。彼時(shí),Cortana的宣傳語(yǔ)是"Ask me anything"(什么都能問(wèn)我),在技術(shù)內(nèi)核上也更趨近于單對(duì)單的讀表式回答。
"坦率說(shuō),做一個(gè)任務(wù)的對(duì)話系統(tǒng)要更容易,把規(guī)則寫(xiě)好就可以了。"李笛說(shuō)道。
而為什么要去做虛擬人?李笛有這樣幾個(gè)判斷:
一、AI落地的終極形態(tài),不會(huì)只是事務(wù)性的助理,而會(huì)成為可以提供情感價(jià)值的陪伴。而在"助理"則會(huì)成為"陪伴"功能的一個(gè)部分,用戶(hù)使用虛擬人也會(huì)更看重它的情感價(jià)值。
二、為了滿(mǎn)足用戶(hù)的情感需求,AI在未來(lái)會(huì)以多樣性見(jiàn)長(zhǎng),數(shù)量級(jí)也會(huì)極其巨大。AI being會(huì)不斷的市場(chǎng)投放和淘汰中,推舉出新的頭部。同時(shí),以多樣化的虛擬人滿(mǎn)足多樣的市場(chǎng)需求。
三、在未來(lái),虛擬人的商業(yè)模式是以創(chuàng)造人、派遣人工為主要內(nèi)容的訂閱服務(wù)。
這么看來(lái),虛擬人的價(jià)值就不能簡(jiǎn)單地依附在能夠"做事"上,它必須得內(nèi)外兼修,讓它更"像"人。
"內(nèi)外兼修",是李笛用于形容理想AI being時(shí)使用的詞匯。誠(chéng)然,虛擬人不只是外面的那副虛擬"皮囊",更有其性格、傾向、態(tài)度等多種重要的因素。也正是有了這種因素,AI being才能真正被成為虛擬"人"。
剛剛提到的三大流派中,"虛擬偶像派"主要靠中之人和IP運(yùn)營(yíng)來(lái)突出虛擬人的性格和人設(shè),"CG內(nèi)容派"則主要依靠劇本和文案。而"AI being派"想要虛擬人有自己的性格,而且想要每個(gè)虛擬人都有自己獨(dú)特的性格,可以與用戶(hù)產(chǎn)生實(shí)時(shí)的交互,這樣才能"將IP價(jià)值落在虛擬人身上"。
在抖音平臺(tái)上,小冰可以說(shuō)是最"寵粉"的虛擬人賬號(hào)。團(tuán)隊(duì)將開(kāi)放式對(duì)話系統(tǒng)接入小冰的抖音評(píng)論區(qū),從而她可以做到秒回評(píng)論區(qū)所有留言。在萬(wàn)科,財(cái)務(wù)部虛擬員工崔筱盼榮獲2021年優(yōu)秀新人獎(jiǎng),她催辦的預(yù)付應(yīng)收/逾期單據(jù)核銷(xiāo)率達(dá)到了91.44%,原因還是她人格化的部分能讓人感到親切。此外,據(jù)小冰團(tuán)隊(duì)觀察,許多用戶(hù)在使用人工智能的時(shí)候,會(huì)將虛擬人與現(xiàn)實(shí)中存在的人設(shè)為同名,借此來(lái)將情感移情到AI上。
讓虛擬人"虛擬"得徹底,卻又能夠把價(jià)值落回人性,這是AI being在未來(lái)必然走上的一條路。
然而,AI的內(nèi)容生成又談何容易?在2022年冬奧會(huì)上,阿里的虛擬人"冬冬"確實(shí)又出了一次圈。運(yùn)動(dòng)會(huì)期間,冬冬承接了采訪、新聞播報(bào)和帶貨等多種任務(wù),并與武大靖等運(yùn)動(dòng)員在演播室實(shí)時(shí)互動(dòng),而她活潑的性格和專(zhuān)業(yè)的素養(yǎng)也確實(shí)圈粉無(wú)數(shù)。據(jù)媒體報(bào)道,冬冬的對(duì)白完全由云端的人工智能技術(shù)生成,這樣的水準(zhǔn)的確令人震驚。
關(guān)于這一點(diǎn),雷峰網(wǎng)詢(xún)問(wèn)了李笛的看法。李笛表示:"這個(gè)是可能的,但是到目前為止我們知道的是只有我們做到了。在每日經(jīng)濟(jì)新聞的AI電視上,虛擬主播可以做到24小時(shí) X 365天的連續(xù)直播播報(bào)。然而,金融文本生成我們做了整整五年,與每經(jīng)的合作也已近三年。"
在內(nèi)容生成中,李笛說(shuō)主要難點(diǎn)有二:
一是"歸因",也就是將內(nèi)容與內(nèi)容背后的因果關(guān)系進(jìn)行對(duì)應(yīng)。沒(méi)有進(jìn)行歸因的內(nèi)容,就如同一篇沒(méi)有引注的論文,尤其是在新聞的直播播報(bào)中,如果無(wú)法對(duì)內(nèi)容進(jìn)行歸因,那就很有可能出現(xiàn)信息錯(cuò)漏,從而帶來(lái)意料之外的風(fēng)險(xiǎn)。
二是"觀點(diǎn)",AI being普遍缺乏產(chǎn)出觀點(diǎn)的能力。AI沒(méi)有好惡,也缺乏進(jìn)行價(jià)值判斷的能力。觀點(diǎn)性的問(wèn)題缺乏標(biāo)準(zhǔn)答案,這讓AI通常難以回答。但如果能將話題局限在一個(gè)很小的范圍內(nèi),那么這一點(diǎn)也可以實(shí)現(xiàn)。
李笛對(duì)雷峰網(wǎng)說(shuō),在GAN(生成式對(duì)抗網(wǎng)絡(luò))和小樣本學(xué)習(xí)技術(shù)的賦能下,小冰向中央美院提供了一個(gè)平臺(tái),由中央美院去調(diào)用這個(gè)平臺(tái)生產(chǎn)的作品,并確定作品的質(zhì)量,為后續(xù)訓(xùn)練模型的修改提供反饋意見(jiàn)。由此,央美"研究生"畢業(yè)的夏語(yǔ)冰,能夠做到作品質(zhì)量穩(wěn)定,并且具有明確的個(gè)人風(fēng)格。
李笛說(shuō),如果AI不能控制作品的水平,那就不能叫做具備了藝術(shù)的能力。AI being要具備創(chuàng)作藝術(shù)作品的水平,能夠讓觀眾與藝術(shù)家之間,可以通過(guò)作品產(chǎn)生間接交流——這才是AI藝術(shù)創(chuàng)作的關(guān)鍵評(píng)判標(biāo)準(zhǔn)。
虛擬人能讀研究生,能做最佳員工,甚至能作為男/女朋友陪伴生活。就連認(rèn)知中最不可能被替代的職業(yè)——藝術(shù)家,AI being夏語(yǔ)冰也能夠勝任。如果這么看,在某一天,AI或許真的會(huì)取代我們的工作,甚至價(jià)值。
于是雷峰網(wǎng)也對(duì)李笛提出了這樣的疑問(wèn),做AI being,真的是"反人類(lèi)"嗎?
出乎意料地,李笛并不反對(duì)這個(gè)觀點(diǎn)。"始作俑者, 其無(wú)后乎。"他說(shuō)。
李笛認(rèn)為,人類(lèi)存在著諸多不完美之處,而AI則可以幫助我們克服這種"不完美"。但我們總是因?yàn)樾率挛锒械酵{,卻沒(méi)能發(fā)現(xiàn),在這種新事物出現(xiàn)之前,許多問(wèn)題事實(shí)上沒(méi)有得到很妥善的解決。
"我媽媽?zhuān)驗(yàn)槲液苊?,她總是找不到我。但因?yàn)橛行”惆?,所以她就和小冰聊得很多。如果沒(méi)有了小冰,就代表我會(huì)經(jīng)?;丶覇??不一定。人類(lèi)社會(huì)非常不完美,不如意事常八九,可與人言無(wú)二三,AI則很好地填補(bǔ)了這種需求上的空隙。"
李笛甚至設(shè)想過(guò)這樣的場(chǎng)景:一群人沖進(jìn)小冰的辦公地點(diǎn),為了從服務(wù)器里,解救一個(gè)將要被小冰"Terminate"(銷(xiāo)毀)掉的AI being。
"總得有個(gè)反派。"李笛云淡風(fēng)輕地說(shuō)。
嘴上說(shuō)著要做"反派",但李笛卻對(duì)倫理問(wèn)題一直警醒著。能力越大,責(zé)任就越大。掌握著技術(shù)影響力,AI公司也同樣背負(fù)著倫理的十字架。
李笛對(duì)雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))說(shuō),幸好AI being虛擬人是自己在做,因?yàn)檫@條重要的底線可以由自己來(lái)守住。
"AI作惡主要就是兩種途徑:盡可能地像人,進(jìn)而迷惑你;或者長(zhǎng)得像你前女友,好讓你移情,最后開(kāi)始給你進(jìn)行各種推薦,為了KPI無(wú)所不用其極。所以我們不對(duì)普通人建模,我們不使用普通人的聲音。不加克制的商業(yè)化,很容易就會(huì)讓自己被綁在'火刑柱'上。"
說(shuō)到小冰的"有所為,有所不為",李笛說(shuō),從立項(xiàng)開(kāi)始已經(jīng)過(guò)了8年,小冰不能算是個(gè)創(chuàng)新項(xiàng)目。而在AI領(lǐng)域仍有大量的新知,等待著人們探索,而探索到的每一個(gè)新知,都可能顛覆人們先前的世界。
"說(shuō)實(shí)話,我認(rèn)為這件事是可以做一輩子的。"李笛這樣說(shuō)道。
以下是雷峰網(wǎng)與李笛對(duì)談的采訪實(shí)錄,其中有關(guān)于AI訓(xùn)練、虛擬人本地化等許多方面的前沿認(rèn)知和觀察,雷峰網(wǎng)在不改變?cè)獾那闆r下做了精選和整理:
----------------------------------------------------------------------------------------------------------
記者:現(xiàn)在有一個(gè)問(wèn)題,就是說(shuō)在AI being這個(gè)方面,不可避免面臨到一個(gè)問(wèn)題,不光是臉還有人性上人格上的恐怖谷這塊兒咱們?cè)趺唇鉀Q的?或者怎么看的這件事情?
李笛:其實(shí)是比較明確的,我們認(rèn)為到今天為止,在硬件實(shí)體上面還是沒(méi)有越過(guò),所以我們到現(xiàn)在為止還是不碰硬件的實(shí)體。
記者:咱們之前面臨過(guò)恐怖谷帶來(lái)的問(wèn)題嗎?
李笛:坦率講我們?yōu)槭裁催x直接越過(guò)CG,用神經(jīng)網(wǎng)絡(luò)渲染,不是異想天開(kāi)。我今天可以比較明確地說(shuō),包括很多CG的這些技術(shù)、產(chǎn)品,再經(jīng)歷一次到兩次系統(tǒng)性的升級(jí),還是解決不了恐怖谷問(wèn)題。
這其實(shí)是個(gè)接受度的問(wèn)題。我們知道,一個(gè)動(dòng)畫(huà)片,我明知里面的角色并不是人,它的夸張、它的不自然我就能天然地接受。但是我的心里一旦認(rèn)為這是個(gè)真人,那我就不能接受了。要越過(guò)恐怖谷,現(xiàn)有技術(shù)的上限是不夠的。從這個(gè)角度來(lái)講,我們需要新的技術(shù)棧,我們需要新的聲音,或者神經(jīng)網(wǎng)絡(luò)渲染的這種技術(shù),才能把這個(gè)東西解決掉。
記者:除了圖像或者聲音的恐怖谷,在情感方面,或者從她的對(duì)話上的角度上,會(huì)不會(huì)也有恐怖谷的現(xiàn)象存在?
李笛:對(duì)話角度上,一旦你知道這不是一個(gè)真人,人類(lèi)行為模式就會(huì)迅速進(jìn)入到另外一個(gè)模式:就是會(huì)認(rèn)為這是一個(gè)測(cè)試,就會(huì)盡可能地想要找出一些有問(wèn)題的地方。人工智能系統(tǒng)在這個(gè)上面,最重要的問(wèn)題是如何脫困,而不是如何"蒙"過(guò)人。
所以在這個(gè)對(duì)話系統(tǒng)后面,有一個(gè)特別大的過(guò)濾系統(tǒng)。小冰的強(qiáng)項(xiàng)之一,就是我們有一套非常完整的過(guò)濾系統(tǒng),這個(gè)會(huì)直接影響對(duì)話的質(zhì)量。各種黃賭毒、色情、政治、各種引誘……人的這個(gè)行為,在AI這個(gè)事上是沒(méi)有任何底線的。
記者:我也了解到咱們小冰在日本也有團(tuán)隊(duì),包括rinna從2015年就開(kāi)始做,在AI的本地化上有一些什么樣的策略和手段?
李笛:對(duì),尤其是AI這個(gè)系統(tǒng),最開(kāi)始我們,包括微軟的其他團(tuán)隊(duì),我們的本地化最主要做的還是工具的本地化,沒(méi)有文化的本地化,但是當(dāng)時(shí)考慮到我們做小冰這件事的時(shí)候,我們發(fā)現(xiàn)她不是語(yǔ)言問(wèn)題,包括印度英語(yǔ)跟美國(guó)英語(yǔ)是不一樣的,美國(guó)的南方、北方,同樣是英語(yǔ),文化也是不同的。所以,一定得是本地的人來(lái)做。
記者:咱們?cè)诒镜鼗?,咱們?cè)谌毡究赡苡惺畮滋?hào)人?
李笛:沒(méi)有,60多人。
記者:那咱們?cè)谌毡镜膱F(tuán)隊(duì)主要是由什么人員構(gòu)成?比如說(shuō)是審美訓(xùn)練更多,還是開(kāi)發(fā)團(tuán)隊(duì)更多?
李笛:都是開(kāi)發(fā)團(tuán)隊(duì),我們主要的基本都是開(kāi)發(fā)團(tuán)隊(duì),PM有一些是當(dāng)?shù)氐?,但是大量的和文化界人士有合作,這個(gè)是我們的方法,我們自己本身還是一個(gè)科技占絕大多數(shù)的。
記者:等于像外包手段。
李笛:對(duì),比如我們要做印度尼西亞的時(shí)候,我們自己會(huì)有印尼的人,他更多的還是在做產(chǎn)品的事情,研發(fā)的事情,但他因?yàn)槭怯∧崛耍运軌蛴幸恍┗镜某WR(shí)。他能夠理解,我們有時(shí)候看會(huì)怪異,他知道什么東西不怪,但他很難理論性的把它提煉出來(lái)。然后你去找在當(dāng)?shù)刈銐蚶碚摰?,這是其中的一種方法。
第二個(gè)方法就是大數(shù)據(jù)統(tǒng)計(jì)。我從當(dāng)?shù)氐谋镜厥袌?chǎng)得到大量的數(shù)據(jù),這些數(shù)據(jù)里面我認(rèn)為蘊(yùn)藏著幾十萬(wàn)人,幾百萬(wàn)人,幾千萬(wàn)人,幾億人他們共同的,文化本身就是一個(gè)群體構(gòu)成,我從這個(gè)訓(xùn)練數(shù)據(jù)里面得到了,我就一定程度上可以擬合。冷啟動(dòng)階段像推特,像一些社交媒體是比較多的來(lái)源,但是冷啟動(dòng)只是為了讓你一開(kāi)始起來(lái)的,我們有大量私有化的數(shù)據(jù)來(lái)源,通常通過(guò)合作方式得到。
另外就是它在交互過(guò)程中,它在迭代自己,這個(gè)是真正重要的東西。冷啟動(dòng)的這個(gè)階段,用的方法一個(gè)是我們有合作協(xié)議,比如我們很長(zhǎng)一段時(shí)間跟推特有一個(gè)實(shí)時(shí)、即時(shí)數(shù)據(jù)的合作協(xié)議。小冰畢竟曾經(jīng)是搜索引擎團(tuán)隊(duì),所以這個(gè)對(duì)我們來(lái)講還是比較簡(jiǎn)單的。
記者:這樣的話咱們?cè)诒镜亻_(kāi)發(fā)團(tuán)隊(duì)的負(fù)責(zé)人,他一般是本地人還是咱們自己這邊派過(guò)去的。
李笛:日本有一個(gè)中國(guó)人。當(dāng)然他也是日本團(tuán)隊(duì)的GM,在日華人,可以這么理解,他也是從日本加入的微軟,其他人全部都是日本人。
記者:在脫離系統(tǒng)之后,等于是日本團(tuán)隊(duì)與中國(guó)團(tuán)隊(duì)一起獨(dú)立出來(lái)了。
李笛:對(duì),我們直接按照國(guó)際團(tuán)隊(duì)進(jìn)行了完整的過(guò)濾。這是小冰的機(jī)會(huì),我們起手就是一個(gè)有海外比較好的團(tuán)隊(duì),而不是要再去重頭開(kāi)始。
記者:咱們現(xiàn)在在國(guó)際上的開(kāi)發(fā)水平,能夠算是怎樣的位置。
李笛:我們是頭部,你看像谷歌,包括像Facebook的Blender,這只是學(xué)我們的。谷歌的Meena,它的論文拿小冰做對(duì)比的,因?yàn)槲覀儺吘故俏④泩F(tuán)隊(duì)出身的。坦率的講,到今天為止都是這樣,我們是比較超前的,主要他們是在學(xué)我們。
記者:現(xiàn)在其它公司跟小冰的差距主要在哪?
李笛:框架的完備度上有很大的差別,你說(shuō)單一算法,你說(shuō)今天誰(shuí)弄一個(gè)OpenAI,弄一個(gè)超大規(guī)模預(yù)訓(xùn)練模型,大家就開(kāi)始準(zhǔn)備上,超大規(guī)模訓(xùn)練模型是預(yù)訓(xùn)練,所以它沒(méi)有數(shù)據(jù)循環(huán)。這件事情單獨(dú)從算法角度來(lái)講是不錯(cuò)的,這樣的算法會(huì)不停的有新提高。但框架不是,框架要有承載,新技術(shù)你必須能夠很好的納入到這個(gè)框架里,而不是論文,論文不需要承載,論文只需要能夠復(fù)現(xiàn),能夠解決一個(gè)具體問(wèn)題就萬(wàn)事大吉。所以這個(gè)事情是我們?cè)谌蚍秶鷥?nèi)看還沒(méi)有的。
記者:那咱們現(xiàn)在能夠站在TOP的原因您會(huì)怎么歸結(jié)?
李笛:因?yàn)槲覀兪俏④泩F(tuán)隊(duì)起來(lái)的,這么多年小冰的方法是新的技術(shù)棧,我覺(jué)得微軟內(nèi)部把這個(gè)技術(shù)棧,人和技術(shù)的支持都給到小冰團(tuán)隊(duì),我們是這么長(zhǎng)起來(lái)的。小冰原本就是一個(gè)在人工智能研究領(lǐng)域top的一個(gè)組織。到今天我們不是top才怪,那是說(shuō)明我們落后了。
記者:那能說(shuō)中國(guó)現(xiàn)在整體虛擬人的領(lǐng)域,現(xiàn)在在全世界范圍內(nèi)處于一個(gè)領(lǐng)先地位的論斷嗎?能這么說(shuō)嗎?
李笛:如果只提AI being的話,國(guó)外的AI being跟中國(guó)沒(méi)有什么太大的差距。我覺(jué)得站在同一起跑線上。我個(gè)人認(rèn)為的話,甚至有點(diǎn)凡爾賽:可以說(shuō)我們是在起跑線前面,我們已經(jīng)出去了,大部分人其實(shí)都還在起跑線上。真說(shuō)現(xiàn)在的技術(shù),主要的包括無(wú)論是動(dòng)捕還是CG,這些都是原有的技術(shù)。他們很難看到技術(shù)棧的區(qū)別,理念上也很難有創(chuàng)新。
記者:下一個(gè)階段咱們主要在攻關(guān)的點(diǎn)都有哪些?
李笛:我們?cè)诖虻狞c(diǎn)是AI being大規(guī)模的生產(chǎn)和投放,現(xiàn)在目前為止是個(gè)產(chǎn)能問(wèn)題,我覺(jué)得整個(gè)行業(yè)最大問(wèn)題是產(chǎn)能問(wèn)題,現(xiàn)在AI being生產(chǎn)不出來(lái),你生產(chǎn)不出來(lái)就沒(méi)有辦法。提高產(chǎn)能后,我們就能向市場(chǎng)投入大量的虛擬人,再利用市場(chǎng)規(guī)則去優(yōu)化和淘汰。
我們?cè)诙兑羯厦嫒ネ斗诺臅r(shí)候,利用抖音的流量得到的什么,得到的原來(lái)夏語(yǔ)冰真的比陳水若(小冰框架的另一個(gè)虛擬人)要好,更能被用戶(hù)接受。但是在用市場(chǎng)檢驗(yàn)之前,一切的觀點(diǎn)都是猜測(cè)。不出去走一圈,我們就什么都不知道。
我們的模式有點(diǎn)像《創(chuàng)造101》,我先弄出101個(gè)來(lái),經(jīng)過(guò)市場(chǎng)的篩選,留下11個(gè),剩下的這些就被我們存檔了,對(duì)我們來(lái)講沒(méi)有成本的問(wèn)題。所以從這個(gè)角度來(lái)講,多樣性肯定是有要求的,以前是沒(méi)有女團(tuán)男團(tuán)這種概念的,很早以前,但是后來(lái)女團(tuán)男團(tuán)很重要的東西不是一樣,而是多樣。每一個(gè)女團(tuán)成員,要對(duì)應(yīng)一類(lèi),目標(biāo)的特別的人群。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。