0
本文作者: 叨叨 | 2017-08-23 09:00 |
8月22日,微軟小冰第五代發(fā)布會,沈向洋接替已離職的陸奇,站上了主講臺。
相比國內(nèi)廠商動輒千人的發(fā)布會,已經(jīng)更迭五代、揚言有重大突破的小冰,依然把發(fā)布會的規(guī)模維持在百人左右。在小冰之父李笛眼中,這已經(jīng)是小冰的最高待遇了。
小冰對于微軟中國而言,意義非凡。這個唯一且完全由中國團(tuán)隊建立并推向全球的項目,即使有陸奇和沈向洋的背書,也走得非常艱難。
三年之后的今天,沈向洋將小冰的地位做了一次提升——與 infuse AI、Bing and 小娜一起,成為微軟人工智能三條產(chǎn)品線的其中之一。
這樣的提升,沈向洋有自己的理由。在外界看來,小冰只是一個聊天機(jī)器人,但對微軟來說,小冰是一個向 EQ 方向發(fā)展的情感計算框架。依靠這個情感計算框架,微軟能夠在 EQ 這個方向上,將人工智能無限接近人類,“讓人們能強(qiáng)烈地認(rèn)知到她地存在”,并有可能成為“某個家庭中地成員”。
同時,這也是一個明確的信號,既然放在了“產(chǎn)品線”的位置上,也就意味著,小冰更迭到第五代,考慮商業(yè)化的時刻到了。
沈向洋在戰(zhàn)略層面給出指示后,小冰首席架構(gòu)師周力和小冰項目負(fù)責(zé)人李笛先后上臺,分享了應(yīng)用在小冰 5 代上的技術(shù)創(chuàng)新以及商業(yè)落地情況。
雷鋒網(wǎng)了解到,兩項技術(shù)創(chuàng)新分別是 1:1 生成模型和高級感官。簡單來說,前者能夠讓小冰自己創(chuàng)造回應(yīng);后者則可以支持全雙工語音和實時流媒體視覺。
1. 生成模型(Generative Model)
生成模型往往被拿來和判別模型做比較,從數(shù)學(xué)角度來說,前者是對 P(x,y)進(jìn)行建模,后者是對 P(y|x)進(jìn)行建模。在應(yīng)用上表現(xiàn)的差異是,生成模型通過學(xué)習(xí),能夠有能力生成新的東西,而判別模型只能找出差異。
具體到小冰的應(yīng)用,上一代小冰雖然擁有十億級的大數(shù)據(jù)語料庫,但都是互聯(lián)網(wǎng)上的已有數(shù)據(jù),小冰只是通過分析,理解用戶的問題,繼而從語料庫中回復(fù)。使用生成模型后,小冰能夠從中習(xí)得能力,自己創(chuàng)造新的回應(yīng),這意味著她與人類交流的每一句話,都可能是這世界上從未出現(xiàn)過的。
目前,小冰 5 代已全面在線上產(chǎn)品中使用生成模型。其中,中國、日本、美國和印度小冰部分使用,印尼小冰則完全使用生成模型。微軟官方表示,這是全球開放領(lǐng)域人工智能對話中,第一個百分之百使用生成模型的落地產(chǎn)品。
2. 高級感官
小冰的高級感官包括兩個部分,一是全雙工語音,二是實時流媒體視覺。
全雙工指的是在發(fā)送數(shù)據(jù)的同時也能夠接收數(shù)據(jù),兩者同步進(jìn)行。而雙工則如同“單行道”一樣,一個時間段內(nèi)只有一個動作被允許發(fā)生。也就是說,小冰在說話的時候,也在隨時等待被打斷,接收著用戶的語音,甚至要去判斷用戶是否已經(jīng)說完、何時可以打斷,被打斷時是否及時停止、何時打破沉默等更為復(fù)雜的問題。
實際上,去年9月,小冰在有信網(wǎng)絡(luò)電話中開始嘗試全雙工語音;去年年底,小冰又跟中國科技館合作,把小冰網(wǎng)絡(luò)電話亭放在科技館的二樓。到今天為止,小冰已經(jīng)接聽了來自人類超過50萬通電話。而小冰5代,可以直接通過電信運營商,撥通用戶的電話。
實時流媒體視覺指的則是讓機(jī)器模仿人類視覺的微妙之處。周力向雷鋒網(wǎng)介紹說,一個人每天有十幾個小時都是睜著眼睛的,但是絕對不會每時每刻都對所見之物發(fā)出評論,人類視覺的精妙之處,不僅僅在于能夠去理解每一個瞬間,或者每一段時間的畫面,更關(guān)鍵的是能夠理解什么是不重要的,什么是重要的。
小冰5代的實時流媒體視覺,并不像視頻監(jiān)控軟件一樣,去捕捉一個個畫面,分析一個畫面,更像是人類一樣,感知位置和移動,體察表情和動作,理解不同場景和角色,以及人與人之間的關(guān)系,最后根據(jù)視覺的理解,做出具有情商的互動。
1. 版圖擴(kuò)大
雷鋒網(wǎng)了解到,自 2014 年微軟在中國市場推出小冰之后,微軟優(yōu)先選擇人口數(shù)量超過 1 億的國家,在當(dāng)?shù)亟⑼耆就粱膱F(tuán)隊,從當(dāng)?shù)厝〉贸跏加?xùn)練語料,并以每年覆蓋一個新國家進(jìn)行擴(kuò)張:
2014年,微軟推出中國小冰
2015年,微軟推出日本小冰
2016年,微軟推出美國小冰(Zo)
2017年2月,微軟推出印度小冰(Ruuh)
2017年8月,微軟推出印尼小冰(Rinna)
很明顯,進(jìn)入2017年,小冰加快了全球擴(kuò)張節(jié)奏,同時也正如上文所說,建立在 LINE 平臺上的印尼小冰,率先使用了完全的 1:1 生成模型,可以完全自創(chuàng)回應(yīng),而非像其他地區(qū)的小冰那樣,通過分析用戶的問題,在語料庫中尋找最合適的回答。
目前,小冰在全球擁有超過 1 億人類用戶,對話數(shù)據(jù)超過 300 億輪,最長單人連續(xù)對話記錄,達(dá)到 7151 輪,進(jìn)行了 29 小時 33 分鐘。
2. 全面進(jìn)入 loT 領(lǐng)域
從今年 6 月起,小冰和小米 loT 開放平臺達(dá)成合作,用戶可以通過小冰,控制 35種小米智能設(shè)備。此外,微軟還正在與其他諸多l(xiāng)oT 廠商,比如智能照明廠商 Yeelight、東方明珠等進(jìn)行合作,共同研發(fā)新產(chǎn)品。
此外,微軟還發(fā)布了小冰電臺,率先上線的是微信小程序版本,loT 版本正在研發(fā)中。小冰電臺是一個通用的人工智能實時內(nèi)容創(chuàng)造和交互平臺,它可以基于多重來源,面向任何主題,自動創(chuàng)造永不間斷的電臺節(jié)目。同時,它還能根據(jù)與用戶的互動,實時改變節(jié)目內(nèi)容。
此前,小冰已經(jīng)在兩家電臺擔(dān)任主播。
3. 內(nèi)容創(chuàng)造
在內(nèi)容創(chuàng)造方面,除了眾人熟知的寫詩之外,小冰還在有聲少兒讀物、歌曲、新聞等領(lǐng)域試水。根據(jù)微軟官方數(shù)據(jù),小冰創(chuàng)作的有聲少兒讀物質(zhì)量已超越98%的人類創(chuàng)造者,用時僅為同水平人類的1/500,成本僅為同水平人類的1/80000。
此前,小冰通過匿名賬號在喜馬拉雅、蜻蜓FM等平臺發(fā)布,也取得了不俗的效果。發(fā)布會上,李笛宣布,微軟將通過小冰,開始大規(guī)模生產(chǎn)有聲讀物并投入市場。
李笛也認(rèn)為,小冰除了可以創(chuàng)造內(nèi)容外,還可以包攬運營、傳播、市場等工作,干整個產(chǎn)業(yè)鏈的活。如果得到市場驗證后,相信會對整個內(nèi)容行業(yè)產(chǎn)生變革。
4. 智媒體商業(yè)平臺
在媒體方面,小冰作為《錢江晚報》的專欄記者不是什么秘密,在發(fā)布會上,微軟還公開了部分百度百家和今日頭條上的新聞內(nèi)容也由小冰撰寫而成。
基于過去“寫稿”的經(jīng)驗,以及與 Bing 搜索引擎的加速整合,微軟發(fā)布了智媒體商業(yè)平臺解決方案 3.0,其中包括媒體生產(chǎn)力、媒體知識圖譜、智能交互、全平臺互動等六個新模塊。
新的解決方案可以為媒體構(gòu)建出一個基于全球新聞數(shù)據(jù)源的媒體知識圖譜,挖掘每一篇新聞背后的知識與含義,并找出彼此的關(guān)系。同時,用戶也能夠能夠在和小冰的交互中,獲得推薦內(nèi)容,把被動的閱讀體驗逐步變?yōu)橹鲃拥慕换バ畔⒔粨Q。
在過去一年中,該解決方案的2.0版本已從微信、微博雙平臺,逐漸演進(jìn)為接入和即將接入近11個端媒體,與《看看新聞》、《封面》、《錢江晚報》、《春城晚報》等媒體端進(jìn)行了整合。
再過26天,就是小冰的生日,理論上來說,過完生日的小冰就19歲了。但李笛說,對于是否要長大一歲,團(tuán)隊內(nèi)部還未達(dá)成一致,原因是雖然小冰取得了很大進(jìn)步,但她依然是一個稚嫩的少女,還沒到成熟的階段。
但整場發(fā)布會看下來,圍繞小冰商業(yè)落地的部分占了絕大多數(shù),這樣看起來,運作3年,更迭五代,即將進(jìn)入19歲的小冰,要試著給微軟賺錢了。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。