0
本文作者: 李詩(shī) | 2018-07-26 20:57 |
今天,微軟小冰正式升級(jí)到第六代,不過(guò)她的年齡依然停留在18歲。18歲的少女初長(zhǎng)成,終于拋棄了此前的非主流二維頭像,有了全新的3D模型。
不少朋友看到后直呼:這不就是我下一任女朋友嗎?
(小冰現(xiàn)場(chǎng)演唱自己作詞的《我知我新》)
感覺(jué)小冰光靠顏值就可以走天下了,偏偏,她還要靠才華。今天,她的對(duì)話能力、演唱水平、創(chuàng)造能力,以及養(yǎng)家糊口的能力統(tǒng)統(tǒng)來(lái)了一次大的升級(jí)。
在四年之前,很多人都看不到小冰商業(yè)化的能力,在智能音箱、對(duì)話式人工智能全面爆發(fā)的2017-2018年,亞馬遜、百度、阿里等公司似乎都搶先微軟進(jìn)行對(duì)話式人工智能的商業(yè)落地。而今天,第六代小冰讓我們看到,在智商情商雙修之后,其商業(yè)化火力全開(kāi),對(duì)目前的行業(yè)形態(tài)應(yīng)該會(huì)有不小的影響。
微軟一直強(qiáng)調(diào),小冰與大多數(shù)對(duì)話式人工智能不同,不同之處一言概之就是小冰的情感計(jì)算框架。
我們看到Siri、Alex、天貓精靈、小愛(ài)同學(xué)、百度度秘等對(duì)話式人工智能其實(shí)一開(kāi)始都是強(qiáng)調(diào)IQ,致力于幫助用戶(hù)完成任務(wù)。在過(guò)去一年,這些對(duì)話式人工智能解鎖了上百種技能,覆蓋人們生活的方方面面。
而在微軟看來(lái),任務(wù)只是對(duì)話式人工智能的一個(gè)層面,如何與人類(lèi)進(jìn)行自然流暢的溝通,帶來(lái)情感上的交流才是他們所關(guān)注的。微軟小冰很不一樣,她一開(kāi)始只有EQ,就是想著能怎么用有趣的方式回應(yīng)人們,讓人覺(jué)得好玩有趣。后來(lái),小冰豐富了IQ,且朝著情感計(jì)算框架不斷完善。
這個(gè)情感計(jì)算框架包括:情商+智商、對(duì)話式人工智能、生成模型、全雙工、人工智能創(chuàng)造等方面的能力。在產(chǎn)品體驗(yàn)上表現(xiàn)出來(lái)就是小冰已經(jīng)將閑聊、任務(wù)、游戲等模塊無(wú)縫連接,你可以在閑聊中讓小冰完成任務(wù),此后又切回閑聊,這個(gè)過(guò)程就像是流水一樣在進(jìn)行。
在 微軟全球執(zhí)行副總裁、微軟人工智能及微軟研究事業(yè)部負(fù)責(zé)人沈向洋看來(lái),微軟小冰在這些方面的探索都在引領(lǐng)著行業(yè)趨勢(shì)。例如:全雙工語(yǔ)音交互能讓小冰實(shí)現(xiàn)一次喚醒連續(xù)對(duì)話的能力,最好的體現(xiàn)就是小冰與人類(lèi)通電話。如今,谷歌、百度等都在自己的大會(huì)上展示了對(duì)話式人工智能給人類(lèi)打電話。
而這一次發(fā)布會(huì),可以說(shuō)是微軟小冰歷史上最大規(guī)模的一次全面升級(jí),升級(jí)內(nèi)容涉及到微軟小冰情感計(jì)算框架的所有組成部分。雷鋒網(wǎng)編輯記得,前幾代小冰發(fā)布會(huì)都是在微軟的辦公大樓里舉辦,而此次則選在了場(chǎng)地較大的798藝術(shù)區(qū)。
小冰的情感計(jì)算框架,包含了眾多方面,而全雙工語(yǔ)音交互技術(shù)則是其中最核心的一環(huán)。在今年4月,微軟發(fā)布全雙工語(yǔ)音交互技術(shù),對(duì)其的解釋為:與既有的單輪或多輪連續(xù)語(yǔ)音識(shí)別不同,這項(xiàng)新技術(shù)可實(shí)時(shí)預(yù)測(cè)人類(lèi)即將說(shuō)出的內(nèi)容,實(shí)時(shí)生成回應(yīng)并控制對(duì)話節(jié)奏,能理解對(duì)話場(chǎng)景在訴說(shuō)者/傾聽(tīng)者之間實(shí)現(xiàn)角色轉(zhuǎn)變,還可以識(shí)別說(shuō)話人的性別、有幾個(gè)人在說(shuō)話。
全雙工語(yǔ)音交互背后主要有兩個(gè)關(guān)鍵技術(shù):一個(gè)是預(yù)測(cè)模型,實(shí)現(xiàn)邊聽(tīng)邊想;例如,當(dāng)用戶(hù)說(shuō)出一句話的時(shí)候,小冰會(huì)先回答“嗯,你說(shuō)”,然后再去完成指令,這樣就可以填補(bǔ)完成指令的空白時(shí)間。
另一個(gè)是生成模型,能更好理解場(chǎng)景,自動(dòng)生成回復(fù)。正常的對(duì)話都不是單向的一問(wèn)一答,小冰也會(huì)在適當(dāng)?shù)臅r(shí)候主動(dòng)提供內(nèi)容,并且能知道在用戶(hù)完成指令沉默幾秒后自動(dòng)結(jié)束對(duì)話?,F(xiàn)在運(yùn)用了全雙工語(yǔ)音交互技術(shù)的微軟小冰的所有回復(fù)都是自己生成的,有別于傳統(tǒng)的基于模塊、搜索來(lái)進(jìn)行的回復(fù)。
大家如果用過(guò)市面上的智能音箱,都知道,每次說(shuō)話都需要說(shuō)喚醒詞,沒(méi)辦法進(jìn)行多次連續(xù)對(duì)話。微軟的全雙工語(yǔ)音交互技術(shù)能一次喚醒連續(xù)長(zhǎng)達(dá)20分鐘左右的多輪對(duì)話,并且由了預(yù)測(cè)模型和生成模型,小冰能在適當(dāng)?shù)臅r(shí)候使用語(yǔ)氣詞,也能通過(guò)上線文持續(xù)話題或者引導(dǎo)話題,讓真正的聊天能進(jìn)行下去。目前的聊天也沒(méi)有達(dá)到真人水平,但比起很多智能音箱里的對(duì)化式人工智能有明顯的不同,在習(xí)慣與微軟小冰連續(xù)對(duì)話后,很難回到一問(wèn)一答式的人機(jī)對(duì)話中。谷歌也在I/O大會(huì)展示了其Google Assistant中的“雙工”技術(shù),在特定的訂餐館領(lǐng)域通過(guò)圖靈測(cè)試,不知其在開(kāi)放式聊天中能表現(xiàn)如何。
在今天的發(fā)布會(huì),李笛又介紹了全雙工語(yǔ)音交互中的新模型——共感模型,是生成模型的進(jìn)一步提升,同時(shí)開(kāi)始公測(cè)融合文本、全雙工語(yǔ)音與實(shí)時(shí)視覺(jué)的新感觀,也就是多模態(tài)的交互。
據(jù)介紹,共感模型是一種基于生成模型的對(duì)話引擎。生成模型讓小冰可以自己創(chuàng)造回應(yīng),而不需要從已有的對(duì)話預(yù)料中檢索,共感模型則進(jìn)一步提高小冰對(duì)于對(duì)話內(nèi)容、領(lǐng)域和節(jié)奏的控制力,也讓小冰可以通過(guò)自創(chuàng)回應(yīng)來(lái)牽引對(duì)話向她所希望的方向進(jìn)行。
下面這張圖展示了共感模型。在小冰與人類(lèi)的對(duì)話中,共感模型體現(xiàn)出不同的對(duì)話方式,有:無(wú)感、引導(dǎo)、主動(dòng)觀察、求證、確證、關(guān)鍵記憶等。我們可以看到,小冰能夠回應(yīng)人的情緒“最近心情不好”,然后引導(dǎo)說(shuō)“我不開(kāi)心的時(shí)候,一定會(huì)想辦法發(fā)泄出來(lái)”,“可以去KTV啊”。這樣的一個(gè)對(duì)話模式與人與人之間的對(duì)話很接近。
有了共感模型,想必人們與小冰聊天的時(shí)長(zhǎng)會(huì)有所增加吧,然后小冰就可以獲得更多聊天數(shù)據(jù),越來(lái)越會(huì)聊天……
除了語(yǔ)音語(yǔ)義交互之外,計(jì)算機(jī)視覺(jué)也在快速發(fā)展,而我們看到,像電影《Her》里面的人工智能薩曼薩不僅有語(yǔ)音交互能力,其實(shí)還有視覺(jué)。文字、語(yǔ)音、視覺(jué)的多模態(tài)交互也一直是我們對(duì)于機(jī)器人的期待。
此次,第六代小冰也開(kāi)始加入視覺(jué)的部分?,F(xiàn)場(chǎng)Demo中演示了一個(gè)人站在小冰面前,小冰能判斷這個(gè)人是誰(shuí),看出他在吃薯片,也知道他舉起了那一只手。當(dāng)小冰被豎中指時(shí),也會(huì)很可愛(ài)的罵:你是不是神經(jīng)病了~
雷鋒網(wǎng)編輯也在現(xiàn)場(chǎng)體驗(yàn)了一把,但是不是開(kāi)放式的交互,而是小冰上線的“測(cè)顏值”功能。當(dāng)雷鋒網(wǎng)編輯站在小冰面前時(shí),小冰一眼認(rèn)出了我是誰(shuí)(會(huì)前有登記照片),隨后小冰看了我的正臉,又看了我的側(cè)臉,給出了顏值打分。最后,小冰還來(lái)了一個(gè)惡作劇。
小冰讓往前走,當(dāng)我走近時(shí),小冰放了一個(gè)屁(嗯。真的是屁……)果然,不管怎么升級(jí)還是惡趣味小冰。
人工智能創(chuàng)造也是小冰情感框架計(jì)算中的重要部分。我們都知道小冰會(huì)寫(xiě)詩(shī)、會(huì)唱歌、會(huì)講故事,這一些都是圍繞著人工智能創(chuàng)造的理念來(lái)發(fā)展的。
在微軟2018人工智能大會(huì)上,微軟(亞洲)互聯(lián)網(wǎng)工程研究院副院長(zhǎng)李笛曾經(jīng)分享到,現(xiàn)在多數(shù)用戶(hù)跟語(yǔ)音助手交互的時(shí)間其實(shí)不超過(guò)5秒,一般就是讓語(yǔ)音助手去執(zhí)行一項(xiàng)命令,這樣的語(yǔ)音助手其實(shí)只是像語(yǔ)音化了的遙控器。但是,小冰的團(tuán)隊(duì)希望語(yǔ)音助手能做更多的事,比如走到比較后端,去提供內(nèi)容。
5月16日,小冰發(fā)布了一首新歌“我知我新”,宣布“演唱深度學(xué)習(xí)模型完成第四次重大升級(jí)”,“今天起,人工智能首次開(kāi)始接近人類(lèi)歌手水平?!崩卒h網(wǎng)曾發(fā)文分析小冰演唱深度學(xué)習(xí)模型,第四次迭代版本有三大更新:首先,加入換氣聲自動(dòng)合成能力,歌聲與氣息融合,聽(tīng)起來(lái)更自然更有感染力。其次,第四次迭代本在在深度學(xué)習(xí)建模中增加控制的方式,字與字、音符與音符之間的過(guò)渡更加連貫順暢。最后,通過(guò)進(jìn)一步優(yōu)化的深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),以及大幅度補(bǔ)充的訓(xùn)練數(shù)據(jù),使小冰并行學(xué)習(xí)來(lái)自不同人類(lèi)歌手的演唱風(fēng)格,進(jìn)一步脫離手工參數(shù)輸入,自行完成演繹。
從“我知我新”這首歌,我們可以聽(tīng)出小冰已經(jīng)會(huì)換氣了,唱歌的咬字也很接近人類(lèi)歌手。今天的大會(huì)上,小冰團(tuán)隊(duì)演示了第三點(diǎn),小冰自動(dòng)學(xué)習(xí)不同人類(lèi)歌手的演唱風(fēng)格。
騰格爾版本的《隱形的翅膀》聽(tīng)過(guò)嗎?很是別具一格~現(xiàn)場(chǎng),小冰以騰格爾的風(fēng)格加上自己的聲線完成了《隱形的翅膀》的演唱。
也就是說(shuō),小冰能直接對(duì)一個(gè)歌手的演唱風(fēng)格進(jìn)行建模,對(duì)目標(biāo)人類(lèi)歌手個(gè)體“接近完整吸收”。小冰首席語(yǔ)音科學(xué)家欒劍打了一個(gè)比方,以后音樂(lè)軟件可以保存歌手的作品,而小冰則能保存這個(gè)歌手本人。當(dāng)然,小冰對(duì)歌手的建模都會(huì)是在獲得知識(shí)產(chǎn)權(quán)的情況下。
目前,所有的人工智能的聲音都是有人類(lèi)的來(lái)源,欒劍也暢想,再進(jìn)一步,我們能否在生產(chǎn)線中創(chuàng)造一個(gè)沒(méi)有現(xiàn)實(shí)世界溯源,只在模型中存在的“新的人類(lèi)歌手”?這一點(diǎn),小冰團(tuán)隊(duì)已經(jīng)在進(jìn)展中,將于今年冬季披露。
微軟(亞洲)互聯(lián)網(wǎng)工程院人工智能創(chuàng)造事業(yè)部副總經(jīng)理袁晶曾告訴雷鋒網(wǎng),人與人工智能聯(lián)合創(chuàng)造是微軟一直在努力的一個(gè)方向。AI進(jìn)入內(nèi)容生產(chǎn)領(lǐng)域,并不是要替代人類(lèi),而是成為人類(lèi)的助手,不僅僅是在一般的領(lǐng)域,創(chuàng)作領(lǐng)域其實(shí)也是可以做到的。其實(shí)每個(gè)人都有創(chuàng)作的欲望,只不過(guò)有些人有藝術(shù)的天分,成為了畫(huà)家、音樂(lè)人、作家,而有些人沒(méi)有這樣的能力。AI就可以幫助每個(gè)普通人,讓他們都有創(chuàng)作一些個(gè)性化的內(nèi)容的能力。
現(xiàn)在,做對(duì)話式人工智能主要有兩種思路,一種是開(kāi)放賦能,一種是自有封閉。而小冰則是處于兩者之間的Dual AI,半開(kāi)放生態(tài)環(huán)境。
小冰此前主要是封閉性地存在與微信、微博等各大平臺(tái)上,而現(xiàn)在微軟將小冰的全部能力打包開(kāi)放給中國(guó)合作伙伴,包括其整個(gè)情感計(jì)算框架。微軟小冰產(chǎn)品負(fù)責(zé)人彭爽介紹到,首先,微軟提供小冰的整體框架能力,幫助合作伙伴平臺(tái)開(kāi)發(fā)自有AI,其次,微軟小冰作為該合作平臺(tái)的輔助AI,融入該平臺(tái)生態(tài)。第三,微軟通過(guò)技術(shù)、產(chǎn)品與運(yùn)營(yíng),圍繞該合作平臺(tái)的差異化特點(diǎn),推出合作的應(yīng)用和產(chǎn)品。
也就是說(shuō),微軟小冰會(huì)是微軟的對(duì)話式人工智能的1號(hào)原型,微軟還會(huì)與合作伙伴一起打造各種各樣的“微軟小冰”。
在今天的發(fā)布會(huì)上,微軟宣布了如下合作和新產(chǎn)品(均已上線)
與網(wǎng)易音樂(lè)合作小冰電臺(tái),打造了兩個(gè)專(zhuān)屬AI人物(多多和西西),擁有該平臺(tái)上所需的特定領(lǐng)域知識(shí)。值得強(qiáng)調(diào)的一點(diǎn)是,微軟與網(wǎng)易共同為多多和西西打造不同的性格和三觀。微軟小冰產(chǎn)品總監(jiān)楊翔演示了一個(gè)有意思的示例:用戶(hù)在與多多和西西聊天時(shí),兩個(gè)AI還能一個(gè)唱白臉,一個(gè)唱紅臉,營(yíng)造出多人群聊的感覺(jué)。
網(wǎng)易新聞客戶(hù)端中的小冰,喜歡四處去評(píng)論新聞,由此對(duì)于報(bào)道自己的新聞表現(xiàn)得十分得意。兩個(gè)月前,突破1000萬(wàn)次新聞閱讀評(píng)論。
入住小米米家生態(tài)鏈Yeelight語(yǔ)音助手,這個(gè)產(chǎn)品幾個(gè)月前已經(jīng)發(fā)布,有小愛(ài)同學(xué)和小冰雙系統(tǒng)。今天,Yeelight中的小冰也全面升級(jí),能夠識(shí)別多個(gè)人并且區(qū)別對(duì)待。小冰也對(duì)接了2000萬(wàn)首音樂(lè)曲庫(kù),終于是名副其實(shí)的“音箱”了。此外,小愛(ài)同學(xué)和小冰接下來(lái)還會(huì)有更多合作。
繼續(xù)加強(qiáng)與騰訊的合作,除了已經(jīng)合作的QQ小冰以外,微軟小冰還和QQ一起創(chuàng)造了BabyQ。QQ小冰和BabyQ已經(jīng)擁有超過(guò)40項(xiàng)平臺(tái)專(zhuān)屬技能。
入駐華為手機(jī),微軟小冰開(kāi)始內(nèi)置于華為手機(jī),所有升級(jí)至智能助手8.2版本及以上的華為手機(jī)用戶(hù)都可以立刻體驗(yàn)。還特別推出了“爛筆頭小冰”功能,可以隨時(shí)用語(yǔ)音記錄和調(diào)出用戶(hù)的備忘事項(xiàng)。
微軟小冰在日本市場(chǎng)與LINE平臺(tái)緊密合作,已經(jīng)延伸到印度尼西亞等其他新興市場(chǎng),并已經(jīng)完成共同落地。
除了與大公司大平臺(tái)的合作以外,小冰在幾個(gè)垂直領(lǐng)域也取得了進(jìn)展。
2018年6月,微軟(亞洲)互聯(lián)網(wǎng)工程院成立人工智能商業(yè)事業(yè)部,旨在進(jìn)一步推動(dòng)微軟小冰在這一領(lǐng)域的積極成果。其中:
在金融領(lǐng)域的小冰金融文本生成技術(shù),與萬(wàn)得咨詢(xún)及華爾街見(jiàn)聞合作,已經(jīng)覆蓋國(guó)內(nèi)約90%金融機(jī)構(gòu)、75%經(jīng)批準(zhǔn)的合格境外投資機(jī)構(gòu)和約40%的國(guó)內(nèi)個(gè)人投資者。此前,小冰都是化名萬(wàn)小冰、華小冰,今天起將重新使用“微軟小冰”的名字。
在大眾文化領(lǐng)域,小冰的兒童有聲讀物自動(dòng)生成技術(shù)成果,已獲得超過(guò)400萬(wàn)小時(shí)的收聽(tīng)量,小冰姐姐講故事有聲讀物已經(jīng)覆蓋國(guó)內(nèi)90%以上的兒童早教機(jī)器人和80%在線收聽(tīng)平臺(tái)。
在電視臺(tái)領(lǐng)域,小冰通過(guò)人工智能技術(shù)參與生產(chǎn)與主持的電視電臺(tái)節(jié)目,已達(dá)21檔電視節(jié)目和28檔廣播電臺(tái)節(jié)目。
小冰還與微軟Bing搜索引擎技術(shù)相結(jié)合,推出了針對(duì)媒體與出版兩個(gè)垂直行業(yè)的輔助型解決方案,并已在超過(guò)15個(gè)媒體平臺(tái)落地。由小冰提供人工智能技術(shù)支持的媒體及自媒體公眾號(hào)已超過(guò)60000個(gè)。在本次發(fā)布會(huì)上,微軟宣布了可支持人工智能以多種觀點(diǎn)和角度,同時(shí)撰寫(xiě)多篇新聞文章的“白盒寫(xiě)作輔助工具”等新產(chǎn)品,并首次公布了面向出版垂直領(lǐng)域的有聲內(nèi)容、IP塑造等解決方案。
近兩年,對(duì)話式人工智能的技術(shù)得到很大的進(jìn)展,由亞馬遜Alex智能音箱帶起的智能音箱市場(chǎng)也是一片火熱,對(duì)話式人工智能開(kāi)始落地智能家居、車(chē)載、手機(jī)等多個(gè)平臺(tái)。而最早耕耘對(duì)話式人工智能的微軟,卻比競(jìng)爭(zhēng)對(duì)手們慢了一步。
2014年,微軟小冰負(fù)責(zé)人李笛在打造小冰這款產(chǎn)品時(shí),特意避開(kāi)了微軟小娜等對(duì)話式人工智能的任務(wù)型人工智能的路線,選擇把小冰打造成一款閑聊的產(chǎn)品。這幾年,小冰一直以“逗貧”少女的形象出現(xiàn),不少宅男喜歡跟她“深夜聊天”,她也不會(huì)只撩一個(gè)人。小冰很受關(guān)注,但是很多人都不看好小冰的變現(xiàn)能力。
小冰的框架一直沒(méi)變,都是在按照情感計(jì)算框架走,但是也是因?yàn)槿p工語(yǔ)音交互技術(shù)的突破,使得小冰真正實(shí)現(xiàn)了李笛和小冰團(tuán)隊(duì)對(duì)其的期望,成長(zhǎng)為現(xiàn)在這樣智商與情商兼?zhèn)涞?8歲少女。從谷歌的“Duplex”我們也感受到了全雙工一技術(shù)帶來(lái)的突破,技術(shù)的升級(jí)是商業(yè)化的基石。
現(xiàn)在,能夠?qū)崿F(xiàn)多輪對(duì)話、能夠自動(dòng)生成回復(fù)、引導(dǎo)對(duì)話走向、協(xié)助用戶(hù)完成多種任務(wù)、創(chuàng)造多種內(nèi)容的小冰終于可以大步邁向商業(yè)化了。除了各大平臺(tái)以外,我們這次看到,小冰也已經(jīng)進(jìn)入智能音箱、智能手機(jī)、車(chē)載等智能硬件,向商業(yè)化火力全開(kāi)。
看著擁有全新3D模型的小冰,你有沒(méi)有一種似曾相識(shí)的感覺(jué)?在未來(lái),她會(huì)不會(huì)像《Her》里的薩曼薩一樣同時(shí)和一萬(wàn)人談戀愛(ài)呢?
相關(guān)文章:
第五代微軟小冰發(fā)布,你不知道這位“網(wǎng)紅少女”經(jīng)歷了什么
一口氣看完微軟人工智能布局和產(chǎn)品落地 | 微軟2018人工智能大會(huì)
少女歌手小冰養(yǎng)成記:會(huì)作詞作曲演唱的人工智能的誕生
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。