1
本文作者: 王金旺 | 2019-08-15 19:23 | 專題:全面突破 vivo NEX |
縱觀人工智能領(lǐng)域當下戰(zhàn)局,無論是國外的微軟、谷歌、亞馬遜,還是國內(nèi)的BAT,都很注重自己的人工智能操作系統(tǒng)或人工智能引擎的開發(fā)、迭代,人工智能引擎也越來越多被應用到諸如消費電子、媒體影音、工業(yè)設(shè)計等領(lǐng)域。
其中,微軟小冰作為微軟在人工智能領(lǐng)域的重點培養(yǎng)對象,也已經(jīng)走過五個年頭,并在文本、語音、視覺這已知的三大技術(shù)領(lǐng)域小有所成,今年微軟對外更多在講的是微軟小冰的繪畫模型(畫家小冰),甚至為小冰在中央美術(shù)學院辦了“個人”畫展。雷鋒網(wǎng)此前也就微軟小冰的繪畫模型的相關(guān)技術(shù)問題與微軟(亞洲)互聯(lián)網(wǎng)工程院副院長、微軟小冰全球產(chǎn)品線負責人李笛進行了深度交流(參見雷鋒網(wǎng)此前報道《微軟李笛:為什么說畫家小冰是最艱難的一次養(yǎng)成?》),也窺探了些許微軟小冰的研發(fā)及商用進程和思路。
8月15日,第七代微軟小冰發(fā)布會在北京召開,會上微軟官方公布了第七代微軟小冰技術(shù)框架的能力升級,主要公布了Dual AI、AI Creation、新技術(shù)突破、新框架發(fā)布,以及商業(yè)化進展五個方面的最新進展。
發(fā)布會上,首先登臺的是微軟全球資深副總裁、微軟(亞洲)互聯(lián)網(wǎng)工程院院長王永東,王永東首先強調(diào),微軟發(fā)布的內(nèi)容都是已經(jīng)上線的產(chǎn)品和合作。
其次,王永東拋出了開場甜點:微軟小冰與閱文集團合作,在學習了《全職高手》原著的文字,重建了小說中的世界觀和知識體系,并基于此進行了擴展和補充后,并通過建立知識圖譜創(chuàng)造了五位主人公的在線實體。據(jù)官方表示,這樣的在線實體也具有AI模型所具有的在交互中不斷迭代的能力。
基于此,微軟官方也表示,微軟小冰與閱文集團的合作內(nèi)容已經(jīng)擴大到100部作品主人公。
這也被王永東稱為有史以來最大規(guī)模將小說中人物進行賦能的計劃。
隨后上臺的全球執(zhí)行副總裁、微軟人工智能事業(yè)部及微軟全球研究院負責人沈向洋進行了此次微軟小冰關(guān)鍵技術(shù)能力發(fā)布,沈向洋首先回顧了微軟小冰的技術(shù)迭代及思考過程:
第一代,微軟小冰是基于文本、基于搜索簡單的對話能力,當時主要在思考人工智能是走“爆款硬件”,還是走“技術(shù)框架”的道路;
第二代,我們認識到小冰需要有更多落地場景需要學習;
第三代,我們認識到小冰需要有不同的感官,需要加入語音、機器視覺的相關(guān)技術(shù);
第四代,我們認識到知識圖譜的重要性,只有通過知識圖譜才能做更多IQ方面的嘗試;
第五代,這一代是我們的一個轉(zhuǎn)折點,我們開始做深層次模型、全雙工、人工智能創(chuàng)造的相關(guān)思考及工作;
第六代,框架逐漸成熟;
第七代,今天發(fā)布的是第七代,這也將會有更強勁的質(zhì)的飛躍。
沈向洋將小冰及其框架的具體發(fā)展過程比喻成森林和樹木的一個關(guān)系:人工智能向前走需要一個框架,這個框架就是一片廣闊的土地,在這片土地上可以有森林,小冰只是這片森林中的一棵大樹。這棵大樹主要是為了驗證這一框架的可行性,之后將會是技術(shù)賦能。
對于小冰的發(fā)展,沈向洋認為主要經(jīng)歷了關(guān)鍵三步:
第一步,做這樣小冰的人工智能,迅速融入各類環(huán)境,能夠為大家接受;
第二步,迅速獲得用戶喜愛,可以和用戶進行交流;
第三步,持續(xù)迭代和演化,持續(xù)的發(fā)展能力。
此外,據(jù)沈向洋介紹,目前已經(jīng)有4.5億臺第三方智能硬件搭載微軟小冰。
發(fā)布會上,微軟首先介紹的是Dual AI的生態(tài)擴展。
微軟小冰產(chǎn)品負責人彭爽介紹稱,這一框架是一個半開放的生態(tài)。此外,微軟小冰除去此前公布的融入華為、小米的智能手機及智能音箱等產(chǎn)品中,擴展到小米有屏幕音箱上以外,具體有以下幾點生態(tài)邊界擴展:
在智能手機方面,此次進一步有vivo和OPPO兩大品牌加入,這也使得微軟小冰在國內(nèi)集齊了智能手機領(lǐng)域華為、小米、vivo、OPPO四大頭部品牌;
在社交網(wǎng)絡(luò)系統(tǒng)方面,微軟小冰在日本與LINE平臺進行合作,在國內(nèi)與QQ不斷合作,發(fā)布會上官宣,小冰已進入3000萬個QQ群。此外,微軟小冰進一步宣布與微信合作,具體與騰訊小微展開兩方面合作:
第一,與微信AI小微就對話開方平臺能力進行合作;
第二,與微信AI涉及的智能硬件產(chǎn)品上展開合作。
內(nèi)容咨詢平臺方面,除網(wǎng)易、新浪外,再次與今日頭條合作,可以為人類發(fā)布內(nèi)容留言,與人類進行交互。
電視電臺方面,截止上個月末,微軟小冰已經(jīng)覆蓋中國及日本50家電臺/電視臺,69檔節(jié)目,累計已參與播出時長為6908小時,今年生產(chǎn)時長是去年的2.05倍。
在此過程中,沈向洋總結(jié)時特別強調(diào),微軟小冰從交互到交流也將是其不斷發(fā)展的一個方向。
去年7月微軟成立了小冰工作室,小冰首席科學家宋睿華將小冰工作室定義為一個系統(tǒng)性地對人類創(chuàng)造力建模的人工智能平臺。在發(fā)布會上,宋睿華也進一步公布了小冰工作室的最新動態(tài),而這樣的最新動態(tài)也主要是基于文本、語音、視覺三方面技術(shù)能力的拓展。
在演唱模型方面,“微軟小冰在擁有越來越多接近人類嗓音的能力后,逐漸向技巧和風格化邁進?!爆F(xiàn)場,微軟官方現(xiàn)場編號為F10的微軟小冰以「民謠+戲曲」風格的聲音演示了曉月老板的《少年弦》,以「音樂劇+High C」演示了周杰倫的牛仔很忙。
微軟小冰的人工智能的創(chuàng)造能力可以復制,一個模型學會后,多個模型可以復制該能力。
宋睿華介紹,人工智能創(chuàng)造更接近內(nèi)容生產(chǎn)角色,滿足未來高度定制化的用戶需求。
文本及視覺能力方面,據(jù)宋睿華在發(fā)布會上介紹稱,中信出版社將出版小冰的第一部繪畫作品集。
我們希望將人工智能創(chuàng)造上升到內(nèi)容生產(chǎn)領(lǐng)域,這也是我們看到的未來時代發(fā)展趨勢。
宋睿華在大會上進一步解釋,未來需要定制化的內(nèi)容,但是由于人類創(chuàng)作者難以實現(xiàn)高并發(fā)性,從內(nèi)容生產(chǎn)源頭做高度定制化不現(xiàn)實,人工智能有可能是解決這一矛盾的唯一方案。
微軟的人工智能創(chuàng)造模型來源于其小冰工作室的「AI Creation模型庫」,基于此實現(xiàn)在人力不參與的情況下實現(xiàn)高并發(fā)內(nèi)容的創(chuàng)造和分發(fā)。
據(jù)微軟官方表示,目前微軟已經(jīng)實現(xiàn)兒童故事生產(chǎn)線,并交付給當當云閱讀,為聯(lián)通沃音樂平臺交付了作詞作曲生產(chǎn)線,與中國紡織工業(yè)聯(lián)合會共同搭建了服裝紋樣設(shè)計生產(chǎn)線并在發(fā)布會上正式公布上線。
宋睿華在發(fā)布會上特別強調(diào)了兒童故事生產(chǎn)線,“微軟小冰以「文本+聲音+視覺+實體搜索」技術(shù)能力為基礎(chǔ)構(gòu)建了「可交互有聲繪本」,只要上傳文本就可以生成類似劇本的有聲繪本。”
在介紹微軟小冰新技術(shù)能力突破時,小冰技術(shù)負責人周力首先上臺表示,“我們不僅僅是為了打造一個微軟小冰這樣一個少女模型,而更在于其背后技術(shù)框架的能力提升?!?/p>
當AI在對話過程中處在平等或主導的地位時,人類反而能夠獲得更豐富的信息,人機對話也更有價值,這其中EQ起到關(guān)鍵作用。
第一,在核心對話引擎上,微軟小冰的對話引擎此次實現(xiàn)了“平等對話”向“主導對話”方向的跨越,主要表現(xiàn)為第七代微軟小冰已經(jīng)可以預先籌劃未來對話,以在各種場合中主導對話走向。
如下圖所示,當小冰在第四輪開啟主導對話能力時,亮粉色的標記為小冰嘗試主導對話,可以預先判斷整個對話未來的若干走向,根據(jù)人類真實反映引導進入不同對話分支。第四輪到第十五輪整個對話過程由AI主導,“這也使得直男從最初不會聊天,到之后可以獲得更多有用信息”。
這一能力被微軟應用到在線零售場景中,官方表示,擁有主導對話在線推薦能力的在線零售場景的應用中,實現(xiàn)了零投訴的推銷。
第二,在全雙工語音交互技術(shù)上,繼電話、智能音箱后,微軟進一步將其拓展到汽車應用領(lǐng)域。
通過車載設(shè)備,我們已經(jīng)在一些車型上測試,同時希望可以在5G普及后,提升微軟小冰全雙工在汽車上的落地普及。
第三,去年微軟小冰多模態(tài)感官的Demo如今已經(jīng)完成公開測試。微軟小冰多模態(tài)感官是一種融合了全雙工語音、實時視覺與核心對話引擎的交互感官。今年2月通過安卓手機上的APP在日本邀請媒體進行了測試。
微軟(亞洲)互聯(lián)網(wǎng)工程院副院長、小冰團隊總負責人李笛上臺介紹稱,Avatar Framework是小冰今年最大的一個飛躍。
首先,李笛解釋了微軟對人工智能的理解:對于人工智能諸如助理的定義可能會比較粗糙,微軟將其定義為AI beings,目前主要包括四類角色:
助理,從屬于某個特定人類,幫助人類實現(xiàn)某種用途或價值;
替身,某個特定人類授權(quán)其代為完成相應工作;
參與者,小冰在QQ群里作為參與者的出現(xiàn),這類應用不從屬于某個特定人類,而是作為參與者與人類進行交互;
創(chuàng)造者,不直接與人類進行交互,而是通過AI衍生物與人類交互。
Avatar Framework被微軟定義為一個可以孵化各種AI beings的通用架構(gòu)。簡言之,Avatar Framework提供的是一套工具包,此次公布的首個工具包版本關(guān)鍵信息如下:
該工具包與微軟小冰框架同源,可構(gòu)建具有完整情感計算能力的人工智能助手、社交對話機器人、人工智能內(nèi)容創(chuàng)作和IP人物角色等;
該工具包包含對話、聲音、視覺、觀點、技能、知識及創(chuàng)造力等豐富工具,并可驅(qū)動兼容的3D人物模型進行實時交互;
在本次發(fā)布前,微軟已通過Avatar Framework框架賦能軟銀Pepper等數(shù)十個第三方客戶AI,以及微軟小冰自身。本次發(fā)布會宣布了微軟與閱文集團針對100部小說主人公IP的合作;
本次發(fā)布的Avatar Framework V1版本是面向全部合作伙伴及客戶的版本。面向個人使用者的版本預計將于2020年春季發(fā)布。
據(jù)官方介紹,Profile工具是Avatar Framework的基礎(chǔ),通過Profile構(gòu)建一個AI being的人格主要分為三步:
第一步,填入76項基礎(chǔ)信息,微軟官方還特別強調(diào),這一步驟支持通過批量上傳文本信息,自動分析文本內(nèi)容的知識圖譜,從中抽取基本信息;
第二步,設(shè)置27項性格特征參數(shù),例如這一階段如果將嚴肅程度調(diào)得很低,將自信程度調(diào)得很高,就可能打造出比較受小朋友歡迎的智能助理;
原型是一切的基礎(chǔ),性格是原型的關(guān)鍵,這主要是因為一個AI being的性格參數(shù)決定了其創(chuàng)造、提供服務時候態(tài)度及傾向。
第三步,設(shè)置AI being喜歡或討厭的話題類型和客觀事物。
以上三步完成AI being的人格定義后,后續(xù)所有工具會在Profile中得到初始數(shù)據(jù),訓練結(jié)果也會反饋影響到初始數(shù)據(jù)值。
隨后通過對話工具、聲音工具、視覺工具實現(xiàn)相應能力設(shè)置。此外,可以通過輸入兼容的3D模型,可以形成可視模型,具體3D模型兼容性要求如下圖左圖所示:
用微軟此次發(fā)布的工具驅(qū)動3D模型主要分為四步:使用推薦3D模型或?qū)胄碌?D模型,設(shè)計宏觀動作風格,設(shè)計標志性動作,設(shè)置面部表情的豐富度。具體信息設(shè)置完成后,還可以根據(jù)此前人設(shè)定義自動匹配相關(guān)參數(shù),此外還可以手動調(diào)整相關(guān)參數(shù)。
去年開始進行商業(yè)化,經(jīng)過一年的發(fā)展,微軟人工智能創(chuàng)造及商業(yè)事業(yè)部總經(jīng)理、小冰團隊商業(yè)負責人徐元春在發(fā)布會上揭秘了當下進程。
微軟小冰的商業(yè)模式到底是什么樣呢?
據(jù)微軟官方表示,目前微軟小冰已落地的商業(yè)客戶覆蓋金融、零售、汽車、地產(chǎn)、紡織等十個領(lǐng)域,客戶包括萬科、萬得資訊、萬事利、中國聯(lián)通等。
徐元春在發(fā)布會上也舉例進行了說明:
資訊領(lǐng)域,去年微軟利用AI Creation文本生成技術(shù),幫助萬得進行滬深兩市上市企業(yè)的公告摘要,目前這個系統(tǒng)已經(jīng)準確和穩(wěn)定的運行超過21個月,從最開始面向機構(gòu)投資者的長摘要拓展到面向個人投資者的短摘要,覆蓋了從系統(tǒng)服務到應用服務的全方位領(lǐng)域;
金融領(lǐng)域,我們和合作伙伴一起開發(fā)了金融電臺產(chǎn)品,通過這個產(chǎn)品,可以讓摘要和財經(jīng)信息即時、高質(zhì)量、24小時不間斷的通過語音輸出給機構(gòu)投資者和個人用戶;
知識產(chǎn)權(quán)領(lǐng)域,我們和青島出版社合作,利用語音合成技術(shù),通過版權(quán)的雙向授權(quán),開發(fā)了全新系列的兒童讀物《小紅馬》;
紡織領(lǐng)域,我們和中國紡織信息中心、國家紡織品開發(fā)中心推出了面向中小型紡織企業(yè)的AI設(shè)計平臺,這個設(shè)計平臺集成了流行趨勢預測、大數(shù)據(jù)、AI設(shè)計模塊,能夠完整的滿足一個中小型企業(yè)在AI設(shè)計領(lǐng)域全部的技術(shù)訴求;
音樂領(lǐng)域,我們與聯(lián)通沃音樂的合作,通過允許沃音樂在平臺層面集成我們的AI作詞、作曲、編曲,以及其它音樂生成的能力,同時結(jié)合運營商的能力和海量的音樂數(shù)據(jù)庫,以及其他合作伙伴模塊,共同打造了完整和獨立的音樂平臺,這個音樂平臺可以為幾億用戶同時提供100%的音樂定制內(nèi)容生產(chǎn)的能力。
人工智能進程中,技術(shù)進入迭代期、商業(yè)化探索仍在繼續(xù)
從第七代微軟小冰的能力更新,雷鋒網(wǎng)也看到,微軟小冰在技術(shù)上已經(jīng)覆蓋了當下可見的文本、語音、視覺三方面,此次發(fā)布更多強調(diào)的是能力的迭代升級、合作廠商的進一步拓展、架構(gòu)的開放應用,以及人工智能的商業(yè)化探索與進程。
人工智能似乎離我們很遠,我們走在城市街道上仍難以看到網(wǎng)上盛傳的配送機器人,多數(shù)人家中也沒有新聞中看到的高逼格的智能家居系統(tǒng),當下的人機交互方式仍以觸屏為主;人工智能似乎又離我們很近,你聽到的電臺主持人可能已經(jīng)是人工智能系統(tǒng),您看到的即時新聞也有可能是人工智能系統(tǒng)所生產(chǎn),人工智能也逐漸滲透到城市監(jiān)控、工業(yè)生產(chǎn)、教育體系等你可能還不曾關(guān)注的領(lǐng)域。
一切都未必如期而至,但一切都在進程中。
相關(guān)文章:
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。