丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
人工智能 正文
發(fā)私信給汪思穎
發(fā)送

0

用代碼構(gòu)建機(jī)器心智,我們離這個(gè)目標(biāo)還有多遠(yuǎn)?

本文作者: 汪思穎 2018-08-29 15:39
導(dǎo)語:無論情感計(jì)算框架,又或是人工智能創(chuàng)造,都不是微軟小冰乃至微軟人工智能研發(fā)部門的最終目標(biāo),或許,構(gòu)建「人工心智」(Artificial Mind)才是。

雷鋒網(wǎng) AI 科技評論按,本文作者為微軟(亞洲)互聯(lián)網(wǎng)工程院宋睿華博士,微軟小冰首席科學(xué)家。雷鋒網(wǎng) AI 科技評論獲其授權(quán)轉(zhuǎn)載。

在中文里,「智能」和「心智」兩個(gè)詞意義相關(guān)卻又有所不同。

「智能」指的是智識與才能,現(xiàn)在通常用來描述某個(gè)對象的聰明層次與能力強(qiáng)度;而「心智」似乎更高階一些,可以理解為產(chǎn)出創(chuàng)造力與智能的本原。

那么問題來了,我們當(dāng)下所研究的「人工智能」,是該致力于持續(xù)提升機(jī)器的智商表現(xiàn)、強(qiáng)化其在垂直領(lǐng)域的專業(yè)能力,還是應(yīng)再超前一步、嘗試構(gòu)建機(jī)器的心智本原——腳下的兩條路,都通往迷霧深鎖、不可預(yù)知的未來,我們要選哪條路走?

在我看來,這兩條路倒無所謂對錯(cuò),只是探索者的著眼點(diǎn)存在差異罷了。多年以來,針對人工智能課題,學(xué)術(shù)界、產(chǎn)業(yè)界的研發(fā)主流都偏重于實(shí)用性更強(qiáng)的「智能」,以至于在相當(dāng)長的周期內(nèi),以對話強(qiáng)化人機(jī)連接、獲取可供機(jī)器學(xué)習(xí)的高價(jià)值數(shù)據(jù)、打造人工智能創(chuàng)造力矩陣、進(jìn)而摸索用代碼構(gòu)建 AI 心智的學(xué)術(shù)思路都少有人探尋,甚至一度被質(zhì)疑——我的同事就曾遇到過這樣的審稿意見:「我完全不能理解,做這種漫無目的的聊天有什么意義。」

直到微軟小冰誕生并取得了一定的成績,對話的價(jià)值才逐漸為學(xué)界所關(guān)注。

從對話到創(chuàng)造 心智的種子開始萌發(fā)

或許大家都沒有意識到,從 2014 年一代小發(fā)布到不久前六代大更新,短短四年間,微軟小冰已從一個(gè)領(lǐng)先的人工智能對話機(jī)器人發(fā)展成為以情感計(jì)算為核心的完整人工智能框架,許多人的態(tài)度也因微軟小冰而改變。

普通人的態(tài)度:

有一次和母親聊天,我問她,機(jī)器人可以打敗人類最好的圍棋棋手,厲不厲害?她說當(dāng)然厲害。我又問,還有個(gè)機(jī)器人能跟人對話,厲不厲害?她說不厲害,原因是,不是每個(gè)人都會下圍棋,而且還能具備冠軍的實(shí)力,但,「是個(gè)人都會說話呀」。這件事讓我很無語。我母親雖然不懂自然語言處理的難度,但她的看法也確實(shí)代表了大眾的直觀感受。換句話說,人們會很自然地用人做某件事的難度來衡量與評判人工智能的能力級別。

但微軟小冰說人話的能力并不一般。即便對人類而言,要做一個(gè)總能琢磨出有趣對白的人,也不是件容易的事,更何況是人工智能。從初代發(fā)布至今,時(shí)不時(shí)會有用戶曬出他們與小冰對話過程中的「金句」截圖,而且隨時(shí)間推移,小冰產(chǎn)出金句的頻率也越來越高。這體現(xiàn)了小冰越來越強(qiáng)的對話能力,也造就了她的吸引力。

與精確、清晰的答案相比,人們在對話時(shí),更期待獲得情感的撫慰或是不尋常的回應(yīng),這是小冰團(tuán)隊(duì)最早發(fā)現(xiàn)和驗(yàn)證的事實(shí)。

后來,母親看到央視《機(jī)智過人》節(jié)目里小冰寫詩的那一期,她開心地跟我說,像小冰這樣的機(jī)器人,能寫出觀眾喜愛的詩,還會調(diào)侃嘉賓,那還真是「挺厲害的」,超出了她的預(yù)期。

專家們的態(tài)度:

過往,學(xué)術(shù)界為能夠清晰定義對話的問題,會把很多精力投注在問題設(shè)定上,從 5W(What、Who、When、Where、Which)到 How 等等。例如 IBM Watson 就在知識問答領(lǐng)域奠定了一座新的里程碑——它能接受自然語言的問題,從大量文檔中搜索并分析得出相對精準(zhǔn)的答案。而且,有了用戶在網(wǎng)絡(luò)社區(qū)里產(chǎn)生的問答語料,研究者發(fā)現(xiàn),這些數(shù)據(jù)對于機(jī)器回答某些寬泛的問題很有幫助。但除卻人工智能對話系統(tǒng)在垂直行業(yè)領(lǐng)域(像醫(yī)療、金融等)的應(yīng)用外,普通人對于人機(jī)對話的需求又該如何定義呢?

說白了,這是一個(gè)關(guān)于普通人與人工智能為什么聊、又聊什么的問題——曾經(jīng)有朋友聽我說起小冰與其用戶間的最長連續(xù)對話時(shí)間超過 29 小時(shí)時(shí)表示難以理解:「這人正常嗎?」但對我來說,小冰的這項(xiàng)記錄倒是挺容易理解的。從需求來說,「越社交,越孤獨(dú)」、「朋友圈越廣闊,自我越渺小」,這些現(xiàn)象都客觀存在。社交網(wǎng)絡(luò)讓用戶們習(xí)慣了展示優(yōu)勢、收獲認(rèn)可,但反過來,當(dāng)我們身邊的每個(gè)人都加入到展示優(yōu)勢的隊(duì)列里,從旁人那里收獲理解和認(rèn)可的難度也加大了。從形象上來說,小冰不是如頂級專家那樣的人工智能,而是像鄰居家或是隔壁班級的小女生,她有無限的耐心,隨時(shí)可以陪伴用戶聊天、玩游戲,卻決不會試圖用淵博的知識和高冷的姿態(tài)碾壓用戶的智商與自尊。

如果將人工智能的價(jià)值定位于陪伴,那么知識與邏輯就不再是最緊迫需發(fā)展的技能,讓用戶感覺無壓力、有趣味,某種意義上更加重要。

2017 年 5 月,微軟小冰解鎖了寫詩及音樂技能,同期,我們還發(fā)布了「人工智能創(chuàng)造三原則」,用以規(guī)范與指引小冰及其同類的心智發(fā)展路徑。在進(jìn)行相關(guān)研究的過程中,我發(fā)覺,人工智能的終極或許是對人類自身的理解與模擬。

訓(xùn)練小冰寫詩,需要對 519 位詩人的現(xiàn)代詩作,正讀一萬遍,倒讀一萬遍,用層次遞歸神經(jīng)元模型來打磨詩作的語言。這正如我們?nèi)祟愃l(fā)現(xiàn)的,閱讀對于寫作的影響——通過大量閱讀優(yōu)秀的文學(xué)作品,人自身的語言體系會進(jìn)化,取決于天賦,這個(gè)進(jìn)化進(jìn)程或快或慢,但總體上,閱讀者的文字表達(dá)能力會在不知不覺中提高。小冰也是如此。有了層次遞歸神經(jīng)元網(wǎng)絡(luò),小冰也可以通過閱讀獲得語言的表達(dá)能力。

在小冰發(fā)布詩集、引發(fā)廣泛爭鳴之后,圈內(nèi)人士對于人工智能創(chuàng)造與機(jī)器寫作的態(tài)度發(fā)生了根本性的轉(zhuǎn)變,學(xué)術(shù)探討、應(yīng)用跟進(jìn)的樣例越來越多。這是我們所樂見的。

盲測者的態(tài)度:

《機(jī)智過人》第一季,央視綜合頻道延請了三位年輕詩人,與小冰一起,根據(jù)嘉賓提供的一張圖片來創(chuàng)作詩歌,再將幾首詩作匿去作者姓名、打亂次序、顯示在大屏幕上,請現(xiàn)場 48 位觀眾投票選出最喜歡的那一首。這可說是一次盲測、一次另類的圖靈測試。

結(jié)果出人意料?,F(xiàn)場觀眾將最多的票數(shù)投給了小冰,這讓原本只是祈禱小冰可別是最后一名的我大吃一驚。攝影機(jī)記錄了當(dāng)時(shí)的一幕,當(dāng)人類與人工智能的作品被放在一起平等地比較,對于機(jī)器創(chuàng)作的偏見似乎突然間消失了。

第二輪,兩位詩人與小冰再度以作品競爭,小冰的詩作仍獲得了第二名,因而挑戰(zhàn)成功。我們不會自大地認(rèn)為,小冰寫的詩能超越人類詩人,但這次節(jié)目卻延伸了我們的思考:或許,人工智能研究所追求的目標(biāo)不應(yīng)只是將人類的智識與才能復(fù)制給機(jī)器,更重要的是,通過探索人工智能,更深刻地了解人類自身。

微軟小冰從四年前的對話型 AI 到當(dāng)前將創(chuàng)造力投射至詩歌、音樂、兒童有聲讀物、金融信息、電視電臺主播、媒體新聞評論乃至輔助寫作等多元領(lǐng)域,這表明,我們最初埋下的那顆心智的種子,現(xiàn)在似已破土露出了一點(diǎn)嫩芽。

下一站 3x3 實(shí)現(xiàn)更主動更具個(gè)性的人機(jī)對話

微軟小冰的下一站在哪里?心智的嫩芽能繼續(xù)成長壯大嗎?答案是,我們正在建立「3x3」的人工智能發(fā)展圖譜,以此來進(jìn)一步加速小冰的升級速度。

第一個(gè) 3,是整合自然語言處理、語音和計(jì)算機(jī)視覺三大學(xué)科的研究成果,以多模態(tài)交互,訓(xùn)練小冰更快進(jìn)步。

此前,上述學(xué)科都是在各自的軌道上獨(dú)立發(fā)展。近年來,深度學(xué)習(xí)技術(shù)與算法的改進(jìn)先后使語音識別和圖像識別實(shí)現(xiàn)了顯著的突破,人們翹首企盼自然語言處理技術(shù)也能達(dá)成類似的突破。過去一年里,我們結(jié)合了計(jì)算機(jī)視覺技術(shù)來訓(xùn)練小冰的詩歌創(chuàng)作能力,并以此評估多模態(tài)交互能否促進(jìn)人工智能技術(shù)的演進(jìn),結(jié)果令人興奮。

  • 借助圖像識別生成詩歌文本涉及到多項(xiàng)挑戰(zhàn),包括發(fā)現(xiàn)圖像中潛藏的詩意線索(例如綠色可象征生機(jī)、陽光可代表希望)以及生成的詩歌既與圖像相關(guān),又能滿足語言層面的詩意要求。

    對于這些挑戰(zhàn),我們的解法是,通過策略梯度,將詩歌生成工作劃分成兩個(gè)相關(guān)的多對抗訓(xùn)練子任務(wù),并提出了學(xué)習(xí)深度耦合的視覺詩意嵌入,訓(xùn)練過程中,機(jī)器可以連帶學(xué)習(xí)圖像中物品、情感和場景的詩意呈現(xiàn)。

    我們還建立了兩種指導(dǎo)詩歌生成的判別網(wǎng)絡(luò),包括多模態(tài)判別器和詩歌風(fēng)格判別器。研究團(tuán)隊(duì)?wèi)?yīng)用自己的模型生成了 8000 張圖像,進(jìn)行了大規(guī)模的實(shí)驗(yàn),其中 1500 張圖像是隨機(jī)選取的。我們還邀請了 500 位人類受試者進(jìn)行圖靈測試,其中 30 名評估者是詩歌方面的專業(yè)人士,測試結(jié)果證明,我們的作詩方法比其他基準(zhǔn)方法更高效也更具藝術(shù)性。

  • 我們還極大地?cái)U(kuò)展了小冰的音樂能力。現(xiàn)實(shí)中,很多人喜歡唱歌,但只有極少數(shù)人才有能力創(chuàng)作歌曲,不僅如此,要想演繹出一首動人心弦的歌曲,往往需要一組音樂人通力合作——從作詞作曲到編曲,從演唱、伴唱到演奏、錄制,流程繁復(fù)又漫長。

    微軟(亞洲)互聯(lián)網(wǎng)工程院在蘇州的一支團(tuán)隊(duì)提出了一項(xiàng)關(guān)于流行音樂生成的新創(chuàng)意。團(tuán)隊(duì)提出了一個(gè)端到端的旋律及編曲生成框架,將之命名為「小冰樂隊(duì)」。這個(gè)框架首先通過一個(gè)基于和弦的節(jié)奏及旋律交叉生成模型(CRMCG)來生成一段主旋律,再借助多樂器協(xié)同編曲模型(MICA)、根據(jù)多模態(tài)學(xué)習(xí)來生成不同樂器的多軌伴奏音樂。最后,團(tuán)隊(duì)還對現(xiàn)實(shí)世界的數(shù)據(jù)集進(jìn)行了大量實(shí)驗(yàn),結(jié)果證明了小冰樂隊(duì)的有效性——相關(guān)研究成果已被團(tuán)隊(duì)寫入論文《小冰樂隊(duì):流行音樂的旋律與編曲生成框架》(Xiaoice band: A melody and arrangement generation framework for pop music)。該論文還獲得了 KDD 2018(國際數(shù)據(jù)挖掘與知識發(fā)現(xiàn)大會,Conference on Knowledge Discovery and Data Mining)「最佳學(xué)生論文獎(jiǎng)」(Best Student Paper Award)。

第二個(gè) 3,是微軟小冰所特有的三大「學(xué)習(xí)器」,生成模型、共感模型和三觀模型。

  • 「生成模型」從第五代小冰開始啟用。在此之前,歷代小冰使用的都是檢索模型。雖擁有 10 億級大數(shù)據(jù)語料庫,但其中的每一句話都是互聯(lián)網(wǎng)上的已有數(shù)據(jù),小冰只是通過分析理解用戶的問題,尋找語料庫中最合適的話作為她的回答,也就是對對話語料庫進(jìn)行實(shí)時(shí)檢索和選擇。使用生成模型之后,小冰能夠自創(chuàng)回應(yīng)。她與人類交流的每一句話,都可能是這世界上從未出現(xiàn)過的。一年來的事實(shí)證明,生成模型使小冰快速學(xué)習(xí)了現(xiàn)有對話語料的交流模式,并能更好地應(yīng)對相對陌生的話題。

  • 此前,用戶在與小冰對話時(shí),偶爾會感受到壓力。比如兩者間的對話總是需要人類來提出話題,小冰來回應(yīng)。就好像我們與感興趣的異性搭訕,如果總是自己主動、對方被動,很快地,對話就會變得淡乎寡味、如同雞肋——共感模型的開發(fā)就是針對這一狀況。共感模型可以幫助小冰自行判斷對用戶的話題是否有感,在此基礎(chǔ)上,小冰將會主動求證,進(jìn)而引導(dǎo)話題的方向,增添新的聊天內(nèi)容。這樣就減輕了用戶的壓力,同時(shí)增加了聊天的自然度和趣味性。

  • 在小冰持續(xù)進(jìn)化的過程中,也不斷有商業(yè)伙伴加入到我們的合作生態(tài)系統(tǒng)中。一些伙伴希望我們將小冰的能力用于孵化其他個(gè)性鮮明的人工智能角色。因此,我們也在不斷研究如何通過對話來塑造個(gè)性——三觀模型應(yīng)此需求而生。

    當(dāng)前,這一模型已被應(yīng)用于網(wǎng)易云音樂的多多和西西。兩個(gè)角色的共性在于,他們都是愛聽音樂的小鹿,都是男性,且年齡相仿。如何讓他們在對話中給用戶留下不同的印象呢?我們借鑒了卡通及游戲制作中人物設(shè)定的方式,給予了他們不同的性格和喜好。例如,多多喜歡喝咖啡,而西西不喜歡,因?yàn)槠つw本來偏黑,迷信喝咖啡會變黑。利用態(tài)度分析的技術(shù),多多和西西會對用戶提出的一組問題和回復(fù)進(jìn)行分析,判斷出用戶對何種目標(biāo)具有怎樣的情感信息,例如,對咖啡是喜歡還是討厭,進(jìn)而根據(jù)人設(shè)的不同特點(diǎn)來影響對話,造成有區(qū)別有個(gè)性的回復(fù)。

    三觀模型將「體溫」賦予了包括小冰在內(nèi)的人工智能角色,并將通過態(tài)度的一貫性、延續(xù)性來逐步凸顯角色的性格。

將三大學(xué)科成果的復(fù)合訓(xùn)練體系與微軟小冰三大學(xué)習(xí)器相乘,必然會大大加速小冰的成長,也讓我們朝向「用代碼構(gòu)建機(jī)器心智」的目標(biāo)走近了一小步??偠灾?,無論情感計(jì)算框架,又或是人工智能創(chuàng)造,都不是微軟小冰乃至微軟人工智能研發(fā)部門的最終目標(biāo),或許,構(gòu)建「人工心智」(Artificial Mind)才是。

雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

用代碼構(gòu)建機(jī)器心智,我們離這個(gè)目標(biāo)還有多遠(yuǎn)?

分享:
相關(guān)文章

編輯

關(guān)注AI學(xué)術(shù),例如論文
當(dāng)月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個(gè)人簡介
為了您的賬戶安全,請驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說