丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
人工智能學(xué)術(shù) 正文
發(fā)私信給camel
發(fā)送

1

國(guó)內(nèi)首發(fā)Nature子刊 Machine Intelligence論文:思想精妙,或?qū)NN有重大改進(jìn)!

本文作者: camel 2019-08-10 08:48
導(dǎo)語(yǔ):思想精妙且深刻!

雷鋒網(wǎng)AI科技評(píng)論按:昨晚,Nature子刊 Machine Intelligence發(fā)布了八月份最新接收論文,共 4 篇。其中兩篇來(lái)自國(guó)內(nèi),一篇是清華生命學(xué)院龔海鵬和澳大利亞格里菲斯大學(xué)周耀旗等人用神經(jīng)網(wǎng)絡(luò)進(jìn)行蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)方面的工作;另一篇?jiǎng)t是中科院自動(dòng)化所余山團(tuán)隊(duì)對(duì)深度神經(jīng)網(wǎng)絡(luò)在連續(xù)學(xué)習(xí)方面的改進(jìn)工作。

雷鋒網(wǎng)這里介紹后者。值得一提的是,這兩篇文章也是國(guó)內(nèi)學(xué)者在NMI期刊上首次的發(fā)表。


國(guó)內(nèi)首發(fā)Nature子刊 Machine Intelligence論文:思想精妙,或?qū)NN有重大改進(jìn)!

這篇文章提出了兩個(gè)極為有意思且深刻的概念:

  • 正交權(quán)重修改(orthogonalweights modification,OWM)算法;

  • 情境依賴處理(context-dependent processing,CDP)模塊。

其思想極為精妙,或?qū)?DNN 有重大改進(jìn)。我們一起來(lái)看!


1、何為智能?

在講解這篇論文的核心內(nèi)容之前,需要我們先思考一個(gè)問(wèn)題,即:何為"智能"?想必每個(gè)人都會(huì)有自己的一個(gè)定義。

圖靈獎(jiǎng)得主Allen Newell和諾貝爾獎(jiǎng)得主Herbert A. Simon曾經(jīng)聯(lián)合撰文將智能定義為"適應(yīng)環(huán)境變化,實(shí)現(xiàn)自身目的"。DeepMind的聯(lián)合創(chuàng)始人之一Shane Legg總結(jié)了數(shù)十種智能的定義,提出智能的通用衡量指標(biāo)應(yīng)該是在不同的環(huán)境中實(shí)現(xiàn)特定目的的能力。從這些定義可見,個(gè)體對(duì)復(fù)雜、動(dòng)態(tài)環(huán)境的高適應(yīng)性是智能的重要標(biāo)志;根據(jù)對(duì)環(huán)境變化的適應(yīng)能力來(lái)評(píng)估智能水平也是不同領(lǐng)域?qū)W者較為統(tǒng)一的共識(shí)。

人類大腦顯然是高環(huán)境適應(yīng)性的典范。人不僅可以在新的環(huán)境中不斷吸收新的知識(shí),而且可以根據(jù)不同的環(huán)境靈活調(diào)整自己的行為。在此方面,目前廣泛使用的深度神經(jīng)網(wǎng)絡(luò)(deep neural networks,DNN)與大腦相比則存在著很大的差距。

目前DNN的優(yōu)點(diǎn)是可以建立輸入輸出之間非常復(fù)雜的映射關(guān)系,用于識(shí)別、分類和預(yù)測(cè)。但是一旦學(xué)習(xí)階段結(jié)束,它所能做的操作就固化了,既難以方便的學(xué)習(xí)新的映射,也不能對(duì)實(shí)際環(huán)境中存在情境信息(比如自身狀態(tài),環(huán)境變化、任務(wù)變化等)做出靈活的響應(yīng),難以滿足復(fù)雜多變的需求,即缺少情境依賴學(xué)習(xí)(contextual-dependent learning)的能力。此外傳統(tǒng)的DNN也受到“災(zāi)難性遺忘"問(wèn)題的困擾,難以在學(xué)習(xí)新知識(shí)的同時(shí)保留舊知識(shí),即缺少連續(xù)學(xué)習(xí)(continual learning)的能力。這兩方面能力的缺失是制約當(dāng)前DNN發(fā)展出高水平智能的重要瓶頸。

余山等人這個(gè)工作的初衷正是對(duì)于上述DNN的能力局限提出的改進(jìn)方案。OWM算法從本質(zhì)上來(lái)說(shuō)是一個(gè)非常古老的算法 (甚至可以追溯到高斯的時(shí)代),即RLS算法,它具有緩解“災(zāi)難遺忘”的能力。余山等人在論文中研究了RLS算法的機(jī)制并對(duì)此加以改進(jìn)從而得到OWM算法。而CDP模塊則是受人腦中前額葉的作用及其連接模式的啟發(fā)。前額葉接受眾多的感覺輸入,然后根據(jù)情境信息選擇與當(dāng)前任務(wù)最為相關(guān)的信息用于控制行為。CDP模塊也正是這樣設(shè)計(jì)的。


2、OWM算法

OWM算法的核心思想很簡(jiǎn)單,正如其名“正交權(quán)重修改”,在學(xué)習(xí)新任務(wù)時(shí),只在舊任務(wù)輸入空間正交的方向上修改神經(jīng)網(wǎng)絡(luò)權(quán)重。如此,權(quán)重增量幾乎不與以往任務(wù)的輸入發(fā)生作用,從而保證了網(wǎng)絡(luò)在新任務(wù)訓(xùn)練過(guò)程中搜索到的解,仍處在以往任務(wù)的解空間中。數(shù)學(xué)上,OWM通過(guò)正交投影算子P與誤差反傳算法得到的權(quán)重增量國(guó)內(nèi)首發(fā)Nature子刊 Machine Intelligence論文:思想精妙,或?qū)NN有重大改進(jìn)!作用來(lái)實(shí)現(xiàn)其目的,即最終的權(quán)重增量國(guó)內(nèi)首發(fā)Nature子刊 Machine Intelligence論文:思想精妙,或?qū)NN有重大改進(jìn)!,這里k為系數(shù)。


國(guó)內(nèi)首發(fā)Nature子刊 Machine Intelligence論文:思想精妙,或?qū)NN有重大改進(jìn)!

圖1:OWM算法原理示意圖。(a): 在權(quán)重更新時(shí),OWM算法只保留傳統(tǒng)BP算法計(jì)算的權(quán)重增量中與歷史任務(wù)輸入空間正交的部分。(b): 在新任務(wù)中,OWM算法將神經(jīng)網(wǎng)絡(luò)對(duì)解的搜索范圍約束在舊任務(wù)的解空間中。

OWM算法實(shí)現(xiàn)了對(duì)網(wǎng)絡(luò)中已有知識(shí)的有效保護(hù),并可以與現(xiàn)有梯度反傳算法完全兼容,在連續(xù)學(xué)習(xí)測(cè)試任務(wù)中表現(xiàn)出了良好的性能。

國(guó)內(nèi)首發(fā)Nature子刊 Machine Intelligence論文:思想精妙,或?qū)NN有重大改進(jìn)!

圖2:在連續(xù)學(xué)習(xí)MNIST手寫體數(shù)字0-9的任務(wù)中,隨著任務(wù)數(shù)目的增加,OWM算法的優(yōu)勢(shì)也愈加明顯。同時(shí),任務(wù)的學(xué)習(xí)順序會(huì)對(duì)個(gè)別任務(wù)產(chǎn)生影響。如先學(xué)數(shù)字4和7,會(huì)顯著提升數(shù)字9的識(shí)別正確率。

在連續(xù)學(xué)習(xí)的標(biāo)準(zhǔn)任務(wù)disjoint MNIST與shuffled MNIST任務(wù)中,OWM算法的表現(xiàn)超過(guò)了同類的其他算法。并且,隨著學(xué)習(xí)的任務(wù)數(shù)目增加,OWM算法的性能優(yōu)勢(shì)會(huì)進(jìn)一步加大。

國(guó)內(nèi)首發(fā)Nature子刊 Machine Intelligence論文:思想精妙,或?qū)NN有重大改進(jìn)!

圖3:OWM算法在ImageNet和中文手寫體漢字識(shí)別的連續(xù)學(xué)習(xí)任務(wù)上體現(xiàn)出優(yōu)良的性能

利用OWM算法,神經(jīng)網(wǎng)絡(luò)可以連續(xù)學(xué)習(xí)識(shí)別ImageNet的1000類圖片和3755個(gè)中文手寫體漢字(每個(gè)任務(wù)僅訓(xùn)練一類圖片或一個(gè)漢字)。

國(guó)內(nèi)首發(fā)Nature子刊 Machine Intelligence論文:思想精妙,或?qū)NN有重大改進(jìn)!

圖4:OWM實(shí)現(xiàn)漢字識(shí)別的小樣本連續(xù)學(xué)習(xí)

值得一提的是,算法具有優(yōu)良的小樣本學(xué)習(xí)能力,以手寫體漢字識(shí)別為例,基于預(yù)訓(xùn)練的特征提取器,系統(tǒng)可以從僅僅數(shù)個(gè)正樣本中就能連續(xù)的學(xué)習(xí)新的漢字。

3、CDP模塊

CDP模塊則是受前額葉皮層啟發(fā)提出的。前額葉是大腦中負(fù)責(zé)認(rèn)知控制的核心皮層。其同時(shí)接收感官輸入和情境信號(hào),并選擇與當(dāng)前任務(wù)最相關(guān)的感官信號(hào)指導(dǎo)輸出響應(yīng)。受此啟發(fā),作者引入了類似的處理架構(gòu)—CDP模塊。

國(guó)內(nèi)首發(fā)Nature子刊 Machine Intelligence論文:思想精妙,或?qū)NN有重大改進(jìn)!

圖5:類前額葉的CDP模塊的結(jié)構(gòu)設(shè)計(jì)。左上角是其工作原理示意圖。

它包括兩個(gè)子模塊:1、編碼子模塊,其負(fù)責(zé)將情境信息編碼為適當(dāng)?shù)目刂菩盘?hào);2、“旋轉(zhuǎn)”子模塊,其利用編碼模塊的控制信號(hào)處理任務(wù)輸入(由于其功能上相當(dāng)于將特征向量在高維空間上進(jìn)行了旋轉(zhuǎn),故稱為“旋轉(zhuǎn)”子模塊)。

若將CDP模塊與OWM算法聯(lián)合使用,神經(jīng)網(wǎng)絡(luò)只需要一個(gè)分類器,就可以連續(xù)學(xué)習(xí)40種不同的臉部特征的識(shí)別任務(wù)。

國(guó)內(nèi)首發(fā)Nature子刊 Machine Intelligence論文:思想精妙,或?qū)NN有重大改進(jìn)!

圖6:同一個(gè)分類器對(duì)于同樣的輸入,連續(xù)學(xué)習(xí)40種不同人臉屬性的分類任務(wù)(藍(lán)色數(shù)據(jù)點(diǎn)),正確率與用40個(gè)分類器的系統(tǒng)(橙色線)幾乎一致。

并且,當(dāng)不同的提示信號(hào)出現(xiàn)時(shí),其對(duì)相應(yīng)的特征做出判斷,效果與引入40個(gè)分類器的情況相當(dāng)。

通過(guò)OWM算法有效克服災(zāi)難性遺忘,通過(guò)CDP模塊實(shí)現(xiàn)單個(gè)網(wǎng)絡(luò)基于情境信號(hào)的多任務(wù)學(xué)習(xí),二者結(jié)合便有望讓智能體通過(guò)連續(xù)不斷的學(xué)習(xí)去適應(yīng)復(fù)雜多變的環(huán)境,從而逐步逼近更高水平的智能。

4、發(fā)表

人們或許還記得,Nature的這個(gè)子刊Machine Intelligence在去年4月份曾遭到了幾乎整個(gè)AI社區(qū)人們的反對(duì),包括Jeff Dean、Ian Goodfellow、Yann LeCun、Yoshua Bengio等一眾AI大牛的簽名聯(lián)合抵制,因?yàn)樗麄冋J(rèn)為機(jī)器學(xué)習(xí)社區(qū)歷來(lái)有開放訪問(wèn)的傳統(tǒng),而 NMI采取付費(fèi)閱讀的形式是開歷史的倒車。

NMI雜志對(duì)此采取了多種方式做出了回應(yīng),包括在論文的頁(yè)面上直接顯示 arXiv 網(wǎng)址,提供免費(fèi)的全文瀏覽鏈接,并鼓勵(lì)作者通過(guò)包括社交媒體在內(nèi)的多種渠道提供給公眾。

2019年1 月份,NMI正式上線。從已經(jīng)發(fā)表的論文看, NMI接收的論文有關(guān)于機(jī)器學(xué)習(xí)理論與方法的研究,有人工智能應(yīng)用于其它領(lǐng)域的研究,也有人工智能的發(fā)展對(duì)于社會(huì)、倫理等方面影響的研究。NMI每月一期,發(fā)表研究文章數(shù)量只有2-4篇。這樣的發(fā)文量使得其文章比較容易被同行注意到,因此相比于傳統(tǒng)的各種頂會(huì)和期刊,它是一個(gè)可見度較高的平臺(tái)。另外作為一個(gè)新雜志,NMI比較注重交叉學(xué)科的研究,雜志除主編以外的三位編輯都具有神經(jīng)科學(xué)背景,這與傳統(tǒng)的頂會(huì)、期刊也完全不同。

據(jù)余山介紹,他們之所以選擇投遞NMI,也正是出于此種考慮,因?yàn)樗麄兊墓ぷ鞅举|(zhì)上是受到腦啟發(fā)的研究,所以NMI是一個(gè)合適的平臺(tái)。論文從投稿到接收大約花了半年時(shí)間。

不過(guò)這并不是OWM算法和CDP模塊的首次曝光。事實(shí)上,這個(gè)工作從2017年底便已開始,并于2018年國(guó)際大學(xué)生類腦計(jì)算大賽中獲得30萬(wàn)獎(jiǎng)金的創(chuàng)新特等獎(jiǎng)。

國(guó)內(nèi)首發(fā)Nature子刊 Machine Intelligence論文:思想精妙,或?qū)NN有重大改進(jìn)!

自動(dòng)化所獲獎(jiǎng)代表

(左起:余山、曾冠雄、陳陽(yáng))

之后他們又經(jīng)過(guò)一系列的改進(jìn)和完善,包括對(duì)算法性能的理論分析,以及對(duì)于CDP模塊的進(jìn)一步優(yōu)化設(shè)計(jì)等,最終才發(fā)表在NMI。

余山介紹說(shuō),這個(gè)工作的共同的第一作者是曾冠雄和陳陽(yáng)。前者今年六月份剛剛碩士畢業(yè);而后者參與該項(xiàng)工作時(shí)還是博士后,現(xiàn)已經(jīng)成為自動(dòng)化所的助理研究員。在該項(xiàng)工作中,曾冠雄負(fù)責(zé)了所有的程序?qū)崿F(xiàn),并提出了CDP模塊的計(jì)算方法和理論解析。陳陽(yáng)則對(duì)OWM算法的機(jī)理做了深入的理論分析,也為其他幾個(gè)關(guān)鍵問(wèn)題的解決做出了貢獻(xiàn)。另一作者是博士生崔波,也參與了其中一些分析和計(jì)算工作。而余山作為指導(dǎo)老師,自謙道“我主要的作用是提出類腦的思路,然后在遇到瓶頸和困難的時(shí)候給大家打氣?!?/p>

欲更加詳細(xì)了解OWM和CDP的精妙,可參見

1)NMI原文: https://www.nature.com/articles/s42256-019-0080-x

2)或這里也有份免費(fèi)全文預(yù)覽: https://rdcu.be/bOaa3


雷鋒網(wǎng)注:本文參考“余山課題組在類人連續(xù)學(xué)習(xí)及情境依賴學(xué)習(xí)方面取得重要進(jìn)展

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

國(guó)內(nèi)首發(fā)Nature子刊 Machine Intelligence論文:思想精妙,或?qū)NN有重大改進(jìn)!

分享:
相關(guān)文章
當(dāng)月熱門文章
最新文章
請(qǐng)?zhí)顚懮暾?qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說(shuō)