0
本文作者: 汪思穎 | 2017-11-14 16:59 |
雷鋒網(wǎng) AI科技評論按,伴隨著最近幾年的機(jī)器學(xué)習(xí)熱潮,遷移學(xué)習(xí) (Transfer Learning)也成為目前最炙手可熱的研究方向。遷移學(xué)習(xí)強(qiáng)調(diào)通過不同領(lǐng)域之間的知識遷移,來完成傳統(tǒng)機(jī)器學(xué)習(xí)較難完成的任務(wù)。它是解決標(biāo)定數(shù)據(jù)難獲取這一基礎(chǔ)問題的重要手段,也是未來更好地研究無監(jiān)督學(xué)習(xí)的重要方法。
在近日雷鋒網(wǎng) AI研習(xí)社的公開課上,來自中國科學(xué)院計算技術(shù)研究所的在讀博士王晉東帶來了題為《遷移學(xué)習(xí)的發(fā)展和現(xiàn)狀》的分享。
王晉東,現(xiàn)于中國科學(xué)院計算技術(shù)研究所攻讀博士學(xué)位,研究方向?yàn)檫w移學(xué)習(xí)和機(jī)器學(xué)習(xí)等。他在國際權(quán)威會議ICDM、UbiComp等發(fā)表多篇文章。同時,也是知乎等知識共享社區(qū)的機(jī)器學(xué)習(xí)達(dá)人(知乎用戶名:王晉東不在家)。他還在Github上發(fā)起建立了多個與機(jī)器學(xué)習(xí)相關(guān)的資源倉庫,成立了超過120個高校和研究所參與的機(jī)器學(xué)習(xí)群,熱心于知識的共享。個人主頁:http://jd92.wang
分享內(nèi)容:
各位聽眾各位同學(xué)大家晚上好,很榮幸收到雷鋒網(wǎng) AI研習(xí)社的邀請,這次的主題是《遷移學(xué)習(xí)的發(fā)展及現(xiàn)狀》。
我是中國科學(xué)院計算技術(shù)研究2014級直博生王晉東,主要研究方向是遷移學(xué)習(xí)及其應(yīng)用,下面是我的一些基本資料。今天主要是來分享知識,歡迎大家批評指正。
今天主要分為五部分。一是遷移學(xué)習(xí)的基本介紹,即為什么要用遷移學(xué)習(xí);二是遷移學(xué)習(xí)方法的常見分類;三是把遷移學(xué)習(xí)與深度學(xué)習(xí)結(jié)合起來的研究;四是遷移學(xué)習(xí)的一些最新進(jìn)展;五是學(xué)習(xí)資源的推薦以及總結(jié)。
遷移學(xué)習(xí)基本介紹
先做一個小小的引子,吳恩達(dá)曾經(jīng)說過,遷移學(xué)習(xí)將會是機(jī)器學(xué)習(xí)的下一個驅(qū)動力。
我們先來看一下背景:在智能大數(shù)據(jù)時代,面對數(shù)據(jù)量以及數(shù)據(jù)類型的不斷增加,需要能快速構(gòu)建具有強(qiáng)泛化能力的機(jī)器學(xué)習(xí)模型。大部分?jǐn)?shù)據(jù)往往沒有標(biāo)注,收集標(biāo)注數(shù)據(jù)或者從頭開始構(gòu)建模型,代價高昂且費(fèi)時。這時候就產(chǎn)生了一個問題:如何基于已有的數(shù)據(jù)和模型,對新數(shù)據(jù)快速構(gòu)建相應(yīng)的模型?
這個問題引出了遷移學(xué)習(xí),遷移學(xué)習(xí)可以解決上述標(biāo)定數(shù)據(jù)難以獲取的問題。
遷移學(xué)習(xí)基本思想是利用學(xué)習(xí)目標(biāo)和已有知識之間的相關(guān)性,把知識從已有的模型和數(shù)據(jù)中遷移到要學(xué)習(xí)的目標(biāo)上去,如下圖中所示。目前,遷移學(xué)習(xí)已被廣泛應(yīng)用于機(jī)器學(xué)習(xí)的許多應(yīng)用中。
從數(shù)據(jù)、模型和應(yīng)用這三個角度來說,遷移學(xué)習(xí)都很有必要。
總的來說,遷移學(xué)習(xí)可以減少對標(biāo)定數(shù)據(jù)的依賴,通過和已有數(shù)據(jù)模型之間的遷移,更好地完成機(jī)器學(xué)習(xí)任務(wù)。
遷移學(xué)習(xí)常見方法分類
下面是遷移學(xué)習(xí)的集中方法,目前常用的主要是同構(gòu)和異構(gòu)遷移學(xué)習(xí),最常用的是下圖右邊的幾種方法。
先看基于實(shí)例的遷移學(xué)習(xí)方法。假設(shè)是源域中的一些數(shù)據(jù)和目標(biāo)域會共享很多共同的特征。方法是對源域進(jìn)行instance reweighting,篩選出與目標(biāo)域數(shù)據(jù)相似度高的數(shù)據(jù),然后進(jìn)行訓(xùn)練學(xué)習(xí)。
下面為大家介紹幾個經(jīng)典的基于實(shí)例的遷移學(xué)習(xí)方法,方法比較簡單,容易實(shí)現(xiàn)。
第二是基于特征的遷移學(xué)習(xí)方法。
假設(shè)是源域和目標(biāo)域含有一些公共的交叉特征,方法是通過特征變換,將兩個域的數(shù)據(jù)變換到同一特征空間,然后進(jìn)行學(xué)習(xí)。
下面是幾種比較經(jīng)典的方法。
第三種是基于模型的遷移學(xué)習(xí)方法。
特點(diǎn)是模型相同部分直接進(jìn)行遷移,好處是可以直接把已有的模型拿來用,針對目標(biāo)任務(wù)做相應(yīng)的修改。
代表工作有下面幾個比較經(jīng)典的,優(yōu)點(diǎn)是充分利用模型之間的相似性。
最后是基于關(guān)系的遷移學(xué)習(xí)方法,可以由師生關(guān)系類比上下級關(guān)系,也可以從生物病毒的傳播規(guī)律類比計算機(jī)病毒的傳播。
假設(shè)是如果兩個域是相似的,那么它們會共享某種相似關(guān)系。方法是利用源域?qū)W習(xí)邏輯關(guān)系網(wǎng)絡(luò),再應(yīng)用于目標(biāo)域上。這部分的研究工作比較少。
深度遷移學(xué)習(xí)
下面來分析深度遷移學(xué)習(xí)。深度學(xué)習(xí)可以學(xué)習(xí)到更魯棒的、泛化能力更強(qiáng)的特征表達(dá),遷移學(xué)習(xí)能學(xué)習(xí)到領(lǐng)域無關(guān)的特征表達(dá),這和深度學(xué)習(xí)不謀而合,將兩者結(jié)合,能充分利用神經(jīng)網(wǎng)絡(luò)的表達(dá)能力,學(xué)習(xí)域不變的特征表示。
下面看下最近的一些工作,14年有一篇論文探討了神經(jīng)網(wǎng)絡(luò)的可遷移性,橫軸是層數(shù),縱軸是精度。
第二篇也是14年的,這篇文章是在AlexNet的分類器層前加入domain loss層,目前引用量也比較多。
15年發(fā)表的DAN網(wǎng)絡(luò)對AlexNet網(wǎng)絡(luò)的后三層都進(jìn)行了域適配,還利用了Multi-kernel MMD進(jìn)行距離度量,這是核心的亮點(diǎn)貢獻(xiàn)。
17年的ICML提出了JAN網(wǎng)絡(luò),兩個核心貢獻(xiàn)如下:一是聯(lián)合適配x和y的分布(JMMD度量),二是在網(wǎng)絡(luò)中加入了adversarial學(xué)習(xí)。
這個工作加了soft labels,同時進(jìn)行domain和task transfer,網(wǎng)絡(luò)看起來比較復(fù)雜,大家可以看原文,也可以看我的專欄鏈接。
ADDA提出用adversarial的思想去進(jìn)行domain adaptation,這篇文章也特別新,代碼也開源了。
以上介紹都是我認(rèn)為的比較經(jīng)典的方法,是目前來說在深度遷移學(xué)習(xí)里面比較好的工作。
遷移學(xué)習(xí)的最新進(jìn)展
下面來談?wù)勥w移學(xué)習(xí)的最新發(fā)展。做遷移學(xué)習(xí)最重要的點(diǎn)是找到相似度,當(dāng)源域和目標(biāo)域相似度減少,如何進(jìn)行成功遷移呢。15年的Transitive transfer learning給我們在這個領(lǐng)域開辟了道路。17年的Distant domain transfer learning是對15年的論文的延伸。
第二個比較新的進(jìn)展是利用物理學(xué)知識輔助學(xué)習(xí)任務(wù)。實(shí)驗(yàn)效果是實(shí)線部分,作者的想法非常具有開創(chuàng)性。
第三個是學(xué)習(xí)遷移。我的理解是把遷移學(xué)習(xí)和增量學(xué)習(xí)進(jìn)行結(jié)合,作者提出從已有的知識里自動學(xué)習(xí)比較適合的算法和參數(shù),這個很有前瞻性,也非常有意義。
學(xué)習(xí)資源推薦及總結(jié)
下面給大家推薦一些學(xué)習(xí)資源,前面是比較經(jīng)典的兩個綜述,第一個是楊強(qiáng)老師的。下面也給大家推薦一些比較知名的學(xué)者、會議、期刊等。最后是我的GitHub,在持續(xù)更新,我的知乎專欄是《小王愛遷移》,歡迎大家投稿。
今天主要是希望大家了解到遷移學(xué)習(xí),知道遷移學(xué)習(xí)的常用方法,大概了解到深度遷移學(xué)習(xí)以及一些最新的方向。
視頻:
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。