遷移學(xué)習(xí)效果優(yōu)化不再是難題，楊強(qiáng)教授團(tuán)隊(duì)帶來(lái)自動(dòng)找到最佳算法的L2T

本文作者：楊曉凡

2017-08-24 14:35

導(dǎo)語(yǔ)：在遷移學(xué)習(xí)領(lǐng)域首次提出“從經(jīng)驗(yàn)學(xué)習(xí)”，效果果然拔群

雷鋒網(wǎng) AI 科技評(píng)論按：近日，香港科技大學(xué)楊強(qiáng)教授團(tuán)隊(duì)發(fā)表了一篇關(guān)于遷移學(xué)習(xí)的論文。在論文中，他們提出了一種新穎的遷移學(xué)習(xí)范式 Learning to Transfer (L2T)，用系統(tǒng)化、自動(dòng)化的方法解決目前遷移學(xué)習(xí)中可選算法多、但實(shí)際應(yīng)用中難以找到最佳算法的問(wèn)題。

雷鋒網(wǎng) AI 科技評(píng)論對(duì)論文中方法的重點(diǎn)思想介紹如下，涉及具體公式及推導(dǎo)過(guò)程請(qǐng)參見(jiàn)原論文。

遷移學(xué)習(xí)效果優(yōu)化不再是難題，楊強(qiáng)教授團(tuán)隊(duì)帶來(lái)自動(dòng)找到最佳算法的L2T

遷移學(xué)習(xí)

遷移學(xué)習(xí)（Transfer Learning）的想法來(lái)自于人類在不同的任務(wù)間轉(zhuǎn)換知識(shí)的能力，在機(jī)器學(xué)習(xí)領(lǐng)域使用遷移學(xué)習(xí)的目的是為了運(yùn)用現(xiàn)有領(lǐng)域內(nèi)的知識(shí)，提高模型在新的領(lǐng)域內(nèi)的表現(xiàn)，又或者訓(xùn)練一個(gè)用于新的領(lǐng)域的模型時(shí)減少所需要的標(biāo)記數(shù)據(jù)數(shù)目。在所能獲得的標(biāo)記數(shù)據(jù)有限的情況下，遷移學(xué)習(xí)有著重要的意義。

遷移學(xué)習(xí)研究的關(guān)鍵問(wèn)題是何時(shí)遷移、如何遷移和遷移什么。如果從現(xiàn)有領(lǐng)域進(jìn)行遷移之后能夠有助于新領(lǐng)域的表現(xiàn)，那么就適合遷移（“何時(shí)遷移”）；要遷移的對(duì)象是兩個(gè)領(lǐng)域內(nèi)共享的那部分知識(shí)（“遷移什么”）；算法發(fā)揮的作用就是找到這部分知識(shí)，然后進(jìn)行遷移（“如何遷移”）。不同的算法很可能會(huì)找到可遷移的知識(shí)里不同的部分，就會(huì)導(dǎo)致不同的遷移學(xué)習(xí)效果，在遷移學(xué)習(xí)完成后對(duì)表現(xiàn)進(jìn)行測(cè)量就能夠看到這些差別。

要達(dá)到源領(lǐng)域和目標(biāo)領(lǐng)域之間的最優(yōu)遷移效果，需要研究者們對(duì)基于實(shí)體、參數(shù)、特征的數(shù)百種遷移學(xué)習(xí)算法逐一嘗試。由于這樣暴力嘗試的代價(jià)過(guò)于高，實(shí)際中研究者往往只能在有限的嘗試中找到一個(gè)次優(yōu)的算法，而這樣的做法則需要對(duì)點(diǎn)對(duì)點(diǎn)遷移有相當(dāng)?shù)慕?jīng)驗(yàn)，思考方法也不系統(tǒng)。

Learning to Transfer

楊強(qiáng)教授團(tuán)隊(duì)認(rèn)為，逐一嘗試現(xiàn)有的不同遷移學(xué)習(xí)算法不應(yīng)成為唯一一種確定要遷移哪些知識(shí)并提高遷移學(xué)習(xí)效果的方法。所以他們?cè)谡撐闹刑岢隽艘环N新的遷移學(xué)習(xí)范式，名為 Learning to Transfer（L2T）。受到人類能夠根據(jù)隨著經(jīng)驗(yàn)增加越來(lái)越輕松地判斷如何轉(zhuǎn)移知識(shí)的啟發(fā)，L2T 的核心思想就是利用以往的遷移學(xué)習(xí)經(jīng)驗(yàn)自動(dòng)決定在源領(lǐng)域和目標(biāo)領(lǐng)域之間如何遷移以及遷移什么，從而提高遷移學(xué)習(xí)的效果；其中對(duì)以往經(jīng)驗(yàn)的利用也是在所有遷移學(xué)習(xí)算法中首次出現(xiàn)。

為了達(dá)到這樣的目標(biāo)，L2T 的過(guò)程分為兩個(gè)階段。

第一個(gè)階段是“積累經(jīng)驗(yàn)”。首先，L2T 智能體進(jìn)行若干次遷移學(xué)習(xí)，并對(duì)這些遷移學(xué)習(xí)過(guò)程做記錄。每一次學(xué)習(xí)的記錄分成三部分：一對(duì)源領(lǐng)域 S 和目標(biāo)領(lǐng)域 T，參數(shù)化為共享潛特征因子（latent feature factor）格式的被遷移知識(shí) W，以及表現(xiàn)提升比 l（論文中定義這個(gè)值為有無(wú)遷移學(xué)習(xí)的狀況下表現(xiàn)之比，越高說(shuō)明遷移學(xué)習(xí)效果越好）。記錄格式類似這樣（S，T，W，l）。

接下來(lái) L2T 智能體就需要根據(jù)這些遷移經(jīng)驗(yàn)，學(xué)習(xí)如何遷移。這個(gè)過(guò)程是學(xué)習(xí)一個(gè)反射函數(shù) f =（S，T，W），函數(shù)值就是剛才的表現(xiàn)提升比 l 。這個(gè)反射函數(shù)的目標(biāo)就是通過(guò) S、T、W 預(yù)計(jì)表現(xiàn)提升比 l ，學(xué)到的反射函數(shù)內(nèi)部就隱含了元認(rèn)知遷移學(xué)習(xí)的技能，即遷移什么、如何遷移才能夠讓給定的源領(lǐng)域和目標(biāo)領(lǐng)域之間的表現(xiàn)提升比最高。源領(lǐng)域和目標(biāo)領(lǐng)域的特性也參與構(gòu)成了 f 的一部分。

第二階段就是真正進(jìn)行遷移。對(duì)于之后再提供的新的一對(duì)源領(lǐng)域和目標(biāo)領(lǐng)域和已經(jīng)學(xué)到的 f，L2T 智能體就可以通過(guò)求 f 最大值的方式找到最優(yōu)的遷移知識(shí)，以參數(shù)的形式體現(xiàn)在W中。遷移學(xué)習(xí)算法按照參數(shù)W執(zhí)行，就可以達(dá)到設(shè)定的遷移學(xué)習(xí)效果。

遷移學(xué)習(xí)效果優(yōu)化不再是難題，楊強(qiáng)教授團(tuán)隊(duì)帶來(lái)自動(dòng)找到最佳算法的L2T

論文中 L2T 范式的說(shuō)明配圖。圖中黑字的（1）、（2）、（3）就是記錄若干次學(xué)習(xí)、學(xué)習(xí)反射函數(shù) f、通過(guò) f 對(duì)新的源領(lǐng)域和目標(biāo)領(lǐng)域的遷移方式求最優(yōu)解

L2T 這種新穎的遷移學(xué)習(xí)范式為有效地遷移學(xué)習(xí)開(kāi)啟了新的大門。通過(guò)對(duì)以往的遷移學(xué)習(xí)經(jīng)驗(yàn)的利用，L2T 能夠以系統(tǒng)化、自動(dòng)化的方式在領(lǐng)域間發(fā)現(xiàn)更多的可遷移知識(shí)，而無(wú)需研究者自己具備豐富的經(jīng)驗(yàn)。

反射函數(shù) f

顯然，在這樣的范式下，反射函數(shù) f 具體形式的構(gòu)造是重中之重。目前作者們選定的 L2T 研究領(lǐng)域?yàn)獒槍?duì)一階潛特征因子的遷移學(xué)習(xí)，即源領(lǐng)域和目標(biāo)領(lǐng)域的特征空間相同，而標(biāo)簽不同。在構(gòu)造 f 的過(guò)程中，作者們討論并解決了以下幾個(gè)問(wèn)題。

把“學(xué)習(xí)什么”參數(shù)化：對(duì)所有算法中的要遷移的內(nèi)容做統(tǒng)一的參數(shù)化。這樣的潛特征因子的遷移學(xué)習(xí)的目標(biāo)就是學(xué)到不同領(lǐng)域間的與領(lǐng)域無(wú)關(guān)的特征因子。比如從識(shí)別狗遷移到識(shí)別貓，其中眼睛、嘴、尾巴等共有的特征就是不同領(lǐng)域間可以共享的特征因子。

從經(jīng)驗(yàn)學(xué)習(xí)：作者們認(rèn)為有兩個(gè)因素對(duì)表現(xiàn)提升比 l 有很大影響，在構(gòu)建 f 的時(shí)候這兩個(gè)方面都要考慮到。因素一是源領(lǐng)域和目標(biāo)領(lǐng)域在共享潛空間的區(qū)別。更小的區(qū)別就是更大的重疊空間，這意味著有更多的潛特征因子可供遷移，提升比例也會(huì)更高。

對(duì)于源領(lǐng)域和目標(biāo)領(lǐng)域在共享潛空間的區(qū)別，作者們首先用了最大平均差異（maximum mean discrepancy，MMD）來(lái)衡量。不過(guò)MMD的問(wèn)題是只能衡量?jī)蓚€(gè)空間的平均值之間的距離，而不足以衡量?jī)蓚€(gè)空間的區(qū)別大?。ㄈ缦聢D）；所以作者們考慮到這一點(diǎn)，也加入了空間分布的集中性的因素在公式中。

遷移學(xué)習(xí)效果優(yōu)化不再是難題，楊強(qiáng)教授團(tuán)隊(duì)帶來(lái)自動(dòng)找到最佳算法的L2T

如圖，藍(lán)色線段為兩個(gè)空間平均值之間的距離。此圖說(shuō)明了這個(gè)距離不足以完全衡量空間區(qū)別的大小

因素二是目標(biāo)領(lǐng)域在潛空間的鑒別能力。目標(biāo)領(lǐng)域在潛空間的鑒別能力越強(qiáng)，表現(xiàn)的提升也會(huì)越明顯。由于遷移學(xué)習(xí)的主要應(yīng)用場(chǎng)景就是在有標(biāo)簽數(shù)據(jù)不足時(shí)，所以作者們也就直接選擇基于無(wú)標(biāo)簽數(shù)據(jù)做計(jì)算。無(wú)標(biāo)簽數(shù)據(jù)的鑒別性可以從兩個(gè)方面評(píng)價(jià)：類似的實(shí)體在嵌入潛空間后也應(yīng)該距離相近；差別很大的實(shí)體在嵌入潛空間后也應(yīng)該距離較遠(yuǎn)。從而提出了鑒別性的評(píng)價(jià)公式。

這樣，明確了 f 的具體形式后，就可以先學(xué)習(xí)以往的若干次遷移學(xué)習(xí)經(jīng)驗(yàn)，然后根據(jù)學(xué)到的 f 求遷移方式（參數(shù)W）的最優(yōu)解。（相關(guān)公式參見(jiàn)論文原文）

實(shí)驗(yàn)結(jié)果

由于不同領(lǐng)域內(nèi)的任務(wù)難度不同，不好直接對(duì)比，論文中選擇了繼續(xù)使用前文定義過(guò)的表現(xiàn)提升比 l（有無(wú)遷移學(xué)習(xí)的狀況下表現(xiàn)之比，越高說(shuō)明遷移學(xué)習(xí)效果越好），讓 L2T 與其它許多常用的遷移學(xué)習(xí)算法進(jìn)行了對(duì)比。

遷移學(xué)習(xí)效果優(yōu)化不再是難題，楊強(qiáng)教授團(tuán)隊(duì)帶來(lái)自動(dòng)找到最佳算法的L2T

從上圖可以看到，當(dāng)目標(biāo)領(lǐng)域內(nèi)的有標(biāo)簽樣本數(shù)目很少的時(shí)候，L2T 的表現(xiàn)遙遙領(lǐng)先，這說(shuō)明 L2T 最為有效地遷移了兩個(gè)領(lǐng)域內(nèi)共有的知識(shí)，而且在樣本很多時(shí)依然保持著優(yōu)勢(shì)。

為了驗(yàn)證“從經(jīng)驗(yàn)學(xué)習(xí)”的有效性，作者們還設(shè)計(jì)了另一個(gè)實(shí)驗(yàn)。首先設(shè)定 L2T 要學(xué)習(xí)的遷移經(jīng)驗(yàn)數(shù)目是1000條，然后用不同的以往算法生成這1000條經(jīng)驗(yàn)供它學(xué)習(xí)，看看 L2T 的表現(xiàn)受經(jīng)驗(yàn)影響情況如何。結(jié)果如下表。（表中內(nèi)容有刪減，原表格參見(jiàn)論文原文）

遷移學(xué)習(xí)效果優(yōu)化不再是難題，楊強(qiáng)教授團(tuán)隊(duì)帶來(lái)自動(dòng)找到最佳算法的L2T

可以看到，隨著使用的算法增多，L2T 的學(xué)習(xí)效果也越好（學(xué)到了更多情況，學(xué)到的反射函數(shù) f 更強(qiáng)，遷移學(xué)習(xí)得更有效）。而且即便只用一種現(xiàn)有算法為 L2T 生成經(jīng)驗(yàn)（ITL 與 DIP 兩行）時(shí)，L2T 的學(xué)習(xí)效果也有大幅度提高（3個(gè)標(biāo)記樣本時(shí)，ITL 和 DIP 本身的表現(xiàn)分別為 1.0188 和 1.0875）。這有力地說(shuō)明了“從經(jīng)驗(yàn)學(xué)習(xí)”的巨大作用。

論文地址：https://arxiv.org/abs/1708.05629

雷鋒網(wǎng) AI 科技評(píng)論編譯

SIGKDD 三大核心獎(jiǎng)項(xiàng)出爐，裴健、楊強(qiáng)分獲創(chuàng)新獎(jiǎng)及杰出服務(wù)獎(jiǎng)

香港科技大學(xué)楊強(qiáng)教授：深度學(xué)習(xí)如何才能更靠譜？

香港科技大學(xué)楊強(qiáng)教授：AI學(xué)術(shù)的前沿工作，也要從工業(yè)界獲得靈感｜CCF－GAIR 2017

雷峰網(wǎng)版權(quán)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。