0
本文作者: 三川 | 2017-04-18 11:54 |
雷鋒網(wǎng)按:日前,知名 AI 博主、愛(ài)爾蘭國(guó)立大學(xué) NLP 博士生 Sebastian Ruder 以“遷移學(xué)習(xí):機(jī)器學(xué)習(xí)的下一個(gè)前線”為題,對(duì)遷移學(xué)習(xí)的技術(shù)原理、重要性與意義、應(yīng)用方法做了詳細(xì)闡述。本文對(duì)其中討論遷移學(xué)習(xí)的原理、重要性,以及吳恩達(dá)的預(yù)測(cè)的部分做了節(jié)選,閱讀原文(英文)請(qǐng)戳這里。雷鋒網(wǎng)編譯。
Sebastian Ruder
Sebastian Ruder:在訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)、學(xué)習(xí)輸入到輸出的精準(zhǔn)映射上,近年來(lái)我們做得越來(lái)越好。不管是針對(duì)圖像、語(yǔ)句,還是標(biāo)簽預(yù)測(cè),有了大量做過(guò)標(biāo)記的樣例,都已不再是難題。
今天的深度學(xué)習(xí)算法仍然欠缺的,是在新情況(不同于訓(xùn)練集的情況)上的泛化能力。
在什么時(shí)候,這項(xiàng)能力是必須的呢?——當(dāng)你把模型應(yīng)用于現(xiàn)實(shí)情形,而非小心翼翼整理好的數(shù)據(jù)集的時(shí)候?,F(xiàn)實(shí)世界是相當(dāng)混亂的,包含無(wú)數(shù)的特殊情形,會(huì)有許多在訓(xùn)練階段模型沒(méi)有遇到過(guò)的情況。因而未必適于對(duì)新情況做預(yù)測(cè)。
把別處學(xué)得的知識(shí),遷移到新場(chǎng)景的能力,就是遷移學(xué)習(xí)。
在機(jī)器學(xué)習(xí)的傳統(tǒng)監(jiān)督學(xué)習(xí)情況下,如果我們準(zhǔn)備為某個(gè)任務(wù)/領(lǐng)域 A 來(lái)訓(xùn)練模型,獲取任務(wù)/領(lǐng)域 A 里標(biāo)記過(guò)的數(shù)據(jù),會(huì)是前提。圖 1 把這表現(xiàn)的很清楚:model A 的訓(xùn)練、測(cè)試數(shù)據(jù)的任務(wù)/領(lǐng)域是一致的。
圖 1: 傳統(tǒng)的 ML 監(jiān)督學(xué)習(xí)
可以預(yù)期,我們?cè)谠摂?shù)據(jù)集上訓(xùn)練的模型 A,在相同任務(wù)/領(lǐng)域的新數(shù)據(jù)上也能有良好表現(xiàn)。另一方面,對(duì)于給定任務(wù)/領(lǐng)域 B,我們需要這個(gè)領(lǐng)域的標(biāo)記數(shù)據(jù),來(lái)訓(xùn)練模型 B,然后才能在該任務(wù)/領(lǐng)域取得不錯(cuò)的效果。
但傳統(tǒng)的監(jiān)督學(xué)習(xí)方法也會(huì)失靈——在缺乏某任務(wù)/領(lǐng)域標(biāo)記數(shù)據(jù)的情況下,它往往無(wú)法得出一個(gè)可靠的模型。舉個(gè)例子,如果我們想要訓(xùn)練出一個(gè)模型,對(duì)夜間的行人圖像進(jìn)行監(jiān)測(cè),我們可以應(yīng)用一個(gè)相近領(lǐng)域的訓(xùn)練模型——白天的行人監(jiān)測(cè)。理論上這是可行的。但實(shí)際上,模型的表現(xiàn)效果經(jīng)常會(huì)大幅惡化,甚至崩潰。這很容易理解,模型從白天訓(xùn)練數(shù)據(jù)獲取了一些偏差,不知道怎么泛化到新場(chǎng)景。
如果我們想要執(zhí)行全新的任務(wù),比如監(jiān)測(cè)自行車騎手,重復(fù)使用原先的模型是行不通的。這里有一個(gè)很關(guān)鍵的原因:不同任務(wù)的數(shù)據(jù)標(biāo)簽不同。但有了遷移學(xué)習(xí),我們能夠在一定程度上解決這個(gè)問(wèn)題,并充分利用相近任務(wù)/領(lǐng)域的現(xiàn)有數(shù)據(jù)。遷移學(xué)習(xí)試圖把處理源任務(wù)獲取的知識(shí),應(yīng)用于新的目標(biāo)難題,見圖 2。
圖 2: 遷移學(xué)習(xí)
實(shí)踐中,我們會(huì)試圖把源場(chǎng)景盡可能多的知識(shí),遷移到目標(biāo)任務(wù)或者場(chǎng)景。這里的知識(shí)可以有許多種表現(xiàn)形式,而這取決于數(shù)據(jù):它可以是關(guān)于物體的組成部分,以更輕易地找出反常物體;它也可以是人們表達(dá)意見的普通詞語(yǔ)。
在去年的 NIPS 2016 講座上,吳恩達(dá)表示:“在監(jiān)督學(xué)習(xí)之后,遷移學(xué)習(xí)將引領(lǐng)下一波機(jī)器學(xué)習(xí)技術(shù)商業(yè)化浪潮?!?/p>
雷鋒網(wǎng)獲知,當(dāng)時(shí),吳恩達(dá)在白板上畫了一副草圖,對(duì)他的立場(chǎng)進(jìn)行解釋。Sebastian Ruder 將其用電腦繪制了出來(lái),便是下圖:
該圖是吳恩達(dá)眼中,推動(dòng)機(jī)器學(xué)習(xí)取得商業(yè)化成績(jī)的主要驅(qū)動(dòng)技術(shù)。從中可以看出,吳老師認(rèn)為下一步將是遷移學(xué)習(xí)的商業(yè)應(yīng)用大爆發(fā)。
有一點(diǎn)是毋庸置疑的:迄今為止,機(jī)器學(xué)習(xí)在業(yè)界的應(yīng)用和成功,主要由監(jiān)督學(xué)習(xí)推動(dòng)。而這又是建立在深度學(xué)習(xí)的進(jìn)步、更強(qiáng)大的計(jì)算設(shè)施、做了標(biāo)記的大型數(shù)據(jù)集的基礎(chǔ)上。近年來(lái),這一波公眾對(duì)人工智能技術(shù)的關(guān)注、投資收購(gòu)浪潮、機(jī)器學(xué)習(xí)在日常生活中的商業(yè)應(yīng)用,主要是由監(jiān)督學(xué)習(xí)來(lái)引領(lǐng)。如果我們忽略“AI 冬天”的說(shuō)法,相信吳恩達(dá)的預(yù)測(cè),機(jī)器學(xué)習(xí)的這一波商業(yè)化浪潮應(yīng)該會(huì)繼續(xù)。
另外一點(diǎn)卻不是那么清楚:為什么遷移學(xué)習(xí)已經(jīng)存在數(shù)十年了,但卻在業(yè)界沒(méi)什么人用?更進(jìn)一步,吳恩達(dá)預(yù)測(cè)的遷移學(xué)習(xí)商業(yè)應(yīng)用爆發(fā)式增長(zhǎng),究竟是否會(huì)發(fā)生?
相比無(wú)監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)系,遷移學(xué)習(xí)目前的曝光程度不高,但越來(lái)越多的人正把目光投向它。
對(duì)于前兩者,比如說(shuō)被認(rèn)為是“通用 AI”(General AI)關(guān)鍵的無(wú)監(jiān)督學(xué)習(xí),其重要性隨著 Yann LeCun 的布道以及“蛋糕論”越來(lái)越受到認(rèn)可,激起又一波關(guān)注。生成對(duì)抗網(wǎng)絡(luò)在其中扮演技術(shù)先鋒角色。對(duì)于強(qiáng)化學(xué)習(xí),最顯著的推動(dòng)力量是谷歌 DeepMind。沒(méi)錯(cuò),我指的是 AlphaGo。強(qiáng)化學(xué)習(xí)技術(shù)已經(jīng)在現(xiàn)實(shí)場(chǎng)景取得成功應(yīng)用,比如降低了 40% 的谷歌數(shù)據(jù)中心溫控成本。
Yann LeCun 蛋糕論。在他看來(lái),強(qiáng)化學(xué)習(xí)是櫻桃,監(jiān)督學(xué)習(xí)是糖衣,無(wú)監(jiān)督學(xué)習(xí)才是糕體。但耐人尋味的是,其中并沒(méi)有遷移學(xué)習(xí)。
這兩個(gè)領(lǐng)域都前景光明。但是,在可預(yù)期的將來(lái),它們恐怕只會(huì)產(chǎn)出相對(duì)有限的商業(yè)化成果——更多是學(xué)術(shù)成果,存在于尖端研究和論文中。這是因?yàn)檫@兩個(gè)領(lǐng)域面臨的技術(shù)挑戰(zhàn)仍然非常嚴(yán)峻。
當(dāng)前,業(yè)界對(duì)機(jī)器學(xué)習(xí)的應(yīng)用呈現(xiàn)二元化:
一方面,近年來(lái)我們獲得了訓(xùn)練更多、更精確模型的能力?,F(xiàn)在所處的是一個(gè)全新階段:對(duì)于許多任務(wù),最先進(jìn)的模型的性能,已達(dá)到了一個(gè)此前夢(mèng)寐以求的水平:如果把這些模型不計(jì)代價(jià)地推向市場(chǎng),消費(fèi)者將不會(huì)抱怨其核心能力。
尖端模型的性能已強(qiáng)到什么程度呢?
最新的殘差網(wǎng)絡(luò)(residual networks)已經(jīng)能在 ImageNet 上取得超人類的水平;谷歌 Smart Reply 能自動(dòng)處理 10% 的手機(jī)回復(fù);語(yǔ)音識(shí)別錯(cuò)誤率一直在降低,精確率已超過(guò)打字員;機(jī)器對(duì)皮膚癌的識(shí)別率以達(dá)到皮膚科醫(yī)生的水平;谷歌 NMT 系統(tǒng)已經(jīng)應(yīng)用于谷歌翻譯的產(chǎn)品端;百度 DeepVoice 已實(shí)現(xiàn)實(shí)時(shí)語(yǔ)音生成……
這個(gè)列表可以搞得很長(zhǎng)。我要表達(dá)的意思是:這個(gè)水平的成熟度,已經(jīng)讓面向數(shù)百萬(wàn)用戶的大規(guī)模模型部署變得可能。
但在另一方面,這些成功的模型對(duì)數(shù)據(jù)極度饑渴,需要海量標(biāo)記數(shù)據(jù)來(lái)達(dá)到這樣的效果。在某些任務(wù)領(lǐng)域,這樣的數(shù)據(jù)資源是存在的——背后是多年的艱辛數(shù)據(jù)收集。而在個(gè)別情況下,數(shù)據(jù)是公共的,比如 ImageNet。但是大量的標(biāo)記數(shù)據(jù)一般是專有的、有知識(shí)產(chǎn)權(quán),亦或是收集起來(lái)極度昂貴,比如醫(yī)療、語(yǔ)音、MT 數(shù)據(jù)集。
同時(shí),當(dāng)機(jī)器學(xué)習(xí)模型被應(yīng)用于現(xiàn)實(shí)情形,它會(huì)遇到無(wú)數(shù)的、此前未遭遇過(guò)的情況;也不知道該如何應(yīng)付。每個(gè)客戶、用戶都有他們的偏好,會(huì)產(chǎn)生異于訓(xùn)練集的數(shù)據(jù)。模型需要處理許多與此前訓(xùn)練的任務(wù)目標(biāo)相近、但不完全一樣的任務(wù)。當(dāng)今的尖端模型雖然在訓(xùn)練過(guò)的任務(wù)上有相當(dāng)于人類或超人類的能力,但在這些情況下,性能會(huì)大打折扣甚至完全崩潰。
遷移學(xué)習(xí)是對(duì)付這些特殊情況的殺手锏。許多產(chǎn)品級(jí)的機(jī)器學(xué)習(xí)應(yīng)用,需要進(jìn)入標(biāo)記數(shù)據(jù)稀缺的任務(wù)領(lǐng)域,對(duì)于這類商業(yè)應(yīng)用,遷移學(xué)習(xí)無(wú)疑是必需的。今天,數(shù)據(jù)的“低樹果實(shí)”基本已經(jīng)被摘光,接下來(lái),必須要把學(xué)得的東西遷移到新的任務(wù)與領(lǐng)域中。
相關(guān)文章:
數(shù)據(jù)不夠怎么訓(xùn)練深度學(xué)習(xí)模型?不妨試試遷移學(xué)習(xí)
香港科技大學(xué)楊強(qiáng) KDD China 技術(shù)峰會(huì)演講:遷移學(xué)習(xí)的本質(zhì)與實(shí)際應(yīng)用
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。