丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
人工智能開發(fā)者 正文
發(fā)私信給三川
發(fā)送

0

為什么吳恩達(dá)認(rèn)為未來屬于遷移學(xué)習(xí)?

本文作者: 三川 2017-04-18 11:54
導(dǎo)語:通俗易懂得解釋什么是遷移學(xué)習(xí),以及它的意義。

雷鋒網(wǎng)按:日前,知名 AI 博主、愛爾蘭國立大學(xué) NLP 博士生 Sebastian Ruder 以“遷移學(xué)習(xí):機(jī)器學(xué)習(xí)的下一個前線”為題,對遷移學(xué)習(xí)的技術(shù)原理、重要性與意義、應(yīng)用方法做了詳細(xì)闡述。本文對其中討論遷移學(xué)習(xí)的原理、重要性,以及吳恩達(dá)的預(yù)測的部分做了節(jié)選,閱讀原文(英文)請戳這里。雷鋒網(wǎng)編譯。

為什么吳恩達(dá)認(rèn)為未來屬于遷移學(xué)習(xí)?

Sebastian Ruder 

Sebastian Ruder:在訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)、學(xué)習(xí)輸入到輸出的精準(zhǔn)映射上,近年來我們做得越來越好。不管是針對圖像、語句,還是標(biāo)簽預(yù)測,有了大量做過標(biāo)記的樣例,都已不再是難題。

今天的深度學(xué)習(xí)算法仍然欠缺的,是在新情況(不同于訓(xùn)練集的情況)上的泛化能力。

在什么時候,這項能力是必須的呢?——當(dāng)你把模型應(yīng)用于現(xiàn)實(shí)情形,而非小心翼翼整理好的數(shù)據(jù)集的時候。現(xiàn)實(shí)世界是相當(dāng)混亂的,包含無數(shù)的特殊情形,會有許多在訓(xùn)練階段模型沒有遇到過的情況。因而未必適于對新情況做預(yù)測。

把別處學(xué)得的知識,遷移到新場景的能力,就是遷移學(xué)習(xí)。

遷移學(xué)習(xí)的原理

在機(jī)器學(xué)習(xí)的傳統(tǒng)監(jiān)督學(xué)習(xí)情況下,如果我們準(zhǔn)備為某個任務(wù)/領(lǐng)域 A 來訓(xùn)練模型,獲取任務(wù)/領(lǐng)域 A 里標(biāo)記過的數(shù)據(jù),會是前提。圖 1 把這表現(xiàn)的很清楚:model A 的訓(xùn)練、測試數(shù)據(jù)的任務(wù)/領(lǐng)域是一致的。

為什么吳恩達(dá)認(rèn)為未來屬于遷移學(xué)習(xí)?

圖 1: 傳統(tǒng)的 ML 監(jiān)督學(xué)習(xí)

可以預(yù)期,我們在該數(shù)據(jù)集上訓(xùn)練的模型 A,在相同任務(wù)/領(lǐng)域的新數(shù)據(jù)上也能有良好表現(xiàn)。另一方面,對于給定任務(wù)/領(lǐng)域 B,我們需要這個領(lǐng)域的標(biāo)記數(shù)據(jù),來訓(xùn)練模型 B,然后才能在該任務(wù)/領(lǐng)域取得不錯的效果。

但傳統(tǒng)的監(jiān)督學(xué)習(xí)方法也會失靈——在缺乏某任務(wù)/領(lǐng)域標(biāo)記數(shù)據(jù)的情況下,它往往無法得出一個可靠的模型。舉個例子,如果我們想要訓(xùn)練出一個模型,對夜間的行人圖像進(jìn)行監(jiān)測,我們可以應(yīng)用一個相近領(lǐng)域的訓(xùn)練模型——白天的行人監(jiān)測。理論上這是可行的。但實(shí)際上,模型的表現(xiàn)效果經(jīng)常會大幅惡化,甚至崩潰。這很容易理解,模型從白天訓(xùn)練數(shù)據(jù)獲取了一些偏差,不知道怎么泛化到新場景。

如果我們想要執(zhí)行全新的任務(wù),比如監(jiān)測自行車騎手,重復(fù)使用原先的模型是行不通的。這里有一個很關(guān)鍵的原因:不同任務(wù)的數(shù)據(jù)標(biāo)簽不同。但有了遷移學(xué)習(xí),我們能夠在一定程度上解決這個問題,并充分利用相近任務(wù)/領(lǐng)域的現(xiàn)有數(shù)據(jù)。遷移學(xué)習(xí)試圖把處理源任務(wù)獲取的知識,應(yīng)用于新的目標(biāo)難題,見圖 2。

為什么吳恩達(dá)認(rèn)為未來屬于遷移學(xué)習(xí)?

圖 2: 遷移學(xué)習(xí)

實(shí)踐中,我們會試圖把源場景盡可能多的知識,遷移到目標(biāo)任務(wù)或者場景。這里的知識可以有許多種表現(xiàn)形式,而這取決于數(shù)據(jù):它可以是關(guān)于物體的組成部分,以更輕易地找出反常物體;它也可以是人們表達(dá)意見的普通詞語。

為什么遷移學(xué)習(xí)這么重要?

為什么吳恩達(dá)認(rèn)為未來屬于遷移學(xué)習(xí)?

在去年的 NIPS 2016 講座上,吳恩達(dá)表示:“在監(jiān)督學(xué)習(xí)之后,遷移學(xué)習(xí)將引領(lǐng)下一波機(jī)器學(xué)習(xí)技術(shù)商業(yè)化浪潮?!?/p>

雷鋒網(wǎng)獲知,當(dāng)時,吳恩達(dá)在白板上畫了一副草圖,對他的立場進(jìn)行解釋。Sebastian Ruder 將其用電腦繪制了出來,便是下圖:

為什么吳恩達(dá)認(rèn)為未來屬于遷移學(xué)習(xí)?

該圖是吳恩達(dá)眼中,推動機(jī)器學(xué)習(xí)取得商業(yè)化成績的主要驅(qū)動技術(shù)。從中可以看出,吳老師認(rèn)為下一步將是遷移學(xué)習(xí)的商業(yè)應(yīng)用大爆發(fā)。

有一點(diǎn)是毋庸置疑的:迄今為止,機(jī)器學(xué)習(xí)在業(yè)界的應(yīng)用和成功,主要由監(jiān)督學(xué)習(xí)推動。而這又是建立在深度學(xué)習(xí)的進(jìn)步、更強(qiáng)大的計算設(shè)施、做了標(biāo)記的大型數(shù)據(jù)集的基礎(chǔ)上。近年來,這一波公眾對人工智能技術(shù)的關(guān)注、投資收購浪潮、機(jī)器學(xué)習(xí)在日常生活中的商業(yè)應(yīng)用,主要是由監(jiān)督學(xué)習(xí)來引領(lǐng)。如果我們忽略“AI 冬天”的說法,相信吳恩達(dá)的預(yù)測,機(jī)器學(xué)習(xí)的這一波商業(yè)化浪潮應(yīng)該會繼續(xù)。

另外一點(diǎn)卻不是那么清楚:為什么遷移學(xué)習(xí)已經(jīng)存在數(shù)十年了,但卻在業(yè)界沒什么人用?更進(jìn)一步,吳恩達(dá)預(yù)測的遷移學(xué)習(xí)商業(yè)應(yīng)用爆發(fā)式增長,究竟是否會發(fā)生?

相比無監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)系,遷移學(xué)習(xí)目前的曝光程度不高,但越來越多的人正把目光投向它。

對于前兩者,比如說被認(rèn)為是“通用 AI”(General AI)關(guān)鍵的無監(jiān)督學(xué)習(xí),其重要性隨著 Yann LeCun 的布道以及“蛋糕論”越來越受到認(rèn)可,激起又一波關(guān)注。生成對抗網(wǎng)絡(luò)在其中扮演技術(shù)先鋒角色。對于強(qiáng)化學(xué)習(xí),最顯著的推動力量是谷歌 DeepMind。沒錯,我指的是  AlphaGo。強(qiáng)化學(xué)習(xí)技術(shù)已經(jīng)在現(xiàn)實(shí)場景取得成功應(yīng)用,比如降低了 40% 的谷歌數(shù)據(jù)中心溫控成本。為什么吳恩達(dá)認(rèn)為未來屬于遷移學(xué)習(xí)?

Yann LeCun 蛋糕論。在他看來,強(qiáng)化學(xué)習(xí)是櫻桃,監(jiān)督學(xué)習(xí)是糖衣,無監(jiān)督學(xué)習(xí)才是糕體。但耐人尋味的是,其中并沒有遷移學(xué)習(xí)。

這兩個領(lǐng)域都前景光明。但是,在可預(yù)期的將來,它們恐怕只會產(chǎn)出相對有限的商業(yè)化成果——更多是學(xué)術(shù)成果,存在于尖端研究和論文中。這是因為這兩個領(lǐng)域面臨的技術(shù)挑戰(zhàn)仍然非常嚴(yán)峻。

遷移學(xué)習(xí)的特別之處在哪?

當(dāng)前,業(yè)界對機(jī)器學(xué)習(xí)的應(yīng)用呈現(xiàn)二元化:

  • 一方面,近年來我們獲得了訓(xùn)練更多、更精確模型的能力。現(xiàn)在所處的是一個全新階段:對于許多任務(wù),最先進(jìn)的模型的性能,已達(dá)到了一個此前夢寐以求的水平:如果把這些模型不計代價地推向市場,消費(fèi)者將不會抱怨其核心能力。

    尖端模型的性能已強(qiáng)到什么程度呢?

    最新的殘差網(wǎng)絡(luò)(residual networks)已經(jīng)能在 ImageNet 上取得超人類的水平;谷歌 Smart Reply 能自動處理 10% 的手機(jī)回復(fù);語音識別錯誤率一直在降低,精確率已超過打字員;機(jī)器對皮膚癌的識別率以達(dá)到皮膚科醫(yī)生的水平;谷歌 NMT 系統(tǒng)已經(jīng)應(yīng)用于谷歌翻譯的產(chǎn)品端;百度 DeepVoice 已實(shí)現(xiàn)實(shí)時語音生成……

    這個列表可以搞得很長。我要表達(dá)的意思是:這個水平的成熟度,已經(jīng)讓面向數(shù)百萬用戶的大規(guī)模模型部署變得可能。

  • 但在另一方面,這些成功的模型對數(shù)據(jù)極度饑渴,需要海量標(biāo)記數(shù)據(jù)來達(dá)到這樣的效果。在某些任務(wù)領(lǐng)域,這樣的數(shù)據(jù)資源是存在的——背后是多年的艱辛數(shù)據(jù)收集。而在個別情況下,數(shù)據(jù)是公共的,比如 ImageNet。但是大量的標(biāo)記數(shù)據(jù)一般是專有的、有知識產(chǎn)權(quán),亦或是收集起來極度昂貴,比如醫(yī)療、語音、MT 數(shù)據(jù)集。

    同時,當(dāng)機(jī)器學(xué)習(xí)模型被應(yīng)用于現(xiàn)實(shí)情形,它會遇到無數(shù)的、此前未遭遇過的情況;也不知道該如何應(yīng)付。每個客戶、用戶都有他們的偏好,會產(chǎn)生異于訓(xùn)練集的數(shù)據(jù)。模型需要處理許多與此前訓(xùn)練的任務(wù)目標(biāo)相近、但不完全一樣的任務(wù)。當(dāng)今的尖端模型雖然在訓(xùn)練過的任務(wù)上有相當(dāng)于人類或超人類的能力,但在這些情況下,性能會大打折扣甚至完全崩潰。

遷移學(xué)習(xí)是對付這些特殊情況的殺手锏。許多產(chǎn)品級的機(jī)器學(xué)習(xí)應(yīng)用,需要進(jìn)入標(biāo)記數(shù)據(jù)稀缺的任務(wù)領(lǐng)域,對于這類商業(yè)應(yīng)用,遷移學(xué)習(xí)無疑是必需的。今天,數(shù)據(jù)的“低樹果實(shí)”基本已經(jīng)被摘光,接下來,必須要把學(xué)得的東西遷移到新的任務(wù)與領(lǐng)域中。

相關(guān)文章:

數(shù)據(jù)不夠怎么訓(xùn)練深度學(xué)習(xí)模型?不妨試試遷移學(xué)習(xí)

香港科技大學(xué)楊強(qiáng) KDD China 技術(shù)峰會演講:遷移學(xué)習(xí)的本質(zhì)與實(shí)際應(yīng)用

雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

為什么吳恩達(dá)認(rèn)為未來屬于遷移學(xué)習(xí)?

分享:
相關(guān)文章

用愛救世界
當(dāng)月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說