0
本文作者: 老王 | 2016-11-04 20:23 |
近日,谷歌 DeepMind 團(tuán)隊(duì)發(fā)現(xiàn)了一種新的方式對(duì)深度學(xué)習(xí)算法進(jìn)行調(diào)整,新算法可以只通過(guò)一個(gè)例子就能識(shí)別出圖像中的物體,該算法被稱為“單次學(xué)習(xí)”。
一套算法通常需要訓(xùn)練大量數(shù)據(jù)才能“學(xué)會(huì)”一件事情,尤其是在計(jì)算機(jī)視覺和語(yǔ)音識(shí)別方向,通常在一個(gè)模型內(nèi)需要喂給成千上萬(wàn)的圖像和語(yǔ)音數(shù)據(jù)才能識(shí)別出某個(gè)圖像/語(yǔ)音,而且圖像和語(yǔ)音訓(xùn)練數(shù)據(jù)的獲取本身就較為麻煩。
Facebook M 研發(fā)人員曾提到,在人工客戶的指引下,計(jì)算機(jī)虛擬客服仍舊需要重復(fù)甚至百萬(wàn)次才能明白用戶某一個(gè)簡(jiǎn)單的需求。
針對(duì)學(xué)習(xí)成本和過(guò)程復(fù)雜這一問(wèn)題,谷歌的 DeepMind 團(tuán)隊(duì)研究員奧里奧爾·溫亞爾斯(Oriol Vinyals)在深度學(xué)習(xí)系統(tǒng)中增加了一個(gè)記憶組件,當(dāng)然,這套系統(tǒng)仍然需要事先分析數(shù)百種圖片,訓(xùn)練好成型的學(xué)習(xí)模型,但此后卻可以學(xué)會(huì)通過(guò)一張照片識(shí)別新的物體。
那么它是如何做到分析一張圖片就能完成物體的檢測(cè)和識(shí)別的?其實(shí)這套系統(tǒng)本質(zhì)上是通過(guò)分析圖片中的獨(dú)特元素來(lái)完成識(shí)別任務(wù)。這種算法只需要看一個(gè)例子,便可達(dá)到近似于傳統(tǒng)深度學(xué)習(xí)系統(tǒng)的準(zhǔn)確率。
除了谷歌的“單次學(xué)習(xí)”之外,目前較為熱門的“遷移學(xué)習(xí)”也是提高數(shù)據(jù)訓(xùn)練效率的一種方式,它可以事先把一個(gè)預(yù)先訓(xùn)練好的模型挪到一個(gè)類似的任務(wù)上使用,節(jié)省了訓(xùn)練時(shí)間。
深度學(xué)習(xí)的某些任務(wù)中擁有龐大的數(shù)據(jù)集,而有些相似的任務(wù)卻沒(méi)有那么大數(shù)據(jù)集。在這種情況下可以從前者訓(xùn)練好的模型中抽掉最后幾層,在后者上只另外訓(xùn)練最后幾層。如語(yǔ)音識(shí)別領(lǐng)域,當(dāng)研究人員擁有大量英語(yǔ)數(shù)據(jù),卻缺乏葡萄牙語(yǔ)數(shù)據(jù)時(shí),但由于兩者均受拉丁語(yǔ)影響,有著一定的共性,研究者可事先拿英語(yǔ)語(yǔ)音數(shù)據(jù)訓(xùn)練模型,基于這個(gè)模型在葡萄牙語(yǔ)上訓(xùn)練模型的最后幾層,然后對(duì)這幾層的參數(shù)進(jìn)行微調(diào)。
楊強(qiáng)教授曾在雷鋒網(wǎng)承辦的 CCF-GAIR 大會(huì)中提到一點(diǎn),大數(shù)據(jù)設(shè)計(jì)出來(lái)的模型用于小數(shù)據(jù)上,它的副產(chǎn)品就是個(gè)性化。這就是遷移學(xué)習(xí)的目的。
遷移學(xué)習(xí)分為兩種:樣本遷移,特征遷移。其在應(yīng)用場(chǎng)景中則如下:
基于模型的遷移:如圖像識(shí)別,訓(xùn)練萬(wàn)張頂千萬(wàn)張。相似度越大,遷移的概率大。
社交網(wǎng)絡(luò)之間的遷移:將千萬(wàn)人的大數(shù)據(jù)模型遷移到某個(gè)人身上。
由此可以看出,谷歌的單次學(xué)習(xí)系統(tǒng)與基于模型的遷移在目的上有一定的相通之處。
之前也有研究者開發(fā)過(guò)單次學(xué)習(xí)系統(tǒng),但通常不兼容深度學(xué)習(xí)系統(tǒng)。而這次具有一定的突破性意義。
韓國(guó)先進(jìn)科技學(xué)院大腦和機(jī)器智能實(shí)驗(yàn)室主任 Sang Wan Lee 說(shuō):
這是一種很有趣的方法,它提供了一種新穎的方式對(duì)大規(guī)模的數(shù)據(jù)庫(kù)進(jìn)行單次學(xué)習(xí)。這為人工智能社區(qū)做出了技術(shù)貢獻(xiàn),計(jì)算機(jī)視覺研究人員可能非常重視此事。
任何新算法在提到效率的同時(shí),總是無(wú)法避免它的不足。有學(xué)者對(duì)單次學(xué)習(xí)提出了質(zhì)疑,他認(rèn)為該套學(xué)習(xí)系統(tǒng)與人類的學(xué)習(xí)方法存在很大差異,可能會(huì)導(dǎo)致識(shí)別準(zhǔn)確率的問(wèn)題。哈佛大學(xué)腦科學(xué)系副教授山姆·格什曼(Sam Gershman)表示,人類通常是通過(guò)理解一張圖像的組成元素來(lái)學(xué)習(xí)的,但在此基礎(chǔ)上還需要一些實(shí)際的知識(shí)和嘗試。平衡車可能看上去與自行車或摩托車大不相同,但它卻可以使用相同的零件。上面提到單次學(xué)習(xí)是基于物體的獨(dú)特元素來(lái)判斷,即便計(jì)算機(jī)掌握摩托車和自行車的所有零件,但面對(duì)擁有相似零件的平衡車時(shí),有很大概率存在誤判的問(wèn)題。
Sang Wan Lee 表示,計(jì)算機(jī)的單次學(xué)習(xí)能力要比拼人類還需要經(jīng)過(guò)一段時(shí)間,即便是我們自己目前也并沒(méi)有揭開人類單次學(xué)習(xí)能力的秘密。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。