只訓(xùn)練一次數(shù)據(jù)就能識(shí)別出物體，谷歌全新 AI 算法“單次學(xué)習(xí)”

本文作者：老王

2016-11-04 20:23

導(dǎo)語(yǔ)：谷歌 DeepMind 團(tuán)隊(duì)發(fā)現(xiàn)了一種新的方式對(duì)深度學(xué)習(xí)算法進(jìn)行調(diào)整，新算法可以只通過一個(gè)例子就能識(shí)別出圖像中的物體，該算法被稱為“單次學(xué)習(xí)”。

近日，谷歌 DeepMind 團(tuán)隊(duì)發(fā)現(xiàn)了一種新的方式對(duì)深度學(xué)習(xí)算法進(jìn)行調(diào)整，新算法可以只通過一個(gè)例子就能識(shí)別出圖像中的物體，該算法被稱為“單次學(xué)習(xí)”。

一套算法通常需要訓(xùn)練大量數(shù)據(jù)才能“學(xué)會(huì)”一件事情，尤其是在計(jì)算機(jī)視覺和語(yǔ)音識(shí)別方向，通常在一個(gè)模型內(nèi)需要喂給成千上萬(wàn)的圖像和語(yǔ)音數(shù)據(jù)才能識(shí)別出某個(gè)圖像/語(yǔ)音，而且圖像和語(yǔ)音訓(xùn)練數(shù)據(jù)的獲取本身就較為麻煩。

Facebook M 研發(fā)人員曾提到，在人工客戶的指引下，計(jì)算機(jī)虛擬客服仍舊需要重復(fù)甚至百萬(wàn)次才能明白用戶某一個(gè)簡(jiǎn)單的需求。

針對(duì)學(xué)習(xí)成本和過程復(fù)雜這一問題，谷歌的 DeepMind 團(tuán)隊(duì)研究員奧里奧爾·溫亞爾斯（Oriol Vinyals）在深度學(xué)習(xí)系統(tǒng)中增加了一個(gè)記憶組件，當(dāng)然，這套系統(tǒng)仍然需要事先分析數(shù)百種圖片，訓(xùn)練好成型的學(xué)習(xí)模型，但此后卻可以學(xué)會(huì)通過一張照片識(shí)別新的物體。

那么它是如何做到分析一張圖片就能完成物體的檢測(cè)和識(shí)別的？其實(shí)這套系統(tǒng)本質(zhì)上是通過分析圖片中的獨(dú)特元素來完成識(shí)別任務(wù)。這種算法只需要看一個(gè)例子，便可達(dá)到近似于傳統(tǒng)深度學(xué)習(xí)系統(tǒng)的準(zhǔn)確率。

除了谷歌的“單次學(xué)習(xí)”之外，目前較為熱門的“遷移學(xué)習(xí)”也是提高數(shù)據(jù)訓(xùn)練效率的一種方式，它可以事先把一個(gè)預(yù)先訓(xùn)練好的模型挪到一個(gè)類似的任務(wù)上使用，節(jié)省了訓(xùn)練時(shí)間。

深度學(xué)習(xí)的某些任務(wù)中擁有龐大的數(shù)據(jù)集，而有些相似的任務(wù)卻沒有那么大數(shù)據(jù)集。在這種情況下可以從前者訓(xùn)練好的模型中抽掉最后幾層，在后者上只另外訓(xùn)練最后幾層。如語(yǔ)音識(shí)別領(lǐng)域，當(dāng)研究人員擁有大量英語(yǔ)數(shù)據(jù)，卻缺乏葡萄牙語(yǔ)數(shù)據(jù)時(shí)，但由于兩者均受拉丁語(yǔ)影響，有著一定的共性，研究者可事先拿英語(yǔ)語(yǔ)音數(shù)據(jù)訓(xùn)練模型，基于這個(gè)模型在葡萄牙語(yǔ)上訓(xùn)練模型的最后幾層，然后對(duì)這幾層的參數(shù)進(jìn)行微調(diào)。

只訓(xùn)練一次數(shù)據(jù)就能識(shí)別出物體，谷歌全新 AI 算法“單次學(xué)習(xí)”

楊強(qiáng)教授曾在雷鋒網(wǎng)承辦的 CCF-GAIR 大會(huì)中提到一點(diǎn)，大數(shù)據(jù)設(shè)計(jì)出來的模型用于小數(shù)據(jù)上，它的副產(chǎn)品就是個(gè)性化。這就是遷移學(xué)習(xí)的目的。

遷移學(xué)習(xí)分為兩種：樣本遷移，特征遷移。其在應(yīng)用場(chǎng)景中則如下：

基于模型的遷移：如圖像識(shí)別，訓(xùn)練萬(wàn)張頂千萬(wàn)張。相似度越大，遷移的概率大。
社交網(wǎng)絡(luò)之間的遷移：將千萬(wàn)人的大數(shù)據(jù)模型遷移到某個(gè)人身上。

由此可以看出，谷歌的單次學(xué)習(xí)系統(tǒng)與基于模型的遷移在目的上有一定的相通之處。

之前也有研究者開發(fā)過單次學(xué)習(xí)系統(tǒng)，但通常不兼容深度學(xué)習(xí)系統(tǒng)。而這次具有一定的突破性意義。

韓國(guó)先進(jìn)科技學(xué)院大腦和機(jī)器智能實(shí)驗(yàn)室主任 Sang Wan Lee 說：

這是一種很有趣的方法，它提供了一種新穎的方式對(duì)大規(guī)模的數(shù)據(jù)庫(kù)進(jìn)行單次學(xué)習(xí)。這為人工智能社區(qū)做出了技術(shù)貢獻(xiàn)，計(jì)算機(jī)視覺研究人員可能非常重視此事。

任何新算法在提到效率的同時(shí)，總是無法避免它的不足。有學(xué)者對(duì)單次學(xué)習(xí)提出了質(zhì)疑，他認(rèn)為該套學(xué)習(xí)系統(tǒng)與人類的學(xué)習(xí)方法存在很大差異，可能會(huì)導(dǎo)致識(shí)別準(zhǔn)確率的問題。哈佛大學(xué)腦科學(xué)系副教授山姆·格什曼（Sam Gershman）表示，人類通常是通過理解一張圖像的組成元素來學(xué)習(xí)的，但在此基礎(chǔ)上還需要一些實(shí)際的知識(shí)和嘗試。平衡車可能看上去與自行車或摩托車大不相同，但它卻可以使用相同的零件。上面提到單次學(xué)習(xí)是基于物體的獨(dú)特元素來判斷，即便計(jì)算機(jī)掌握摩托車和自行車的所有零件，但面對(duì)擁有相似零件的平衡車時(shí)，有很大概率存在誤判的問題。

Sang Wan Lee 表示，計(jì)算機(jī)的單次學(xué)習(xí)能力要比拼人類還需要經(jīng)過一段時(shí)間，即便是我們自己目前也并沒有揭開人類單次學(xué)習(xí)能力的秘密。

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

7人收藏

相關(guān)文章

老王

編輯

微信 wangyafeng123456

發(fā)私信

當(dāng)月熱門文章

只訓(xùn)練一次數(shù)據(jù)就能識(shí)別出物體，谷歌全新 AI 算法“單次學(xué)習(xí)”

只訓(xùn)練一次數(shù)據(jù)就能識(shí)別出物體，谷歌全新 AI 算法“單次學(xué)習(xí)”