3
本文作者: 圖普科技 | 2016-07-28 11:49 |
雷鋒網按:本文由圖普科技工程師翻譯自《Facebook’s New AI Can Paint, But Google’s Knows How to Party》。雷鋒網獨家文章。
Facebook和Google正在建造巨大的神經網絡——這些人造大腦可以馬上識別人臉,汽車,建筑和數碼照片里面的其他物體,但它們能做的還不止這些。
他們可以識別口語,將一種語言翻譯成另一種;它們還能識別廣告,或教機器人把螺釘帽放到瓶子里。如果你把這些大腦完全顛倒,你不僅可以教他們識別圖像,還可以以相當有趣(但有時令人不安)的方式描繪圖像。
Facebook曾透露,他們正在訓練其神經網絡自動描繪含有飛機、汽車、和動物等物體的小圖像,有大概40%的機率,這些圖像可以讓我們以為它們是真實的。“這個模型可以區(qū)分你會用愿意用手機拍下來的圖像和其他不自然的圖像——比如你的電視上的白色雪花,或某種抽象藝術圖像,”Facebook的人工智能研究員Fergus說?!八斫鈭D像組成的結構”(如上圖)。
與此同時,Google的研究員已經把事情推到了另一個極端——他們使用神經網絡將真實的照片變成虛幻但有趣的圖像。他們訓練機器在照片中尋找常見的模式,加強這些模式,然后用相同的圖像重復這個過程?!斑@將創(chuàng)建一個反饋循環(huán):如果一個云看起來有點像一只鳥,我們的神經網絡會讓它看起來更像一只鳥,”Google在一篇博客文章中解釋這個項目?!岸敱恍薷牡膱D像再次通過網絡,網絡能更確切地識別出圖像中的‘鳥’,到最后,一幅鳥的圖像就好像是憑空地出現了。”這個過程的結果是一種機器生成的抽象藝術(見下文)。
Google的神經網絡可以在地平線上看到塔的粗略輪廓,然后增強輪廓線條,直到出現完整的圖像。
在某種程度上,這些只是賣弄的花招——特別是Google的引起幻覺重現的反饋回路。而且值得注意的是,Facebook的假圖片只有64*64像素。但在另一種程度上,這些項目可以用于優(yōu)化神經網絡,讓它們接近類似于人類。一家叫做Dextro的計算機視覺公司的首席執(zhí)行官David Luan說:“這項工作有助于更好地形象化了我們的網絡是怎么學習的?!?/p>
這些成果也有點令人不安。不僅僅是因為Google的圖像生成像是服用了過量的致幻劑,像鳥和駱駝,或蝸牛和豬(見下文)的雜交育種,更有甚者,它們讓我們看到了一個機器能用一種我們不能意識到的方式控制我們的所觀所聽的世界——一個真實與虛幻交織在一起的世界。
Fergus和Facebook的其他兩名研究人員在學術文檔庫arXiv.org發(fā)表論文,介紹圖像生成模型——他們和與紐約大學庫朗數學科學研究所的博士生一起完成的成果。該系統(tǒng)使用了兩個神經網絡,讓它們互相競爭。一個網絡被用于識別自然圖像,另一個盡可能地去欺騙第一個。
Yann LeCun是Facebook人工智能實驗室的負責人,他稱這種為對抗訓練?!八鼈兓ハ啾荣?,”他在談論這兩個網絡時說道,“一個試圖欺騙另一個,另一個在盡力不被欺騙?!苯Y果就是一個系統(tǒng)產出了十分逼真的圖像。
LeCun和Fergus認為, 這個成果可以用于將已經退化的圖片還原成真實的圖片?!澳憧梢园岩粋€圖像恢復成自然圖像,”Fergus說。但他們認為,更重要的是,系統(tǒng)可以向 “無監(jiān)督的機器學習”邁一步,換句話說,這個成果可以幫助機器在沒有人類研究者提供明確的指導的前提下學習。
最終,LeCun說,只要有一組使用“沒有標記的”示例圖像,你就可以用這個模型訓練圖像識別系統(tǒng)—這意味著人類不需要一幅幅的瀏覽訓練用的圖像,辨別出圖像里有什么并用文字加以說明。“機器可以在不知道圖像內容的前提下學習圖像的結構”他說。
Luan指出當前系統(tǒng)仍然需要一些監(jiān)督。但他稱Facebook的論文為“優(yōu)雅的工作”,他相信,它可以像Google正在做的工作一樣,幫助我們理解神經網絡的行為。
Facebook和Google創(chuàng)造的神經網絡由許多層的神經元組成,他們每一個都和其他神經元協(xié)同工作。雖然這些神經元執(zhí)行某些任務非常好,我們不太明白背后的原因是什么?!把芯可窠浘W絡的挑戰(zhàn)之一是理解每一層在發(fā)生什么”,Google在其博客上這樣說(他們拒絕進一步討論其圖像生成工作)。
Google解釋道,通過將神經網絡顛倒過來和教它們生成圖像,他們可以更好地了解神經網絡的運作方式。Google要求其網絡放大它在圖像內發(fā)現的東西。有時候,他們只是放大一個形狀的邊緣。其他時候,他們放大更復雜的東西,比如在地平線的一座塔的輪廓,在樹上的一座建筑,或隨機的噪聲(見上圖)。但在每種情況下,研究人員都可以更好地了解這個網絡正在看到的是什么。
Google表示“這種技術給我們提供了一種定性的感覺,幫助我們理解神經網絡的每一層抽象在它理解圖像的過程中扮演什么角色”。它幫助研究人員“形象化神經網絡是如何能夠執(zhí)行困難的分類任務,優(yōu)化網絡體系結構和檢查這個網絡在訓練期間學會了什么?!?/p>
另外,像Facebook的工作那樣,這個成果有點酷,有點奇怪,也有點可怕。貌似,計算機越能好的識別圖像,對我們來說就越不利。
雷鋒網注:雷鋒網獨家文章,轉載請聯系授權并標注出處和作者,不得刪減內容。
雷峰網原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知。