0
當(dāng)AI浪潮襲來,谷歌、Facebook、微軟等幾個山頭恨不得把自己都浸沒在潮水里,可勁打滾兒的時候,蘋果這座孤島卻始終有一種不愿被沾濕的姿態(tài)。
12月初,在灑滿陽光的西班牙NIPS大會上,蘋果AI研究團隊負(fù)責(zé)人Russ Salakhutdinov曾興奮地宣布,蘋果將允許其AI研究人員對外發(fā)布論文。那之后,眾人都在翹首以待,巴巴等著這個這個世界上市值最高的公司(截至12月23日市值6172.34億美元)的第一篇AI論文將以何種面目出現(xiàn)。
今天,這篇論文出來了。蘋果伸出了手指,試探了一下海水。
這篇題為《通過對抗訓(xùn)練從模擬的和無監(jiān)督的圖像中學(xué)習(xí)》(Learning from Simulated and Unsupervised Images through Adversarial Training)的論文于12月22日提交給了arXiv.org,一經(jīng)發(fā)布迅速點燃了媒體頭條。
蘋果這篇圖像識別領(lǐng)域的論文,提出了一個所謂“模擬+無監(jiān)督學(xué)習(xí)”(simulated + unsupervised learning),使用了如今最炙手可熱的深度學(xué)習(xí)“對抗訓(xùn)練”。
而有著“GANs之父”之稱的Ian Goodfellow在推特里直接評論道:“蘋果第一份機器學(xué)習(xí)論文是關(guān)于GANs的?!?/p>
于是,GANs又借勢火了一把。
所謂的GANs模型,就是讓兩個網(wǎng)絡(luò)相互競爭,玩一個“貓鼠游戲”。
一個叫做生成器網(wǎng)絡(luò)G( Generator Network),它不斷捕捉訓(xùn)練庫里真實圖片的概率分布,將輸入的隨機向量轉(zhuǎn)變成新的樣本。一句話,G負(fù)責(zé)生成假圖片。
另一個叫做判別器網(wǎng)絡(luò)D(Discriminator Network),它可以同時觀察真實和假造的數(shù)據(jù),判斷這個圖片到底是不是真的。
G嘗試用自己的贗品來“蒙騙”D,而D也不斷提高自己鑒別贗品的水平。這樣G的造假能力和D的鑒別能力都會越來越高超。
在機器學(xué)習(xí)領(lǐng)域,需要海量的數(shù)據(jù)來訓(xùn)練模型,而海量數(shù)據(jù)本身的獲取都成問題。AI界常有這么個說法:
“誰手握了數(shù)據(jù),誰就占據(jù)了人工智能的制高點?!?/p>
南京大學(xué)周志華教授也曾經(jīng)在演講中提到機器學(xué)習(xí)應(yīng)用的限制因素:
機器學(xué)習(xí)雖然能力很強,但它并不是一個萬能的東西。至少有兩件事,我們經(jīng)常都要提醒自己,機器學(xué)習(xí)可能是做不了的。
第一種情況,如果我們的拿到的數(shù)據(jù)特征信息不夠充分,那么機器學(xué)習(xí)可能就幫不上忙;第二種情況,如果數(shù)據(jù)樣本的信息非常不充分,那么這種情況也基本上解決不了問題。
所以,GANs最具革命性的地方在于,它的生成器G自己產(chǎn)出數(shù)據(jù),而人只需要最初輸入一些隨機向量。無怪乎,Yann LeCun曾評價說:
“對抗訓(xùn)練是切片面包以來最酷的事情(Adversarial training is the coolest thing since sliced bread)?!?/p>
但是蘋果這份論文里提到的模型,與GANs還是有些微不同的。他們想要解決的問題就是:提升合成圖像的質(zhì)量。他們對GANs稍加修改,提出了“SimGAN”訓(xùn)練方法,其中的“Sim”指的就是單詞“模擬器”。論文摘要里提到:
“我們的模擬+無監(jiān)督學(xué)習(xí)方法,使用的對抗網(wǎng)絡(luò)跟GANs很類似。但是,輸入值是合成圖像,而不是隨機向量?!?/p>
蘋果的SimGAN其實包括三部分:模擬器(Simulator)和精制器(Refiner),然后再加上一個判別器(Discriminator)。模擬器合成圖像,再用精制器優(yōu)化,最后喂給判別器訓(xùn)練。
有學(xué)術(shù)圈內(nèi)人士對這篇論文的“含金量”表示懷疑,然而蘋果這份論文“試水”的意義其實遠大于論文本身的意義。Forbes評論道:這篇AI論文,是蘋果標(biāo)志性的一步。
對于AI業(yè)界來說,這表明蘋果要邁開步子、扛著大旗來攪動海水了。
這篇論文的第一作者是Ashish Shrivastava,其個人主頁上顯示為馬里蘭大學(xué)計算機視覺博士。
其它共同作者還有5人,分別是Tomas Pfister, Oncel Tuzel, Wenda Wang(華裔), Russ Webb 和Josh Susskind。但是蘋果的“秘密文化”并沒有一下子就敞開大口,這6名研究人員,除了Tomas Pfister之外,雷鋒網(wǎng)在Twitter上很難找到其它5人的蹤跡,而Tomas Pfister這位劍橋、牛津雙名校的高材生,至今發(fā)過的推文也只有5條而已。
PS:關(guān)注雷鋒網(wǎng)(微信公眾號:雷鋒網(wǎng))
相關(guān)文章:
百度硅谷 AI 實驗室主任 Adam Coates:企業(yè)級 AI 的未來展望及人才競爭
AI+時代,產(chǎn)品經(jīng)理如何做才能獲得機會突破?
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。