0
本文作者: 亞萌 | 2016-12-27 22:13 |
當(dāng)AI浪潮襲來(lái),谷歌、Facebook、微軟等幾個(gè)山頭恨不得把自己都浸沒(méi)在潮水里,可勁打滾兒的時(shí)候,蘋(píng)果這座孤島卻始終有一種不愿被沾濕的姿態(tài)。
12月初,在灑滿陽(yáng)光的西班牙NIPS大會(huì)上,蘋(píng)果AI研究團(tuán)隊(duì)負(fù)責(zé)人Russ Salakhutdinov曾興奮地宣布,蘋(píng)果將允許其AI研究人員對(duì)外發(fā)布論文。那之后,眾人都在翹首以待,巴巴等著這個(gè)這個(gè)世界上市值最高的公司(截至12月23日市值6172.34億美元)的第一篇AI論文將以何種面目出現(xiàn)。
今天,這篇論文出來(lái)了。蘋(píng)果伸出了手指,試探了一下海水。
這篇題為《通過(guò)對(duì)抗訓(xùn)練從模擬的和無(wú)監(jiān)督的圖像中學(xué)習(xí)》(Learning from Simulated and Unsupervised Images through Adversarial Training)的論文于12月22日提交給了arXiv.org,一經(jīng)發(fā)布迅速點(diǎn)燃了媒體頭條。
蘋(píng)果這篇圖像識(shí)別領(lǐng)域的論文,提出了一個(gè)所謂“模擬+無(wú)監(jiān)督學(xué)習(xí)”(simulated + unsupervised learning),使用了如今最炙手可熱的深度學(xué)習(xí)“對(duì)抗訓(xùn)練”。
而有著“GANs之父”之稱的Ian Goodfellow在推特里直接評(píng)論道:“蘋(píng)果第一份機(jī)器學(xué)習(xí)論文是關(guān)于GANs的?!?/p>
于是,GANs又借勢(shì)火了一把。
所謂的GANs模型,就是讓兩個(gè)網(wǎng)絡(luò)相互競(jìng)爭(zhēng),玩一個(gè)“貓鼠游戲”。
一個(gè)叫做生成器網(wǎng)絡(luò)G( Generator Network),它不斷捕捉訓(xùn)練庫(kù)里真實(shí)圖片的概率分布,將輸入的隨機(jī)向量轉(zhuǎn)變成新的樣本。一句話,G負(fù)責(zé)生成假圖片。
另一個(gè)叫做判別器網(wǎng)絡(luò)D(Discriminator Network),它可以同時(shí)觀察真實(shí)和假造的數(shù)據(jù),判斷這個(gè)圖片到底是不是真的。
G嘗試用自己的贗品來(lái)“蒙騙”D,而D也不斷提高自己鑒別贗品的水平。這樣G的造假能力和D的鑒別能力都會(huì)越來(lái)越高超。
在機(jī)器學(xué)習(xí)領(lǐng)域,需要海量的數(shù)據(jù)來(lái)訓(xùn)練模型,而海量數(shù)據(jù)本身的獲取都成問(wèn)題。AI界常有這么個(gè)說(shuō)法:
“誰(shuí)手握了數(shù)據(jù),誰(shuí)就占據(jù)了人工智能的制高點(diǎn)。”
南京大學(xué)周志華教授也曾經(jīng)在演講中提到機(jī)器學(xué)習(xí)應(yīng)用的限制因素:
機(jī)器學(xué)習(xí)雖然能力很強(qiáng),但它并不是一個(gè)萬(wàn)能的東西。至少有兩件事,我們經(jīng)常都要提醒自己,機(jī)器學(xué)習(xí)可能是做不了的。
第一種情況,如果我們的拿到的數(shù)據(jù)特征信息不夠充分,那么機(jī)器學(xué)習(xí)可能就幫不上忙;第二種情況,如果數(shù)據(jù)樣本的信息非常不充分,那么這種情況也基本上解決不了問(wèn)題。
所以,GANs最具革命性的地方在于,它的生成器G自己產(chǎn)出數(shù)據(jù),而人只需要最初輸入一些隨機(jī)向量。無(wú)怪乎,Yann LeCun曾評(píng)價(jià)說(shuō):
“對(duì)抗訓(xùn)練是切片面包以來(lái)最酷的事情(Adversarial training is the coolest thing since sliced bread)?!?/p>
但是蘋(píng)果這份論文里提到的模型,與GANs還是有些微不同的。他們想要解決的問(wèn)題就是:提升合成圖像的質(zhì)量。他們對(duì)GANs稍加修改,提出了“SimGAN”訓(xùn)練方法,其中的“Sim”指的就是單詞“模擬器”。論文摘要里提到:
“我們的模擬+無(wú)監(jiān)督學(xué)習(xí)方法,使用的對(duì)抗網(wǎng)絡(luò)跟GANs很類(lèi)似。但是,輸入值是合成圖像,而不是隨機(jī)向量。”
蘋(píng)果的SimGAN其實(shí)包括三部分:模擬器(Simulator)和精制器(Refiner),然后再加上一個(gè)判別器(Discriminator)。模擬器合成圖像,再用精制器優(yōu)化,最后喂給判別器訓(xùn)練。
有學(xué)術(shù)圈內(nèi)人士對(duì)這篇論文的“含金量”表示懷疑,然而蘋(píng)果這份論文“試水”的意義其實(shí)遠(yuǎn)大于論文本身的意義。Forbes評(píng)論道:這篇AI論文,是蘋(píng)果標(biāo)志性的一步。
對(duì)于AI業(yè)界來(lái)說(shuō),這表明蘋(píng)果要邁開(kāi)步子、扛著大旗來(lái)攪動(dòng)海水了。
這篇論文的第一作者是Ashish Shrivastava,其個(gè)人主頁(yè)上顯示為馬里蘭大學(xué)計(jì)算機(jī)視覺(jué)博士。
其它共同作者還有5人,分別是Tomas Pfister, Oncel Tuzel, Wenda Wang(華裔), Russ Webb 和Josh Susskind。但是蘋(píng)果的“秘密文化”并沒(méi)有一下子就敞開(kāi)大口,這6名研究人員,除了Tomas Pfister之外,雷鋒網(wǎng)在Twitter上很難找到其它5人的蹤跡,而Tomas Pfister這位劍橋、牛津雙名校的高材生,至今發(fā)過(guò)的推文也只有5條而已。
PS:關(guān)注雷鋒網(wǎng)(微信公眾號(hào):雷鋒網(wǎng))
相關(guān)文章:
百度硅谷 AI 實(shí)驗(yàn)室主任 Adam Coates:企業(yè)級(jí) AI 的未來(lái)展望及人才競(jìng)爭(zhēng)
AI+時(shí)代,產(chǎn)品經(jīng)理如何做才能獲得機(jī)會(huì)突破?
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。