0
本文作者: 楊文 | 2017-08-04 14:06 |
雷鋒網(wǎng)AI科技評(píng)論按:蘋果第一篇AI論文一經(jīng)投放,便斬獲CVPR 2017最佳論文。隨后便有外界不斷猜測(cè)蘋果的論文質(zhì)量有水分,似乎不能匹配最佳論文的頭銜。雷鋒網(wǎng)記者隨后從學(xué)術(shù)角度采訪了幾位學(xué)術(shù)界人士??纯此麄?cè)趺凑f(shuō)。
蘋果的AI研究消息首次進(jìn)入公眾視野的是在去年的12月初。
2016年12月8日,在西班牙NIPS 2016大會(huì)上,蘋果AI研究負(fù)責(zé)人Russ Salakhutdinov承諾將會(huì)公布和分享他們的最新AI研究成果。
2016年12月22日,首篇機(jī)器學(xué)習(xí)論文通過康奈爾大學(xué)圖書館出版,顯示的提交時(shí)間是11月15日。
2017年7月19日,蘋果開通機(jī)器學(xué)習(xí)博客(Apple Machine Learning Journal ),同時(shí)發(fā)表一篇題為“Improving the Realism of Synthetic Images”的文章。這篇文章用更通俗的語(yǔ)言介紹了之前發(fā)表的論文。
2017年7月22日,蘋果的這篇論文獲CVPR 2017最佳論文。
回顧一下這篇論文的主要內(nèi)容:
這篇題為《通過對(duì)抗訓(xùn)練從模擬的和無(wú)監(jiān)督的圖像中學(xué)習(xí)》是圖像識(shí)別領(lǐng)域的論文。論文中,提出了一個(gè)“模擬+無(wú)監(jiān)督學(xué)習(xí)”(simulated + unsupervised learning)的學(xué)習(xí)方法,使用的是如今非?;鸬纳疃葘W(xué)習(xí)“對(duì)抗訓(xùn)練”。GANs(對(duì)抗訓(xùn)練)發(fā)明者Ian Goodfellow得知蘋果的第一篇機(jī)器學(xué)習(xí)論文是關(guān)于GANs,也十分興奮,并在自己的推特中第一時(shí)間轉(zhuǎn)了這篇論文。
GANs模型,簡(jiǎn)單的說(shuō)就是讓兩個(gè)網(wǎng)絡(luò)相互競(jìng)爭(zhēng),玩一個(gè)“貓鼠游戲”。
一個(gè)叫做生成器網(wǎng)絡(luò)G( Generator Network),它不斷捕捉訓(xùn)練庫(kù)里真實(shí)圖片的概率分布,將輸入的隨機(jī)向量轉(zhuǎn)變成新的樣本。一句話,G負(fù)責(zé)生成假圖片。
另一個(gè)叫做判別器網(wǎng)絡(luò)D(Discriminator Network),它可以同時(shí)觀察真實(shí)和假造的數(shù)據(jù),判斷這個(gè)圖片到底是不是真的。
G嘗試用自己的生成的仿品來(lái)“蒙騙”D,而D也不斷提高自己鑒別真?zhèn)蔚乃?。這樣G的造假能力和D的鑒別能力都會(huì)越來(lái)越高超。
而蘋果的“對(duì)抗訓(xùn)練”是對(duì)原有的GANs模型做了稍加的修改,形成了自己的SimGANs模型。其中sim是單詞 Simulator的縮寫,即模擬器的意思。
蘋果的SimGANs其實(shí)包括三部分:模擬器(Simulator)和精制器(Refiner),然后再加上一個(gè)判別器(Discriminator)。模擬器合成圖像,再用精制器做優(yōu)化使得更像真實(shí)圖片,最后再由判別器做識(shí)別訓(xùn)練。
蘋果也在自己的論文摘要中提到: “我們的模擬+無(wú)監(jiān)督學(xué)習(xí)方法,使用的對(duì)抗網(wǎng)絡(luò)跟GANs很類似。但是,輸入值是合成圖像,而不是隨機(jī)向量。
隨后便有學(xué)術(shù)界人士質(zhì)疑,指出蘋果的創(chuàng)新并不是具有突破性的,似乎不夠資格評(píng)選為“最佳論文”。
甚至在知名問答社區(qū)知乎上有人從論文的第一作者背景開始懷疑,最佳論文評(píng)選過程有暗箱操作的嫌疑。
點(diǎn)贊數(shù)最多的答主回答:
論文第一作者Ashish Shrivastava,馬里蘭大學(xué)計(jì)算機(jī)視覺博士
隨后雷鋒網(wǎng)駐國(guó)外記者也就「今年的CVPR 最佳論文是否實(shí)至名歸」這個(gè)問題采訪了幾位學(xué)術(shù)界人士:
CrowdAI 研究員Jigar Doshi接受采訪說(shuō):
(因?yàn)榭偣灿袃善罴颜撐?,他先從第一篇談起)第一篇Densely Connected Convolutional Networks(密集連接的卷積網(wǎng)絡(luò))中,DenseNet模型有兩大貢獻(xiàn),一個(gè)是計(jì)算效率提升,大幅度地減少了參數(shù)數(shù)量,模型訓(xùn)練出來(lái)的精確度和質(zhì)量都要比之前好。還有就是模型能夠泛化,研究者用了好幾個(gè)數(shù)據(jù)集,用來(lái)展示研究成果可以用到其他數(shù)據(jù)集和場(chǎng)景中。這是一個(gè)大家都能用,一個(gè)通用的方法。大家都在看,都在討論,這篇論文是值得評(píng)為最佳論文的。
談到蘋果的SimGANs,Jigar評(píng)論到:SimGANs的優(yōu)點(diǎn)是無(wú)需標(biāo)注自動(dòng)生成新數(shù)據(jù),但是他在演示過程中只用了一個(gè)數(shù)據(jù)集,對(duì)它的泛化能力表示存疑。半年前自己也試過類似的方法,不過不起作用,不理解為什么在蘋果的試驗(yàn)中起了作用。同時(shí)很奇怪為什么這篇論文能評(píng)為最佳論文。
南洋理工大學(xué)一位研究手勢(shì)識(shí)別的計(jì)算機(jī)視覺博士評(píng)價(jià)蘋果論文說(shuō)道:
蘋果SimGANs的手勢(shì)識(shí)別效果并不好,還沒有自己做的模型效果好。
另一位MIT生物圖像博士:
感覺SimGANs并不是很有意義(not very meaningful),相比其他方法并沒有很大的提升。
不過也有AI學(xué)界人士支持蘋果獲最佳論文,一位亞馬遜研究員告訴記者:
SimGANs 很簡(jiǎn)單。但也開了一個(gè)新口子,針對(duì)一個(gè)具體問題有了新方法,未來(lái)其他人可以研究如何把類似方法用到其他領(lǐng)域,算是“拋磚引玉”。另外,由于該方法的特殊性,需要做許多工作才能用于某一領(lǐng)域,因此確實(shí)難以在一個(gè)研究中提出一個(gè)通用方案,解決一個(gè)具體問題已經(jīng)可以了。
來(lái)自國(guó)內(nèi)的一位中科院教授說(shuō)道:
SimGANs 論文第一作者 Ashish Shrivastava 的導(dǎo)師是 CVPR 大會(huì)主席 Rama Chellappa,算是“舉賢不避親”(意思是只要是真正有本領(lǐng)的賢能人才,不管與舉薦人是否有關(guān)系,都可以正常舉薦,讓賢能的人才發(fā)揮其作用。)雷鋒網(wǎng)記者也跟其他參會(huì)的學(xué)生老師提了這個(gè)疑問,很多人認(rèn)為論文評(píng)審流程嚴(yán)格,未必有多大不公平。
最后采訪的幾位大??偨Y(jié)了一下今年的兩篇最佳論文:這兩篇論文沒什么理論突破,只是技術(shù)上的提升改進(jìn)。同時(shí)也表示,今年的CVPR創(chuàng)新突破已經(jīng)很少,差不多都是在原有的基礎(chǔ)上有一點(diǎn)點(diǎn)提升。
雷鋒網(wǎng)小結(jié):三位反對(duì)蘋果獲最佳論文的統(tǒng)一看法是:蘋果SimGANs的泛化能力差,只能用到具體的某個(gè)領(lǐng)域。另外單從表現(xiàn)效果上看,和其他方法相比也沒有很大的提升。兩位支持者看法是:由于SimGANs方法的特殊性,確實(shí)難以形成一個(gè)通用方案,不過蘋果給出了一個(gè)新思路,能啟發(fā)大家就夠了。這屆CVPR總體來(lái)說(shuō)沒有學(xué)術(shù)界期待的那種劃時(shí)代的研究成果出現(xiàn),蘋果論文之所以不那么出色也能從中脫穎而出,恐怕不是蘋果“有關(guān)系”,而是“矮子里面選高個(gè)”的原因吧!
雷鋒網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。