智慧之巔，三十年來AI宗師們的那點(diǎn)事

本文作者： Leo

2015-06-18 12:48

導(dǎo)語：“深度學(xué)習(xí)讓機(jī)器執(zhí)行人類的活動，如看、聽和思考，可以模式識別提供了可能性，促進(jìn)了人工智能技術(shù)的進(jìn)步。”但是也不免有人笑談，Hinton已建立了一個很好的梯子，但這個梯子并不一定能帶你到月球。

編者按：deep learning曾被《紐約時報》頭版報道：“深度學(xué)習(xí)讓機(jī)器執(zhí)行人類的活動，如看、聽和思考，可以模式識別提供了可能性，促進(jìn)了人工智能技術(shù)的進(jìn)步?！钡且膊幻庥腥诵φ?，Hinton已建立了一個很好的梯子，但這個梯子并不一定能帶你到月球。而這里，Leo或許可以帶給你不一樣的想法。

近期Nature雜志刊登了Lecun、Bengio、Hinton的深度學(xué)習(xí)(deep learning)文章，是對最近深度學(xué)習(xí)火爆進(jìn)展的總結(jié)，也是對他們?nèi)陮Ｗ⑼黄凭竦淖罴芽隙ā?/span>

深度學(xué)習(xí)火到什么程度呢？據(jù)我所知，在工業(yè)界，Google、Facebook、微軟、百度、騰訊以及其它創(chuàng)業(yè)公司，都想用深度學(xué)習(xí)的算法，意圖達(dá)到頂級的智能識別實(shí)用精度（語音識別、人像識別等）。

深度學(xué)習(xí)的廣泛應(yīng)用，讓它載入史冊，可以比肩最近人工智能領(lǐng)域的圖靈獎工作--哈佛教授 Leslie Valiant的可學(xué)習(xí)性理論（2010年圖靈獎，90年代初在此思想下誕生了著名的 Boosting 算法)、 UCLA教授 Judea Pearl 的基于概率推斷的人工智能（2011年圖靈獎，90年代末開始基于此思想的圖模型風(fēng)靡學(xué)術(shù)界）。

智慧之巔，三十年來AI宗師們的那點(diǎn)事

Harvard教授 Leslie Valiant

智慧之巔，三十年來AI宗師們的那點(diǎn)事

UCLA教授 Judea Pearl

我時常和業(yè)內(nèi)人士交流，包括硅谷的工程師、研究員（圖像分類、廣告推薦等），風(fēng)險投資者，美國學(xué)術(shù)界的教授，還有在創(chuàng)業(yè)公司的和在學(xué)校實(shí)驗(yàn)室做研究的清華、交大學(xué)生。大家對深度學(xué)習(xí)的歷史背景缺乏全面細(xì)膩的了解，甚至有些盲從。

在我創(chuàng)業(yè)前，深度學(xué)習(xí)還沒“火”，我在Yann Lecun的實(shí)驗(yàn)室呆了一年，研究圖模型和深度學(xué)習(xí)的關(guān)系——當(dāng)時對兩個體系都深刻理解的人幾乎沒有。而在本該功利的創(chuàng)業(yè)環(huán)境里，到目前為止，我們團(tuán)隊還未使用深度學(xué)習(xí)，顯得有些“另類”甚至“落伍”，所以帶著這樣熟悉又陌生的心情，今天想分享一下自己的體會，算是對深度學(xué)習(xí)以及Hinton和Lecun的三十年創(chuàng)新之路的致敬。

首先，來介紹下Deep Learning的主要人物背景：

Geoff Hinton是深度學(xué)習(xí)學(xué)派的祖師爺，老爺子腰椎不好，經(jīng)常得站著寫代碼到夜里一點(diǎn)，不能坐飛機(jī)，得坐火車從東邊到西邊去開會。

智慧之巔，三十年來AI宗師們的那點(diǎn)事

Geoff Hinton，deep learning 學(xué)派創(chuàng)始人之一

Yann Lecun 是 Geoff Hinton 三十年前的弟子。最近深度學(xué)習(xí)應(yīng)用于智能理解特別廣泛的模型是卷積神經(jīng)網(wǎng)（ConvNet），就是 Yann Lecun 發(fā)明的 / 命名的。在學(xué)術(shù)上，這和傳統(tǒng)的深度學(xué)習(xí)其他的模型有顯著性差異 —— 我甚至認(rèn)為這是思想性的巨大差異（世界可學(xué)性的假設(shè)）。

智慧之巔，三十年來AI宗師們的那點(diǎn)事

圖右為Yann Lecun，卷積神經(jīng)網(wǎng)的發(fā)明者，Geoff Hinton的弟子

Andrew Ng 是 Michale Jordan（ Berkeley 教授，圖模型的泰斗）的明星弟子，Andrew 獨(dú)立后，在Stanford,、Google 和 Baidu 做的反而是deep learning （有點(diǎn)武當(dāng)?shù)茏訉W(xué)了少林，或者少林弟子學(xué)了武當(dāng)?shù)囊馕叮?。后來做了網(wǎng)絡(luò)公開課程Coursera后名聲大噪，意義大大超越了其學(xué)術(shù)界的地位和范疇。

智慧之巔，三十年來AI宗師們的那點(diǎn)事

吳恩達(dá)（Andrew Ng），百度首席科學(xué)家，在線教育平臺coursera的創(chuàng)始人

歷史究竟發(fā)生了什么? 深度學(xué)習(xí)為什么突然火了？

標(biāo)志性事件發(fā)生在2012年，兩個“小毛孩”打敗了業(yè)界神話。

2012年底，Geoff Hinton 的博士生 Alex Krizhevsky、Ilya Sutskever（他們研究深度學(xué)習(xí)時間并不長）在圖片分類的競賽 ImageNet上，在識別結(jié)果拿了第一名。其實(shí)類似的比賽每年有很多，而這個事件的意義在于，Google 團(tuán)隊也在這個數(shù)據(jù)集上做了測試（非公開的，Google沒有顯式參加學(xué)術(shù)界的“競賽”），用的也是深度學(xué)習(xí)，但識別精度比Geoff Hinton的團(tuán)隊差了很多，這下工業(yè)界振奮了：

同樣用深度學(xué)習(xí)的算法，大神級別的Google團(tuán)隊，居然會在識別精度上差這么多！

先來談?wù)劇癎oogle團(tuán)隊”是干什么的。它是特殊的，因?yàn)樗煌谄渌鸊oogle團(tuán)隊，并且這個項(xiàng)目受到Google公司足夠的戰(zhàn)略級重視，有著世界級的明星領(lǐng)導(dǎo)者，其中包括 Andrew Ng、Google 神人 Jeff Dean（他們在深度學(xué)習(xí)領(lǐng)域已投入很多，并到處宣講他們的戰(zhàn)果）以及業(yè)界無法企及的硬件和數(shù)據(jù)資源的支持。

我想，如果沒有這樣巨大的反差，深度學(xué)習(xí)還不會得到這么快的傳播和認(rèn)可。因?yàn)楫?dāng)時的學(xué)術(shù)界還不知道Google內(nèi)部的測試成績，只知道Geoff Hinton得了第一，擊敗了另一個學(xué)術(shù)界頂級的Oxford團(tuán)隊。甚至今天，很多人還不知道這段歷史。

兩個“小毛孩”讓業(yè)界神話陷入低沉：Google投入產(chǎn)出并不具有說服力，甚至，是可恥的。但是，工業(yè)界似乎不需要、也不該關(guān)心面子。

緊接著，巨頭的壟斷游戲開始了。

在機(jī)器學(xué)習(xí)方面頂級年度會議（NIPS）上，Google競價超過了包括微軟在內(nèi)的其他公司，收購了Alex Krizhevsky、Ilya Sutskever 和 Geoff Hinton這三個剛剛注冊幾個月的公司。好像是花5000萬美元買了三個人的部分時間?，F(xiàn)在，Google 團(tuán)隊里面，曾經(jīng)被打敗的人可以正式拉著 Geoff Hinton 聊天了，工業(yè)界似乎不需要、也不該關(guān)心面子。而Facebook作為對谷歌的回應(yīng)，挖了Yann Lecun，讓他在紐約領(lǐng)導(dǎo)成立了 Facebook AI lab。Andrew Ng則離開Google去了百度。

從“硬”結(jié)果來說，其實(shí)此時的百度做得不會比過去的 Google 差，“軟”名聲還是因此提高很多：相比于Google X, Facebook AI lab, Google Brain等，能提出用“深度學(xué)習(xí)研究院”這個用算法來命名部門的人是需要“魄力”的。

有趣的是，后來Yann Lecun組的學(xué)生也出來了一半，陸續(xù)開了幾家深度學(xué)習(xí)的創(chuàng)業(yè)公司，其中一家早前被 Twitter 收購。另外一些創(chuàng)業(yè)公司，則分別投入了Facebook 和 Google的麾下。粗略估計，深度學(xué)習(xí)給Geoff Hinton和 Yann Lecun 的組帶來了近十個千萬富翁。

更有意思的是（很有啟發(fā)性并值得思考），Alex Krizhevsky 和 Geoff Hinton的競賽用的正是 Yann Lecun 發(fā)明的卷積神經(jīng)網(wǎng)，但結(jié)果剛出來時（實(shí)現(xiàn)細(xì)節(jié)還沒有公布），Yann Lecun和他的NYU實(shí)驗(yàn)室成員甚至沒法重復(fù)Geoff Hinton的結(jié)果。這顯然不科學(xué)！

自己發(fā)明的算法，使用結(jié)果不如另外一個組。這下炸了鍋，Yann Lecun開了組會，反思的主題是“為什么過去兩年我們沒有得到這樣的成績” 。

高手過招，Idea is cheap; The devil is in the details （有想法很廉價；魔鬼在細(xì)節(jié)處）。想法其實(shí)很重要，但只能區(qū)分高手和普通人。高手都有想法，但誰才能創(chuàng)造歷史呢？Yann Lecun 這樣的實(shí)驗(yàn)室需要反思什么呢？先看看他們有些什么吧。

我經(jīng)歷過巔峰時期的微軟亞洲研究院（十五年前，這里的實(shí)習(xí)生只能是名校的各系第一名）、UCLA (排名10名左右)、MIT AI lab (計算機(jī)專業(yè)第一名)，實(shí)驗(yàn)室的茶歇時間 Tea Time, 過道擠滿了頂級會議的最佳論文獲得者---NIPS, CVPR等 ?；谝陨辖?jīng)驗(yàn)，我先介紹一下 Yann Lecun 實(shí)驗(yàn)室的過人之處。

Yann Lecun上課教授和使用的是他自己寫的語言Lush，用來替代 matlab（很方便描述矩陣運(yùn)算、圖像處理等）、python在科學(xué)研究的功能。他的團(tuán)隊三十年如一日的專注于神經(jīng)網(wǎng)絡(luò)的研究，從不隨波逐流，課題覆蓋卷積神經(jīng)網(wǎng)的方方面面。有的博士生聰明數(shù)學(xué)好，非常敏感于卷積神經(jīng)網(wǎng)模型的深刻理解；有的博士生專注于結(jié)構(gòu)參數(shù)的行為分析（多少層啊之類）；有的博士生研究在不同數(shù)據(jù)分布（應(yīng)用場景下）的表現(xiàn)，比如字母識別、圖像分類、物體檢測、場景分類等。

這樣的學(xué)術(shù)堅持，是在怎樣的艱難背景下呢？

人工智能領(lǐng)域，神經(jīng)網(wǎng)絡(luò)思想在80年代末開始衰落，之后分別經(jīng)歷了幾個劃時代的圖靈獎級工作的興起，統(tǒng)計學(xué)習(xí)理論（帶來支持向量機(jī) SVM 算法），可學(xué)習(xí)理論(帶來 Boosting 算法)，概率推斷（圖模型，graphical model）幾乎壟斷了過去的三十年。在之前提到2012年的 Geoff Hinton 團(tuán)隊的深度學(xué)習(xí)打敗Google的標(biāo)志性事件前，圖模型的思想橫掃計算機(jī)視覺領(lǐng)域（超越了boosting，SVM等）。這使得深度學(xué)習(xí)生存艱難，沒有多少同行在研究中使用深度學(xué)習(xí)，更多年輕學(xué)生愿意去“時髦”的機(jī)器學(xué)習(xí)研究組。

2006年，Yann Lecun的文章還在闡述深度學(xué)習(xí)如何能跟當(dāng)年流行的圖模型（比如條件隨機(jī)場模型）等價，證明自己的工作在不同數(shù)據(jù)集上也能和圖模型做到相當(dāng)?shù)淖R別精度。盡管在2012年末，Alex Krizhevsky、Ilya Sutskever 兩個“小毛孩”在競賽中用深度學(xué)習(xí)打敗了Google團(tuán)隊，讓工業(yè)界炸了鍋。

但是，工業(yè)界對深度學(xué)習(xí)的追捧傳遞回學(xué)術(shù)界是發(fā)生在一年以后。原因是，除了頂級教授因?yàn)樗饺岁P(guān)系能知道工業(yè)界最前沿進(jìn)展，大部分學(xué)術(shù)界教授并沒有公開渠道及時獲取信息，而這些教授卻是學(xué)術(shù)工作評審的主力。因此，直到2013年，Yann Lecun 的文章在計算機(jī)視覺的頂級會議上（CVPR）依然很難發(fā)表（這時的深度學(xué)習(xí)在多項(xiàng)數(shù)據(jù)集上相比其他“傳統(tǒng)”方法并不排他性的出色）。

Yann Lecun 像戰(zhàn)士一樣對抗著學(xué)術(shù)界的“庸俗”和“傳統(tǒng)”，在不同場合討伐從業(yè)人員的態(tài)度、標(biāo)準(zhǔn)和品味，公開發(fā)文抵制計算機(jī)視覺頂級會議CVPR，并于2013年創(chuàng)辦了新的學(xué)術(shù)文章發(fā)布體系（ICLR）。

可笑的是，僅僅不到兩年的時間，現(xiàn)在，視覺的文章沒用上深度學(xué)習(xí)都很難被發(fā)表。

主流（不見得創(chuàng)造歷史）的和最需要獨(dú)立思想和自由批判精神的年輕學(xué)者，卻似乎沒有節(jié)操地要和深度學(xué)習(xí)沾上邊（當(dāng)上“千”個博士生都在研究深度學(xué)習(xí)的時候，應(yīng)該不需要什么獨(dú)立見解和勇氣）。

今天，反而是三十年后卷土重來的Yann Lecun（還有Bengio，Geoff Hinton）愿意站在先鋒，批判性地談?wù)撋疃葘W(xué)習(xí)的泡沫繁榮，呼吁學(xué)術(shù)界、資金擁有者冷靜。這種反差很是讓人感慨。

智慧之巔，三十年來AI宗師們的那點(diǎn)事

Yoshua Bengio

到底當(dāng)時，Yann Lecun 和 Geoff Hinton的團(tuán)隊細(xì)微差別在哪呢？高手也可能錯過什么呢？或許我們很難有接近事實(shí)的答案，原因可能很復(fù)雜。對于歷史的真實(shí)解讀才有助于我們拋開浮華，啟發(fā)與他們一樣追求創(chuàng)新的我們，無論是在學(xué)術(shù)研究還是創(chuàng)業(yè)。

下次我會撰文就這個問題專門討論一下，期待有興趣的朋友和我共同交流，郵箱：leo@yitu-inc.com。

附：作者與深度學(xué)習(xí)的關(guān)系

加州大學(xué)洛杉磯分校（UCLA）統(tǒng)計學(xué)博士，師從 Alan Yuille 教授，思想上屬于 Bayesian 理念，繼承大師 Stuart Geman（美國數(shù)學(xué)家，科學(xué)院院士, 他和弟弟在84年的馬爾科夫隨機(jī)場奠基性工作，足足影響了之后三十年的科研歷史）David Mumford（美國數(shù)學(xué)家，74年菲爾茲獎得主）和概率學(xué)大師Ulf Grenander開創(chuàng)的 Pattern Theory 學(xué)派（這些數(shù)學(xué)家的工作大大早于計算機(jī)領(lǐng)域的圖模型）。創(chuàng)立依圖前，作者在 Yann Lecun 的實(shí)驗(yàn)室研究圖模型和深度學(xué)習(xí)的關(guān)系，可以從不同視角看深度學(xué)習(xí)。

智慧之巔，三十年來AI宗師們的那點(diǎn)事

依圖科技CEO Leo ，中文名：朱瓏

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

0人收藏

相關(guān)文章

Leo

專欄作者

依圖科技CEO

發(fā)私信

當(dāng)月熱門文章