丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
人工智能 正文
發(fā)私信給郭思
發(fā)送

0

七次 CV 奪冠背后:顏水成與他的學(xué)生們

本文作者: 郭思 2023-09-19 11:18
導(dǎo)語:一波深度學(xué)習(xí)浪潮、七次世界冠軍、兩次轉(zhuǎn)場與追隨......

                       

七次 CV 奪冠背后:顏水成與他的學(xué)生們

他們不僅乘上了 AI 的浪潮,更創(chuàng)造了浪潮本身。

01冠軍團隊的誕生

2007 年,顏水成飛赴南洋,第一次踏上新加坡的土地,走進(jìn)新加坡國立大學(xué)(NUS)的校園。彼時,他將從美國伊利諾伊大學(xué)厄巴納-香檳分校(UIUC)結(jié)束博士后生涯,與導(dǎo)師黃煦濤(Thomas Huang)教授辭別,進(jìn)入找教職的階段。

1995 年,顏水成考入北京大學(xué)數(shù)學(xué)系后本碩博連讀,博士期間一直在微軟亞洲研究院(MSRA)實習(xí),由時任副院長的張宏江博士指導(dǎo)。他對計算機視覺和多媒體分析十分癡迷,畢業(yè)后先去往香港中文大學(xué)多媒體實驗室(MM Lab)跟隨后來的商湯創(chuàng)始人湯曉鷗教授做博士后研究,一年半之后又赴美國伊利諾伊大學(xué)厄巴納-香檳分校(UIUC),師從華人視覺鼻祖黃煦濤(Thomas Huang)教授做博士后。在黃煦濤的建議下,他在找教職時,將目標(biāo)瞄準(zhǔn)了亞洲的高校,先后面試了 NTU 與 NUS 兩所新加坡大學(xué)。兩個學(xué)校都面試順利通過了。

顏水成在新加坡待了一個星期,給自己充分的時間來考慮最終去向。

最后要離開的前一天,他去到 NUS 的校園里,走走停停,來到未來辦公室旁邊的一處山坡,上面立著一棵枝繁葉茂的大樹。顏水成就站在那棵樹下,俯瞰著遠(yuǎn)處開闊的城市,感嘆著“這個地方真是太美了”,便定下了來 NUS 的想法。

那時的他沒有想到,后來在 NUS 扎根下來,自己也長成了一棵枝繁葉茂的“大樹”,他與學(xué)生們之間的故事也從這里展開。

七次 CV 奪冠背后:顏水成與他的學(xué)生們

顏水成

三十出頭的顏水成意氣風(fēng)發(fā),很快著手組建了機器學(xué)習(xí)與視覺實驗室(NUS-LV Lab),并定下了一個頗有野心的目標(biāo):

讓全世界都知道新加坡NUS-LV Lab是一個世界一流的計算機視覺研究團隊!那幾年,整個實驗室都處于全力向前高速奔跑的狀態(tài)。顏水成對自己和對學(xué)生都要求極高,每周一對一的交流從不間斷,學(xué)生第一篇稚嫩的論文會被他批得體無完膚。深夜時 MSN 上彈出來一條消息“Hi”,學(xué)生們就知道一場深夜討論要來了,他們很驚詫,怎么導(dǎo)師比他們年輕人還能熬夜。正是在這樣一種師生齊心的勁頭下,每個學(xué)生最后都達(dá)到了顏水成對他們“well-trained”(受過良好訓(xùn)練)的期望。


到了 2010 年,顏水成團隊在全球范圍內(nèi)已經(jīng)名聲漸起,他開始琢磨,“光寫文章還不行”,還要走到國際計算機視覺比賽的舞臺上,跟全世界企業(yè)和高校的團隊一較高下。他將目光瞄準(zhǔn)了這一年的 Pascal VOC 挑戰(zhàn)賽。那時候,由歐盟組織的 Pascal VOC 是最熱門且含金量最高的視覺比賽,而李飛飛在同年發(fā)起的 ImageNet 挑戰(zhàn)賽,才剛剛起步。


這一年的主力是 2009 年入學(xué)的博士生陳強。陳強本科畢業(yè)于中國科學(xué)技術(shù)大學(xué),其后在上海交通大學(xué)讀碩士,在將視覺識別研究應(yīng)用在安防領(lǐng)域的過程中,他深感傳統(tǒng)的機器視覺技術(shù)無法真正解決識別問題,決定繼續(xù)讀博探索這個方向。陳強的碩士導(dǎo)師劉允才教授也曾師從黃煦濤,便把陳強推薦到了同門顏水成的門下。

七次 CV 奪冠背后:顏水成與他的學(xué)生們

陳強

陳強具有很強的解決問題的思維,而且對打比賽充滿激情,若是在比賽中獲得冠軍,也能更好的實踐自己的理論研究。


因為在識別任務(wù)上有經(jīng)驗,陳強就專攻 Pascal VOC 的分類子項(Classification)。經(jīng)過半年的準(zhǔn)備,顏水成團隊首戰(zhàn)告捷,成為最早在該比賽中奪冠的亞洲團隊。值得一提的是,顏水成在打比賽方面的傳承實際是繼承于黃煦濤。黃煦濤極其喜歡Pascal VOC和ImageNet兩個比賽,曾多次奪得冠軍。在 NUS,傳承也從陳強那里開始了。


在首次出戰(zhàn)的這一年,顏水成門下進(jìn)來兩位新學(xué)生——董健和夏威,他們也加入了之后的比賽隊伍,并連續(xù)兩年奪冠。董健本科畢業(yè)于中國科學(xué)技術(shù)大學(xué),與師兄程斌和陳強均是校友。董健編程能力很強,本科時出于業(yè)余愛好,曾開發(fā)過百萬下載量的游戲。也正是在游戲開發(fā)中,產(chǎn)生了對 AI 的濃厚興趣,決定跟從在AI領(lǐng)域有著深厚背景的顏水成。

七次 CV 奪冠背后:顏水成與他的學(xué)生們

董健

夏威與董健是同住了四年的室友。夏威本科在華中科技大學(xué)數(shù)理實驗班就讀,在系里劉文予教授的實驗室里做科研訓(xùn)練,參與過華科和朱松純老師在湖北創(chuàng)立的蓮花山實驗室的一些合作項目,為后面在NUS開展正式的視覺研究打下了一些基礎(chǔ)。


七次 CV 奪冠背后:顏水成與他的學(xué)生們

顏水成(左)、夏威(右)

2011 年的 Pascal VOC,陳強和董健在這一年作為主力做物體分類子項,再次拿到了分類子項的冠軍。這一年的物體分割子項(Segmentation)則由夏威主導(dǎo),成績位列第三名。那時團隊也開始做檢測任務(wù),而各個任務(wù)之間都相互關(guān)聯(lián),尤其是在深度學(xué)習(xí)之前,做分割需要分類和檢測任務(wù)中很多傳統(tǒng)機器學(xué)習(xí)算法的支持,所以夏威也同時輔助做其它子項的比賽。這是深度學(xué)習(xí)到來的前夜。(暢聊加:lionceau2046)

02投身深度學(xué)習(xí)的第一次勝利

如果說 2010 年的冠軍是顏水成團隊的一個小高峰,那么在 2012 年,他們則經(jīng)歷了一個徹底的大轉(zhuǎn)折——全面轉(zhuǎn)向深度學(xué)習(xí)。Pascal VOC 挑戰(zhàn)賽在 2012 年迎來收官之戰(zhàn)。董健和夏威作為主力,分別攬下了分類和分割兩個賽道的冠軍。至此,顏水成團隊在分類子項上實現(xiàn)三連冠,總共拿下四個冠軍。這也是傳統(tǒng)視覺算法最后的輝煌。而另一邊,同期舉行的 ImageNet 挑戰(zhàn)賽終于在這一年大放異彩。包括顏水成在內(nèi)的所有人都沒有預(yù)料到,一輪新的人工智能熱潮會在那里被掀起。2018 年圖靈獎得主、時任多倫多大學(xué)教授的 Geoffrey Hinton 團隊提出深度卷積神經(jīng)網(wǎng)絡(luò) AlexNet,在 ImageNet 挑戰(zhàn)賽上一舉奪魁,深度學(xué)習(xí)的大潮由此拉開序幕。顏水成是“AlexNet時刻”的見證者之一,他和組里的學(xué)生都大為震動。雖然那時團隊在全球視覺比賽的舞臺上已經(jīng)屢獲佳績,但他們驚訝地發(fā)現(xiàn),自己所用的傳統(tǒng)方法與深度學(xué)習(xí)這個“新物種”相比,竟能有這么大的 Gap。


顏水成對神經(jīng)網(wǎng)絡(luò)非常熟練,早在2000年,他就采用神經(jīng)網(wǎng)絡(luò)給北京一家企業(yè)做經(jīng)濟指標(biāo)的預(yù)測模型,產(chǎn)品上線后客戶反饋效果特別好。當(dāng)時,Data-adaptive kernel 這樣的想法他就曾在傳統(tǒng)神經(jīng)網(wǎng)絡(luò)上嘗試過。面對深度學(xué)習(xí)帶來的巨大性能提升,顏水成果斷下了決定:這是歷史性的變革,ALL-IN!。自此,顏水成整個實驗室的研究方向和工作重點都完全轉(zhuǎn)到了深度學(xué)習(xí),是繼 Hinton 等先驅(qū)者之后第一批開始深度學(xué)習(xí)探索的實驗室之一。


同時基于新加坡的優(yōu)勢,顏水成的實驗室應(yīng)該也是亞洲最早擁有百卡級NVIDIA GPU的大學(xué)實驗室。顏水成在多年后告訴雷峰網(wǎng)(公眾號:雷峰網(wǎng)):“我不太相信某一代技術(shù)能解決所有問題,新一代技術(shù)出現(xiàn)一定能帶來更大的機會。所以我保持著隨時清零的心態(tài),新東西如果真的好,那我就會馬上把它往前推動?!闭沁@種心態(tài),使得顏水成在之前的子空間、稀疏表示/低秩矩陣的兩次浪潮中都收獲頗豐,都有單篇引用過千的論文, 這一次則輪到了深度學(xué)習(xí)。他的學(xué)生后來都十分感激當(dāng)時顏水成的決斷:“最重要的是當(dāng)時顏老師的技術(shù)視野。方向選擇對了,打比賽拿名次就是水到渠成的事兒。”決定轉(zhuǎn)型后,一個專門小組很快就成立了,為轉(zhuǎn)戰(zhàn) 2013 年的 ImageNet 挑戰(zhàn)賽做準(zhǔn)備。

顏水成把復(fù)現(xiàn) AlexNet 的任務(wù)交給了組里 11 級博士生林敏。

七次 CV 奪冠背后:顏水成與他的學(xué)生們

林敏

林敏從北京大學(xué)元培班畢業(yè),讀生物科學(xué)專業(yè),喜歡寫些代碼。進(jìn)入 NUS 后,林敏先去了一個生物實驗室輪轉(zhuǎn)。那段時間,林敏白天做生物實驗,晚上寫代碼,同時在網(wǎng)上學(xué)吳恩達(dá)的機器學(xué)習(xí)課程。后來他覺得二選一才能更專注,于是干脆轉(zhuǎn)計算機。

然而,新舊事物之間并不總能迅速而平滑地更替,很多團隊都在試圖復(fù)現(xiàn)并超越 AlexNet,顏水成團隊在這一年的分類任務(wù)上采取的方案,是在復(fù)現(xiàn)的基礎(chǔ)上加以部分改動,同時沿用傳統(tǒng)的方法。也就是說,是一個“大雜燴”。最終第二名的成績,象征了傳統(tǒng)視覺時代最后一次并不優(yōu)雅的掙扎。而對“大雜燴”不很滿意的林敏,也想要做一個全新的深度網(wǎng)絡(luò)出來。問題是,這個網(wǎng)絡(luò)要做成什么樣?顏水成下了一個命題:做減法。在當(dāng)時計算資源非常受限的大背景下,要用最小的資源達(dá)到最優(yōu)的性能。從這個目標(biāo)出發(fā),林敏負(fù)責(zé)網(wǎng)絡(luò)架構(gòu)的設(shè)計,陳強則從視覺應(yīng)用的角度與林敏討論數(shù)據(jù)量的規(guī)模。他們最后提出了著名的網(wǎng)絡(luò)結(jié)構(gòu) NIN(Network in Network),首次使用了 1×1 卷積。1×1 卷積這個絕妙的設(shè)計,是林敏的一次“妙手偶得之”。在構(gòu)思網(wǎng)絡(luò)結(jié)構(gòu)那段時間,林敏在一次課上突然出現(xiàn)自發(fā)性氣胸,住院一周。不過這絲毫未耽誤他的進(jìn)度,他沒想到的是,躺在醫(yī)院病床上的那一周,靈感全都迸發(fā)了出來。他讀到了“生成對抗網(wǎng)絡(luò)(GAN)之父” Ian Goodfellow 在那年發(fā)表的一篇論文。這篇論文提出名為 Maxout 的網(wǎng)絡(luò),在線性變化之外添加 Max(求最大值) 操作,從而改進(jìn)了以往的常規(guī)卷積網(wǎng)絡(luò)。林敏思來想去,尋到了 Maxout 在當(dāng)時具有最高識別率的原因所在,那就是有了 Max 操作后,它就比廣義線性模型更復(fù)雜了。他想到,如果再往前推進(jìn)一點呢?能不能把它變得更復(fù)雜一些?比如,在每一個卷積層后面再添加一個 MLP(多層感知器)卷積層。

七次 CV 奪冠背后:顏水成與他的學(xué)生們

Network in Network在最后實現(xiàn)的時候,他才驚喜地發(fā)現(xiàn),太巧妙了,這正是 1×1 的卷積!加上一層 MLP 后,可以全連接地輸出同樣數(shù)量的特征圖,不必改變輸出的尺寸,卷積層之后又緊跟著神經(jīng)元激活函數(shù),所以在減少參數(shù)的同時,網(wǎng)絡(luò)變深了,效果也進(jìn)而得以提升。2014 年,NIN 的“考試”來了。董健和林敏作為主力,以 NIN 作為主干網(wǎng)絡(luò),在 ImageNet 檢測子項“使用訓(xùn)練數(shù)據(jù)進(jìn)行訓(xùn)練”場景上獲得了冠軍。NIN 的勝利不止于此。當(dāng)時實驗室的另外一個博士生劉洛麒,正在想辦法將深度學(xué)習(xí)應(yīng)用到人臉領(lǐng)域。有了 NIN 的加持,很快他就將當(dāng)時人臉識別和人臉檢測最權(quán)威的基準(zhǔn) LFW 和 FDDB 的性能,刷到了當(dāng)時世界最好的成績。

七次 CV 奪冠背后:顏水成與他的學(xué)生們

劉洛麒

同年,谷歌大腦團隊推出的 GoogLeNet 也從 NIN 汲取靈感,采用 1x1 卷積,拿到了檢測任務(wù)中“使用額外訓(xùn)練數(shù)據(jù)進(jìn)行訓(xùn)練”場景的冠軍,他們自稱network in network in network。當(dāng)時谷歌大腦的總監(jiān) Vincent Vanhoucke 和大神Jeff Dean在賽后當(dāng)即給顏水成團隊發(fā)了郵件表示祝賀。

不僅是 GoogLeNet,2015 年的冠軍 ResNet 也使用了 1x1 卷積。NIN的核心1x1卷積成為后來幾乎所有 CNN 模型變體的基礎(chǔ)模塊,極大地促進(jìn)了深度學(xué)習(xí)的發(fā)展。Network in Network 的名字,背后還有一個小故事。顏水成和林敏通過郵件來回溝通了好幾輪,其中有一個名字能縮寫成MIN,很貼合林敏的名字,但全名不是很直白,最后顏水成建議Network in Network, 兩人都覺得形象生動,就拍板下來了NIN(您)。后來2014比賽演講的標(biāo)題就設(shè)成了 NIN Good (您好)!投身深度學(xué)習(xí)浪潮的三年以來,這是顏水成和他的學(xué)生們真正意義上的第一次勝利。

03技術(shù)落地大潮來臨

時間來到 2015 年。八年過去,顏水成在計算機視覺領(lǐng)域聲名鵲起,團隊每年在視覺頂會上的文章接受量非常耀眼。在視覺之外,他在多媒體領(lǐng)域的研究成果同樣十分突出。從首次獲得 Pascal VOC 冠軍開始的四年里,顏水成團隊開始收獲他們在國際多媒體頂級會議 ACM Multimedia (ACM MM)上的獎項大滿貫:2010 年最佳論文獎、2012 年最佳技術(shù)演示獎、2013 年最佳論文獎和最佳學(xué)生論文獎。論文和獎拿多了,自然會想做些不一樣的事情。首先做出技術(shù)落地嘗試的是夏威。

2012 年,一直盤算著創(chuàng)業(yè)的他,在打完分割任務(wù)的比賽后突發(fā)奇想,想將人體分割與分析(human parsing)技術(shù)用來落地,比如一鍵換衣、拍照搜衣服同款等。他專門跑去商學(xué)院修了一門創(chuàng)業(yè)課,帶著創(chuàng)業(yè)項目申請了新加坡的一個 20 萬新幣的創(chuàng)業(yè)基金,但在倒數(shù)第二輪被斃掉了。沒拿到錢的夏威頗為失意,也在這時有了日后去硅谷創(chuàng)業(yè)的念頭。接著在第二年,顏水成帶著他的一位博士生黃君實去阿里巴巴訪問半年,并將他們的算法應(yīng)用在在阿里電商平臺上,協(xié)助第一個實現(xiàn)了拍照搜服飾同款的功能??吹郊夹g(shù)真的變成了商業(yè)系統(tǒng),他感覺打開了一片新的天地,也埋下了對技術(shù)落地的憧憬。七次 CV 奪冠背后:顏水成與他的學(xué)生們

黃君實

2015 年,顏水成真正覺得,時候到了。

這一年是整個視覺領(lǐng)域的轉(zhuǎn)折點。孫劍在 MSRA 帶領(lǐng)何愷明、張祥雨、任少卿憑借 ResNet 在 ImageNet 奪冠,掀起了一波更大的深度學(xué)習(xí)浪潮。機器學(xué)習(xí)的研究路子徹底成了實驗科學(xué),所謂“大力出奇跡”,誰有數(shù)據(jù)、算力,誰就是王道,而王道就掌握在工業(yè)界的少數(shù)幾個巨頭手中。一時間,許多學(xué)術(shù)界的頂尖學(xué)者開始奔向工業(yè)界,既是向往企業(yè)的“大力”,也是為了尋找技術(shù)落地的機會。吳恩達(dá)被余凱說服,在 2014 年去往百度任首席科學(xué)家。李飛飛則在 2016 年從斯坦福大學(xué)離職加入谷歌,孫劍也在這一年加盟曠視。有趣的是,吳恩達(dá)、余凱、李飛飛、孫劍等人與顏水成都是76年前后生人。他們經(jīng)歷了同樣的時代:大學(xué)期間經(jīng)歷了90年代互聯(lián)網(wǎng)浪潮的興起;攻讀博士時在AI低谷期的沉淀,反而成為了他們在AI時代到來時最寶貴的財富;當(dāng)在各自領(lǐng)域深耕數(shù)年,學(xué)術(shù)研究已經(jīng)達(dá)到了一個上限的時候,他們不約而同選擇在技術(shù)落地上進(jìn)行下一個突破。他們相互影響,成就了彼此。

就在這個時候,有“紅衣教主”之稱的奇虎 360 董事長周鴻祎正在醞釀成立一個 AI 研究院,并從北京向顏水成拋來了橄欖枝。幾乎每家老牌互聯(lián)網(wǎng)大廠,都在那時紛紛投資深度學(xué)習(xí),AI 研究院成為標(biāo)配。顏水成在視覺研究上的耀眼履歷自不必說,他的團隊在比賽中多次奪冠,強大的技術(shù)研發(fā)與實踐能力是周鴻祎尤為欣賞的地方。而從顏水成的視角,他看中的是 360 的場景。他那時發(fā)現(xiàn),360 做智能硬件對視覺技術(shù)的需求很大,軟硬件結(jié)合會是視覺的一個大趨勢。此外,搜索、廣告、金融、直播等AI和大數(shù)據(jù)緊密結(jié)合的應(yīng)用場景,360也都兼而有之。這對于他和學(xué)生們來說,是一個大好機會。從學(xué)術(shù)界功成身退的顏水成就此北上,帶著學(xué)生投身業(yè)界第一站,開始了技術(shù)落地的故事。

04   產(chǎn)業(yè)探索的八年

如何在企業(yè)做 AI 研究院?顏水成定義了一個下限和上限。下限,是支持好內(nèi)部業(yè)務(wù),這也是研究院的立命所在?!澳睦镉?AI需求,我們就沖上去?!?這是顏水成所稱的“萬金油打法”。上限,是用技術(shù)去驅(qū)動甚至創(chuàng)造一個新業(yè)務(wù)和行業(yè),在彼時的360,這項新業(yè)務(wù)就是IoT。顏水成很快轉(zhuǎn)向“在商言商”的實用主義思維,將視覺研究置于商業(yè)邏輯的閉環(huán)內(nèi),與團隊協(xié)同作戰(zhàn),打大仗。為打造智能硬件產(chǎn)品,顏水成與學(xué)生以及研究院的幾十位研究員們,度過了許多個加班加點的攻堅之戰(zhàn)。到 2018 年,他們已將人臉識別、語音識別、SLAM 等技術(shù)落地在非常多產(chǎn)品上。這年的雙十一前夕,顏水成在 360 產(chǎn)品發(fā)布會上,推出 6 大“安全”智能硬件新品,以總價不足 3500 元的低價殺入了 IoT 市場,業(yè)界驚呼“性價比逆天”。對于顏水成來說,這是一次了不起的轉(zhuǎn)身。

七次 CV 奪冠背后:顏水成與他的學(xué)生們

顏水成在2018年10月30日 360 產(chǎn)品發(fā)布會上

決策智能也是顏水成技術(shù)落地的場景之一。這年 12 月,360 金融在納斯達(dá)克敲響上市鐘,顏水成的團隊在大數(shù)據(jù)智能風(fēng)控方面提供了支持。360 的廣告、推薦業(yè)務(wù)也由深度學(xué)習(xí)技術(shù)作支撐。

除了技術(shù)落地,技術(shù)本身的升華也未間斷。2017 年,顏水成帶領(lǐng) 360 與 NUS 的聯(lián)隊提出雙通道網(wǎng)絡(luò) DPN,在 ImageNet 挑戰(zhàn)賽上獲得冠軍,為這個舉辦了八年的賽事畫上了圓滿的句號,同時也成為PASCAL VOC和ImageNet 兩項賽事收官之戰(zhàn)的雙料冠軍團隊。這次的靈魂人物是顏水成的學(xué)生陳云鵬,DPN的提出者,后來他也拒絕了Facebook的offer跟隨顏水成來到中國。除了極高的準(zhǔn)確率之外,DPN 的最大特點是低能耗,將 ResNet 的計算量降低了 57%,在實測中提速高達(dá) 300%。這其實也是結(jié)合工業(yè)界落地需求的必然結(jié)果。IoT 產(chǎn)品對資源利用率要求非常高,DPN 作為一個更輕量級的視覺模型,讓 360 在視覺理解的賽道上邁出了更大一步。步入 2019 年,顏水成感覺在 360 使命已畢,決意開始新的征程。七次 CV 奪冠背后:顏水成與他的學(xué)生們

2018 年師門聚會:左起劉洛麒、董健、夏威、顏水成、陳強、黃君實、程斌(手機中照片為林敏)

他與學(xué)生們也就此暫別。

此時,林敏已于 2017 年11 月舉家飛往加拿大,在深度學(xué)習(xí)“三巨頭”之一Yoshua Bengio 的Mila實驗室做博士后,繼續(xù)學(xué)術(shù)上新的探索。陳強離開的腳步比顏水成稍快了一些。念鄉(xiāng)情的他回到老家上海,加入了“下沉市場三巨頭”之一趣頭條 ,在那里帶AI算法團隊。彼時他相信,互聯(lián)網(wǎng)還有“增長”這個故事可講。董健則在顏水成離開后繼續(xù)留在了 360。由于對工程和業(yè)務(wù)落地更感興趣,董健選擇離開研究院,轉(zhuǎn)而領(lǐng)導(dǎo)360智能工程部,負(fù)責(zé)公司級的AI基礎(chǔ)設(shè)施建設(shè)和中臺化AI能力輸出,支持搜索、推薦、廣告、金融和視覺等泛AI業(yè)務(wù)。而劉洛麒留在了360 AI 研究院,繼續(xù)負(fù)責(zé)計算機視覺在 IoT 和互聯(lián)網(wǎng)業(yè)務(wù)的落地。后來他加入美圖,領(lǐng)導(dǎo)美圖影像研究院(MT Lab),負(fù)責(zé)產(chǎn)品核心算法研發(fā),并在新一輪AI大模型浪潮中,研發(fā)出國內(nèi)首款懂美學(xué)的美圖視覺大模型MiracleVision。黃君實則在360信息流產(chǎn)品部磨煉一段時間之后,加入了美團視覺智能中心,繼續(xù)探索他的產(chǎn)研之路。

畢業(yè)之后就創(chuàng)業(yè)的程斌,則開啟了二次創(chuàng)業(yè)之路,其所在公司Fasion.AI是國內(nèi)較早聚焦于AIGC及其商業(yè)化落地的初創(chuàng)團隊。

畢業(yè)后沒有跟隨團隊加入360但卻一直有著創(chuàng)業(yè)夢的夏威,則在畢業(yè)答辯之前就帶著老師的祝福飛往舊金山灣區(qū)創(chuàng)業(yè)。他作為創(chuàng)始成員加入了華人留學(xué)生創(chuàng)辦的 CV 公司 Orbeus,擔(dān)任chief scientist,負(fù)責(zé)識別算法的研發(fā)。2015年底公司被亞馬遜收購后,他隨之加入了AWS AI,擔(dān)任Principal Scientist,領(lǐng)導(dǎo)團隊先后發(fā)布了AWS最早的幾款Cloud AI產(chǎn)品Rekognition,Textract等。

學(xué)生們各自求仁得仁,顏水成也重整行裝,準(zhǔn)備尋找技術(shù)落地的新土壤。2019 年 7 月,在老朋友朱瓏的盛情相邀下,顏水成來到了“AI四小龍”之一的依圖科技,出任 CTO,繼續(xù)讓 AI 技術(shù)在更多場景真正落地。那時的依圖在人臉識別競賽 NIST-FRVT 上已蟬聯(lián)三年冠軍,而依圖的安防和醫(yī)療賽道,不僅能為顏水成將視覺落地提供場景,更與他對技術(shù)價值的想象十分吻合。

這一次,顏水成給自己定義了兩個命題,一是做好視覺研究,二是推動技術(shù)與業(yè)務(wù)的結(jié)合,進(jìn)一步落地。在依圖的一年多時間里,他都努力在實踐這兩個命題。2020 年4月25 日,顏水成的恩師黃煦濤過世。悲傷之余,顏水成開始靜心思考如果再工作四十年,最應(yīng)該做什么。

他把答案落在了重回學(xué)術(shù)基礎(chǔ)研究上,此后他的幾次選擇都離不開這次深度的思考。2021年1月,顏水成重回新加坡,正式出任 Sea 集團首席科學(xué)家,并負(fù)責(zé)從零建設(shè)和領(lǐng)導(dǎo) Sea 人工智能實驗室(SAIL)。林敏、陳強、董健等人則開始了他們第二次的追隨,

不同的是,加入 Sea 后,他們是各自沿著不同的軌道繼續(xù)行駛。陳強和董健在工業(yè)界磨煉多年,加入了Shopee,現(xiàn)在仍在Shopee領(lǐng)導(dǎo)著業(yè)務(wù)線。一如既往學(xué)者范的林敏,則跟隨顏水成同在 SAIL,探索 AI For Science 應(yīng)用。顏水成提到這位學(xué)生總是夸贊不停,讓他去推動一些新的方向。如今,林敏依舊在Sea擔(dān)任著AI首席研究員,繼續(xù)著他的學(xué)術(shù)研究之路。


05再入獅城的AI「傳道者」

2023年年初,昆侖萬維創(chuàng)始人周亞輝聯(lián)系上顏水成,彼時的顏水成剛剛結(jié)束在 Sea的研究工作,準(zhǔn)備去智源研究院訪問一段時間。在顏水成眼中,智源研究院或許是中國最接近 Open AI 和 Deepmind 風(fēng)格的團隊,而恩師張宏江正是智源的創(chuàng)始人,他用「潛心磨劍」形容自己的這次游歷與訪問。歷時半年,在智源的訪問結(jié)束之后,顏水成再次整裝重新出發(fā)。而年初周亞輝的出現(xiàn),為這次重新出發(fā)更添了一份傳奇色彩,早在顏水成決定去智源訪問之時,周亞輝便提前預(yù)定了需要顏水成出任「AI掌門」。

「我早就決定去智源訪問一段時間,您可能需要等。」

「沒問題?!?/p>

2023年9 月,顏水成正式加入昆侖萬維,與周亞輝一起出任天工智能聯(lián)席 CEO,并兼任昆侖萬維 2050 全球研究院院長。如今,顏水成早已是新加坡工程院院士,同時當(dāng)選 AAAI Fellow、ACM Fellow、IEEE Fellow 和 IAPR Fellow 等諸多榮譽,是中國計算機視覺領(lǐng)域的佼佼者。

并且,他已經(jīng)八次入選「湯森路透全球高被引學(xué)者」。毫無疑問,此時的顏水成選擇再次入局工業(yè)界,是帶著更大的底氣與實力。于顏水成而言,他想在企業(yè)研究院進(jìn)行長期性研究,做出新突破,把握住這波 AI 浪潮帶來的新機遇。

這些年來,顏水成和學(xué)生們每一次的選擇都并非是隨波逐流,而是對潮流的主動把握。但這一次,顏水成有了新的思考,他想自己創(chuàng)造潮流。

在研究層面上,多年以來,顏水成一直追求學(xué)術(shù)界和工業(yè)界的雙重滿足(Double Satisfactions),在技術(shù)層面一直追求走在AI的浪尖上,在他看來目前的浪尖是Foundation Models,也正是AI最令人興奮的時刻。

他始終認(rèn)為通用人工智能時代來臨,未來擁有無限可能。在通用人工智能領(lǐng)域,從研究、研發(fā)到產(chǎn)品是完整的鏈條,缺一不可,只有將三者完全打通,研究才能發(fā)揮最大價值。

昆侖萬維愿意將研究、研發(fā)、產(chǎn)品三線合一,無疑是顏水成實現(xiàn)潮流創(chuàng)造之夢的絕佳平臺。此外,昆侖萬維承諾提供的研究環(huán)境,在顏水成看來,也是一個新的世外桃源之地。以前大量的AI PhD畢業(yè)生選擇離開了新加坡,一個核心原因是缺少像硅谷那樣支持最前沿AI基礎(chǔ)研究的企業(yè),昆侖萬維2050研究院將是本地企業(yè)的起點,這樣更多的新加坡畢業(yè)生可以選擇留下來,同時也能吸引合適的研究者來到新加坡。昆侖萬維2050研究院也將擔(dān)當(dāng)AI前沿研究的種子,更多的本地和海外企業(yè)如果跟進(jìn)建立Labs, 新加坡就會建立完善的生態(tài)圈,為扎根新加坡、面向東南亞市場的企業(yè)提供強大的技術(shù)和信心支撐。


目前,昆侖萬維2050全球研究院還處于早期孵化階段,但顏水成的抱負(fù)十分遠(yuǎn)大:他希望建立一支既懂學(xué)術(shù)、又懂商業(yè),能夠真正把研究、研發(fā)和產(chǎn)品結(jié)合在一起的優(yōu)秀團隊,幫助昆侖萬維打造業(yè)界領(lǐng)先的人工智能團隊,推動天工大模型及AIGC業(yè)務(wù)邁向一個新高度,加速AI產(chǎn)品的研發(fā)、落地及商業(yè)化。確保昆侖萬維2050全球研究走在通往通用人工智能(AGI)正確的路徑上,是顏水成在昆侖萬維的新使命。關(guān)于方向,顏水成表示將逐步開展不同領(lǐng)域的研究:下一代Foundation Model的基礎(chǔ)研究和研發(fā);Agent的研發(fā)和智能體進(jìn)化的研究;生物智能等前沿技術(shù)領(lǐng)域的探索。他的重點的方向會主要圍繞下一代Foundation Model,研究方向也會從以前專注計算機視覺,更多地轉(zhuǎn)向CV+NLP,多模態(tài)的研究。


這一次,盡管學(xué)生們早已各奔東西,但傳承仍在持續(xù)。除了前文提及的董健、陳強、林敏仍在Shopee外,顏水成的學(xué)生遍布全球AI行業(yè),馮佳時現(xiàn)在是字節(jié)跳動智能內(nèi)容創(chuàng)作基礎(chǔ)研究團隊負(fù)責(zé)人;劉洛麒現(xiàn)在擔(dān)任著美圖影像研究院(MT Lab)負(fù)責(zé)人;程斌也繼續(xù)在創(chuàng)業(yè)道路上努力前行。顏水成現(xiàn)在則除了做研究之外,也在通過培養(yǎng)學(xué)生、指導(dǎo)他們?nèi)谫Y,讓學(xué)生們能夠通過創(chuàng)業(yè)的方式在AI行業(yè)發(fā)光發(fā)熱。回顧顏水成的學(xué)術(shù)與產(chǎn)業(yè)經(jīng)歷,獅城新加坡是一個重要據(jù)地。


2007年,他第一次踏入新加坡,曾給恩師黃煦濤發(fā)郵件請教“how to be a good professor”,得到的回答是“Just be yourself”。他把這句話分享給了學(xué)生們,并闡釋為“Confident、Unique、...”,懷著這種信念去挑戰(zhàn)世界級比賽、發(fā)表頂級論文,并毅然帶領(lǐng)學(xué)生們走向工業(yè)界。這些年兜兜轉(zhuǎn)轉(zhuǎn),顏水成心中的信念和愿景始終不變,“希望像李開復(fù)那一代人那樣做AI布道人,拉一些有號召力的人進(jìn)來。”

他說,這份使命和責(zé)任將永遠(yuǎn)支撐著他們繼續(xù)前行。

現(xiàn)在,顏水成可以重新出發(fā)了。

雷峰網(wǎng) 雷峰網(wǎng) 雷峰網(wǎng)

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知

七次 CV 奪冠背后:顏水成與他的學(xué)生們

分享:
相關(guān)文章
當(dāng)月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說