丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
人工智能學(xué)術(shù) 正文
發(fā)私信給陳彩嫻
發(fā)送

0

賓大蘇煒杰:從「匱乏」走向「豐富」

本文作者: 陳彩嫻 2022-03-29 17:05
導(dǎo)語(yǔ):你當(dāng)像鳥(niǎo)飛往你的山。

初識(shí)蘇煒杰,他與許多青年學(xué)者一樣,外表溫文爾雅、略帶靦腆,但一談起學(xué)術(shù)和 AI 的未來(lái)發(fā)展,就充滿激情。

看他的簡(jiǎn)歷,成長(zhǎng)經(jīng)歷一帆風(fēng)順:本科就讀于富有盛譽(yù)的北京大學(xué)數(shù)學(xué)科學(xué)學(xué)院,接著在美國(guó)斯坦福大學(xué)攻讀博士,師從美國(guó)國(guó)家科學(xué)院院士、麥克阿瑟天才獎(jiǎng)得主 Emmanuel Candès 和美國(guó)國(guó)家科學(xué)院和工程院雙院院士 Cynthia Dwork。緊接著跳過(guò)博士后階段,執(zhí)教于培養(yǎng)了埃隆·馬斯克和沃倫·巴菲特的沃頓商學(xué)院,并聯(lián)合指導(dǎo)常青藤名校賓夕法尼亞大學(xué)在機(jī)器學(xué)習(xí)領(lǐng)域的發(fā)展。

他的團(tuán)隊(duì)在機(jī)器學(xué)習(xí)優(yōu)化算法、可信 AI 和高維數(shù)據(jù)分析等領(lǐng)域做出了許多原創(chuàng)甚至突破性的工作,部分成果已經(jīng)應(yīng)用于業(yè)界。但蘇煒杰謙虛地說(shuō),和同一階段的其他 AI 學(xué)者相比,他的論文數(shù)量算是少的。而事實(shí)是,他「相對(duì)較少」的工作已經(jīng)讓他贏得了 NSF Career Award、斯隆研究獎(jiǎng)和 SIAM 數(shù)據(jù)科學(xué)青年獎(jiǎng)等眾多榮譽(yù)。能獲得其中一個(gè)獎(jiǎng)項(xiàng)已經(jīng)堪稱領(lǐng)域小牛,而蘇煒杰獲獎(jiǎng)時(shí)的工作年限比平均還早兩三年。顯然,蘇煒杰是以「質(zhì)量取勝」。

他指導(dǎo)過(guò)的學(xué)生已經(jīng)或即將執(zhí)教于北京大學(xué)、羅切斯特大學(xué)和曼徹斯特大學(xué)等名校的計(jì)算機(jī)系,以及供職于 Google 和 Facebook 等硅谷大廠的研究部門(mén)。盡管離博士畢業(yè)只有 5 年多時(shí)間,但蘇煒杰已經(jīng)向「桃李滿天下」的夢(mèng)想邁進(jìn)了一大步。

在這些成績(jī)的背后,蘇煒杰的研究經(jīng)歷是否一帆風(fēng)順?又有哪些故事值得有志于 AI 的學(xué)生借鑒?


1、田園的成長(zhǎng)經(jīng)歷

盡管沒(méi)有相關(guān)統(tǒng)計(jì)數(shù)據(jù),但在農(nóng)村長(zhǎng)大的知名 AI 青年學(xué)者比例想必是極少的。而蘇煒杰就是其中一員。

他談起農(nóng)村成長(zhǎng)經(jīng)歷的話語(yǔ)中充滿著快樂(lè)。蘇煒杰從小就幫父母干農(nóng)活,在夏天和秋天播種和收割水稻期間學(xué)校會(huì)放「農(nóng)忙假」,這時(shí)候摸田螺和抓黃鱔是他的最?lèi)?ài)。平時(shí)放學(xué)回家路上,蘇煒杰要路過(guò)家里的兩畝地,打開(kāi)水渠給水稻灌溉。小學(xué)期間他家沒(méi)有房子住,全家就暫住在村里廢棄了的供銷(xiāo)社老房子里。令他感到欣喜的是,這個(gè)老房子中間有塊空地,他每天回家都能花很多時(shí)間種些花花草草。

在農(nóng)村長(zhǎng)大,幾乎沒(méi)有課業(yè)壓力,蘇煒杰有更多與自然親近的機(jī)會(huì)。但這無(wú)法掩蓋物質(zhì)上匱乏的事實(shí)。相比于城區(qū)學(xué)校,蘇煒杰就讀的農(nóng)村小學(xué)和初中教學(xué)資源要少很多,基礎(chǔ)設(shè)施比較差。比如,他的初中操場(chǎng)沒(méi)有400米跑道,體育課練跳遠(yuǎn)時(shí)全校連個(gè)皮尺都沒(méi)有,更沒(méi)有機(jī)會(huì)接觸計(jì)算機(jī),甚至初一開(kāi)始學(xué)英語(yǔ)時(shí)都是用漢字注音。因此周?chē)耐瑢W(xué)對(duì)讀書(shū)改變命運(yùn)普遍信心不足、學(xué)習(xí)興趣也不大,經(jīng)濟(jì)條件較好的同學(xué)經(jīng)常中途轉(zhuǎn)學(xué)到城區(qū)學(xué)校。

現(xiàn)在,蘇煒杰曾就讀的這兩所學(xué)校因?yàn)檗r(nóng)村適齡人口減少等原因,都已經(jīng)關(guān)閉。

還有機(jī)會(huì)上的匱乏。他沒(méi)有讀過(guò)幼兒園,本應(yīng)該開(kāi)始讀小學(xué)時(shí),因?yàn)榻虒W(xué)資源不足,農(nóng)村孩子必須晚一年上學(xué),因此后來(lái)在高中和大學(xué)他一般都比同學(xué)年齡大一些。蘇煒杰笑著提到還出現(xiàn)過(guò)有人以為他是復(fù)讀生的誤會(huì)。

在匱乏中的成長(zhǎng)經(jīng)歷,讓蘇煒杰從小認(rèn)識(shí)到生活的艱辛,特別珍視機(jī)會(huì),感恩他人的幫助。

蘇煒杰所在的農(nóng)村隸屬于寧波地區(qū)的余姚市,這是中國(guó)經(jīng)濟(jì)最發(fā)達(dá)的縣級(jí)市之一,有著濃厚的經(jīng)商創(chuàng)業(yè)氛圍。特別是在農(nóng)村,大家覺(jué)得得早點(diǎn)做生意賺錢(qián)更好,讀書(shū)是一種性價(jià)比很低的人生選擇。這也是江浙籍中科院院士自建國(guó)初比例持續(xù)下降的原因之一。

這些經(jīng)歷,大概率會(huì)讓蘇煒杰走一條不一樣的道路。


2、在追求知識(shí)中走向「豐富」

改變蘇煒杰人生走向的第一個(gè)節(jié)點(diǎn)是在小學(xué)五年級(jí)。那一年,他的母親從村里培養(yǎng)出大專生的鄰居那借了兩本教科書(shū),一本關(guān)于微積分,另一本關(guān)于線性代數(shù)。在強(qiáng)烈的好奇心趨勢(shì)下,經(jīng)過(guò)一年時(shí)間,他在沒(méi)有人幫助的情況下讀懂了這兩本書(shū)。之后,初一時(shí)父親帶著他去寧波和杭州買(mǎi)了不少高等數(shù)學(xué)和熱力學(xué)、量子力學(xué)、狹義相對(duì)論等物理書(shū)。浸潤(rùn)在遠(yuǎn)超他年齡的知識(shí)海洋中,蘇煒杰當(dāng)時(shí)真正看懂的不多,但對(duì)知識(shí)的渴求已經(jīng)在他心中深深扎根。

誠(chéng)然,書(shū)籍是治愈匱乏最好的療法。蘇煒杰開(kāi)始經(jīng)常騎很久的自行車(chē)去市圖書(shū)館,借閱數(shù)學(xué)物理天文地理等各種書(shū)籍。通過(guò)閱讀《古今數(shù)學(xué)思想》和《為了人類(lèi)心智的榮耀》等數(shù)學(xué)家傳記,蘇煒杰為高斯、歐拉、黎曼、龐加萊的事跡而激動(dòng),為拉馬努金和愛(ài)多士等近代數(shù)學(xué)家的故事而傾倒。有一次,他想買(mǎi)價(jià)格200多元的《中國(guó)大百科全書(shū)》精粹版,等了半年才向父母提出來(lái)。那次他把厚厚的一本書(shū)放在自行車(chē)后座,從新華書(shū)店回家,是他印象中最快樂(lè)的一次騎行。

知識(shí)的豐富,很快帶來(lái)回報(bào)。從未接受過(guò)競(jìng)賽訓(xùn)練的蘇煒杰,初二那年參加初三組數(shù)學(xué)競(jìng)賽獲獎(jiǎng),收到城區(qū)一所初中的邀請(qǐng)轉(zhuǎn)學(xué)。之后高中就讀于家鄉(xiāng)最好的余姚中學(xué)。從此雖然老家一直在農(nóng)村,但蘇煒杰的求學(xué)生涯永遠(yuǎn)告別了田園時(shí)光。

更大的回報(bào)很快接踵而至。高一第一學(xué)期,蘇煒杰參加高三數(shù)學(xué)競(jìng)賽,「劍一出鞘」,就獲得了省第六名,代表浙江省參加中國(guó)數(shù)學(xué)奧林匹克,這讓這個(gè)質(zhì)樸的農(nóng)村男生興奮得都不敢相信是真的。之后,蘇煒杰去了杭州、福州等地參加培訓(xùn),這也是他第一次真正意義上走出家鄉(xiāng)余姚。跟來(lái)自全國(guó)各地的優(yōu)秀同學(xué)交流過(guò)程中,他感受到了差距,特別是在見(jiàn)識(shí)和談吐方面的不及,讓當(dāng)時(shí)的他對(duì)自己失去信心。

但最后蘇煒杰在決賽中發(fā)揮出色,獲得銀牌,名列浙江省第二名,保送清華大學(xué)數(shù)理基科班。這是他家鄉(xiāng)百萬(wàn)人口縣級(jí)市第一次有高一學(xué)生保送清北,他還因此獲得了「寧波市十佳學(xué)子」的稱號(hào),在家鄉(xiāng)引起了轟動(dòng)。蘇煒杰至今在家鄉(xiāng)仍有很高的知名度。

高三那年,蘇煒杰再次代表浙江省參加中國(guó)數(shù)學(xué)奧林匹克,獲得全國(guó)第二名,保送北京大學(xué)數(shù)學(xué)科學(xué)學(xué)院,并進(jìn)入國(guó)家集訓(xùn)隊(duì)。大多數(shù)集訓(xùn)隊(duì)隊(duì)員所在高中之前就有學(xué)長(zhǎng)學(xué)姐進(jìn)過(guò)國(guó)家隊(duì),而蘇煒杰是其高中進(jìn)入數(shù)學(xué)國(guó)家集訓(xùn)隊(duì)的第一人,至今也是唯一一個(gè)。

因此,母校老師對(duì)他寄予厚望,希望他能成功進(jìn)入 IMO 國(guó)家隊(duì),為余姚中學(xué)帶來(lái)第一塊學(xué)科競(jìng)賽國(guó)際金牌。但在集訓(xùn)隊(duì)的最后兩次選拔賽中,蘇煒杰發(fā)揮不理想,一步之遙與國(guó)家隊(duì)失之交臂。十多年過(guò)去了,他還對(duì)此略感遺憾,但不是因?yàn)閭€(gè)人榮譽(yù)的得失,而是因?yàn)楣钾?fù)了高中母校的期望。

參加數(shù)學(xué)競(jìng)賽讓這個(gè)農(nóng)村男生獲得了不敢想象的豐富機(jī)會(huì),盡管也有不少失利,但這更讓他珍視機(jī)會(huì)的來(lái)之不易。蘇煒杰感到自己很幸運(yùn),因?yàn)檫@一路他并沒(méi)有做任何規(guī)劃,只是單純地追隨他內(nèi)心對(duì)數(shù)學(xué)之美的熱烈追求。


3、從數(shù)學(xué)夢(mèng)到與AI結(jié)緣

在北大數(shù)院就讀的四年時(shí)光里,匱乏隨之遠(yuǎn)去,取而代之的是豐富的數(shù)學(xué)知識(shí)海洋。蘇煒杰盡情地投入這場(chǎng)盛宴,不敢有一絲懈怠。他基本不玩游戲,每天就是跟在燕園第一周就在一起的女朋友、現(xiàn)在的妻子在圖書(shū)館自習(xí)中度過(guò)。

生活方面,北大給蘇煒杰提供了助學(xué)金,加上他每年獲得的最高獎(jiǎng)學(xué)金,就可以完全承擔(dān)學(xué)費(fèi)和生活費(fèi)。這份恩情他一直記在心里。

身處北大數(shù)院,就是與全國(guó)最優(yōu)秀的同齡人共處一個(gè)集體。這種感覺(jué)是美妙的,有什么問(wèn)題,跟同學(xué)一交流,馬上就會(huì)豁然開(kāi)朗,甚至意識(shí)到之前沒(méi)有注意到的問(wèn)題,而且還會(huì)有一點(diǎn)壓力,這又會(huì)讓你更加努力。

北大對(duì)蘇煒杰的改變是多方面的,對(duì)他的思維方式打下深深的烙印。數(shù)學(xué)的思維是向深處探索的,直面真正有難度的問(wèn)題,力求揭開(kāi)事物的本質(zhì)。蘇煒杰日后的科研風(fēng)格也正是如此,長(zhǎng)期專注于若干重要且基本的問(wèn)題,很少做推廣別人的工作。

實(shí)現(xiàn)兒時(shí)數(shù)學(xué)夢(mèng)近在咫尺,但隨著大四出國(guó)申請(qǐng)季的到來(lái),蘇煒杰對(duì)未來(lái)產(chǎn)生了猶豫和陷入了抉擇的困難。數(shù)學(xué)無(wú)與倫比的純粹、簡(jiǎn)潔和普適性深深地吸引著他,而申請(qǐng)純數(shù)學(xué)博士是成為一名數(shù)學(xué)家的必要條件,也是實(shí)現(xiàn)他數(shù)學(xué)夢(mèng)的必經(jīng)之路。同時(shí),蘇煒杰在北大數(shù)院的方向也正是基礎(chǔ)數(shù)學(xué),核心專業(yè)課平均分97分,名列年級(jí)第一,再加上他在丘成桐大學(xué)生數(shù)學(xué)競(jìng)賽的出色成績(jī),可以讓他申請(qǐng)到最好的基礎(chǔ)數(shù)學(xué)博士項(xiàng)目。

但此時(shí)的蘇煒杰,隨著年齡和閱歷的增加,有了不一樣的思考。

北大是綜合性大學(xué),他有機(jī)會(huì)選修機(jī)器學(xué)習(xí)、計(jì)算數(shù)學(xué)和統(tǒng)計(jì)等課程和參加相關(guān)講座,還在林毅夫教授創(chuàng)辦的國(guó)家發(fā)展研究院獲得了經(jīng)濟(jì)學(xué)雙學(xué)位。這些另一個(gè)維度的經(jīng)歷讓蘇煒杰了解到數(shù)學(xué)在其他領(lǐng)域的作用,可以幫助解決重要的實(shí)際問(wèn)題。

另一個(gè)因素是蘇煒杰在大三那年(2010年)暑假得到了在微軟亞洲研究院實(shí)習(xí)的機(jī)會(huì), 此時(shí)機(jī)器學(xué)習(xí)方興未艾,在微軟亞研,蘇煒杰了解到機(jī)器學(xué)習(xí)的前沿方向和應(yīng)用,產(chǎn)生了濃厚的興趣。當(dāng)時(shí)大家還不怎么使用 AI 這個(gè)詞,但回想起來(lái),他對(duì) AI 的初印象確是來(lái)自于這段實(shí)習(xí)經(jīng)歷。這段經(jīng)歷還讓蘇煒杰結(jié)交了很多計(jì)算機(jī)專業(yè)的同齡人,體會(huì)到了不同學(xué)科之間思考方式的差異。

賓大蘇煒杰:從「匱乏」走向「豐富」

圖注:2010年夏天,蘇煒杰(最左)在微軟亞洲研究院實(shí)習(xí)

但讓蘇煒杰決心走一條不一樣的路的最終決定因素是他的成長(zhǎng)經(jīng)歷。農(nóng)村的成長(zhǎng)經(jīng)歷,讓蘇煒杰希望未來(lái)事業(yè)能跟業(yè)界更緊密些, 有機(jī)會(huì)能改善父母的生活。經(jīng)過(guò)一番思想斗爭(zhēng),最后放棄了純數(shù)學(xué)作為個(gè)人事業(yè)。

蘇煒杰后來(lái)選擇了斯坦福大學(xué)統(tǒng)計(jì)系繼續(xù)他的學(xué)術(shù)夢(mèng),就不再是狹義上的數(shù)學(xué)家。但他未來(lái)的學(xué)術(shù)風(fēng)格、思考問(wèn)題的方式以及學(xué)術(shù)情懷,從來(lái)沒(méi)有離開(kāi)過(guò)數(shù)學(xué)。


4、成熟于硅谷的 AI 學(xué)術(shù)風(fēng)格

懷揣著對(duì)未來(lái)的憧憬,2011 年蘇煒杰飛躍大洋來(lái)到硅谷,在斯坦福最高博士生獎(jiǎng)學(xué)金(Stanford Graduate Fellowship)的支持下開(kāi)啟攻讀博士之旅。蘇煒杰所在的統(tǒng)計(jì)系有二十位不到的教授,但卻有近十位是美國(guó)國(guó)家科學(xué)院院士,因此 「院士只是平均水平」。系里的老師普遍在電子工程系、醫(yī)學(xué)院、計(jì)算機(jī)系、數(shù)學(xué)系有正式職位,是名副其實(shí)的數(shù)據(jù)科學(xué)。

此時(shí)的斯坦福和附近的谷歌等公司還處在 AI 即將快速發(fā)展的前夜。這種多元和動(dòng)態(tài)完美結(jié)合的環(huán)境讓蘇煒杰能深入接觸機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué)的前沿。

在斯坦福眾多頂級(jí)學(xué)者中,他選擇了 Emmanuel Candès 教授作為他的博士導(dǎo)師。Emmanuel 是真正的天才,他曾獲得麥克阿瑟天才獎(jiǎng)等大獎(jiǎng),研究的內(nèi)容橫跨計(jì)算數(shù)學(xué)、機(jī)器學(xué)習(xí)、統(tǒng)計(jì)、信息論、信號(hào)處理和優(yōu)化等眾多領(lǐng)域,在很年輕的時(shí)候就當(dāng)選為美國(guó)國(guó)家科學(xué)院院士。2020年,他還與陶哲軒一起獲得了當(dāng)年的「IEEE Jack S. Kilby Signal Processing Medal」(信號(hào)處理領(lǐng)域最高榮譽(yù))。

2014年,蘇煒杰在微軟研究院硅谷分部實(shí)習(xí),導(dǎo)師是美國(guó)國(guó)家科學(xué)院和工程院雙院院士 Cynthia Dwork。她是一位初見(jiàn)就覺(jué)得是「我的朋友」的老太太,早年在密碼學(xué)和分布式計(jì)算做出了奠基性的工作,開(kāi)啟了工作量證明這個(gè)研究方向,為后來(lái)的區(qū)塊鏈奠定了部分理論基礎(chǔ)。近幾年 Cynthia 領(lǐng)導(dǎo)了可信 AI(特別是隱私數(shù)據(jù)保護(hù)和算法公平性)這個(gè)朝氣蓬勃的領(lǐng)域,蘇煒杰也在她的指導(dǎo)下進(jìn)入了這個(gè)領(lǐng)域。從此,她一直給予蘇煒杰學(xué)術(shù)上的指導(dǎo)和支持,是他實(shí)際意義上的導(dǎo)師。同時(shí),Cynthia 還是早期的一代女性計(jì)算機(jī)科學(xué)家,早年作為女性學(xué)習(xí)計(jì)算機(jī)需要克服諸多困難,蘇煒杰聯(lián)系到自身從農(nóng)村走來(lái)也多有坎坷,因此很有共鳴。

賓大蘇煒杰:從「匱乏」走向「豐富」

圖注:Cynthia Dwork

這兩位教授領(lǐng)域不同,但有相似的學(xué)術(shù)觀點(diǎn),共同塑造了蘇煒杰今天的學(xué)術(shù)風(fēng)格。這并不是說(shuō)蘇煒杰從 Emmanuel 和 Cynthia 處學(xué)到很多具體知識(shí)點(diǎn),坦率地講,作為北大數(shù)院的頂尖畢業(yè)生,他的知識(shí)儲(chǔ)備在本科基本已經(jīng)完成。但學(xué)術(shù)遠(yuǎn)遠(yuǎn)不止于知識(shí)的積累,更重要的是學(xué)術(shù)風(fēng)格的建立,理解什么是好的學(xué)術(shù)。

首先,以解決問(wèn)題為導(dǎo)向,而不因?qū)W科限制自己。Emmanuel當(dāng)年與陶哲軒一起發(fā)明壓縮感知(Compressed Sensing)的時(shí)候,就是為了加速磁共振成像這個(gè)實(shí)際問(wèn)題。這個(gè)工作兼具數(shù)學(xué)之美與實(shí)際之美,是非常罕見(jiàn)的。而在研究的過(guò)程中,他用到了信號(hào)處理、信息論、優(yōu)化和統(tǒng)計(jì)等多個(gè)學(xué)科的思想和方法。Cynthia 早年的領(lǐng)域是理論計(jì)算機(jī),但近些年在開(kāi)啟隱私數(shù)據(jù)保護(hù)和算法公平性這些領(lǐng)域的時(shí)候深入引進(jìn)了統(tǒng)計(jì)技術(shù)和社會(huì)學(xué)思想。

另一個(gè)很重要的一點(diǎn)是持久地做自己認(rèn)為重要的課題。Emmanuel 告訴蘇煒杰,他基本不看 arXiv 上最新的論文,而是做自己認(rèn)為重要的問(wèn)題,且不輕易因?yàn)橥饨绲穆曇舾淖?。如果過(guò)于緊跟潮流,總是在模仿,很容易迷失在浩如煙海的論文海洋之中,研究的內(nèi)容很難有自己的特色,且無(wú)法產(chǎn)生深遠(yuǎn)的影響力。Cynthia 十多年前剛開(kāi)啟隱私數(shù)據(jù)保護(hù)這個(gè)領(lǐng)域時(shí),領(lǐng)域內(nèi)對(duì)此有不同聲音,但經(jīng)過(guò)十多年的持續(xù)耕耘,現(xiàn)在已經(jīng)在業(yè)界廣泛應(yīng)用。

此外,要重質(zhì)量而不是數(shù)量。蘇煒杰回憶,Emmanuel 好幾次跟他說(shuō)自己不應(yīng)該寫(xiě)某些論文,希望從簡(jiǎn)歷里刪掉。當(dāng)時(shí)蘇煒杰還挺驚訝,因?yàn)檫@些論文的引用量也有數(shù)百。獨(dú)立工作后他才明白,現(xiàn)在學(xué)術(shù)圈的問(wèn)題是論文太多,但真正高質(zhì)量的論文比例卻不高。Emmanuel 告誡他,一篇論文好不好,要看5年甚至10年以后是否還有參考價(jià)值。

這些言傳身教讓蘇煒杰受益匪淺,體現(xiàn)在他做科研也不局限于某個(gè)具體學(xué)科,經(jīng)常橫跨機(jī)器學(xué)習(xí)、優(yōu)化和統(tǒng)計(jì)等多個(gè)領(lǐng)域,以及習(xí)慣于持續(xù)地研究問(wèn)題,注重「種樹(shù)」而非「摘果」?!阜N樹(shù)」的成功率固然不高,但這類(lèi)工作一旦成功,往往能給本領(lǐng)域提供新的問(wèn)題和機(jī)會(huì)。

因?yàn)閹W(xué)生有壓力,他也有一些純粹只是為了發(fā)表而發(fā)表的論文,但他每年要求自己至少寫(xiě)一篇「5年以后還有人讀」的論文?,F(xiàn)在蘇煒杰有40余篇論文,但他坦然說(shuō)只有3、4篇是他真正喜歡的,具有長(zhǎng)期價(jià)值。也正是這少量的幾篇高質(zhì)量論文,讓蘇煒杰贏得了眾多榮譽(yù),其成果已經(jīng)在包括賓大、MIT、UC Berkeley、斯坦福、普林斯頓、耶魯、北大、UCSD、UIUC等眾多大學(xué)的數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)課程中講授。有朋友跟他說(shuō):「未來(lái)可以寫(xiě)進(jìn)教科書(shū)?!?/p>

除了學(xué)術(shù),兩位導(dǎo)師在生活上對(duì)蘇煒杰也很關(guān)心。Emmanuel 有著法國(guó)學(xué)者常見(jiàn)的高冷氣質(zhì),但內(nèi)心卻很關(guān)心學(xué)生,每學(xué)期都會(huì)邀請(qǐng)學(xué)生去他家參加派對(duì),有一次得知蘇煒杰遇到經(jīng)濟(jì)困難后曾提出經(jīng)濟(jì)上的幫助。Cynthia 則經(jīng)常問(wèn)蘇煒杰工作開(kāi)不開(kāi)心,2017年她入職哈佛大學(xué)后,曾提到如果蘇煒杰想來(lái)「波士頓的那兩個(gè)學(xué)?!梗S時(shí)跟她說(shuō)。


5、豐收篇

2016年,蘇煒杰博士畢業(yè),論文獲得了首屆「斯坦福 Theodore Anderson 獎(jiǎng)」。在 Emmanuel 和 Cynthia 兩位導(dǎo)師的推薦下,入職常青藤名校賓夕法尼亞大學(xué),開(kāi)始了在東海岸的獨(dú)立工作。

賓大蘇煒杰:從「匱乏」走向「豐富」

圖注:蘇煒杰和他妻子與Emmanuel Candes的合影

懷揣著對(duì) AI 的熱情,以及深厚的數(shù)學(xué)情懷,蘇煒杰開(kāi)始迎來(lái)學(xué)術(shù)上的豐收。

蘇煒杰的一個(gè)主要課題是揭開(kāi)深度學(xué)習(xí)背后的機(jī)制,理解為什么深度神經(jīng)網(wǎng)絡(luò)有時(shí)候效果好、有時(shí)候不好?;蛟S是因?yàn)閿?shù)學(xué)背景出身,他除了重視提升效果,也強(qiáng)調(diào)「知其然,也要知其所以然」。

他對(duì) AI 科技評(píng)論談道:

有人說(shuō)深度學(xué)習(xí)是「煉金術(shù)」。這對(duì)于人臉識(shí)別、下圍棋甚至蛋白質(zhì)折疊等也許沒(méi)有特別大的影響,但對(duì)于高風(fēng)險(xiǎn)的 AI 應(yīng)用卻是至關(guān)重要的。最近 DeepMind 將深度強(qiáng)化學(xué)習(xí)應(yīng)用到核聚變,結(jié)果令人興奮,但在沒(méi)有完全理解深度學(xué)習(xí)的機(jī)制之前,即使成功率達(dá)到99.99%,我們能承受最后變成一顆小型氫彈的0.01%的可能性嗎?

這是一個(gè)重要且非?;钴S的科研領(lǐng)域,但還沒(méi)有一個(gè)理論獲得學(xué)界廣泛認(rèn)可。經(jīng)過(guò)多年思考,蘇煒杰和他團(tuán)隊(duì)提出了一個(gè)深度神經(jīng)網(wǎng)絡(luò)的「局域彈性」(local elasticity)理論,給神經(jīng)網(wǎng)絡(luò)泛化、優(yōu)化等性質(zhì)提供了一個(gè)簡(jiǎn)單的唯象理論。

這個(gè)理論可以用一個(gè)很簡(jiǎn)單的例子來(lái)介紹:神經(jīng)網(wǎng)絡(luò)看到一張波斯貓的圖片后更新了其參數(shù),然后我們觀察神經(jīng)網(wǎng)絡(luò)更新后在另一張圖片上預(yù)測(cè)的改變。實(shí)驗(yàn)發(fā)現(xiàn),改變的大小取決于新圖片跟波斯貓的相似度:變化在暹羅貓上最大,在老虎上其次,在汽車(chē)上最小。形象地說(shuō),深度神經(jīng)網(wǎng)絡(luò)像橡皮泥一樣有局部的彈性。

直覺(jué)上,蘇煒杰相信這個(gè)唯象理論是通向最終理論的必經(jīng)之路,但現(xiàn)在還不完善,還需要大量后續(xù)工作來(lái)深入研究。

相關(guān)論文:

  • The Local Elasticity of Neural Networks

  • Neurashed: A Phenomenological Model for Imitating Deep Learning Training

蘇煒杰認(rèn)為數(shù)學(xué)理論還可以指導(dǎo)實(shí)際的 AI 問(wèn)題。「There is Nothing More Practical Than A Good Theory」,一個(gè)好的理論價(jià)值的最直接體現(xiàn)在于能不能指導(dǎo)實(shí)際,節(jié)約人力物力。流體力學(xué)和空氣動(dòng)力學(xué)就是一個(gè)很好的例子,現(xiàn)在可以用仿真來(lái)替代真實(shí)的風(fēng)洞試驗(yàn)。但 AI 領(lǐng)域很多方向還需要耗費(fèi)巨大的人力物力來(lái)收集數(shù)據(jù)和訓(xùn)練模型,比如最近很熱門(mén)的預(yù)訓(xùn)練大模型;另一個(gè)例子是自動(dòng)駕駛,現(xiàn)在離實(shí)際的落地應(yīng)用還有很長(zhǎng)一段距離,需要逐個(gè)解決無(wú)數(shù)個(gè)"黑天鵝問(wèn)題"。

學(xué)界在這個(gè)方向上的工作都還很初步,但蘇煒杰團(tuán)隊(duì)最近的一個(gè)工作算是邁了一小步。這個(gè)工作發(fā)表在《美國(guó)國(guó)家科學(xué)院院刊》(PNAS),對(duì)深度神經(jīng)網(wǎng)絡(luò)進(jìn)行了極大的簡(jiǎn)化,著重分析了特征與后繼層參數(shù)在網(wǎng)絡(luò)訓(xùn)練中的相互作用。

賓大蘇煒杰:從「匱乏」走向「豐富」

論文地址:https://www.pnas.org/doi/epdf/10.1073/pnas.2103091118

運(yùn)用這個(gè)框架,蘇煒杰發(fā)現(xiàn)了深度神經(jīng)網(wǎng)絡(luò)在訓(xùn)練數(shù)據(jù)不平衡時(shí)表現(xiàn)可能會(huì)非常差,特別是對(duì)數(shù)據(jù)量不夠的類(lèi)別,其預(yù)測(cè)能力會(huì)非常隨機(jī)。這個(gè)發(fā)現(xiàn)完全是理論預(yù)測(cè)的,但通過(guò)實(shí)驗(yàn)完美地確認(rèn)有這個(gè)現(xiàn)象,然后針對(duì)性地提出了解決方案。這個(gè)工作說(shuō)明,在一定程度上,數(shù)學(xué)是可以指導(dǎo)深度學(xué)習(xí)的實(shí)際應(yīng)用的,但像這樣的工作目前在深度學(xué)習(xí)的研究中還是非常少見(jiàn)的。雷峰網(wǎng)

此外,數(shù)學(xué)對(duì) AI 知識(shí)的梳理和傳承也是有很大作用的。恩格斯曾說(shuō)過(guò):「任何一門(mén)科學(xué)的真正完善在于數(shù)學(xué)工具的廣泛應(yīng)用」。這句話或許稍有片面,但也可以看出數(shù)學(xué)對(duì)一個(gè)學(xué)科發(fā)展的重要性。為什么埃及金字塔、瑪雅歷法、以及中國(guó)古代的很多技術(shù)會(huì)失傳?本質(zhì)上是因?yàn)檫@些知識(shí)當(dāng)時(shí)沒(méi)有被「數(shù)學(xué)化」,其傳承需要師徒手把手面對(duì)面教授繼承。相反,我們現(xiàn)在還可以很好地理解兩千年前的《幾何原本》,因?yàn)橐粋€(gè)知識(shí)體系在被數(shù)學(xué)化后就是精準(zhǔn)的,其傳承就可以超越時(shí)空。

但 AI 領(lǐng)域的許多知識(shí)目前處于一個(gè)「煉金術(shù)」的狀態(tài),知識(shí)是由大量的試錯(cuò)、經(jīng)驗(yàn)總結(jié)起來(lái)的,缺乏體系,不完整,也存在相互矛盾的現(xiàn)象,這會(huì)造成年輕的學(xué)生很難掌握如此繁瑣的 AI 知識(shí)和經(jīng)驗(yàn),很有可能再過(guò)幾十年這些花費(fèi)巨大資源獲取的知識(shí)會(huì)被遺忘。

蘇煒杰有一個(gè)工作對(duì)一類(lèi) AI 領(lǐng)域的現(xiàn)象作了梳理和簡(jiǎn)化。添加動(dòng)量(momentum)是優(yōu)化機(jī)器學(xué)習(xí)模型時(shí)常用的一個(gè)技巧,Hinton的一個(gè)重要工作指出添加動(dòng)量可以顯著地加快優(yōu)化深度神經(jīng)網(wǎng)絡(luò),目前也有很多解釋的工作,但大家還是覺(jué)得這個(gè)現(xiàn)象很神秘。通過(guò)和美國(guó)國(guó)家工程院院士 Stephen Boyd 、以及導(dǎo)師 Emmanuel 合作,蘇煒杰的一個(gè)工作指出可以用動(dòng)力系統(tǒng)的連續(xù)觀點(diǎn)很直觀地解釋復(fù)雜的加速現(xiàn)象。

賓大蘇煒杰:從「匱乏」走向「豐富」

論文地址:https://jmlr.org/papers/volume17/15-084/15-084.pdf

這個(gè)工作因?yàn)槊黠@的幾何直觀性,在機(jī)器學(xué)習(xí)、優(yōu)化和控制論等多個(gè)領(lǐng)域都有很大影響力,眾多學(xué)者用這個(gè)方法設(shè)計(jì)新的加速算法,并做了大量推廣工作。這其中就包括機(jī)器學(xué)習(xí)泰斗 Michael Jordan 和著名機(jī)器學(xué)習(xí)學(xué)者 Peter Bartlett。Michael Jordan 教授在 2018 年里約國(guó)際數(shù)學(xué)家大會(huì)的 1 小時(shí)報(bào)告中,以大篇幅介紹了這個(gè)工作。

賓大蘇煒杰:從「匱乏」走向「豐富」

圖注:Michael Jordan在2018年國(guó)際數(shù)學(xué)家大會(huì)1小時(shí)報(bào)告上詳細(xì)介紹蘇煒杰的工作

蘇煒杰參加 NeurIPS 等機(jī)器學(xué)習(xí)會(huì)議時(shí),經(jīng)常碰到不認(rèn)識(shí)的人看到他胸前的名牌后問(wèn)「Are you the Su of the Su, Boyd, Candès?」雷峰網(wǎng)

蘇煒杰本科期間曾選修過(guò)經(jīng)濟(jì)學(xué)雙學(xué)位,經(jīng)濟(jì)學(xué)的思想體現(xiàn)在他近期一個(gè)旨在提高論文同行評(píng)議質(zhì)量的工作。在這個(gè)工作中,蘇煒杰把對(duì)于預(yù)測(cè)精度的追求和效用函數(shù)的最大化分離,因此在更廣的意義上可以將博弈論的觀點(diǎn)有機(jī)地引進(jìn)到很多機(jī)器學(xué)習(xí)的問(wèn)題。這個(gè)框架與Michael Jordan近幾年倡導(dǎo)的「ML + Economics」不謀而合。蘇煒杰對(duì)推廣這個(gè)框架充滿信心,歡迎感興趣的學(xué)者和學(xué)生聯(lián)系他。

相關(guān)論文:

  • You Are the Best Reviewer of Your Own Papers: An Owner-Assisted Scoring Mechanism



6、隱私數(shù)據(jù)保護(hù)


蘇煒杰進(jìn)入隱私數(shù)據(jù)保護(hù)領(lǐng)域的引路人是 Cynthia Dwork。這個(gè)領(lǐng)域是數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)的結(jié)合點(diǎn),具有很多優(yōu)美的性質(zhì)。

數(shù)據(jù)隱私的重要性在于,在這個(gè)大數(shù)據(jù)時(shí)代,如何妥善獲取和使用與真人相關(guān)的數(shù)據(jù),漸漸成為亟需解決的問(wèn)題。沒(méi)有人愿意生個(gè)病、上個(gè)網(wǎng)、買(mǎi)件衣服都會(huì)被人隨意知曉,更別提手機(jī)里沒(méi)有修過(guò)的自拍了。在數(shù)據(jù)日益成為AI核心組成部分的今天,保護(hù)數(shù)據(jù)隱私的重要性是基建性的。

可能有種錯(cuò)覺(jué)是相比于中國(guó)用戶,歐美用戶更注重隱私,但這其實(shí)是不對(duì)的。蘇煒杰曾和 Cynthia 討論過(guò)這個(gè)問(wèn)題,Cynthia 的觀點(diǎn)是隱私的重要性是獨(dú)立于文化的。幾年前國(guó)內(nèi)某 IT 大佬曾公開(kāi)宣稱中國(guó)用戶不太注重?cái)?shù)據(jù)隱私,第二天就導(dǎo)致其公司股票大降。隨著我國(guó)公民意識(shí)個(gè)人權(quán)益的不斷增強(qiáng),數(shù)據(jù)隱私保護(hù)的重要性會(huì)越來(lái)越高。

差分隱私由 Cynthia 和合作者于 2006 年提出。除了差分隱私,現(xiàn)在隱私數(shù)據(jù)保護(hù)有安全多方計(jì)算、同態(tài)加密、聯(lián)邦學(xué)習(xí)等技術(shù)。聯(lián)邦學(xué)習(xí)是從「物理」上形式地保護(hù)了隱私,讓數(shù)據(jù)實(shí)現(xiàn)在本地計(jì)算,從而讓「散戶心理上舒服」,但一般并不能在完全絕對(duì)意義上保護(hù)隱私,還需要和差分隱私結(jié)合。而差分隱私無(wú)論是理論還是實(shí)際應(yīng)用,都是現(xiàn)在最成熟的的技術(shù)。硅谷眾多的旗艦大廠都已經(jīng)使用差分隱私多年,Apple 的 iCloud 也用到了這項(xiàng)技術(shù),2020 年美國(guó)人口統(tǒng)計(jì)也大規(guī)模地使用了差分隱私。

簡(jiǎn)單地說(shuō),差分隱私要求數(shù)據(jù)集的單個(gè)用戶的改變基本不影響算法輸出,從而嚴(yán)格保護(hù)每一個(gè)用戶的隱私。為了實(shí)現(xiàn)保護(hù),需要給算法添加噪音,噪音加的越大,隱私就越安全,但是隨之性能也會(huì)越差。在有限的隱私預(yù)算下,很多時(shí)候隱私算法的性能表現(xiàn)會(huì)不如人意。

關(guān)于這個(gè)問(wèn)題,蘇煒杰曾跟學(xué)術(shù)圈研究隱私的人交流,他們一般認(rèn)為隱私保護(hù)是第一位的;但工業(yè)界的從業(yè)人員認(rèn)為算法的性能與隱私保護(hù)一樣重要,兩者需要取舍。蘇煒杰學(xué)經(jīng)濟(jì)學(xué)時(shí)常聽(tīng)到「everything has a price」(每一個(gè)物品都有一個(gè)價(jià)格),隱私也是。因此如果為了保護(hù)隱私而導(dǎo)致算法效率大幅下降,那么是不可取的。

在保證隱私的前提下,為了提高算法精度,蘇煒杰和合作者提出的高斯差分隱私。

相關(guān)工作:

  • Gaussian Differential Privacy

  • Deep Learning with Gaussian Differential Privacy

這個(gè)工作的核心是從假設(shè)檢驗(yàn)的角度來(lái)精準(zhǔn)地刻畫(huà)隱私程度,從理論上嚴(yán)格證明了這個(gè)新框架具有多個(gè)最優(yōu)性質(zhì)。蘇煒杰的團(tuán)隊(duì)還把高斯差分隱私應(yīng)用到深度神經(jīng)網(wǎng)絡(luò)的訓(xùn)練,在同等隱私保護(hù)程度的條件下取得了比 Google Brain 更高的預(yù)測(cè)精度。

這個(gè)新的隱私數(shù)據(jù)分析框架已經(jīng)納入TensorFlow,最近也受到了 Facebook(Meta)的關(guān)注。他的團(tuán)隊(duì)已經(jīng)跟 Meta 合作,希望能將高斯差分隱私部署到他們的廣告推薦系統(tǒng)中。這個(gè)工作既有理論上的優(yōu)美保證,又能應(yīng)用到實(shí)際提高機(jī)器學(xué)習(xí)算法的效率,對(duì)此蘇煒杰感到非常興奮的。


7、生活感悟

蘇煒杰在 AI 學(xué)術(shù)上的探索歷程,是一個(gè)寒門(mén)子弟從早期匱乏逐漸走向「豐富」的成功例子。但這背后也需要他克服更多的困難。

比如,博士第三年,蘇煒杰和妻子突然迎來(lái)了他們的第一個(gè)孩子,而他妻子不久前辭去了在國(guó)內(nèi)本很有發(fā)展前景的工作。隨之而來(lái)的經(jīng)濟(jì)壓力和科研時(shí)間的極大縮短,讓蘇煒杰只能迎頭而上。

賓大蘇煒杰:從「匱乏」走向「豐富」

圖注:蘇煒杰與他的大兒子

這段時(shí)間是蘇煒杰人生中最努力的時(shí)候,既要兼顧學(xué)術(shù)與家庭,又要解決物質(zhì)與精神壓力,就只能白天照顧小孩、晚上熬夜搞學(xué)術(shù)。當(dāng)時(shí)腦海里就只剩下兩個(gè)字:努力。幸運(yùn)的是,他堅(jiān)持下來(lái)了,做出了讓 Emmanuel 和 Cynthia 非常欣賞的工作。

回想起那段時(shí)間,蘇煒杰還有一種「一步走錯(cuò)則滿盤(pán)皆輸」的后怕感。那時(shí)他的學(xué)術(shù)剛剛起步,如果在壓力下,做不出成果,就不可能找到好的教職工作,那之前一路堅(jiān)守的學(xué)術(shù)夢(mèng)想就沒(méi)有意義了。

為了承擔(dān)生育與撫養(yǎng)小孩的費(fèi)用,以及支付她妻子讀碩士的學(xué)費(fèi),蘇煒杰還通過(guò)做額外的助教來(lái)減輕經(jīng)濟(jì)負(fù)擔(dān)。但即便如此,博士畢業(yè)時(shí)他的銀行存款已經(jīng)是零,信用卡還透支了一萬(wàn)五千美元。臨近畢業(yè)時(shí)導(dǎo)師建議他去做一年博士后,這對(duì)建立人脈和拓展研究方向都有幫助,但因?yàn)槠惹行枰环菡焦ぷ鞯氖杖?,蘇煒杰沒(méi)有考慮。雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))

基于這段經(jīng)歷,蘇煒杰有一些對(duì)寒門(mén)子弟人生規(guī)劃的建議。如果有志于學(xué)術(shù),但來(lái)自農(nóng)村或家庭經(jīng)濟(jì)一般,可能選擇跟業(yè)界聯(lián)系緊密、就業(yè)相對(duì)容易的領(lǐng)域是個(gè)明智的選擇。除了個(gè)別領(lǐng)域,絕大多數(shù)領(lǐng)域的博士超過(guò)半數(shù)是無(wú)法在學(xué)術(shù)圈找到工作的,最終還是會(huì)在業(yè)界就業(yè)。而家庭經(jīng)濟(jì)一般,往往很難承受學(xué)術(shù)工作找不到、業(yè)界工作也不匹配的風(fēng)險(xiǎn)。

對(duì)于計(jì)劃在業(yè)界就業(yè)的同學(xué),蘇煒杰的建議是擇業(yè)時(shí)更要多地考慮這個(gè)方向是不是在上升期,因?yàn)樘幱谏仙诘念I(lǐng)域更看重個(gè)人能力和拼搏精神,對(duì)社會(huì)關(guān)系的要求較低。從這個(gè)角度看,如果家庭經(jīng)濟(jì)一般的同學(xué)有機(jī)會(huì)從事AI方面的工作,是一個(gè)很好的選擇。本科報(bào)專業(yè)的時(shí)候可以多考慮計(jì)算機(jī)、數(shù)學(xué)、統(tǒng)計(jì)與數(shù)據(jù)科學(xué)、電氣工程等方向。黃國(guó)平博士是一個(gè)很好的成功例子,蘇煒杰讀過(guò)他的故事,深有共鳴。



8、展望

蘇煒杰懷著兒時(shí)就有的數(shù)學(xué)情懷,做出了兼具理論優(yōu)美和實(shí)際價(jià)值的工作。這在日益壯大的青年 AI 學(xué)者群體中是很少見(jiàn)的。對(duì)于有志研究 AI 的同學(xué),蘇煒杰建議可以多選一些數(shù)學(xué)基礎(chǔ)課程。此外,在「AI+Science」這個(gè)趨勢(shì)的背景下,也可以學(xué)一些生物、物理、化學(xué)等課程,增加知識(shí)維度。

蘇煒杰在可信 AI、優(yōu)化、統(tǒng)計(jì)與數(shù)據(jù)科學(xué)、深度學(xué)習(xí)等多個(gè)領(lǐng)域都有原創(chuàng)性貢獻(xiàn),這每一個(gè)標(biāo)簽加上他身上也都恰如其分。但蘇煒杰并不喜歡被標(biāo)簽限制住,在 AI 被數(shù)據(jù)驅(qū)動(dòng)的浪潮中,不同的領(lǐng)域其實(shí)是在解決同一類(lèi)問(wèn)題,只不過(guò)在前后端的側(cè)重點(diǎn)有所不同。這些本應(yīng)該在一起的領(lǐng)域由于歷史的原因被不同的期刊、會(huì)議、基金項(xiàng)目和院系所分割。

他特別欣賞斯坦福和 MIT 這兩所大學(xué)的模式。斯坦福通過(guò)正式的雙聘制度讓不同的學(xué)科交叉,而 MIT通過(guò)建立林肯實(shí)驗(yàn)室、媒體實(shí)驗(yàn)室等部門(mén)的方式打破學(xué)科壁壘,以解決具體實(shí)際問(wèn)題為導(dǎo)向,這將是趨勢(shì),蘇煒杰提到。

最后他對(duì) AI 科技評(píng)論說(shuō)道:

在這個(gè)激動(dòng)人心的變革時(shí)代,每一位 AI 學(xué)者都在做同樣一件事情。這件事就是 2018 年 Michael Jordan 和張亞勤在烏鎮(zhèn)見(jiàn)面時(shí)說(shuō)的同一句話:「我只是做數(shù)據(jù)分析的」。


雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

賓大蘇煒杰:從「匱乏」走向「豐富」

分享:
相關(guān)文章
最新文章
請(qǐng)?zhí)顚?xiě)申請(qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說(shuō)