丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
人工智能學術 正文
發(fā)私信給陳彩嫻
發(fā)送

0

賓大蘇煒杰:從「匱乏」走向「豐富」

本文作者: 陳彩嫻 2022-03-29 17:05
導語:你當像鳥飛往你的山。

初識蘇煒杰,他與許多青年學者一樣,外表溫文爾雅、略帶靦腆,但一談起學術和 AI 的未來發(fā)展,就充滿激情。

看他的簡歷,成長經(jīng)歷一帆風順:本科就讀于富有盛譽的北京大學數(shù)學科學學院,接著在美國斯坦福大學攻讀博士,師從美國國家科學院院士、麥克阿瑟天才獎得主 Emmanuel Candès 和美國國家科學院和工程院雙院院士 Cynthia Dwork。緊接著跳過博士后階段,執(zhí)教于培養(yǎng)了埃隆·馬斯克和沃倫·巴菲特的沃頓商學院,并聯(lián)合指導常青藤名校賓夕法尼亞大學在機器學習領域的發(fā)展。

他的團隊在機器學習優(yōu)化算法、可信 AI 和高維數(shù)據(jù)分析等領域做出了許多原創(chuàng)甚至突破性的工作,部分成果已經(jīng)應用于業(yè)界。但蘇煒杰謙虛地說,和同一階段的其他 AI 學者相比,他的論文數(shù)量算是少的。而事實是,他「相對較少」的工作已經(jīng)讓他贏得了 NSF Career Award、斯隆研究獎和 SIAM 數(shù)據(jù)科學青年獎等眾多榮譽。能獲得其中一個獎項已經(jīng)堪稱領域小牛,而蘇煒杰獲獎時的工作年限比平均還早兩三年。顯然,蘇煒杰是以「質(zhì)量取勝」。

他指導過的學生已經(jīng)或即將執(zhí)教于北京大學、羅切斯特大學和曼徹斯特大學等名校的計算機系,以及供職于 Google 和 Facebook 等硅谷大廠的研究部門。盡管離博士畢業(yè)只有 5 年多時間,但蘇煒杰已經(jīng)向「桃李滿天下」的夢想邁進了一大步。

在這些成績的背后,蘇煒杰的研究經(jīng)歷是否一帆風順?又有哪些故事值得有志于 AI 的學生借鑒?


1、田園的成長經(jīng)歷

盡管沒有相關統(tǒng)計數(shù)據(jù),但在農(nóng)村長大的知名 AI 青年學者比例想必是極少的。而蘇煒杰就是其中一員。

他談起農(nóng)村成長經(jīng)歷的話語中充滿著快樂。蘇煒杰從小就幫父母干農(nóng)活,在夏天和秋天播種和收割水稻期間學校會放「農(nóng)忙假」,這時候摸田螺和抓黃鱔是他的最愛。平時放學回家路上,蘇煒杰要路過家里的兩畝地,打開水渠給水稻灌溉。小學期間他家沒有房子住,全家就暫住在村里廢棄了的供銷社老房子里。令他感到欣喜的是,這個老房子中間有塊空地,他每天回家都能花很多時間種些花花草草。

在農(nóng)村長大,幾乎沒有課業(yè)壓力,蘇煒杰有更多與自然親近的機會。但這無法掩蓋物質(zhì)上匱乏的事實。相比于城區(qū)學校,蘇煒杰就讀的農(nóng)村小學和初中教學資源要少很多,基礎設施比較差。比如,他的初中操場沒有400米跑道,體育課練跳遠時全校連個皮尺都沒有,更沒有機會接觸計算機,甚至初一開始學英語時都是用漢字注音。因此周圍的同學對讀書改變命運普遍信心不足、學習興趣也不大,經(jīng)濟條件較好的同學經(jīng)常中途轉(zhuǎn)學到城區(qū)學校。

現(xiàn)在,蘇煒杰曾就讀的這兩所學校因為農(nóng)村適齡人口減少等原因,都已經(jīng)關閉。

還有機會上的匱乏。他沒有讀過幼兒園,本應該開始讀小學時,因為教學資源不足,農(nóng)村孩子必須晚一年上學,因此后來在高中和大學他一般都比同學年齡大一些。蘇煒杰笑著提到還出現(xiàn)過有人以為他是復讀生的誤會。

在匱乏中的成長經(jīng)歷,讓蘇煒杰從小認識到生活的艱辛,特別珍視機會,感恩他人的幫助。

蘇煒杰所在的農(nóng)村隸屬于寧波地區(qū)的余姚市,這是中國經(jīng)濟最發(fā)達的縣級市之一,有著濃厚的經(jīng)商創(chuàng)業(yè)氛圍。特別是在農(nóng)村,大家覺得得早點做生意賺錢更好,讀書是一種性價比很低的人生選擇。這也是江浙籍中科院院士自建國初比例持續(xù)下降的原因之一。

這些經(jīng)歷,大概率會讓蘇煒杰走一條不一樣的道路。


2、在追求知識中走向「豐富」

改變蘇煒杰人生走向的第一個節(jié)點是在小學五年級。那一年,他的母親從村里培養(yǎng)出大專生的鄰居那借了兩本教科書,一本關于微積分,另一本關于線性代數(shù)。在強烈的好奇心趨勢下,經(jīng)過一年時間,他在沒有人幫助的情況下讀懂了這兩本書。之后,初一時父親帶著他去寧波和杭州買了不少高等數(shù)學和熱力學、量子力學、狹義相對論等物理書。浸潤在遠超他年齡的知識海洋中,蘇煒杰當時真正看懂的不多,但對知識的渴求已經(jīng)在他心中深深扎根。

誠然,書籍是治愈匱乏最好的療法。蘇煒杰開始經(jīng)常騎很久的自行車去市圖書館,借閱數(shù)學物理天文地理等各種書籍。通過閱讀《古今數(shù)學思想》和《為了人類心智的榮耀》等數(shù)學家傳記,蘇煒杰為高斯、歐拉、黎曼、龐加萊的事跡而激動,為拉馬努金和愛多士等近代數(shù)學家的故事而傾倒。有一次,他想買價格200多元的《中國大百科全書》精粹版,等了半年才向父母提出來。那次他把厚厚的一本書放在自行車后座,從新華書店回家,是他印象中最快樂的一次騎行。

知識的豐富,很快帶來回報。從未接受過競賽訓練的蘇煒杰,初二那年參加初三組數(shù)學競賽獲獎,收到城區(qū)一所初中的邀請轉(zhuǎn)學。之后高中就讀于家鄉(xiāng)最好的余姚中學。從此雖然老家一直在農(nóng)村,但蘇煒杰的求學生涯永遠告別了田園時光。

更大的回報很快接踵而至。高一第一學期,蘇煒杰參加高三數(shù)學競賽,「劍一出鞘」,就獲得了省第六名,代表浙江省參加中國數(shù)學奧林匹克,這讓這個質(zhì)樸的農(nóng)村男生興奮得都不敢相信是真的。之后,蘇煒杰去了杭州、福州等地參加培訓,這也是他第一次真正意義上走出家鄉(xiāng)余姚。跟來自全國各地的優(yōu)秀同學交流過程中,他感受到了差距,特別是在見識和談吐方面的不及,讓當時的他對自己失去信心。

但最后蘇煒杰在決賽中發(fā)揮出色,獲得銀牌,名列浙江省第二名,保送清華大學數(shù)理基科班。這是他家鄉(xiāng)百萬人口縣級市第一次有高一學生保送清北,他還因此獲得了「寧波市十佳學子」的稱號,在家鄉(xiāng)引起了轟動。蘇煒杰至今在家鄉(xiāng)仍有很高的知名度。

高三那年,蘇煒杰再次代表浙江省參加中國數(shù)學奧林匹克,獲得全國第二名,保送北京大學數(shù)學科學學院,并進入國家集訓隊。大多數(shù)集訓隊隊員所在高中之前就有學長學姐進過國家隊,而蘇煒杰是其高中進入數(shù)學國家集訓隊的第一人,至今也是唯一一個。

因此,母校老師對他寄予厚望,希望他能成功進入 IMO 國家隊,為余姚中學帶來第一塊學科競賽國際金牌。但在集訓隊的最后兩次選拔賽中,蘇煒杰發(fā)揮不理想,一步之遙與國家隊失之交臂。十多年過去了,他還對此略感遺憾,但不是因為個人榮譽的得失,而是因為辜負了高中母校的期望。

參加數(shù)學競賽讓這個農(nóng)村男生獲得了不敢想象的豐富機會,盡管也有不少失利,但這更讓他珍視機會的來之不易。蘇煒杰感到自己很幸運,因為這一路他并沒有做任何規(guī)劃,只是單純地追隨他內(nèi)心對數(shù)學之美的熱烈追求。


3、從數(shù)學夢到與AI結(jié)緣

在北大數(shù)院就讀的四年時光里,匱乏隨之遠去,取而代之的是豐富的數(shù)學知識海洋。蘇煒杰盡情地投入這場盛宴,不敢有一絲懈怠。他基本不玩游戲,每天就是跟在燕園第一周就在一起的女朋友、現(xiàn)在的妻子在圖書館自習中度過。

生活方面,北大給蘇煒杰提供了助學金,加上他每年獲得的最高獎學金,就可以完全承擔學費和生活費。這份恩情他一直記在心里。

身處北大數(shù)院,就是與全國最優(yōu)秀的同齡人共處一個集體。這種感覺是美妙的,有什么問題,跟同學一交流,馬上就會豁然開朗,甚至意識到之前沒有注意到的問題,而且還會有一點壓力,這又會讓你更加努力。

北大對蘇煒杰的改變是多方面的,對他的思維方式打下深深的烙印。數(shù)學的思維是向深處探索的,直面真正有難度的問題,力求揭開事物的本質(zhì)。蘇煒杰日后的科研風格也正是如此,長期專注于若干重要且基本的問題,很少做推廣別人的工作。

實現(xiàn)兒時數(shù)學夢近在咫尺,但隨著大四出國申請季的到來,蘇煒杰對未來產(chǎn)生了猶豫和陷入了抉擇的困難。數(shù)學無與倫比的純粹、簡潔和普適性深深地吸引著他,而申請純數(shù)學博士是成為一名數(shù)學家的必要條件,也是實現(xiàn)他數(shù)學夢的必經(jīng)之路。同時,蘇煒杰在北大數(shù)院的方向也正是基礎數(shù)學,核心專業(yè)課平均分97分,名列年級第一,再加上他在丘成桐大學生數(shù)學競賽的出色成績,可以讓他申請到最好的基礎數(shù)學博士項目。

但此時的蘇煒杰,隨著年齡和閱歷的增加,有了不一樣的思考。

北大是綜合性大學,他有機會選修機器學習、計算數(shù)學和統(tǒng)計等課程和參加相關講座,還在林毅夫教授創(chuàng)辦的國家發(fā)展研究院獲得了經(jīng)濟學雙學位。這些另一個維度的經(jīng)歷讓蘇煒杰了解到數(shù)學在其他領域的作用,可以幫助解決重要的實際問題。

另一個因素是蘇煒杰在大三那年(2010年)暑假得到了在微軟亞洲研究院實習的機會, 此時機器學習方興未艾,在微軟亞研,蘇煒杰了解到機器學習的前沿方向和應用,產(chǎn)生了濃厚的興趣。當時大家還不怎么使用 AI 這個詞,但回想起來,他對 AI 的初印象確是來自于這段實習經(jīng)歷。這段經(jīng)歷還讓蘇煒杰結(jié)交了很多計算機專業(yè)的同齡人,體會到了不同學科之間思考方式的差異。

賓大蘇煒杰:從「匱乏」走向「豐富」

圖注:2010年夏天,蘇煒杰(最左)在微軟亞洲研究院實習

但讓蘇煒杰決心走一條不一樣的路的最終決定因素是他的成長經(jīng)歷。農(nóng)村的成長經(jīng)歷,讓蘇煒杰希望未來事業(yè)能跟業(yè)界更緊密些, 有機會能改善父母的生活。經(jīng)過一番思想斗爭,最后放棄了純數(shù)學作為個人事業(yè)。

蘇煒杰后來選擇了斯坦福大學統(tǒng)計系繼續(xù)他的學術夢,就不再是狹義上的數(shù)學家。但他未來的學術風格、思考問題的方式以及學術情懷,從來沒有離開過數(shù)學。


4、成熟于硅谷的 AI 學術風格

懷揣著對未來的憧憬,2011 年蘇煒杰飛躍大洋來到硅谷,在斯坦福最高博士生獎學金(Stanford Graduate Fellowship)的支持下開啟攻讀博士之旅。蘇煒杰所在的統(tǒng)計系有二十位不到的教授,但卻有近十位是美國國家科學院院士,因此 「院士只是平均水平」。系里的老師普遍在電子工程系、醫(yī)學院、計算機系、數(shù)學系有正式職位,是名副其實的數(shù)據(jù)科學。

此時的斯坦福和附近的谷歌等公司還處在 AI 即將快速發(fā)展的前夜。這種多元和動態(tài)完美結(jié)合的環(huán)境讓蘇煒杰能深入接觸機器學習和數(shù)據(jù)科學的前沿。

在斯坦福眾多頂級學者中,他選擇了 Emmanuel Candès 教授作為他的博士導師。Emmanuel 是真正的天才,他曾獲得麥克阿瑟天才獎等大獎,研究的內(nèi)容橫跨計算數(shù)學、機器學習、統(tǒng)計、信息論、信號處理和優(yōu)化等眾多領域,在很年輕的時候就當選為美國國家科學院院士。2020年,他還與陶哲軒一起獲得了當年的「IEEE Jack S. Kilby Signal Processing Medal」(信號處理領域最高榮譽)。

2014年,蘇煒杰在微軟研究院硅谷分部實習,導師是美國國家科學院和工程院雙院院士 Cynthia Dwork。她是一位初見就覺得是「我的朋友」的老太太,早年在密碼學和分布式計算做出了奠基性的工作,開啟了工作量證明這個研究方向,為后來的區(qū)塊鏈奠定了部分理論基礎。近幾年 Cynthia 領導了可信 AI(特別是隱私數(shù)據(jù)保護和算法公平性)這個朝氣蓬勃的領域,蘇煒杰也在她的指導下進入了這個領域。從此,她一直給予蘇煒杰學術上的指導和支持,是他實際意義上的導師。同時,Cynthia 還是早期的一代女性計算機科學家,早年作為女性學習計算機需要克服諸多困難,蘇煒杰聯(lián)系到自身從農(nóng)村走來也多有坎坷,因此很有共鳴。

賓大蘇煒杰:從「匱乏」走向「豐富」

圖注:Cynthia Dwork

這兩位教授領域不同,但有相似的學術觀點,共同塑造了蘇煒杰今天的學術風格。這并不是說蘇煒杰從 Emmanuel 和 Cynthia 處學到很多具體知識點,坦率地講,作為北大數(shù)院的頂尖畢業(yè)生,他的知識儲備在本科基本已經(jīng)完成。但學術遠遠不止于知識的積累,更重要的是學術風格的建立,理解什么是好的學術。

首先,以解決問題為導向,而不因?qū)W科限制自己。Emmanuel當年與陶哲軒一起發(fā)明壓縮感知(Compressed Sensing)的時候,就是為了加速磁共振成像這個實際問題。這個工作兼具數(shù)學之美與實際之美,是非常罕見的。而在研究的過程中,他用到了信號處理、信息論、優(yōu)化和統(tǒng)計等多個學科的思想和方法。Cynthia 早年的領域是理論計算機,但近些年在開啟隱私數(shù)據(jù)保護和算法公平性這些領域的時候深入引進了統(tǒng)計技術和社會學思想。

另一個很重要的一點是持久地做自己認為重要的課題。Emmanuel 告訴蘇煒杰,他基本不看 arXiv 上最新的論文,而是做自己認為重要的問題,且不輕易因為外界的聲音改變。如果過于緊跟潮流,總是在模仿,很容易迷失在浩如煙海的論文海洋之中,研究的內(nèi)容很難有自己的特色,且無法產(chǎn)生深遠的影響力。Cynthia 十多年前剛開啟隱私數(shù)據(jù)保護這個領域時,領域內(nèi)對此有不同聲音,但經(jīng)過十多年的持續(xù)耕耘,現(xiàn)在已經(jīng)在業(yè)界廣泛應用。

此外,要重質(zhì)量而不是數(shù)量。蘇煒杰回憶,Emmanuel 好幾次跟他說自己不應該寫某些論文,希望從簡歷里刪掉。當時蘇煒杰還挺驚訝,因為這些論文的引用量也有數(shù)百。獨立工作后他才明白,現(xiàn)在學術圈的問題是論文太多,但真正高質(zhì)量的論文比例卻不高。Emmanuel 告誡他,一篇論文好不好,要看5年甚至10年以后是否還有參考價值。

這些言傳身教讓蘇煒杰受益匪淺,體現(xiàn)在他做科研也不局限于某個具體學科,經(jīng)常橫跨機器學習、優(yōu)化和統(tǒng)計等多個領域,以及習慣于持續(xù)地研究問題,注重「種樹」而非「摘果」?!阜N樹」的成功率固然不高,但這類工作一旦成功,往往能給本領域提供新的問題和機會。

因為帶學生有壓力,他也有一些純粹只是為了發(fā)表而發(fā)表的論文,但他每年要求自己至少寫一篇「5年以后還有人讀」的論文?,F(xiàn)在蘇煒杰有40余篇論文,但他坦然說只有3、4篇是他真正喜歡的,具有長期價值。也正是這少量的幾篇高質(zhì)量論文,讓蘇煒杰贏得了眾多榮譽,其成果已經(jīng)在包括賓大、MIT、UC Berkeley、斯坦福、普林斯頓、耶魯、北大、UCSD、UIUC等眾多大學的數(shù)據(jù)科學和機器學習課程中講授。有朋友跟他說:「未來可以寫進教科書。」

除了學術,兩位導師在生活上對蘇煒杰也很關心。Emmanuel 有著法國學者常見的高冷氣質(zhì),但內(nèi)心卻很關心學生,每學期都會邀請學生去他家參加派對,有一次得知蘇煒杰遇到經(jīng)濟困難后曾提出經(jīng)濟上的幫助。Cynthia 則經(jīng)常問蘇煒杰工作開不開心,2017年她入職哈佛大學后,曾提到如果蘇煒杰想來「波士頓的那兩個學校」,隨時跟她說。


5、豐收篇

2016年,蘇煒杰博士畢業(yè),論文獲得了首屆「斯坦福 Theodore Anderson 獎」。在 Emmanuel 和 Cynthia 兩位導師的推薦下,入職常青藤名校賓夕法尼亞大學,開始了在東海岸的獨立工作。

賓大蘇煒杰:從「匱乏」走向「豐富」

圖注:蘇煒杰和他妻子與Emmanuel Candes的合影

懷揣著對 AI 的熱情,以及深厚的數(shù)學情懷,蘇煒杰開始迎來學術上的豐收。

蘇煒杰的一個主要課題是揭開深度學習背后的機制,理解為什么深度神經(jīng)網(wǎng)絡有時候效果好、有時候不好?;蛟S是因為數(shù)學背景出身,他除了重視提升效果,也強調(diào)「知其然,也要知其所以然」。

他對 AI 科技評論談道:

有人說深度學習是「煉金術」。這對于人臉識別、下圍棋甚至蛋白質(zhì)折疊等也許沒有特別大的影響,但對于高風險的 AI 應用卻是至關重要的。最近 DeepMind 將深度強化學習應用到核聚變,結(jié)果令人興奮,但在沒有完全理解深度學習的機制之前,即使成功率達到99.99%,我們能承受最后變成一顆小型氫彈的0.01%的可能性嗎?

這是一個重要且非?;钴S的科研領域,但還沒有一個理論獲得學界廣泛認可。經(jīng)過多年思考,蘇煒杰和他團隊提出了一個深度神經(jīng)網(wǎng)絡的「局域彈性」(local elasticity)理論,給神經(jīng)網(wǎng)絡泛化、優(yōu)化等性質(zhì)提供了一個簡單的唯象理論。

這個理論可以用一個很簡單的例子來介紹:神經(jīng)網(wǎng)絡看到一張波斯貓的圖片后更新了其參數(shù),然后我們觀察神經(jīng)網(wǎng)絡更新后在另一張圖片上預測的改變。實驗發(fā)現(xiàn),改變的大小取決于新圖片跟波斯貓的相似度:變化在暹羅貓上最大,在老虎上其次,在汽車上最小。形象地說,深度神經(jīng)網(wǎng)絡像橡皮泥一樣有局部的彈性。

直覺上,蘇煒杰相信這個唯象理論是通向最終理論的必經(jīng)之路,但現(xiàn)在還不完善,還需要大量后續(xù)工作來深入研究。

相關論文:

  • The Local Elasticity of Neural Networks

  • Neurashed: A Phenomenological Model for Imitating Deep Learning Training

蘇煒杰認為數(shù)學理論還可以指導實際的 AI 問題。「There is Nothing More Practical Than A Good Theory」,一個好的理論價值的最直接體現(xiàn)在于能不能指導實際,節(jié)約人力物力。流體力學和空氣動力學就是一個很好的例子,現(xiàn)在可以用仿真來替代真實的風洞試驗。但 AI 領域很多方向還需要耗費巨大的人力物力來收集數(shù)據(jù)和訓練模型,比如最近很熱門的預訓練大模型;另一個例子是自動駕駛,現(xiàn)在離實際的落地應用還有很長一段距離,需要逐個解決無數(shù)個"黑天鵝問題"。

學界在這個方向上的工作都還很初步,但蘇煒杰團隊最近的一個工作算是邁了一小步。這個工作發(fā)表在《美國國家科學院院刊》(PNAS),對深度神經(jīng)網(wǎng)絡進行了極大的簡化,著重分析了特征與后繼層參數(shù)在網(wǎng)絡訓練中的相互作用。

賓大蘇煒杰:從「匱乏」走向「豐富」

論文地址:https://www.pnas.org/doi/epdf/10.1073/pnas.2103091118

運用這個框架,蘇煒杰發(fā)現(xiàn)了深度神經(jīng)網(wǎng)絡在訓練數(shù)據(jù)不平衡時表現(xiàn)可能會非常差,特別是對數(shù)據(jù)量不夠的類別,其預測能力會非常隨機。這個發(fā)現(xiàn)完全是理論預測的,但通過實驗完美地確認有這個現(xiàn)象,然后針對性地提出了解決方案。這個工作說明,在一定程度上,數(shù)學是可以指導深度學習的實際應用的,但像這樣的工作目前在深度學習的研究中還是非常少見的。雷峰網(wǎng)(公眾號:雷峰網(wǎng))

此外,數(shù)學對 AI 知識的梳理和傳承也是有很大作用的。恩格斯曾說過:「任何一門科學的真正完善在于數(shù)學工具的廣泛應用」。這句話或許稍有片面,但也可以看出數(shù)學對一個學科發(fā)展的重要性。為什么埃及金字塔、瑪雅歷法、以及中國古代的很多技術會失傳?本質(zhì)上是因為這些知識當時沒有被「數(shù)學化」,其傳承需要師徒手把手面對面教授繼承。相反,我們現(xiàn)在還可以很好地理解兩千年前的《幾何原本》,因為一個知識體系在被數(shù)學化后就是精準的,其傳承就可以超越時空。

但 AI 領域的許多知識目前處于一個「煉金術」的狀態(tài),知識是由大量的試錯、經(jīng)驗總結(jié)起來的,缺乏體系,不完整,也存在相互矛盾的現(xiàn)象,這會造成年輕的學生很難掌握如此繁瑣的 AI 知識和經(jīng)驗,很有可能再過幾十年這些花費巨大資源獲取的知識會被遺忘。

蘇煒杰有一個工作對一類 AI 領域的現(xiàn)象作了梳理和簡化。添加動量(momentum)是優(yōu)化機器學習模型時常用的一個技巧,Hinton的一個重要工作指出添加動量可以顯著地加快優(yōu)化深度神經(jīng)網(wǎng)絡,目前也有很多解釋的工作,但大家還是覺得這個現(xiàn)象很神秘。通過和美國國家工程院院士 Stephen Boyd 、以及導師 Emmanuel 合作,蘇煒杰的一個工作指出可以用動力系統(tǒng)的連續(xù)觀點很直觀地解釋復雜的加速現(xiàn)象。

賓大蘇煒杰:從「匱乏」走向「豐富」

論文地址:https://jmlr.org/papers/volume17/15-084/15-084.pdf

這個工作因為明顯的幾何直觀性,在機器學習、優(yōu)化和控制論等多個領域都有很大影響力,眾多學者用這個方法設計新的加速算法,并做了大量推廣工作。這其中就包括機器學習泰斗 Michael Jordan 和著名機器學習學者 Peter Bartlett。Michael Jordan 教授在 2018 年里約國際數(shù)學家大會的 1 小時報告中,以大篇幅介紹了這個工作。

賓大蘇煒杰:從「匱乏」走向「豐富」

圖注:Michael Jordan在2018年國際數(shù)學家大會1小時報告上詳細介紹蘇煒杰的工作

蘇煒杰參加 NeurIPS 等機器學習會議時,經(jīng)常碰到不認識的人看到他胸前的名牌后問「Are you the Su of the Su, Boyd, Candès?」雷峰網(wǎng)

蘇煒杰本科期間曾選修過經(jīng)濟學雙學位,經(jīng)濟學的思想體現(xiàn)在他近期一個旨在提高論文同行評議質(zhì)量的工作。在這個工作中,蘇煒杰把對于預測精度的追求和效用函數(shù)的最大化分離,因此在更廣的意義上可以將博弈論的觀點有機地引進到很多機器學習的問題。這個框架與Michael Jordan近幾年倡導的「ML + Economics」不謀而合。蘇煒杰對推廣這個框架充滿信心,歡迎感興趣的學者和學生聯(lián)系他。

相關論文:

  • You Are the Best Reviewer of Your Own Papers: An Owner-Assisted Scoring Mechanism



6、隱私數(shù)據(jù)保護


蘇煒杰進入隱私數(shù)據(jù)保護領域的引路人是 Cynthia Dwork。這個領域是數(shù)據(jù)科學和機器學習的結(jié)合點,具有很多優(yōu)美的性質(zhì)。

數(shù)據(jù)隱私的重要性在于,在這個大數(shù)據(jù)時代,如何妥善獲取和使用與真人相關的數(shù)據(jù),漸漸成為亟需解決的問題。沒有人愿意生個病、上個網(wǎng)、買件衣服都會被人隨意知曉,更別提手機里沒有修過的自拍了。在數(shù)據(jù)日益成為AI核心組成部分的今天,保護數(shù)據(jù)隱私的重要性是基建性的。

可能有種錯覺是相比于中國用戶,歐美用戶更注重隱私,但這其實是不對的。蘇煒杰曾和 Cynthia 討論過這個問題,Cynthia 的觀點是隱私的重要性是獨立于文化的。幾年前國內(nèi)某 IT 大佬曾公開宣稱中國用戶不太注重數(shù)據(jù)隱私,第二天就導致其公司股票大降。隨著我國公民意識個人權益的不斷增強,數(shù)據(jù)隱私保護的重要性會越來越高。

差分隱私由 Cynthia 和合作者于 2006 年提出。除了差分隱私,現(xiàn)在隱私數(shù)據(jù)保護有安全多方計算、同態(tài)加密、聯(lián)邦學習等技術。聯(lián)邦學習是從「物理」上形式地保護了隱私,讓數(shù)據(jù)實現(xiàn)在本地計算,從而讓「散戶心理上舒服」,但一般并不能在完全絕對意義上保護隱私,還需要和差分隱私結(jié)合。而差分隱私無論是理論還是實際應用,都是現(xiàn)在最成熟的的技術。硅谷眾多的旗艦大廠都已經(jīng)使用差分隱私多年,Apple 的 iCloud 也用到了這項技術,2020 年美國人口統(tǒng)計也大規(guī)模地使用了差分隱私。

簡單地說,差分隱私要求數(shù)據(jù)集的單個用戶的改變基本不影響算法輸出,從而嚴格保護每一個用戶的隱私。為了實現(xiàn)保護,需要給算法添加噪音,噪音加的越大,隱私就越安全,但是隨之性能也會越差。在有限的隱私預算下,很多時候隱私算法的性能表現(xiàn)會不如人意。

關于這個問題,蘇煒杰曾跟學術圈研究隱私的人交流,他們一般認為隱私保護是第一位的;但工業(yè)界的從業(yè)人員認為算法的性能與隱私保護一樣重要,兩者需要取舍。蘇煒杰學經(jīng)濟學時常聽到「everything has a price」(每一個物品都有一個價格),隱私也是。因此如果為了保護隱私而導致算法效率大幅下降,那么是不可取的。

在保證隱私的前提下,為了提高算法精度,蘇煒杰和合作者提出的高斯差分隱私。

相關工作:

  • Gaussian Differential Privacy

  • Deep Learning with Gaussian Differential Privacy

這個工作的核心是從假設檢驗的角度來精準地刻畫隱私程度,從理論上嚴格證明了這個新框架具有多個最優(yōu)性質(zhì)。蘇煒杰的團隊還把高斯差分隱私應用到深度神經(jīng)網(wǎng)絡的訓練,在同等隱私保護程度的條件下取得了比 Google Brain 更高的預測精度。

這個新的隱私數(shù)據(jù)分析框架已經(jīng)納入TensorFlow,最近也受到了 Facebook(Meta)的關注。他的團隊已經(jīng)跟 Meta 合作,希望能將高斯差分隱私部署到他們的廣告推薦系統(tǒng)中。這個工作既有理論上的優(yōu)美保證,又能應用到實際提高機器學習算法的效率,對此蘇煒杰感到非常興奮的。


7、生活感悟

蘇煒杰在 AI 學術上的探索歷程,是一個寒門子弟從早期匱乏逐漸走向「豐富」的成功例子。但這背后也需要他克服更多的困難。

比如,博士第三年,蘇煒杰和妻子突然迎來了他們的第一個孩子,而他妻子不久前辭去了在國內(nèi)本很有發(fā)展前景的工作。隨之而來的經(jīng)濟壓力和科研時間的極大縮短,讓蘇煒杰只能迎頭而上。

賓大蘇煒杰:從「匱乏」走向「豐富」

圖注:蘇煒杰與他的大兒子

這段時間是蘇煒杰人生中最努力的時候,既要兼顧學術與家庭,又要解決物質(zhì)與精神壓力,就只能白天照顧小孩、晚上熬夜搞學術。當時腦海里就只剩下兩個字:努力。幸運的是,他堅持下來了,做出了讓 Emmanuel 和 Cynthia 非常欣賞的工作。

回想起那段時間,蘇煒杰還有一種「一步走錯則滿盤皆輸」的后怕感。那時他的學術剛剛起步,如果在壓力下,做不出成果,就不可能找到好的教職工作,那之前一路堅守的學術夢想就沒有意義了。

為了承擔生育與撫養(yǎng)小孩的費用,以及支付她妻子讀碩士的學費,蘇煒杰還通過做額外的助教來減輕經(jīng)濟負擔。但即便如此,博士畢業(yè)時他的銀行存款已經(jīng)是零,信用卡還透支了一萬五千美元。臨近畢業(yè)時導師建議他去做一年博士后,這對建立人脈和拓展研究方向都有幫助,但因為迫切需要一份正式工作的收入,蘇煒杰沒有考慮。雷峰網(wǎng)

基于這段經(jīng)歷,蘇煒杰有一些對寒門子弟人生規(guī)劃的建議。如果有志于學術,但來自農(nóng)村或家庭經(jīng)濟一般,可能選擇跟業(yè)界聯(lián)系緊密、就業(yè)相對容易的領域是個明智的選擇。除了個別領域,絕大多數(shù)領域的博士超過半數(shù)是無法在學術圈找到工作的,最終還是會在業(yè)界就業(yè)。而家庭經(jīng)濟一般,往往很難承受學術工作找不到、業(yè)界工作也不匹配的風險。

對于計劃在業(yè)界就業(yè)的同學,蘇煒杰的建議是擇業(yè)時更要多地考慮這個方向是不是在上升期,因為處于上升期的領域更看重個人能力和拼搏精神,對社會關系的要求較低。從這個角度看,如果家庭經(jīng)濟一般的同學有機會從事AI方面的工作,是一個很好的選擇。本科報專業(yè)的時候可以多考慮計算機、數(shù)學、統(tǒng)計與數(shù)據(jù)科學、電氣工程等方向。黃國平博士是一個很好的成功例子,蘇煒杰讀過他的故事,深有共鳴。



8、展望

蘇煒杰懷著兒時就有的數(shù)學情懷,做出了兼具理論優(yōu)美和實際價值的工作。這在日益壯大的青年 AI 學者群體中是很少見的。對于有志研究 AI 的同學,蘇煒杰建議可以多選一些數(shù)學基礎課程。此外,在「AI+Science」這個趨勢的背景下,也可以學一些生物、物理、化學等課程,增加知識維度。

蘇煒杰在可信 AI、優(yōu)化、統(tǒng)計與數(shù)據(jù)科學、深度學習等多個領域都有原創(chuàng)性貢獻,這每一個標簽加上他身上也都恰如其分。但蘇煒杰并不喜歡被標簽限制住,在 AI 被數(shù)據(jù)驅(qū)動的浪潮中,不同的領域其實是在解決同一類問題,只不過在前后端的側(cè)重點有所不同。這些本應該在一起的領域由于歷史的原因被不同的期刊、會議、基金項目和院系所分割。

他特別欣賞斯坦福和 MIT 這兩所大學的模式。斯坦福通過正式的雙聘制度讓不同的學科交叉,而 MIT通過建立林肯實驗室、媒體實驗室等部門的方式打破學科壁壘,以解決具體實際問題為導向,這將是趨勢,蘇煒杰提到。

最后他對 AI 科技評論說道:

在這個激動人心的變革時代,每一位 AI 學者都在做同樣一件事情。這件事就是 2018 年 Michael Jordan 和張亞勤在烏鎮(zhèn)見面時說的同一句話:「我只是做數(shù)據(jù)分析的」。


雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

賓大蘇煒杰:從「匱乏」走向「豐富」

分享:
相關文章
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設置密碼以方便用郵箱登錄
立即設置 以后再說