0
作者 | 陳彩嫻
(一)
作為一枚資深權游粉,韓旭說道,他最喜歡的劇中角色是提利昂·蘭尼斯特(韓旭稱呼他為“小矮子”),因為他習慣用大腦思考,運用知識與智慧來解決問題,而非武力:
“在這部劇中,所有人都在討論自己家族的命運,只有小矮子在考慮整個國家應該往哪發(fā)展。他關心的不是權力斗爭,而是如何用權力去建設整個國家。”
與提利昂一樣,韓旭也熱衷于閱讀經典,讀一些人文社科類書籍,關注民生時事。這一點使他的談吐有別于大多數思維抽象的理科生:談起專業(yè)之外的社會議題,韓旭也能引經據典,拋磚引玉,結合自己與他人的思考進行一番嚴謹的論述。
比如,在繼續(xù)對權游進行討論時,韓旭又引用中國近代解放戰(zhàn)爭的例子來對他的觀點進行了佐證:
“要想取得一場戰(zhàn)爭的勝利,不能光靠武力。解放戰(zhàn)爭時,共產黨打敗國民黨,靠的也不只是戰(zhàn)無不勝的軍隊,還有在解放區(qū)進行的土地改革等政策。就像陳毅元帥說的,淮海戰(zhàn)役的勝利,是人民群眾用小車推出來的。”
顯然,韓旭對知識的力量是崇拜的。韓旭眼中的“知識”,也不僅是冷冰冰的科技,還有社會與人文。從本科開始,他的書架上便不只有計算機類的教材,還有許多社科類書籍,比如費孝通的《鄉(xiāng)土中國》、蔣廷黻與徐中約的《中國近代史》,以及馬伯庸的一系列小說。最近,他又開始看《毛澤東選集》。誠如他所說,這兩年,“內卷”、“后浪”等名詞被廣泛討論,他嘗試用一種幾十年前的、與現在有所不同又有所相同的視角來審視當前的社會生產關系,“依然感覺很受用?!?/span>
也許正是如此,當韓旭審視自己以及審視他人時,他的思考是圓潤的,也是溫良的。在談到清北學子在深圳中小學競爭上崗、北大校友李雪琴當網紅時,此前已有過相關思考的韓旭很快就提出了自己的觀點:
“外界對清北的畢業(yè)生都寄予厚望,認為他們應該從事高大上的行業(yè),比如做科研。但事實是,科研并不一定適合所有人。科研人才缺不缺?肯定是缺的,但不是所有人都能勝任,或適合。
理論上講,如果國家要發(fā)展,未來所有行業(yè)的文化水平都會普遍提高,生產工具也在不斷發(fā)展。無論是讀到碩士生還是博士生,你在某個專業(yè)有了深入研究,最后還是要從事具體的工作。博士生去做基礎工作,不一定是浪費?!?/span>
以自己為例,雖然韓旭也想一直從事科研,做一名高校教師,培養(yǎng)一代又一代做研究的學生,桃李滿天下。如果在大學里無法謀得一職半位,他覺得去中學當一名教師也很不錯。
雖然崇尚知識,但在韓旭的世界觀里,個人的生活似乎才是討論的中心。即使在討論制度建設與人才培養(yǎng)等話題時,他的聚焦點也不僅是宏大的概念,更有人與時間的參與。
在清華,韓旭比大多數人更容易見識到大神風采。
與他同年入學的2013級學子中,就有一些少年成名之才,如胡淵鳴,人稱“鳴神”,是“太極”(TaiChi)編程語言的發(fā)明者,因用99行代碼就能打造冰雪奇緣而一舉封神;陳立杰,2013年 IOI 金牌得主,多次獲得理論計算機頂會STOC與FOCS最佳學生論文獎;范浩強,2011年 IOI 金牌得主,高二便被唐文斌拉去曠視創(chuàng)業(yè),在清華讀本科時用一半時間工作、一半時間學習還能保持連續(xù)四年姚班第一名的成績,如今擔任曠視算法總監(jiān)……
除了同級的名人,韓旭在擔任計算機系科協主席、負責舉辦活動時,也經常有機會見到以前清華的風云人物,比如王小川、樓天城。
仰望大神難免讓人自覺淪為平庸之輩,本科時觀看清華特獎頒獎時,韓旭也會感慨相形見絀,但在清華度過八年時光后,他的看法也發(fā)生了細微改變:即使在清華,風華絕代、國士無雙也只是少數,踏實工作、中流砥柱可能更符合大多數清華人的平均形象。關于“偉大”的描述往往浮于表面,大多數人的成長更像是一幅立體的圖像,不大的挫折與不小的成就交疊,起起落落,在時間的維度上一直前進。
(二)
2011年,高一的韓旭獲得了NOI邀請賽的金牌,并因此被保送到了清華大學計算機系。他常調侃自己:“在清華計算機系,我不過是一個腳踏實地、安分守己的普通人。”
但事實上,在一眾 AI 博士生中,韓旭并不“普通”。從某些層面來看,韓旭達到了世俗對清華學子的期許,既勤苦修學、實用知識,又敢于擔當、熱心助人:
在科研上,得益于信息學競賽的背景,他從大一就開始進實驗室做科研,2017年本科畢業(yè)后直博清華,博士剛開學就中了第一篇頂會一作,之后幾年也比較高產,目前博士四年級在讀,卻已手握將近 30 篇 AI 頂會論文,出版過學術專著,獲得過大大小小十多項獎學金,還入選了2020年“微軟學者”。
在為人處事上,他一直奉行“窮則獨善其身,達則兼濟天下”的信條。
90后的一代,又被稱為“冷”的一代,歸因不外乎獨生子女的成長模式、網絡通訊的發(fā)達、個人主義的覺醒等。但在韓旭的身上,仍可見一絲“修身、齊家、治國、平天下”的復古。在“獨善其身”之余,韓旭一直熱心于以“微薄之力”幫助他人,即使在制定職業(yè)目標時,他所選擇的也是“知識改變人生”的教職。
從大二開始到本科畢業(yè),他在計算機系學生科協干了三年,讀博后也繼續(xù)做著計算機系的輔導員,和學生科協有著千絲萬縷的聯系。
國內高校并沒有硬性要求博士生讀博期間必須要做助教的要求,但韓旭還是在繁重的科研中擠出時間,擔任一些本科生課程的助教。他的想法是:“我當助教,把這門課的內容搞好一點,同學上課上得舒服一點,還挺有滿足感的?!睆谋究频浆F在,他已經當過三門課的助教,分別是《軟件工程》、《面向對象程序設計基礎》與《寫作與溝通》。
只是,相比傳統(tǒng)士大夫將飽讀詩書與仕途平坦相捆綁的做法,韓旭是“冷”。這種“冷”,更多是體現在對頭銜追求的漠視,對名利榮譽的淡然。在審視自己的“成功”時,韓旭是謹慎的:“如果只是發(fā)論文,但不是那種開創(chuàng)式、奠基式的工作,即使論文數量很多、引用數也不低,總感覺差了那么點意思?!?/span>
他將自己的學術成果歸功于組內的合作與導師的指導?!斑@個沒什么好強調的,主要是歸功于清華的平臺,還有計算機行業(yè)的發(fā)展。一個人的命運,要靠自我奮斗,也要考慮到歷史的進程?!?/span>
圖注:2021年2月2日,團隊剛投完ACL,興奮合影
韓旭的研究方向為自然語言處理,師從劉知遠與孫茂松,隸屬于知名的清華大學自然語言處理實驗室(THUNLP)。由孫茂松老師領導的THUNLP是國內自然語言處理領域具有重要影響力的研究團隊之一,除了在國際頂會上有頗多斬獲,也培養(yǎng)出了許多優(yōu)秀的「NLPer」,包括韓旭的導師劉知遠(現任清華大學副教授)、師兄涂存超(冪律智能創(chuàng)始人)等等。
韓旭解釋,他之所以能在博士剛開學就中頂會論文,是因為他從本科就開始進 THUNLP 實習、做項目。
當時,大一剛開學,得知劉知遠老師在招募實習生,韓旭毫不猶豫就報了名,和班上另外三個同學加入了實驗室,在學長的指導下開發(fā)了“微博關鍵詞”的趣味應用。這個小小的成就使他很早就找到了自己未來的研究目標:“這個應用從部署到最后結束維護,訪問次數一共超過了3000萬次,大家就感覺做自然語言處理還挺好玩的。我們幾個,除了我,徐磊去了MIT讀博,郭志芃去了冪律智能,跟涂存超師兄一起創(chuàng)業(yè)、當聯合創(chuàng)始人了。”
當知識圖譜被公認為是實現機器理解人類語言的有效途徑之一時,韓旭跟隨劉知遠老師在該方向上率先探索,一個課題不斷修改、實驗、打磨,最后在臨近大四結束時投出文章,所以在博一剛開學時就接到了論文被接收的消息。隨后,他在讀博時繼續(xù)圍繞如何在自然語言處理中知識的獲取與理解進行探索,進展也比較順利,取得了不錯的成果。
說起來,韓旭的博士導師劉知遠也是國內自然語言處理領域有名的年輕學者。他的求學經歷也與劉知遠相似:本科與博士都是就讀于清華大學,也是在THUNLP做研究。韓旭談到,他選擇留在清華讀博的一個重要原因,就是因為覺得與導師興趣愛好相似,三觀相近,溝通起來比較順利:
“我導師之前也是一邊做科研、一邊做輔導員,也喜歡看各種各樣的歷史書籍、語言學書籍和哲學書籍。感覺和我很像,專注本職工作之余,也會關注專業(yè)以外的領域,世界觀也很寬廣,對事情有自己的看法。”
(三)
韓旭想贏嗎?答案不言自明。
從大一爭取進實驗室,到讀博期間保持穩(wěn)定的論文輸出,韓旭都不掩飾自己是一個目的明確、也會積極爭取的人。比如說,他想從事大學教職,面對競爭日益激烈的大環(huán)境,也計劃博士畢業(yè)后再讀一個博士后(postdoc)。
但與此同時,他又很坦然,論文被接收也好,被拒也好,他都是無所謂的:“好比我打游戲,想贏不想輸,但輸了也不會特別難過,感覺過去了就過去了。辯證法講對立統(tǒng)一,可能這就是對立統(tǒng)一吧?!?/span>
韓旭從小熱愛歷史,“沒搞競賽之前,一度想去當考古學家?!痹谑窌镆姂T了人生的起伏,以及朝代的興衰更替,韓旭不執(zhí)著于輸贏,對當下的評價也習慣于拉長視角,從寬闊的時空中看待事物的“偉大”與“渺小”。
比如,2016年AlphaGo打敗世界冠軍時,韓旭看到新聞,只覺得是浩瀚歷史里的一個小節(jié)點:“講道理就算擊敗了也不意味著什么,機器本來就是為了在某方面擊敗人類而生的,不然要它何用。折騰了大幾十年,耗費這么多還在弱智能狀態(tài),不得不說人的智能本身是多么奇妙和復雜?!?/span>
他將自己的論文成果歸功于組內合作緊密、計算設備充足時,對比了過去與現在的科研方式差異:
“過去是歐洲“貴族式”的科研方式,只有一小撥人,一個小圈子,他們就可以安安靜靜地做研究,整個科研行業(yè)的變化也不會那么快?,F在的科技更像工業(yè)化時代里的一個產業(yè),發(fā)展速度特別快,更新換代的速度也特別快,所有人——無論是天才還是普通人——都只是這個行業(yè)里的一枚螺絲釘?!?/span>
工業(yè)時代,福特生產方式浸透到各行各業(yè),分工合作成為主題,科研領域也不例外。比如一篇重要學術工作的形成,就像一輛汽車的組裝,分成不同的部分:需要精妙的算法構思,需要復雜的設備支撐實驗、需要嚴絲合縫的邏輯推演與寫作……
當合作成為大勢所趨,在自己的領域開辟一條新的賽道,也不再是一件容易的事。
韓旭以自然語言處理研究為例:“GPT-3給大家的印象很深刻,但如果你要訓練一個超級大的模型,這就要有大量的分布式計算資源,而這些計算資源就涉及到另一個研究領域,即高性能計算,這就不是我們(NLP研究員)擅長的事了?,F在很多重大研究都是復合式的、交叉式的,要一幫人才能完成,一個人是做不成的?!?/span>
對于奠基性的工作,韓旭自然是向往的:“如果有一天,我能有一篇奠基性的工作,我的腦袋出現在教科書上,我會感覺很滿意?!钡S即,他又說道:“但可能一輩子也做不出這種開創(chuàng)式的成果。這個也說不準。就做好自己的事吧。正如《增廣賢文》所言,但行好事,莫問前程。”
談起讀博期間的成果,韓旭最自豪的不是論文高產,也不是整理實驗室成果出版的《知識圖譜與深度學習》,而是在GitHub上開源和維護 OpenKE、OpenNRE 項目,分別針對關系抽取和知識表示學習的論文進行了系統(tǒng)梳理,這些項目在開源社區(qū)獲得了不小的關注量(超過8000顆星)。
一方面,論文高產多少歸功于組內合作與導師指導,而工具開源工程由韓旭和實驗室同學一磚一瓦地搭建;另一方面,他認為,相比非奠基性的論文工作,開源工具包可以讓大家實際用起來,推動大家的工作。
韓旭曾與實驗室同學一起做了一個少樣本學習評測平臺,感覺這個過程比改進模型更有意思:從研究、評測到做工具包,開源,維護,把整個體系搭建起來,為后來的研究者提供基礎。最近半年,他也投入到實驗室大規(guī)模預訓練語言模型的工作中,和實驗室以及清華計算機系高性能所的同學們一起做模型加速。他們訓練出的CPM-1、CPM-2模型發(fā)布在了2021年北京智源大會上。
圖注:韓旭參加2021年北京智源大會
(四)
不難想象,身兼數職的韓旭很忙,經常分身乏術。讀博期間,他除了做研究,還要維護開源工具包、備課,回復學弟學妹的咨詢。隨著事情的增加,他的業(yè)余時間越來越少,不得不開啟了常年熬夜模式。
本科那會,他常在朋友圈抱怨清華的課業(yè)繁重,直言不諱,頗有一番碼農的俗雅之風:“三周小學期不知道折了多少陽壽”;“垃圾代碼,不寫注釋,毀我青春,頹我精神,耗我感情”;“五天碼了60k,bug調了一坨坨,調參數等結果和老中醫(yī)有的一拼,誰說圖形學水的,我絕對不打死你。”
到了博士二年級,韓旭已經被磨得沒有脾氣,朋友圈只留下了一句無奈的《空城計》摘曲:“我本是臥龍崗上散淡的人……現在是掉發(fā)寫論文的科研狗?!?/span>
“好多時候太累了,都來不及去解決大家提的需求?!表n旭感嘆道。但問到如果重返大一、是否還會選擇進實驗室做科研時,韓旭還是毫不猶豫:“進呀!干嘛不進?以前是科研設備不多,很難有機會早早嘗試做科研?,F在有資源了,干嘛不做?”
雖然很忙很累,但韓旭覺得,讀博仍然是他做過最對的選擇之一。
臨近本科畢業(yè)時,他也曾糾結過,是讀個碩士直接工作,還是選擇讀博?!澳晟贂r總會有一些躁動,想要做不一樣的事情、體驗不一樣的人生?,F在也許是年紀更大了,看待世界與看待自己的方式都有了改變,我發(fā)現自己還是更喜歡簡單的、安靜的生活,做學術研究,教書育人,寫點代碼,桃李滿天下就更好了?!?/span>
“可能人就是這樣的。本科的時候覺得自己超級忙,讀了博士后才發(fā)現還是讀博更忙。可能工作之后,又發(fā)現還是工作更忙,讀博也挺舒服的?!?/span>
寫段子與背古文,是韓旭在朋友圈宣泄壓力的渠道之一。
調參數調到煩了,隨手寫下一句:“小火喂藥,大火煉丹?!?/span>百忙之中組織社團活動,直接調侃ETC是“一年一度的騙吃騙喝,順帶炒股的刺激性比賽”。情到深處,愛面子,不想直抒胸臆,就借助古人的話:“流螢斷續(xù)光,一明一滅一尺間,寂寞何以堪”;“戀他朝市求何事,想取丘園樂此身”;“金古梁溫黃,五人去其四”;“茍利國家生死以,豈因禍福避趨之”;“嚴冬數九人難處,酒濁一壺誰與圖”……
如前所述,韓旭是一個歷史迷。在繁重的科研生活中,能滿足韓旭“一點私心”的事不多,除了能偶爾與志同道合的博導聊侃,就是疫情前每年都能出國參加頂會,見識之余順便打卡世界文明旅游景點。
韓旭有一個世界文明打卡計劃。在上小學與初中那會,他還沒有完全投入計算機的懷抱,經??匆恍┯悬c“民科”的世界未解之謎和世界地理歷史類書籍,也很喜歡玩帝國時代、鋼鐵雄心、文明之類的游戲,對世界各國文明十分神往,便給自己定下了目標,要去東南亞解鎖占婆、高棉、暹羅,還有到美洲解鎖奇琴伊查、特奧蒂亞坎等等地方。
“世界上有很多不同的國家、不同的文明,有的文明已經鑲刻在歷史里。古時的人已經不在,但一些物質的東西可能還在。我們生活在這個時代,但再過100-200年,我也會成為歷史。想到這一點,我就很想去這些地方看一看,看看歷史上各個地方的人當時是什么樣的狀態(tài)?!?/span>
2019年,韓旭前往佛羅倫薩參加ACL2019時,途徑羅馬,開會前一天就在羅馬城逛了一圈,十分開心:“羅馬城的建筑十分集中,而且風格多樣,很好逛。我們回國之前還在飛機上玩起了‘精羅震怒’的歷史梗?!?/span>
從大學到現在,韓旭已經去了一部分地方,但有些地方再也無法成行,比如敘利亞的首都大馬士革。大馬士革一度是中東的中心,阿尤布王朝的薩拉丁就在此定都,在伊斯蘭教文化中的地位十分重要。敘利亞戰(zhàn)爭爆發(fā)后,大馬士革被炸得粉碎,即使再去,也無法再親眼見識其本來風采,這讓韓旭十分遺憾。
現在,科研之余,韓旭也還是會抽空看一看歷史類的讀物,在B站上關注“稚嫩的魔法師”。
少年時代,他喜歡看世界史,尤其是中世紀史,現在更喜歡看中國近代史。他的心態(tài)也發(fā)生了轉變:“以前更多是希望了解世界,現在是更希望了解中國。我可能有點本土情結吧?!?/span>
除了歷史書,他也會看一些社科研究者寫的分析與見解類文章:“他們會用一種體系化的方式幫助你了解整個社會運轉的內在邏輯與歷史發(fā)展規(guī)律。我們離不開社會,所以了解社會的運轉規(guī)律還是很重要的?!?/span>
(五)
正如“清華的學生也會在課堂上睡覺”一樣,韓旭對現實的關注與焦慮,與多數普通學子無異。在思考畢業(yè)留京問題時,他曾調侃自己:“聽說清華工科男值500萬,曾經想過把自己賣了,可以在北京買間廁所?!?/span>
也與許許多多身處瞬息萬變的時代而無法為生活做準確預測的95后青年一樣,韓旭雖思考未來,但也不敢作太多設想,沒聊多久便剎住了話題:“這個問題很復雜,不能細想。”
韓旭的理想是當一名高校教師,從事科研一輩子。從某種意義上講,這并不是一條容易的道路,但拋開現實的考量不談,韓旭引用諸葛亮《誡子書》中的一句話來勉勵自己:“靜以修身,儉以養(yǎng)德。非淡泊無以明志,非寧靜無以致遠。”
他信奉“盡人事、聽天命”。雖然常聽別人說“站在風口上,豬也能飛起來”,但比起尋找“風口”,韓旭更關注如何把分內事做到最好,至于成功與否,他總是隨緣,畢竟“成功有很多隨機因素,天時、地利、人和缺一不可?!?/span>
無論“內卷”或“佛系”,都不足以詮釋一代人的面貌,即使它們都是時代的產物。卷外人顧自評頭點足,卷內人也仍在自己的賽道上努力奔跑。只是,對于競爭,對于名次,對于榮譽,多了一分清醒,還有一分豁達。
“你的分數比別人高,難道就代表你比別人優(yōu)秀嗎?”韓旭這樣說道。
相比對隨機結果的執(zhí)著,韓旭更愿意追求自己能把握的事情,比如自由地做自己實實在在感興趣的研究。自然語言處理的終極目標,是讓機器能完全理解人類語言。而韓旭的研究期望,也是終其一生,為這個大目標的實現推進一小步。
至于前程幾許,再另當別論吧。
相關閱讀
雷鋒網雷鋒網雷鋒網
雷峰網原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知。