0
本文作者: 喬燕薇 | 2022-09-13 15:49 |
6月28日,中國(guó)科學(xué)院深圳理工大學(xué)(籌)(以下簡(jiǎn)稱“深理工”)一支特殊的小分隊(duì)從深圳趕赴安徽,看望一位“扭扭車”男孩張亮。
因患“脆骨癥”無(wú)法獨(dú)立行走、只能依靠扭扭車代步的張亮,在今年的高考中取得了535分的成績(jī),超過(guò)安徽省理科一本線44分。在接受央視采訪時(shí),張亮曾提起自己的理想志愿——深理工大學(xué)的計(jì)算機(jī)專業(yè),他希望在沿海城市上大學(xué)。遺憾的是,深理工的計(jì)算機(jī)專業(yè)今年尚未開(kāi)始招收本科生。
深理工計(jì)算機(jī)科學(xué)與控制工程學(xué)院院長(zhǎng)潘毅聽(tīng)聞后,決定與學(xué)校工作人員一同前往安徽看望張亮。雖然最終因公務(wù)而未能成行,但學(xué)校小分隊(duì)帶去了潘毅的書(shū)信,潘毅也與張亮現(xiàn)場(chǎng)連線,鼓勵(lì)他未來(lái)報(bào)考學(xué)院的研究生。
2022年,深理工的首屆聯(lián)合培養(yǎng)碩士研究生畢業(yè),100%實(shí)現(xiàn)就業(yè)升學(xué)。
潘毅是深理工計(jì)算機(jī)學(xué)院的首任院長(zhǎng)。2020年,潘毅應(yīng)深圳先進(jìn)院院長(zhǎng)樊建平之邀加入深理工,主持計(jì)算機(jī)學(xué)院的建設(shè)工作。這是潘毅第一次在國(guó)內(nèi)全職任教,卻不是他第一次從零開(kāi)始打造一個(gè)全新的計(jì)算機(jī)團(tuán)隊(duì)。
在美國(guó)亞特蘭大的喬治亞州立大學(xué)任教時(shí),潘毅曾先后擔(dān)任喬治亞州立大學(xué)計(jì)算機(jī)系和生物系系主任、文理學(xué)院副院長(zhǎng)等職位,帶領(lǐng)該校的計(jì)算機(jī)系從一個(gè)相對(duì)冷門(mén)的專業(yè),成長(zhǎng)為生物信息領(lǐng)域世界第22名。
憑借生物信息學(xué)領(lǐng)域的貢獻(xiàn),潘毅被評(píng)為喬治亞州立大學(xué)終身教授、大學(xué)杰出教授、州校董教授,當(dāng)選美國(guó)醫(yī)學(xué)與生物工程院院士與烏克蘭國(guó)家工程院院士。
耳順之年,功成名就,潘毅卻將自己的“進(jìn)度條”撥回起點(diǎn),選擇回國(guó)任職。
自2005年擔(dān)任佐治亞州立大學(xué)計(jì)算機(jī)系主任以來(lái),潘毅經(jīng)歷了生物信息學(xué)發(fā)展最迅速、技術(shù)迭代最快的十幾年,他研究了大半生的計(jì)算機(jī)技術(shù)與生物學(xué)結(jié)合后煥發(fā)出新的生命力。
“這是一條非常崎嶇的道路?!迸艘氵@樣形容自己從計(jì)算機(jī)轉(zhuǎn)型做生物信息學(xué)的選擇。
但他也說(shuō),“我可以干到八十歲再退休?!?/p>
和不少生物信息學(xué)領(lǐng)域的學(xué)者一樣,潘毅也是一位計(jì)算機(jī)專業(yè)出身的跨學(xué)科研究者。
作為國(guó)家恢復(fù)高考后的第一屆考生,潘毅以江蘇省理科狀元的成績(jī)進(jìn)入清華電子工程系就讀,也就是改組前的計(jì)算機(jī)工程與科學(xué)系。
中國(guó)最早一批的生信人,在1960年前后出生。1978年,恰同學(xué)少年。
佐治亞大學(xué)生物化學(xué)系教授徐鷹,正在念吉林大學(xué)計(jì)算機(jī)本科。后來(lái)與徐鷹一起在橡樹(shù)嶺國(guó)家實(shí)驗(yàn)室做研究,并一起獲得2001年美國(guó)“最杰出研究與開(kāi)發(fā)100 人獎(jiǎng)”的密蘇里大學(xué)許東教授,此時(shí)還在讀初中,直到五年后就讀北大。和潘毅是蘇州同鄉(xiāng)的深圳灣實(shí)驗(yàn)室系統(tǒng)與物理生物學(xué)研究所副所長(zhǎng)周耀旗,一年之后也將會(huì)去中科大讀化學(xué)。
潘毅在清華大學(xué)度過(guò)了八年半的時(shí)光。
碩士期間,潘毅在由金蘭、鄭緯民、沈美明和王鼎興幾位老教授組成的教研組內(nèi)學(xué)習(xí),導(dǎo)師金蘭教授是清華大學(xué)計(jì)算機(jī)專業(yè)最早的一批老師,親歷了計(jì)算機(jī)專業(yè)的創(chuàng)建。
右一為金蘭教授
1956年,清華大學(xué)開(kāi)設(shè)電子計(jì)算機(jī)專業(yè),從莫斯科留學(xué)歸來(lái)的金蘭教授被任命為教研組副主任,負(fù)責(zé)模擬計(jì)算機(jī)方面的工作。
潘毅回憶道:“金蘭教授已經(jīng)年邁,但他每年都要發(fā)幾篇英文的文章,隨時(shí)記錄自己的想法,這種認(rèn)真刻苦的作風(fēng)讓我印象十分深刻,也給了我很多的鼓勵(lì),讓我養(yǎng)成了好的學(xué)術(shù)作風(fēng)。”
在金蘭教授的幫助下,潘毅在1985年讀碩士期間就已經(jīng)在海外頂級(jí)會(huì)議ICDCS上發(fā)布了論文。在當(dāng)時(shí)那個(gè)年代,很多教授難有在海外發(fā)布文章的機(jī)會(huì),而ICDCS更是只有不超過(guò)20%的錄用率。
2019年當(dāng)選中國(guó)工程院院士的鄭緯民教授,曾在實(shí)驗(yàn)室里手把手教導(dǎo)潘毅開(kāi)發(fā)軟硬件、做分布式系統(tǒng)。
2017年 潘毅與鄭緯民院士參觀毛主席故居
2018年清華大學(xué)英文雜志《大數(shù)據(jù)挖掘與分析》創(chuàng)刊時(shí),潘毅邀請(qǐng)了老師鄭緯民與他一同擔(dān)任主編。這本雜志如今已位列全球計(jì)算機(jī)領(lǐng)域前4%,進(jìn)入世界一流期刊的行列。
同樣在2018年,鄭緯民院士到蘇州出差時(shí),還專程前往潘毅的故鄉(xiāng)蘇州吳江區(qū)參觀,在他以前的居所與上大學(xué)前工作過(guò)的工廠拍照留念,可見(jiàn)他對(duì)自己這位徒弟的喜愛(ài)。
鄭緯民院士在潘毅老家胡家弄拍照留念
沈美明教授對(duì)潘毅更是慷慨解囊。潘毅表示,“我出國(guó)留學(xué)前手頭沒(méi)有美金,還是沈老師借了錢(qián)給我解燃眉之急?!?/p>
當(dāng)時(shí)的清華大學(xué)計(jì)算機(jī)系主任,同樣出身吳江區(qū)黎里鎮(zhèn)的王鼎興教授,與潘毅的來(lái)往要更密切一些,“王老師的父親和我的外公是朋友,我們兩家是世交。”
潘毅進(jìn)入清華讀書(shū)后,王鼎興教授在學(xué)習(xí)上和生活上都給予了他非常多的幫助,潘毅回憶,“我讀大學(xué)時(shí)常去王老師家中做客,和王老師一家人成為了很好的朋友?!?/p>
剛進(jìn)入大學(xué)時(shí),周圍優(yōu)秀的同學(xué)和緊張的學(xué)習(xí)環(huán)境使潘毅面臨著空前的壓力。這個(gè)時(shí)期,王鼎興教授在學(xué)業(yè)上的指導(dǎo)和精神上的鼓勵(lì)都使他獲益匪淺,也逐漸建立起為人處世上的原則。
“直到現(xiàn)在我和王老師還經(jīng)常交流,偶爾提起家鄉(xiāng)黎里鎮(zhèn)的變化,王老師都會(huì)很高興?!?/p>
在清華大學(xué)這個(gè)“紅色工程師的搖籃”中學(xué)習(xí)成長(zhǎng),年輕的潘毅和他的同學(xué)們都以能進(jìn)入國(guó)企成為一名工程師為榮。
“那時(shí)候沒(méi)有出國(guó)的機(jī)會(huì),要去國(guó)外做教授幾乎不可能,(大學(xué)時(shí))包括我在內(nèi)同學(xué)們都覺(jué)得在一個(gè)大企業(yè)里做到總工程師,就已經(jīng)很了不起?!?/p>
但是,身處國(guó)家風(fēng)云巨變的時(shí)代,繼成為恢復(fù)高考后的第一批大學(xué)生后,又趕上了國(guó)家放開(kāi)出國(guó)留學(xué)政策,潘毅走上了一條意料之外的道路。
攻讀了兩年博士后,由于導(dǎo)師決定定居國(guó)外,潘毅最終放棄留校,并于1986年經(jīng)清華大學(xué)的允許前往加拿大卡爾加里大學(xué)。1987年1月份,潘毅轉(zhuǎn)到美國(guó)著名高等學(xué)府,也是美國(guó)最早的十所大學(xué)之一——匹茲堡大學(xué)計(jì)算機(jī)科學(xué)系重新開(kāi)始攻讀博士學(xué)位。
這時(shí)的生物信息學(xué)尚且處于早期的萌芽階段,大名鼎鼎的人類基因組計(jì)劃也要在三年后才正式啟動(dòng)。
人類基因組計(jì)劃啟動(dòng)一年后,1991年,博士畢業(yè)的潘毅通過(guò)競(jìng)爭(zhēng)激烈的面試,進(jìn)入俄亥俄州的私立天主教學(xué)校戴頓大學(xué)工作。
與潘毅同年出生、同年高考,又同年博士畢業(yè)的徐鷹,則選擇留校做了助理教授,并于1993年進(jìn)入橡樹(shù)嶺國(guó)家實(shí)驗(yàn)室后,偶然加入到人類基因組計(jì)劃的工作中,比潘毅早一步觸摸到生物學(xué)的邊緣。
而1991年才剛剛開(kāi)始攻讀博士學(xué)位的許東,恰好選擇了計(jì)算生物物理的研究方向,比前輩徐鷹還要早兩年接觸生物學(xué)。
戴頓大學(xué)是一所教學(xué)型學(xué)校,注重學(xué)生教育,為教授們提供的科研條件并不算好。因此,在戴頓大學(xué)工作的九年里,潘毅只能一點(diǎn)點(diǎn)艱難推進(jìn)自己的研究。
這種情況直到2000年潘毅進(jìn)入佐治亞州立大學(xué)工作才得以好轉(zhuǎn)。在佐治亞州立大學(xué),潘毅偶然發(fā)現(xiàn)蛋白質(zhì)序列的對(duì)比需要用到并行計(jì)算,這正是他所擅長(zhǎng)的計(jì)算機(jī)領(lǐng)域的知識(shí)。
他決定投身于此。然而,最大的難題在于生物信息學(xué)的交叉性,了解計(jì)算機(jī)知識(shí)的人沒(méi)有生物學(xué)背景,而生物學(xué)專業(yè)的人又不懂計(jì)算機(jī)編程,這兩門(mén)學(xué)科之間存在著非常大的鴻溝,令很多研究者望而卻步。
潘毅開(kāi)始更加深入地學(xué)習(xí)生物學(xué)專業(yè)知識(shí)。
2005年,潘毅升任佐治亞州立大學(xué)計(jì)算機(jī)系主任。這時(shí)的佐治亞州立大學(xué)的計(jì)算機(jī)系才剛剛設(shè)立,系里只有十五六個(gè)教授,不論資金還是人力都十分緊缺。
對(duì)身為系主任的潘毅來(lái)說(shuō),如何利用眼下有限的資源使計(jì)算機(jī)系脫穎而出是個(gè)難題。
他想到了自己前不久開(kāi)始進(jìn)行的生物信息學(xué)研究。
21世紀(jì)初,生物信息還是一門(mén)新興學(xué)科,不論是美國(guó)老牌名校還是剛剛成立的佐治亞州立大學(xué)計(jì)算機(jī)系,都沒(méi)有歷史積累,站在同一個(gè)起跑線上。只有這樣,才有“彎道超車”的機(jī)會(huì)。
作為生物學(xué)和計(jì)算機(jī)學(xué)兩門(mén)學(xué)科的融合,生物信息利用計(jì)算機(jī)技術(shù)解決生物學(xué)的問(wèn)題,這就要求從業(yè)者必須同時(shí)具備兩門(mén)學(xué)科的知識(shí)背景。
那時(shí)候計(jì)算機(jī)背景的學(xué)者中,鮮少有人愿意選擇跨行到生物這一高難度的領(lǐng)域,潘毅卻覺(jué)得這或許正是佐治亞州立大學(xué)計(jì)算機(jī)系突圍的機(jī)會(huì)。別人不想干的事情他來(lái)干,并且一定能干好,他要成為最早一批“吃螃蟹”的人。
于是,他與一位對(duì)計(jì)算機(jī)領(lǐng)域較為了解的生物學(xué)教授合作,申請(qǐng)了一筆一百五十萬(wàn)美元的科研經(jīng)費(fèi),組建起佐治亞州立大學(xué)生物信息學(xué)研究的初始團(tuán)隊(duì)。
潘毅將經(jīng)費(fèi)分配給其他教授,要求他們與生物系的教授合作,在自身研究方向的基礎(chǔ)上結(jié)合生物學(xué)知識(shí),在一定期限內(nèi)產(chǎn)出一批新的科研成果。比如,將人工智能用于生物數(shù)據(jù)分析,將計(jì)算機(jī)可視化用于蛋白質(zhì)和分子可視化,將算法、數(shù)據(jù)庫(kù)等技術(shù)全部融入生物學(xué)領(lǐng)域。
潘毅探索生物信息學(xué)的研究就此走上正軌。
潘毅開(kāi)始建設(shè)佐治亞州立大學(xué)的生物信息團(tuán)隊(duì)時(shí),徐鷹正擔(dān)任佐治亞大學(xué)生物信息研究所的首任所長(zhǎng),兩人一個(gè)在亞特蘭大,一個(gè)在雅典市。
此前,徐鷹與雷峰網(wǎng)《醫(yī)健AI掘金志》交流時(shí),曾提出一個(gè)劃分,生物信息學(xué)作為生物學(xué)與計(jì)算機(jī)科學(xué)兩大學(xué)科的交叉點(diǎn),這一領(lǐng)域內(nèi)不同學(xué)者所做的研究在兩個(gè)學(xué)科所占比重上通常有所不同。
例如,徐鷹本人的研究中90%是生物,10%是計(jì)算;許東的研究中20%是生物,80%是計(jì)算;潘毅的研究中5%是生物,95%是計(jì)算。
同樣是學(xué)計(jì)算機(jī)出身的學(xué)者,徐鷹的研究更加偏向生物,潘毅則是更加偏向計(jì)算;而分別是物理、化學(xué)專業(yè)出身的許東和周耀旗,研究?jī)?nèi)容則更加偏向生物物理和化學(xué)物理。
“許東老師是計(jì)算生物物理的博士,要比我們更加了解生物的性質(zhì)。我們作為計(jì)算機(jī)專業(yè)的教授,強(qiáng)項(xiàng)是算法的分析和系統(tǒng)的開(kāi)發(fā)?!?/p>
潘毅說(shuō),他所研究的內(nèi)容是如何將生物的問(wèn)題轉(zhuǎn)化為計(jì)算的問(wèn)題,并開(kāi)發(fā)出相應(yīng)的工具,高效、高質(zhì)地解決這一問(wèn)題。
在生物學(xué)領(lǐng)域的研究中,AI技術(shù)的應(yīng)用是必不可少的。但對(duì)于不懂計(jì)算機(jī)的生物學(xué)家來(lái)說(shuō),如何將先進(jìn)的AI技術(shù)應(yīng)用到研究中也是一大難題。
潘毅所擅長(zhǎng)的正是制造并利用先進(jìn)的AI工具,并用其解決生物學(xué)難題。
“我始終對(duì)學(xué)生講,研究問(wèn)題不僅僅要關(guān)注AI,還要將AI的算法與實(shí)際問(wèn)題相結(jié)合,從實(shí)踐中來(lái)到實(shí)踐中去,這樣的算法既有理論的高度又有落地的基礎(chǔ),才有頂天立地的效果?!?/p>
而在接觸生物信息領(lǐng)域早期,潘毅與徐鷹、許東的研究?jī)?nèi)容曾有過(guò)重合。
1997年,徐鷹進(jìn)入橡樹(shù)嶺國(guó)家實(shí)驗(yàn)室生命科學(xué)部擔(dān)任課題組長(zhǎng),次年許東加入課題組,兩人合作進(jìn)行了蛋白折疊與蛋白結(jié)構(gòu)預(yù)測(cè)的相關(guān)項(xiàng)目,又于2003年先后離開(kāi)橡樹(shù)嶺,分別前往佐治亞大學(xué)和密蘇里大學(xué)擔(dān)任教職。
就在徐鷹、許東兩位教授回到學(xué)校不久后,潘毅也開(kāi)始探索生物信息領(lǐng)域。
潘毅最初接觸的問(wèn)題是蛋白質(zhì)、DNA、RNA等的序列對(duì)比。
進(jìn)行序列對(duì)比的目的是尋找不同序列之間的相似性。相似的序列往往起源于共同的祖先,可能有相似的結(jié)構(gòu)和相似的生物學(xué)功能。
因此,對(duì)于一個(gè)已知序列但是結(jié)構(gòu)和功能都未知的蛋白質(zhì),如果與它相似的序列的結(jié)構(gòu)和功能是已知的,就據(jù)此可以推測(cè)出未知蛋白質(zhì)的結(jié)構(gòu)和功能。
為了迅速在存儲(chǔ)量巨大的數(shù)據(jù)庫(kù)中找到相似的序列,相應(yīng)的算法和工具必不可少。
序列比較的指標(biāo)之一——序列相似度(similarity)就需要使用替換積分矩陣(subsitution matrix)進(jìn)行統(tǒng)計(jì)。
潘毅最初進(jìn)行序列對(duì)比工作時(shí),最常見(jiàn)的DNA替換積分矩陣和蛋白質(zhì)替換積分矩陣是等價(jià)矩陣(unitary matrix)。
等價(jià)矩陣是最簡(jiǎn)單的替換積分矩陣,相同堿基/氨基酸之間的匹配得分為1,不同堿基/氨基酸間的替換得分為0。
潘毅發(fā)現(xiàn),等價(jià)矩陣在工作中并不考慮堿基或氨基酸的理化性質(zhì),也無(wú)法區(qū)別對(duì)待不同的替換,準(zhǔn)確度存在很大問(wèn)題。
于是,他選擇了準(zhǔn)確度相對(duì)較高的BLOSUM-62矩陣,但依舊無(wú)法滿足生物學(xué)研究中的準(zhǔn)確度需求。
對(duì)別的生物學(xué)家來(lái)說(shuō),在研究中沒(méi)有合適的工具或許是無(wú)法逾越的難題,但學(xué)計(jì)算機(jī)出身的潘毅卻可以自己制作工具。
在當(dāng)時(shí),應(yīng)用廣泛的多序列對(duì)比工具CLUSTALW,僅僅能找到序列中六個(gè)基序中的兩到三個(gè),而潘毅自制的打分系統(tǒng)能夠精準(zhǔn)地找到全部六個(gè)基序。
“這才是真正有生物學(xué)意義的工具?!?/p>
他帶領(lǐng)兩個(gè)博士生將這一研究成果整理成冊(cè),出版了《Multiple Biological Sequence Alignment: Scoring Functions, Algorithms and Evaluation》(《多生物序列對(duì)比:打分函數(shù)、算法、評(píng)價(jià)》)一書(shū)。
隨著研究的深入,潘毅逐漸意識(shí)到簡(jiǎn)單的算法無(wú)法處理數(shù)目龐大的生物數(shù)據(jù),下一步的研究必須要利用人工智能技術(shù)。
他開(kāi)始嘗試使用AI算法進(jìn)行蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè),先后將聚類算法、支持向量機(jī)、正則化算法、決策樹(shù)、關(guān)聯(lián)規(guī)則等多種算法運(yùn)用到生物信息學(xué)的研究中,但無(wú)一例外都存在精度差、速度慢等問(wèn)題。
直到2014年前后,生物信息領(lǐng)域的研究者們集體轉(zhuǎn)向深度學(xué)習(xí)技術(shù),潘毅也是其中之一。
“GPU等硬件的發(fā)展讓機(jī)器速度大幅提升,深度學(xué)習(xí)技術(shù)也成熟了,這時(shí)候用在生物信息上如魚(yú)得水。”
生物信息學(xué)進(jìn)入了深度學(xué)習(xí)的時(shí)代。區(qū)別于生物學(xué)家所做的深度學(xué)習(xí),潘毅的研究既包括深度學(xué)習(xí)在生物方面的應(yīng)用,同時(shí)也在改進(jìn)算法的精度、速度以及架構(gòu),將生物學(xué)知識(shí)融入進(jìn)算法中。
比如,將傳統(tǒng)生物學(xué)知識(shí)中神經(jīng)網(wǎng)的聯(lián)絡(luò)方法取代深度學(xué)習(xí)常用的線性連法,改進(jìn)深度學(xué)習(xí)中梯度消失的問(wèn)題。
在技術(shù)發(fā)生變革的同時(shí),潘毅的研究也逐漸進(jìn)入第二階段。
2010年前后,他開(kāi)始嘗試將計(jì)算機(jī)與生物學(xué)知識(shí)相融合,比如,在進(jìn)行多序列對(duì)比時(shí),將堿基或氨基酸之間變化的概率也加入計(jì)算之中,從而更加精準(zhǔn)地描述生物學(xué)問(wèn)題。
這個(gè)階段,潘毅的研究重心逐漸從蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)轉(zhuǎn)變?yōu)樯锞W(wǎng)絡(luò)分析,這也是潘毅的生物信息學(xué)研究生涯中占據(jù)精力最多的基礎(chǔ)研究。
在生物網(wǎng)絡(luò)分析的研究中,要通過(guò)生物實(shí)驗(yàn)數(shù)據(jù)挖掘出生物網(wǎng)絡(luò)的潛在變化,以系統(tǒng)的方法研究生命現(xiàn)象的熱點(diǎn)和難點(diǎn),主要包括蛋白質(zhì)調(diào)控網(wǎng)絡(luò)與基因調(diào)控網(wǎng)絡(luò)。
基因調(diào)控網(wǎng)絡(luò)的研究如今已被廣泛應(yīng)用于疾病基因預(yù)測(cè)、藥物靶標(biāo)的篩選等領(lǐng)域,并對(duì)疾病早期診斷、個(gè)性化治療、藥物研究產(chǎn)生了深遠(yuǎn)影響。
對(duì)生物網(wǎng)絡(luò)分析的基礎(chǔ)研究也為多年后潘毅轉(zhuǎn)向應(yīng)用研究打下了堅(jiān)實(shí)的基礎(chǔ)。
在潘毅的帶領(lǐng)下,佐治亞州立大學(xué)的生物信息研究團(tuán)隊(duì)飛速成長(zhǎng)起來(lái),潘毅帶領(lǐng)團(tuán)隊(duì)開(kāi)始組織生物信息領(lǐng)域會(huì)議、創(chuàng)辦學(xué)術(shù)雜志、出版系列叢書(shū)。
潘毅與李明、王建新兩位教授以及圖靈獎(jiǎng)獲得者John Hopcroft共同出席ISBRA 2014
他與徐鷹、許東、周耀旗,以及加拿大滑鐵盧大學(xué)終身教授李明、弗吉尼亞大學(xué)教授張愛(ài)東等生物信息領(lǐng)域的諸位華人學(xué)者們,也是在這個(gè)時(shí)期相識(shí)。
2005年,潘毅創(chuàng)辦生物信息學(xué)研究與應(yīng)用國(guó)際研討會(huì)(ISBRA)后,曾多次邀請(qǐng)李明、徐鷹等教授參加并進(jìn)行主題演講;他與張愛(ài)東分別擔(dān)任著IEEE/ACM計(jì)算生物學(xué)和生物信息學(xué)學(xué)報(bào)(TCBB)的副主編和主編;還曾邀請(qǐng)同為系主任的許東,以及彼時(shí)仍在印第安納大學(xué)工作的周耀旗,前往佐治亞州立大學(xué)演講。
“我和這幾位老師在工作上經(jīng)常相互學(xué)習(xí),向他們請(qǐng)教問(wèn)題,也會(huì)邀請(qǐng)他們?cè)跁?huì)議上做主題演講。我也很感謝這些年他們對(duì)我和我學(xué)生們的幫助?!?/p>
即便做了16年的系主任,行政工作繁忙,潘毅依舊時(shí)常與生物信息學(xué)領(lǐng)域的華人學(xué)者們互相交流學(xué)習(xí)。
2007年,IEEE生物信息與生物工程國(guó)際大會(huì)授予潘毅杰出成就獎(jiǎng)。根據(jù)相關(guān)網(wǎng)站排名,2011年至2021年間,佐治亞州立大學(xué)計(jì)算機(jī)系生物信息領(lǐng)域世界排名22名。
“現(xiàn)在的佐治亞州立大學(xué)計(jì)算機(jī)系四十多位教授中,有十幾位教授專攻生物信息學(xué)方向,這樣規(guī)模的生物信息學(xué)研究團(tuán)隊(duì)在美國(guó)如今的大學(xué)中仍是十分難得。”
對(duì)潘毅來(lái)說(shuō),1986年出國(guó)讀博是人生中的重大分水嶺。
出國(guó)以前,他是江蘇省的理科高考狀元,是恢復(fù)高考后的第一屆大學(xué)生,是國(guó)內(nèi)頂尖學(xué)府清華大學(xué)的天之驕子,即便面A臨著優(yōu)秀的同窗們帶來(lái)的競(jìng)爭(zhēng)壓力,但他未來(lái)的人生仍是清晰可見(jiàn)的一片坦途。
選擇出國(guó)留學(xué),則使他的人生增添了許多的不確定性。
1991年,潘毅從匹茲堡大學(xué)獲得博士學(xué)位。按照計(jì)劃,他應(yīng)該進(jìn)入一所研究型高校擔(dān)任教職,一邊從事教學(xué)工作一邊推進(jìn)自己的學(xué)術(shù)研究。
但彼時(shí)的美國(guó)正深陷新一輪周期型經(jīng)濟(jì)危機(jī)的泥潭,工業(yè)界不再需要大批的高學(xué)歷人才,畢業(yè)的博士生們只能涌向教學(xué)崗位,使得就業(yè)競(jìng)爭(zhēng)加劇,很多人陷入了畢業(yè)即失業(yè)的窘境。
潘毅還算幸運(yùn),在人生地不熟的美國(guó)以亞裔的身份拿到了戴頓大學(xué)的offer,獲得了自己的第一份工作。
雖然這個(gè)offer解決了潘毅的燃眉之急,但作為教學(xué)型學(xué)校,戴頓大學(xué)提供給教師們的研究資源實(shí)在有限,潘毅的學(xué)術(shù)研究進(jìn)入了長(zhǎng)達(dá)九年的艱難時(shí)期。
直到2005年開(kāi)始擔(dān)任佐治亞州立大學(xué)計(jì)算機(jī)系主任時(shí),潘毅已經(jīng)45歲,此時(shí)距離1978年他走進(jìn)清華校園學(xué)習(xí)計(jì)算機(jī)已經(jīng)過(guò)去27年,人生中五分之三的時(shí)間都在和計(jì)算機(jī)打交道。
人到中年,進(jìn)入一個(gè)完全陌生的領(lǐng)域并不是件容易事。
首先是專業(yè)知識(shí)上的欠缺。為了進(jìn)行生物信息學(xué)研究,計(jì)算機(jī)出身的潘毅只能開(kāi)始從頭學(xué)習(xí)生物學(xué)的背景知識(shí),像剛?cè)雽W(xué)的大學(xué)生一樣看教科書(shū)、讀論文、聽(tīng)報(bào)告,終于將自己從單一學(xué)科背景打造成交叉學(xué)科的研究者。
其次是心理上的落差。在計(jì)算機(jī)行業(yè)內(nèi)已經(jīng)成名的潘毅,要進(jìn)入生物信息領(lǐng)域,只能和所有新人一樣從底層開(kāi)始一步步向上走。
“又要做一個(gè)小字輩,從頭開(kāi)始干起,這樣的感覺(jué)是很不好的?!?/p>
那時(shí)已經(jīng)常在并行計(jì)算領(lǐng)域大型學(xué)術(shù)會(huì)議上作主題演講(keynote speech)的潘毅,進(jìn)入生物信息學(xué)領(lǐng)域后,反而連在一些低級(jí)別研討會(huì)(workshop)上的演講機(jī)會(huì)都時(shí)常爭(zhēng)取不到,無(wú)人問(wèn)津。
“人家都不理你,也會(huì)感覺(jué)很心寒?!迸艘氵@樣形容當(dāng)時(shí)的感受。
除此之外,還有研究中遇到的最重要的難題:與生物學(xué)家合作中的矛盾。
最初進(jìn)入生物信息學(xué)領(lǐng)域時(shí),由于計(jì)算機(jī)出身的潘毅等人不懂生物,只能與生物學(xué)領(lǐng)域的學(xué)者合作,針對(duì)對(duì)方已經(jīng)提出的問(wèn)題進(jìn)行研究和改進(jìn)。
但生物學(xué)家往往也不懂計(jì)算機(jī)技術(shù),對(duì)方總是將計(jì)算機(jī)專業(yè)的學(xué)者當(dāng)做寫(xiě)程序的“工具人”,而非真正的合作伙伴。
“有時(shí)連申請(qǐng)到的經(jīng)費(fèi)也不給我們,在科學(xué)研究里只把我們當(dāng)做technician(技術(shù)員),這是很讓人傷心的事情。”
潘毅介紹,生物學(xué)家們無(wú)法體會(huì)計(jì)算機(jī)學(xué)者在改進(jìn)程序中付出的時(shí)間和精力,因此雙方在合作中常常產(chǎn)生誤解?!爸挥锌朔诉@些問(wèn)題,我們的研究才能繼續(xù)朝前走,這也正是很多學(xué)校做不成生物信息學(xué)的原因。”
只是,作為團(tuán)隊(duì)的領(lǐng)導(dǎo)者,潘毅面臨的難題還遠(yuǎn)不止如此。
在美國(guó)密蘇里大學(xué)擔(dān)任了多年系主任的許東對(duì)雷峰網(wǎng)《醫(yī)健AI掘金志》說(shuō):“潘毅教授是一位非常成功的管理者?!?/strong>
許東在密蘇里大學(xué)擔(dān)任系主任時(shí),曾幾次前往佐治亞州立大學(xué)交流訪問(wèn),與同為系主任的潘毅交流頗多。
談及過(guò)往,許東表示潘毅不論是擔(dān)任佐治亞州立大學(xué)計(jì)算機(jī)系主任期間,還是后來(lái)升任文理學(xué)院副院長(zhǎng)后,都展現(xiàn)了出色的管理能力,“潘毅教授的活動(dòng)能力很強(qiáng),善于交往,他主持的雜志也做得非常好?!?/p>
但是,作為華人外來(lái)者,想要融入美國(guó)當(dāng)?shù)厝硬⒉皇且患菀椎氖虑?。即便獲得了與白人同樣的工作崗位,也很難獲得同等的尊重和重視。
“華人面孔有時(shí)候只被當(dāng)做點(diǎn)綴。如果是白人先接觸到的某項(xiàng)工作,我們就很難再加入其中了,只有那些沒(méi)被白人選中的工作或是一些臨時(shí)任務(wù),我們才能接手?!?/p>
成為一個(gè)優(yōu)秀管理者的背后,是無(wú)數(shù)不為人知的苦功。
潘毅就這樣一路升級(jí)通關(guān),從初到美國(guó)時(shí)“水土不服”的華人留學(xué)生,成長(zhǎng)為生物信息學(xué)領(lǐng)域的中流砥柱。
到2020年回國(guó)時(shí),潘毅已經(jīng)獲得了喬治亞州立大學(xué)終身教授、大學(xué)杰出教授、州校董教授、AIMBE院士等諸多榮譽(yù),在生物信息學(xué)波瀾壯闊的三十年里書(shū)寫(xiě)了濃墨重彩的一筆。
2021年,潘毅入選全球前2%頂尖科學(xué)家榜單與世界頂尖1000名計(jì)算機(jī)科學(xué)家榜單。
潘毅的諸多科研成果對(duì)后來(lái)者的研究也有很大影響,他為生物學(xué)領(lǐng)域開(kāi)發(fā)的許多工具至今仍在廣泛應(yīng)用。
近年來(lái)在世界各地受到廣泛關(guān)注的可解釋性AI的研究,早在2004年潘毅就已經(jīng)將其應(yīng)用于生物信息領(lǐng)域,指導(dǎo)生物學(xué)家進(jìn)行有選擇性的生物實(shí)驗(yàn)。
潘毅在佐治亞州立大學(xué)參加學(xué)生畢業(yè)典禮
多年來(lái)潘毅培養(yǎng)的學(xué)生中,很多人畢業(yè)后也選擇了從事學(xué)術(shù)研究和教學(xué)工作,在美國(guó)、中國(guó)、韓國(guó)等世界各地將生物信息學(xué)這一學(xué)科傳承下去。
在科研中,潘毅最看中學(xué)生勤奮刻苦的品質(zhì),能夠在生物信息學(xué)領(lǐng)域堅(jiān)持下去并取得一定成果的研究者,一定具有這一品質(zhì)。
“我?guī)н^(guò)的博士中有一個(gè)??飘厴I(yè)的學(xué)生,鐘衛(wèi),到美國(guó)后重新讀了本科。他的天資并不是最高的,但十分勤奮,讀書(shū)時(shí)花費(fèi)了很多時(shí)間去做研究,現(xiàn)在也已經(jīng)是美國(guó)南卡羅來(lái)納大學(xué)的終身正教授,還拿到了學(xué)校的杰出研究獎(jiǎng)?!边@是潘毅教學(xué)經(jīng)歷中印象最深刻的一位學(xué)生。
潘毅與學(xué)生鐘衛(wèi)畢業(yè)合影(左一為鐘衛(wèi))
上文中《多生物序列對(duì)比:打分函數(shù)、算法、評(píng)價(jià)》一書(shū)的作者之一,潘毅的博士生郭炫,目前在美國(guó)北德克薩斯大學(xué)做助理教授,即將升任終身副教授,已經(jīng)兩次拿到美國(guó)國(guó)立衛(wèi)生研究院的基金。
另一位曾在潘毅門(mén)下學(xué)習(xí)的學(xué)生,中南大學(xué)計(jì)算機(jī)學(xué)院的李敏教授,如今也已經(jīng)成為了國(guó)內(nèi)生物信息學(xué)領(lǐng)域的中流砥柱,獲得了2022年度國(guó)家杰出青年科學(xué)基金。
2018年,ISBRA會(huì)議在北京召開(kāi)時(shí),潘毅與李敏這對(duì)師生曾同時(shí)作為特邀嘉賓出席并做報(bào)告,徐鷹同樣也在受邀之列。
在今年7月頒布的吳文俊人工智能科學(xué)技術(shù)獎(jiǎng)中,李敏以“面向復(fù)雜生物數(shù)據(jù)的模式挖掘與智能算法研究”項(xiàng)目獲得吳文俊人工智能自然科學(xué)獎(jiǎng)。
談及當(dāng)初在佐治亞州立大學(xué)學(xué)習(xí)的時(shí)光,李敏回憶道:“我剛到亞特蘭大時(shí),潘老師剛出差回來(lái),一大早趕到辦公室?guī)沂煜は道锏沫h(huán)境、安排辦公室,事無(wú)巨細(xì),像一個(gè)大家長(zhǎng),讓我在異國(guó)他鄉(xiāng)的陌生感一掃而空?!?/p>
潘毅在科研上更是大力支持學(xué)生。直到李敏完成學(xué)業(yè)回國(guó),潘毅還時(shí)常關(guān)心她的個(gè)人發(fā)展,積極推薦她擔(dān)任國(guó)際期刊的編委等。
陜西省政協(xié)常委、陜西師范大學(xué)計(jì)算機(jī)學(xué)院副院長(zhǎng)雷秀娟教授,也曾在潘毅的團(tuán)隊(duì)中訪問(wèn)學(xué)習(xí)。
“潘老師不僅是我的學(xué)術(shù)導(dǎo)師,更是人生導(dǎo)師。”雷秀娟向雷峰網(wǎng)《醫(yī)健AI掘金志》介紹,她前往佐治亞州立大學(xué)學(xué)習(xí)時(shí),潘毅已經(jīng)是全球知名的科學(xué)家、院士,依舊會(huì)花大量時(shí)間指導(dǎo)學(xué)生的科研工作,從論文思路到框架、內(nèi)容、表達(dá)、圖表等等,精益求精。
“潘老師對(duì)我們的關(guān)心不僅在科研上,也在生活上,隔三差五就詢問(wèn)大家是否有困難,并全力幫助?!崩仔憔昊貞?。
潘毅在美國(guó)任教期間,共培養(yǎng)了二十個(gè)博士、五十多個(gè)碩士,其中十幾人一畢業(yè)就拿到了美國(guó)大學(xué)的助理教授職位。這些學(xué)生中目前已經(jīng)有兩位擔(dān)任系主任,五位升任正教授。
學(xué)生們?nèi)〉玫某删妥屪鳛槔蠋煹呐艘銦o(wú)比驕傲,“我愿意不遺余力地幫助他們成長(zhǎng),希望未來(lái)他們的成就都能夠超過(guò)我。作為老師,應(yīng)該有這樣的胸懷支持學(xué)生、托舉他們?!?/p>
正如四十年前,清華大學(xué)的諸位師長(zhǎng)對(duì)潘毅的幫助與期盼。
潘毅向雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))《醫(yī)健AI掘金志》描述了他的教育理想:為政界培養(yǎng)出一名省部級(jí)的官員,為學(xué)術(shù)界培養(yǎng)出一名院士,為產(chǎn)業(yè)界培養(yǎng)出一名千億資產(chǎn)的企業(yè)家?!叭绻苓_(dá)到這個(gè)境界,我的人生就圓滿了?!?/p>
2020年12月,潘毅回國(guó)赴任深理工計(jì)算機(jī)科學(xué)與控制工程學(xué)院擔(dān)任第一任院長(zhǎng),開(kāi)始籌建這個(gè)全新的學(xué)院。
他將目光放在了人工智能在疾病預(yù)測(cè)以及藥物研發(fā)中的應(yīng)用,回國(guó)以來(lái)先后進(jìn)行了利用人工智能完成新冠病毒藥物的小分子篩選、通過(guò)多模態(tài)數(shù)據(jù)融合技術(shù)進(jìn)行自閉癥早篩方案研發(fā)等多項(xiàng)研究工作。
談及回國(guó)原因時(shí),潘毅表示:“和白人打交道的場(chǎng)合待膩了,想換個(gè)環(huán)境,回家鄉(xiāng)來(lái)。留在美國(guó)每天和十幾二十個(gè)白人系主任聊天對(duì)我來(lái)說(shuō)是一件不太輕松的事情,反而是回到國(guó)內(nèi)再創(chuàng)一個(gè)學(xué)院,繼續(xù)做我的研究更有意思。”
2020年,潘毅回國(guó)時(shí)整60歲,這是一個(gè)大多數(shù)人準(zhǔn)備退休的年紀(jì),而潘毅在生物信息學(xué)世界的新征途卻剛剛開(kāi)始。
“我可以干到八十歲再退休。”
作者注:
1993年,中國(guó)參與人類基因組計(jì)劃,生物信息學(xué)科迎來(lái)大爆發(fā)。
在近三十年的時(shí)間里,一大批生物、化學(xué)、物理、計(jì)算等專業(yè)的學(xué)者,前仆后繼加入到學(xué)科的產(chǎn)研建設(shè),那是一個(gè)靈感迸發(fā)、情誼綿長(zhǎng)的年代,也是一個(gè)走出質(zhì)疑、迷茫的年代。
目前,雷峰網(wǎng)啟動(dòng)《生物信息學(xué)的三十年往事》專題,將陸續(xù)推出徐鷹、潘毅、周耀旗、許東、唐建等新老學(xué)者的人物故事,記錄光輝歲月,以照后人之路。
關(guān)于生物信息學(xué)的更多故事,歡迎與本文作者喬燕薇交流,微信號(hào):qiaoyw186
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。