0
姜濤是極少數(shù)能同時把計算機理論和生物學都做好的學者。
近四十年的工作學習生涯中,姜濤最初并非從事生物信息學工作,而是研究計算機理論和算法。
直到1995年,他獲得首次學術休假,決定利用機會拜師Richard M. Karp。人類史上規(guī)模最宏大的跨國跨學科工程人類基因組計劃進行之際,就連Karp這樣享譽國際的計算理論界泰斗都投身其中。
就這樣,姜濤走上生信道路,新世紀后又參與了第二次生命科學浪潮——基因芯片設計與應用。
43歲,姜濤當選美國科學促進會會士(AAAS Fellow),又在一年后接連升任UCR校長講座教授和計算機協(xié)會會士(ACM Fellow)。1988年博士畢業(yè)至今,姜濤發(fā)表了超300篇論文,高產期一年多達18篇。
回顧這一路的發(fā)展軌跡, 姜濤認為自己多少帶有些運氣成分,“個人成就總是離開不科學發(fā)展大環(huán)境,如此才能保證科研工作的影響力及可持續(xù)性。”
但換句話說,那又何嘗不是時勢造英雄,即所謂“時來天地皆同力,運去英雄不自由?!?br/>
1958年,蘭州市郊北山之麓,一座新學校拔地而起。
此處黃土光裸、風沙肆虐,來人無不嘆句荒涼。
原來,在鐵道部的領導下,唐山鐵道學院、北京鐵道學院兩所學校(部分系所及員工)遷至于此,組建起了這所新的“蘭州鐵道學院”,也就是后來的蘭州交通大學。
“西部大開發(fā)”,一個充滿了時代性的口號,將許多人的一生留在了那里。姜濤的父母就是如此,他們隨唐山鐵道學院西遷至蘭州,把家安在了大西北,并養(yǎng)育了一對兒女。
上世紀70年代,我國部分地區(qū)的中學學制為四年(初高中各兩年),等到姜濤1979年考入中科大時,也僅僅16歲出頭。在當時平均年齡為16.7歲的同級學生中,姜濤比中科大少年班的學生也大不了多少。
實際上,姜濤完全有機會參加1977年的高考,當時已通過了省里的高考預考,但姜濤自覺書沒讀夠,便拖到了兩年后。兜兜轉轉,姜濤回到了老家安徽。
1984年,姜濤(左二)在中科大畢業(yè)時和室友合影
1978年3月,時任中科大校長的郭沫若在全國科學大會上發(fā)表了演講《科學的春天》,鼓勵全國的青少年學習當代科學技術,打破陳規(guī),披荊斬棘,開拓我國科學發(fā)展的道路。
這篇激情洋溢的演講令姜濤深受震撼,時隔四十余年,他仍然形容那篇演講是“詩一樣的鼓舞”。
同樣在1978年,作家徐遲在《人民文學》發(fā)表了報告文學《哥德巴赫猜想》,這篇講述數(shù)學家陳景潤成長與研究經歷的文章一經問世就引起了熱烈反響。全國各地報紙、廣播電臺紛紛全文轉載和連續(xù)廣播,在當時掀起了崇尚科學的熱潮。
1979年,來自西部黃土高坡的姜濤,與來自江蘇張家港的周耀旗(現(xiàn)任深圳灣實驗室系統(tǒng)與物理生物學研究所副所長)一起進入了中科大,還差點成了同班同學。
周耀旗曾介紹,1979年的高考化學科目非常難,他在這門科目上發(fā)揮得卻不錯,因為這個優(yōu)勢填報了中科大的近代化學系。
姜濤原本的計劃也是學習化學專業(yè)。他的母親曾在蘭州鐵道學院給排水系執(zhí)教,研究水環(huán)境等相關課題,化學知識背景深厚。在母親的耳濡目染下,姜濤的高考化學成績非常優(yōu)異。但在改革開放后,中國半導體產業(yè)逐漸進入全面復蘇階段,中科大無線電電子學系(現(xiàn)名為電子工程與信息科學系)成為了全國教育重心。
著名電子學家、時任中國科學院電子學研究所所長顧德歡先生出任首任系主任。姜濤談到,“從實用性方面考慮,父母更鼓勵我選擇無線電系?!?/p>
那時,中科大各院系一直延續(xù)著“五年制+大一不分專業(yè)”的教學模式。入學第二年,姜濤選擇了計算機專業(yè)。1982年,計算機專業(yè)獨立建系,不再隸屬于無線電系,姜濤也在這一年結束了長達三年的基礎課程學習,開始進行專業(yè)課學習。
受時代所限,即便是中科大這樣的高校,在七、八十年代能夠提供給學生的上機機會也十分有限。姜濤描述,“只好把主要精力放在基礎學科上,一邊學習數(shù)學、物理、化學的課程,一邊排隊等待上機?!?/p>
一天,數(shù)學系的王樹禾前來教授圖論課,還是穿著他那件發(fā)皺的藍色中山裝。在姜濤的記憶中,王老師有科大組合數(shù)學四大天王之一的美譽,他編撰的《圖論》深入淺出、鞭辟入里,被計算機系選為教材。
但更重要的是,他每堂課總是特意查找有關數(shù)學家的生平,為枯燥的內容增色不少。
王樹禾、李炯生、陶懋頎、李喬(從左到右),在中科大被稱為組合與圖論四大天王
那堂課結束后,姜濤很快便找到了一個可行的科研方案——理論研究,從自己擅長的數(shù)學與算法入手。
后來,在王樹禾教授的鼓勵之下,他便將目標確定為一個懸而未決的圖論問題:哈約斯猜想(Hajós' Conjecture)。實際上,這個猜想早在1961年就由法國數(shù)學家哈約斯(Hajos, G.)提出,簡單來說,就是如何將一個圖拆分成少量不相交的圈。
經過半年的研究,盡管姜濤沒有完全解決這一問題,但他至少在平面圖的范圍內證明了哈約斯猜想。后來這一成果于1984年發(fā)表在中科大的學報上,是姜濤為數(shù)不多的中文研究成果,也成為了他競爭郭沫若獎學金的重要成績。
值得一提的是,由于新中國此前從未設立過學金,只有“助困”性質的人民助學金,郭沫若獎學金也被視為“新中國第一獎學金”,更被無數(shù)科大學子視為夢寐以求的最高獎。
1982年開春,學校隆重舉行1981年度郭沫若獎學金獲得者、三好學生、優(yōu)秀學生干部授獎大會。獲獎者有姜濤、白重恩(清華大學經濟管理學院院長)。
對姜濤而言,這是他學術生涯的起點。
姜濤的出國經歷堪稱曲折。1984年,姜濤與周耀旗同年畢業(yè)。
相比之下,周耀旗獲得了國家公派留學的名額,在中山大學進行一年集訓后順利出國。而姜濤所在的計算機系,在中國仍是一個新興學科,并不屬于多個公派留學的計劃覆蓋范圍之內。
于是,姜濤準備“曲線出國”——報考清華大學的研究生,爭取已分到清華的日本留學名額。
可在準備考試之前,中科大計算機系公布了公派留學計劃——從應屆畢業(yè)生中選拔一些優(yōu)秀學生出國留學,畢業(yè)后回到中科大任教。盡管一番折騰,姜濤最終拿到了留學名額,并通過了英語考試。
出國在望,手續(xù)卻不太順利。
這項留學計劃原本啟動時間就比較晚,且當時國內的計算機科學底蘊尚淺,姜濤與國外幾所高校溝通留學事宜都沒有成功。原定于1984年秋天啟程的留學之旅,便拖了下來。
經過漫長的等待,兩封來自美國的錄取通知姍姍而來,一封來自馬里蘭大學,另一封來自明尼蘇達大學。這兩所學校都被是公立名校,但相比較而言,馬里蘭大學的計算機專業(yè)排名要更靠前。
然而,那個年代信息流通緩慢,姜濤找來的一份美國大學計算機科學專業(yè)的排名(Gourman Report),顯示明尼蘇達優(yōu)于馬里蘭。所以,拿著這份“過時”的排名,1985年初,姜濤去往明尼蘇達大學。
1986年于明尼蘇達大學
作為中科大計算機系的公派留學生,姜濤這一批學子擔負著學成歸國任教的任務。在挑選專業(yè)時,姜濤站在學校和國家更需要的角度考慮,選擇了當時國內尚未開設的軟件工程專業(yè)。
一段時間后,姜濤發(fā)現(xiàn)軟件工程專業(yè)的很多課程自己沒有學過,很難跟上進度。加上當年在科大排隊上機的經歷,讓他在編程功底上欠缺太多,于是決定轉向其他研究方向——計算機理論。
當時的明尼蘇達大學計算機系中,這個方向的老師并不多,姜濤選擇了其中一位美籍菲律賓教授Oscar Ibarra。這位教授當時正在進行晶格自動機(cellular automata,作為并行計算的一個基本模型)的研究.因此,姜濤博士階段的研究主要圍繞這一主題進行。
生計問題是姜濤在留學期間的另一重壓力。
國家資助了姜濤留學第一年的學費與生活費,次年開始所有的開銷都要自己承擔。于是姜濤選擇了在當時最適合學生做的兼職——擔任學校的教學助理與科研助理,獲取獎學金。讀博士期間,姜濤有一半的時間在做教學助理,另一半的時間在做科研助理。
1987年,姜濤在晶格自動機通訊復雜度研究上取得了初步成果,開始參加國際學術會議;1988年,攻讀博士學位不到四年的姜濤已經達到了畢業(yè)標準。
畢業(yè)前夕,姜濤參加在華盛頓特區(qū)舉行的IEEE Structure in Complexity Theory年會時,結識了會議的一位“圈內人物”——李明。
李明已經博士后畢業(yè),在美國任教,和姜濤一樣是一位純粹的計算機理論研究者,與生物學的緣分尚未來臨。但這次的會面為二人在加拿大重逢,成為關系密切的朋友與合作伙伴,共同研究生物信息學埋下了伏筆。
二十世紀八十年代末,留學生想要留美任教手續(xù)十分繁瑣,難以獲得簽證,畢業(yè)后往往要先離開美國一段時間,再回去才能應聘教職。作為北美州唯二的兩個發(fā)達國家,加拿大與美國毗鄰,二者的社會文化環(huán)境、科研條件等都較為相似,幾所杰出的高校也具有很好的科研基礎。
在美國簽證發(fā)放不斷收緊的情況下,姜濤前往加拿大的麥克馬斯特大學任教,李明也離開了美國前往加拿大工作,先后入職約克大學與滑鐵盧大學,和姜濤所在的麥克馬斯特大學車程不到一小時。
1994年,姜濤(居中)在麥克馬斯特大學的科研團隊
初到加拿大,姜濤在當?shù)氐挠嬎銠C理論領域“舉目無親”,不遠處的李明既是老鄉(xiāng),又是在美國求學時的舊相識,自然而然地來往密切起來。
“對我來說,李明是一位兄長,我在工作上得到了很多他的幫助和提攜。”
李明比姜濤年長幾歲,向來不吝惜向姜濤傳授自己的科研經驗,甚至于后來姜濤轉向生物信息學的研究也與李明的鼓勵密分不開。除此之外,兩人在Kolmogorov complexity理論在計算復雜性及算法平均復雜性分析中的應用方面也有多項合作,并解決了多個著名難題。
二十世紀九十年代初,在李明的激勵下,姜濤參與到人類基因組計劃中的一個重要測序方法——霰彈槍測序法的研究之中。其中一個相關的重要問題是:當給定一組字符串后,怎樣計算它們的最短公共超串(shortest superstring)。
姜濤首次得到了一個著名算法的線性逼近分析。后來,團隊中又加入了來自荷蘭CWI的John Tromp、 MIT的Avrim Blum、貝爾實驗室的Mihalis Yannakakis三位學者,合作發(fā)布了一篇STOC論文《 Linear approximation of shortest superstrings》,在當時的計算機理論領域引起了強烈反響,帶動了一大批做算法的學者研究這一問題。
2006年,姜濤(右一)和李明(左一)合影
可以說,霰彈槍測序法是姜濤的生物信息學入門之作。
1994年,姜濤和他在麥克馬斯特大學的第一個博士生王魯生,以及加州大學伯克利分校的Eugene Lawler教授(著名組合數(shù)學家;已故),合作開發(fā)了一個關于多序列比對的快速近似算法。
這一算法在當時引起不小的震動。不少本領域的權威人士,如Pavel Pevzner、Eugene Myers、Webb Miller等都認為“這個結果既 surprising ,又非常deep”,并被寫進多本生物信息學教科書。
1995年,姜濤和王魯生以及另一位在加拿大西安大略大學的張凱中教授合作,一起開發(fā)了一種比較樹結構的方法,稱為“樹比對”,并于當年發(fā)表。這種方法較傳統(tǒng)樹結構比較方法(樹編輯)在計算上有多種優(yōu)越性,所以也在生物信息領域之外(如數(shù)據(jù)庫查詢,XML數(shù)據(jù)處理等)得到廣泛應用。
這一研究的份量在姜濤看來不輕,因為長期以來生物信息學總是借鑒其他領域的方法,如,機器學習、數(shù)據(jù)挖掘、自然語言、圖像處理,“而它是為數(shù)不多的,將生物信息學方法推廣到其它領域的范例之一”。
這是姜濤從計算復雜性理論轉向算法研究的分水嶺,卻不能算是他進入生物信息學領域的標志,“這時候我還從還沒有真正看過生物數(shù)據(jù),只是做了一些算法問題?!?/p>
直到1995年學術休假時,李明建議姜濤,“生物信息學現(xiàn)在非常重要,我們應該盡早涉入?!?br/>
出于對李明的信任和尊敬,姜濤決定利用學術休假學習生物信息學。
1995年,姜濤利用一年的學術休假“拜師”Richard M. Karp。Karp(1985年圖靈獎獲得者)是一位計算機理論、算法領域的大師,一生有諸多傳奇。1968年,他離開工作十年的IBM沃森研究中心,前往加州大學伯克利分校(UC Berkeley)工作。
那里是計算機科學理論的一個著名研究中心,Stephen Cook(1982年圖靈獎獲得者)、Manuel Blum(1995年圖靈獎獲得者) 、姚期智(2000年圖靈獎獲得者)等一批知名學者都先后在此任教,學術氣氛十分濃厚。
不過,這樣一位計算機科學界的頂級大佬,在90年代初期來了一個“大轉彎”——將研究重心移到了生物信息學領域。
這在學術圈是轟動性的大事。很多學者猜測是由于HGP(人類基因組計劃)的啟動,使得Karp看到了計算科學在基因組測序及分析方面的潛力。沒過多久,Karp本人就親自證實了這一猜測。
姜濤是最早得知Karp研究變動的人。1995年,在姜濤發(fā)去拜師郵件后,很快便收到了Karp的回信:“我即將搬去華盛頓大學(西雅圖),你有沒有興趣同往?”
1993年,人類基因組計劃的發(fā)展如潮水般兇猛,自動化基因測序儀的誕生推動HGP進入了實質性的運作階段。1994年,3000個(原計劃為600- 1500) 標簽分辨率為1CM (即1%重組率)的遺傳圖譜的繪制,標志著HGP進入一個新階段——物理圖譜繪制階段。
Karp之所以要動身去往西雅圖,一個重要原因是HGP的研究中心之一設在了“西雅圖華盛頓大學基因組測序中心”。現(xiàn)在,有一個機會擺在姜濤面前。
這個中心里,領導者是物理圖譜領軍人士及人類基因組計劃發(fā)起人之一Maynard Olson,具體合作者包括Gane Wong及于軍,大家共同創(chuàng)立了當時世界上最嚴謹、精確、系統(tǒng)的基因組物理圖譜制作方法——多酶完全水解物理圖譜,還將其用于規(guī)?;锢韴D譜制作,并為基于克隆的DNA測序提供直接材料。
那時候姜濤還沒到35歲,但覺得時間過得飛快。這是一段繪制人類DNA圖譜的“軍備競賽”,醫(yī)藥公司以及私營企業(yè)實驗室加入競爭,迫使人類基因組計劃陷入一場瘋狂角逐。
姜濤逐漸認識到,“在生物學問題里,不能再為了做出漂亮的算法而只關注簡化后的數(shù)學問題,必須直面所有真實的生物數(shù)據(jù)?!?/p>
如今,姜濤仍對那段經歷印象深刻,很大一部分原因是此前他從未脫離老本行,即便是合作一些生物課題,也是將自己定義為一名計算機理論學者。
Karp看出了姜濤的疑慮,臨別之際他送給了姜濤一句話,“沒有關系,都是科學,不要太關注領域的界限。”
姜濤與Richard Manning Karp教授
重回麥克馬斯特大學,姜濤趕上了被譽為“加拿大基因組計劃”的CGAT項目(Canadian Genome Analysis and Technology)。該項目計劃耗資2200萬美元,為期5年,用以資助加拿大學者從人類染色體圖譜繪制和小鼠免疫系統(tǒng)基因測序,到社會問題研究的所有項目。
姜濤與李明再續(xù)合作,順利申請到第一批經費,約十幾萬加元。
姜濤稱,“盡管這筆經費并不算多,但提供了認真去做生物信息學的良機。”
不過,加拿大啟動基因組計劃,只是HGP推動各國參與生命科學大討論的冰山一角。
自1999年以來,伴隨著測序儀的改進和新的用于組裝和注釋軟件的開發(fā),人類基因組測序已在全球數(shù)十個主要研究中心全面展開。這也意味著,HGP培育了一種新的科學研究協(xié)作文化。
1999年,姜濤去往美國加州大學河濱分校(University of California - Riverside,UCR),任計算機科學與工程系教授。對于這次任職,姜濤一是想認真做生物信息學,二是加強與生物學背景的學者合作。
因此,即使李明已經邀請他去往滑鐵盧大學任職,但考慮到河濱分校擁有世界級水平的植物系,姜濤還是選擇了后者。
他講到,“我在工作面試中能感覺到,該校的教授們非常愿意和計算背景的人合作。”首位向姜濤伸出橄欖枝的就是一位植物遺傳學大咖——剛上任UCR自然科學與農學院長不久的Michael T. Clegg教授。
Michael T. Clegg教授
Clegg希望在任期內完成一件事:重振正在衰退的統(tǒng)計系,發(fā)展新興學科。
因此,他對生物信息學很感興趣。姜濤的到來讓他看到了希望,兩人迅速討論決定合作研究一些植物基因的遺傳機制并全面分析植物基因組中的各種重復序列。
經歷了半年的前期準備工作,2000年,兩人與當時剛搬到加州大學圣巴巴拉分校的李明合作,成功申請到了NSF-ITR第一批大規(guī)模項目。
對他們來說,此舉相當有振奮意義?!斑@個項目不僅是由美國國家科技署發(fā)起的支持信息技術優(yōu)先領域的特殊項目,而且第一批大規(guī)模項目的命中率不到1%,結果還是由白宮直接官宣?!?/p>
毫無疑問,姜濤也借此打響了在美國任教的第一槍。
今年是姜濤在河濱分校任教的第23個年頭。這些年里,姜濤發(fā)表論文300余篇,是一位名副其實的“多產型學者”,也是一位炙手可熱的“合作者”。
2001年,姜濤被第二位合作對象“鎖定”,植物病理系的James Borneman教授。
Borneman是一位微生物學家,多年來一直與多個實驗室合作,希望了解微生物在病原體和疾病中的作用。
當時他敏銳地注意到,“DNA微芯片技術”正成為各國學術界和工業(yè)界研究和開發(fā)的熱點,尤其在1998年6月29日美國宣布正式啟動“基因芯片計劃”,聯(lián)合私人投資機構投入了20億美元以上的研究經費后,以基因芯片為核心的相關產業(yè)迅速在全球崛起。
這對Borneman來說無疑是他從事微生物研究的最佳窗口期。他難掩激動,“這場研究消除了人工培養(yǎng)微生物的環(huán)節(jié),將推動我們研究成千上萬的微生物。”
所以,對于這場“豪賭”,Borneman必須選對團隊。
他注意到,姜濤的豐富算法研究經驗將對芯片探針的設計至關重要,加上他在生物信息學中的積累,正是此次項目的最佳合作人選。
在姜濤的幫助下,系里的熱衷于算法的同事Marek Chrobak也加入進來。
這是一位波蘭學者,早年工作與姜濤在加拿大時從事的計算復雜性分析有不少交集,此次姜濤親自邀請自然是熱情接受,姜濤因此感慨,“我來UCR做起了生物信息學,至少系里有一個人能夠理解自己?!?/p>
緊接著Della Vedova Gianluca(來自Milan Bicocca University的一位訪問學生)、UCR博士生Andres Figueroa的加入,五人團隊的人選正式敲定。
James Borneman、姜濤、Marek Chrobak
2001年,以Borenman教授及姜濤為主導開發(fā)的OFRG技術(Oligonucleotide Fingerprinting of rRNA Genes),一度成為當時最先進的微生物群體分析手段,可以用來分析植物根部土壤中的微生物群體組成。
時隔多年,姜濤站在更長遠的視角上,認為“這次研究在基因研究歷史上影響并不大,很快便被大規(guī)模測序技術普及所替代”,但值得一提的是,這次研究卻奠定了姜濤此后的一個研究主線:利用計算機科學的手段解決實際的生物學問題。
此后,姜濤頻繁開展相關領域的合作,其中之一是與同校的分子生物學家Frances M. Sladek合作。
她多年通過實驗手段研究核受體的調控機制,于2002年找到姜濤想通過計算方法來擴大研究范圍,加快研究進程。因此二人研究發(fā)明了一種新型馬爾科夫鏈(當時起名為optimized Markov chains,后被人改稱為permutated Markov chains),并建立一個重要核受體(HNF4a)綁定位點當時最大的數(shù)據(jù)集。
2003年,姜濤(紅衣居中)與UCR科研團隊
除此之外,姜濤還趕了一個“時髦”。
在RNA-seq技術出現(xiàn)不久之后,基于RNA-Seq數(shù)據(jù)的轉錄組組裝,即從數(shù)百萬個短讀段中重建所有全長mRNA轉錄本并確定它們的峰度,成為分子生物學學界的一大挑戰(zhàn)。
2010年,姜濤和UCR博士生李煒、清華大學訪問學生馮建興,共同提出了一個通過RNA-seq讀段來重建轉錄組,并估計每個mRNA轉錄本(isoforms,也叫基因異構體)峰度的算法,稱為Isoinfer,屬于這方面最早的方法之一。
2011年,姜濤與團隊利用數(shù)據(jù)的稀疏性,對這個算法做了進一步改進,稱為Isolasso,并得到了更廣泛地應用。這一研究的影響是廣泛的、雙重的。
首先,由于下一代測序(NGS)技術的快速發(fā)展,及其對生命科學和醫(yī)學的潛在影響,RNA-Seq數(shù)據(jù)分析在生物信息學中屬于時興主題。
其次,盡管許多RNA-Seq應用程序取得了成功,但在RNA-Seq數(shù)據(jù)分析中仍然存在不少挑戰(zhàn),其中之一來自RNA-Seq讀取中的偏差的理解和處理。
因此,姜濤等人提出的處理RNA-Seq偏差的方法,屬于結合了統(tǒng)計學、機器學習和組合算法的技術典范。
2002年夏天,姜濤開始頻繁回國訪問并到清華擔任客座教授,為新世紀初的中國生物信息學事業(yè)做出了重要貢獻。而他做的第一件事,就是和大學同學鐘揚恢復了聯(lián)系。
實際上,兩人自畢業(yè)后已經十七年未見。但當年鐘揚在復旦大學研究植物多樣性及進化并開始對生物信息學發(fā)生興趣。通過同學關系聯(lián)系上姜濤后兩人一拍即合,確定了合作關系,并共同承擔了國家基金委第二期“龍星計劃”生物信息學在復旦的授課。
2005年,兩人首次提出了一個利用基因在基因組上的順序來分析直系同源基因的一個新方法,解決了同源基因序列極其相似的難題。
2002年,姜濤與鐘揚于虹橋機場,2010年鐘揚在姜濤所在的UCR實驗室。
值得一提的是,2002年徐鷹回國創(chuàng)辦了生物信息國際研討會(IBW),不僅打開了國內外學術交流的通道,更在此次會議中討論做出決定:“以后每屆的IBW會議,都在會議所在地,開會前辦五天的龍星計劃?!?/p>
如此一來,國內生信隊伍原本各自為營,但在徐鷹等學者的努力下聚集起來,有力的推動了生物信息學在國內的發(fā)展,姜濤在此后的很長時間里,也成為IBW會議的“常備軍”。
第三屆IBW議特邀代表與部分學生(姜濤在前排左一)
幾乎在同一時間,2003年,姚期智在清華計算機系成立了一個“計算機理論講席教授組”,姜濤成為最早入組的學者之一。
實際上,這正是姚期智在清華開創(chuàng)的特殊教育模式。
為培養(yǎng)中國的計算機精英研究生,姚期智希望吸引海外人學者回國授課,但每位教授回國時間又很有限。
“姚先生想到了當時清華初起的一個好辦法,成立一個6-10人講課團隊,每個人講一兩個月的課,加起來就是一整年的課程,保證了對學生培養(yǎng)的連續(xù)性。”
姚期智教授
由此,清華的計算機學科第一次集齊了理論、應用、系統(tǒng)結構和軟件四大領域的優(yōu)秀學者,分別為姜濤、鄧小鐵(香港城市大學)、堵丁柱(德州大學達拉斯分校)、李明(滑鐵盧大學)、蔡進一(威斯康星大學)、尹依群(普林斯頓大學)、滕尚華(波士頓大學)、劉燕虹(紐約大學石溪分校)、Ko Ker-I(紐約大學石溪分校)、邵中(耶魯大學)。
到2007年,姚期智建立了清華大學理論計算機科學研究中心,擴招研究生,同時組建了第二屆講席教授組20人,其中美國國家科學院院士4名、美國人文科學院院士2名、美國國家工程院院士1名、奈望林納獎得主2名。
隨著各個講席教授組在清華的成功,自動化系決定成立一個“計算生物學講席教授組”。通過李衍達院士,張學工教授及美國冷泉港實驗室的張奇?zhèn)ィㄖ锌拼?7級)的努力,這一想法很快得到實現(xiàn)。
2008年5月,清華大學自動化系下的“生物信息學與系統(tǒng)生物學講席教授組”正式成立,美國南加州大學教授、計算生物學奠基人之一Michael S. Waterman教授受聘為講席教授組首席科學家,講席教授組的成員包括姜濤、張奇?zhèn)?、王永雄、劉軍、孫豐珠(博士師從Waterman),陳挺等著名世界級學者。
至此,我國第一個生物信息學與系統(tǒng)生物學研究中心誕生了。
2012年長城上,姜濤(前排左一)與Michael Waterman (居中白帽者)、張奇?zhèn)ィ◣R者)等清華同事以及學生合影
近些年來,姜濤長期在清華大學訪問,和多位教授合作培養(yǎng)了六名博士生,研究領域主要集中在算法及機器學習方法在生物信息學領域的應用上,尤其是RNA異構體功能的預測。在與雷峰網(wǎng)的交流中,姜濤極認真地說到,“算法是我的終身興趣,生物信息學是我一生的事業(yè)。因為生信領域有大量數(shù)據(jù),包括不同物種的測序數(shù)據(jù),是機器學習理想的應用場景。同時,這一領域缺乏基準真相(ground truth或標簽),又極具有挑戰(zhàn)性?!被谶@個想法,姜濤多年來的研究主線從未出現(xiàn)偏差。這是正是很多計算機科學出身的學者極為重視的一點。只不過,姜濤的態(tài)度很明確,他是一個依舊談論“理想”的人。“我希望建立一個像基因功能數(shù)據(jù)庫Gene Ontology (GO)一樣的基因異構體功能標注數(shù)據(jù)庫,并得到廣泛應用,讓基因異構體之間的功能差異得到更多生物學家的重視,使得今后我們每當談到基因功能時,必想到不同的異構體?!睘榱诉@個理想,姜濤還有很長的一段路要走。
有意思的是,這么多年過去,姜濤一直沒做兩件事,一是管理工作,二是發(fā)朋友圈。
這是姜濤刻意為之。他堅持認為,自己的性格不適合做管理工作。早在中科大讀書之時,他就已做了取舍:寧可泡在圖書館里找課題做研究,空余時間在足球場上踢出一身汗,也沒有考慮去競爭學生會組織工作。
近年來,姜濤的博士生每年穩(wěn)定在五名以上,高峰時曾經到過十來名,他更不考慮謀個管理職位,而是省出時間多和學生一對一交流。
“你能想象,如果和每個學生每周都深聊的話,還是非常忙的?!?/p>
至于朋友圈,他談到,“作為一位理論研究工作者,我寫作的速度跟思考的速度遠遠不匹配,所以發(fā)朋友圈對我來講跟寫論文一樣,是件大事,需要認真計劃。”
但這樣一位學者,卻對社會學、心理學很感興趣,總覺得自己的科研和興趣愛好終究會聯(lián)系在一起。
“當年出國時基本上對美國社會一無所知,很長時間是通過看美劇來了解美國的家庭及朋友圈文化。
但在美國生活了這么多年,孩子們長大以后卻告訴我電視劇所描述的與真實生活差別還蠻大的?!?/p>
在對生活和研究上,姜濤的態(tài)度都是一樣,未知是最大的動力。
作者注:
1993年,中國參與人類基因組計劃,生物信息學科迎來大爆發(fā)。在近三十年的時間里,一大批生物、化學、物理、計算等專業(yè)的學者,前仆后繼加入到學科的產研建設,那是一個靈感迸發(fā)、情誼綿長的年代,也是一個走出質疑、迷茫的年代。
目前,雷峰網(wǎng)(公眾號:雷峰網(wǎng))啟動《生物信息學的三十年往事》專題,將陸續(xù)推出徐鷹、潘毅、周耀旗、許東、姜濤、張奇?zhèn)?、唐建等新老學者的人物故事,記錄光輝歲月,以照后人之路。
關于生物信息學的更多故事,歡迎與本文作者吳彤交流,微信號:icedaguniang
雷峰網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知。