丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
醫(yī)療AI 正文
發(fā)私信給任平
發(fā)送

0

「霰彈槍測序法」推動者、ACM Fellow姜濤:從中科大計(jì)算機(jī),走入AI生命科學(xué)的光輝歲月

本文作者: 任平 2023-04-20 10:43
導(dǎo)語:時來天地皆同力,運(yùn)去英雄不自由。

姜濤是極少數(shù)能同時把計(jì)算機(jī)理論和生物學(xué)都做好的學(xué)者。

近四十年的工作學(xué)習(xí)生涯中,姜濤最初并非從事生物信息學(xué)工作,而是研究計(jì)算機(jī)理論和算法。

直到1995年,他獲得首次學(xué)術(shù)休假,決定利用機(jī)會拜師Richard M. Karp。人類史上規(guī)模最宏大的跨國跨學(xué)科工程人類基因組計(jì)劃進(jìn)行之際,就連Karp這樣享譽(yù)國際的計(jì)算理論界泰斗都投身其中。

就這樣,姜濤走上生信道路,新世紀(jì)后又參與了第二次生命科學(xué)浪潮——基因芯片設(shè)計(jì)與應(yīng)用。

43歲,姜濤當(dāng)選美國科學(xué)促進(jìn)會會士(AAAS Fellow),又在一年后接連升任UCR校長講座教授和計(jì)算機(jī)協(xié)會會士(ACM Fellow)。1988年博士畢業(yè)至今,姜濤發(fā)表了超300篇論文,高產(chǎn)期一年多達(dá)18篇。

「霰彈槍測序法」推動者、ACM Fellow姜濤:從中科大計(jì)算機(jī),走入AI生命科學(xué)的光輝歲月

回顧這一路的發(fā)展軌跡, 姜濤認(rèn)為自己多少帶有些運(yùn)氣成分,“個人成就總是離開不科學(xué)發(fā)展大環(huán)境,如此才能保證科研工作的影響力及可持續(xù)性?!?/p>

但換句話說,那又何嘗不是時勢造英雄,即所謂“時來天地皆同力,運(yùn)去英雄不自由。”

中科大,學(xué)術(shù)的春天

1958年,蘭州市郊北山之麓,一座新學(xué)校拔地而起。

此處黃土光裸、風(fēng)沙肆虐,來人無不嘆句荒涼。

原來,在鐵道部的領(lǐng)導(dǎo)下,唐山鐵道學(xué)院、北京鐵道學(xué)院兩所學(xué)校(部分系所及員工)遷至于此,組建起了這所新的“蘭州鐵道學(xué)院”,也就是后來的蘭州交通大學(xué)。

“西部大開發(fā)”,一個充滿了時代性的口號,將許多人的一生留在了那里。姜濤的父母就是如此,他們隨唐山鐵道學(xué)院西遷至蘭州,把家安在了大西北,并養(yǎng)育了一對兒女。

上世紀(jì)70年代,我國部分地區(qū)的中學(xué)學(xué)制為四年(初高中各兩年),等到姜濤1979年考入中科大時,也僅僅16歲出頭。在當(dāng)時平均年齡為16.7歲的同級學(xué)生中,姜濤比中科大少年班的學(xué)生也大不了多少。

實(shí)際上,姜濤完全有機(jī)會參加1977年的高考,當(dāng)時已通過了省里的高考預(yù)考,但姜濤自覺書沒讀夠,便拖到了兩年后。兜兜轉(zhuǎn)轉(zhuǎn),姜濤回到了老家安徽。

「霰彈槍測序法」推動者、ACM Fellow姜濤:從中科大計(jì)算機(jī),走入AI生命科學(xué)的光輝歲月


1984年,姜濤(左二)在中科大畢業(yè)時和室友合影

1978年3月,時任中科大校長的郭沫若在全國科學(xué)大會上發(fā)表了演講《科學(xué)的春天》,鼓勵全國的青少年學(xué)習(xí)當(dāng)代科學(xué)技術(shù),打破陳規(guī),披荊斬棘,開拓我國科學(xué)發(fā)展的道路。

這篇激情洋溢的演講令姜濤深受震撼,時隔四十余年,他仍然形容那篇演講是“詩一樣的鼓舞”。

同樣在1978年,作家徐遲在《人民文學(xué)》發(fā)表了報告文學(xué)《哥德巴赫猜想》,這篇講述數(shù)學(xué)家陳景潤成長與研究經(jīng)歷的文章一經(jīng)問世就引起了熱烈反響。全國各地報紙、廣播電臺紛紛全文轉(zhuǎn)載和連續(xù)廣播,在當(dāng)時掀起了崇尚科學(xué)的熱潮。

1979年,來自西部黃土高坡的姜濤,與來自江蘇張家港的周耀旗(現(xiàn)任深圳灣實(shí)驗(yàn)室系統(tǒng)與物理生物學(xué)研究所副所長)一起進(jìn)入了中科大,還差點(diǎn)成了同班同學(xué)。

周耀旗曾介紹,1979年的高考化學(xué)科目非常難,他在這門科目上發(fā)揮得卻不錯,因?yàn)檫@個優(yōu)勢填報了中科大的近代化學(xué)系。

姜濤原本的計(jì)劃也是學(xué)習(xí)化學(xué)專業(yè)。他的母親曾在蘭州鐵道學(xué)院給排水系執(zhí)教,研究水環(huán)境等相關(guān)課題,化學(xué)知識背景深厚。在母親的耳濡目染下,姜濤的高考化學(xué)成績非常優(yōu)異。但在改革開放后,中國半導(dǎo)體產(chǎn)業(yè)逐漸進(jìn)入全面復(fù)蘇階段,中科大無線電電子學(xué)系(現(xiàn)名為電子工程與信息科學(xué)系)成為了全國教育重心。

著名電子學(xué)家、時任中國科學(xué)院電子學(xué)研究所所長顧德歡先生出任首任系主任。姜濤談到,“從實(shí)用性方面考慮,父母更鼓勵我選擇無線電系?!?/p>

那時,中科大各院系一直延續(xù)著“五年制+大一不分專業(yè)”的教學(xué)模式。入學(xué)第二年,姜濤選擇了計(jì)算機(jī)專業(yè)。1982年,計(jì)算機(jī)專業(yè)獨(dú)立建系,不再隸屬于無線電系,姜濤也在這一年結(jié)束了長達(dá)三年的基礎(chǔ)課程學(xué)習(xí),開始進(jìn)行專業(yè)課學(xué)習(xí)。

受時代所限,即便是中科大這樣的高校,在七、八十年代能夠提供給學(xué)生的上機(jī)機(jī)會也十分有限。姜濤描述,“只好把主要精力放在基礎(chǔ)學(xué)科上,一邊學(xué)習(xí)數(shù)學(xué)、物理、化學(xué)的課程,一邊排隊(duì)等待上機(jī)?!?/p>

一天,數(shù)學(xué)系的王樹禾前來教授圖論課,還是穿著他那件發(fā)皺的藍(lán)色中山裝。在姜濤的記憶中,王老師有科大組合數(shù)學(xué)四大天王之一的美譽(yù),他編撰的《圖論》深入淺出、鞭辟入里,被計(jì)算機(jī)系選為教材。

但更重要的是,他每堂課總是特意查找有關(guān)數(shù)學(xué)家的生平,為枯燥的內(nèi)容增色不少。

「霰彈槍測序法」推動者、ACM Fellow姜濤:從中科大計(jì)算機(jī),走入AI生命科學(xué)的光輝歲月


王樹禾、李炯生、陶懋頎、李喬(從左到右),在中科大被稱為組合與圖論四大天王

那堂課結(jié)束后,姜濤很快便找到了一個可行的科研方案——理論研究,從自己擅長的數(shù)學(xué)與算法入手。

后來,在王樹禾教授的鼓勵之下,他便將目標(biāo)確定為一個懸而未決的圖論問題:哈約斯猜想(Hajós' Conjecture)。實(shí)際上,這個猜想早在1961年就由法國數(shù)學(xué)家哈約斯(Hajos, G.)提出,簡單來說,就是如何將一個圖拆分成少量不相交的圈。

經(jīng)過半年的研究,盡管姜濤沒有完全解決這一問題,但他至少在平面圖的范圍內(nèi)證明了哈約斯猜想。后來這一成果于1984年發(fā)表在中科大的學(xué)報上,是姜濤為數(shù)不多的中文研究成果,也成為了他競爭郭沫若獎學(xué)金的重要成績。

值得一提的是,由于新中國此前從未設(shè)立過學(xué)金,只有“助困”性質(zhì)的人民助學(xué)金,郭沫若獎學(xué)金也被視為“新中國第一獎學(xué)金”,更被無數(shù)科大學(xué)子視為夢寐以求的最高獎。

1982年開春,學(xué)校隆重舉行1981年度郭沫若獎學(xué)金獲得者、三好學(xué)生、優(yōu)秀學(xué)生干部授獎大會。獲獎?wù)哂薪獫?、白重恩(清華大學(xué)經(jīng)濟(jì)管理學(xué)院院長)。

對姜濤而言,這是他學(xué)術(shù)生涯的起點(diǎn)。

選錯學(xué)校、自掙學(xué)費(fèi),一份轟動性的計(jì)算機(jī)成果

姜濤的出國經(jīng)歷堪稱曲折。1984年,姜濤與周耀旗同年畢業(yè)。

相比之下,周耀旗獲得了國家公派留學(xué)的名額,在中山大學(xué)進(jìn)行一年集訓(xùn)后順利出國。而姜濤所在的計(jì)算機(jī)系,在中國仍是一個新興學(xué)科,并不屬于多個公派留學(xué)的計(jì)劃覆蓋范圍之內(nèi)。

于是,姜濤準(zhǔn)備“曲線出國”——報考清華大學(xué)的研究生,爭取已分到清華的日本留學(xué)名額。

可在準(zhǔn)備考試之前,中科大計(jì)算機(jī)系公布了公派留學(xué)計(jì)劃——從應(yīng)屆畢業(yè)生中選拔一些優(yōu)秀學(xué)生出國留學(xué),畢業(yè)后回到中科大任教。盡管一番折騰,姜濤最終拿到了留學(xué)名額,并通過了英語考試。

出國在望,手續(xù)卻不太順利。

這項(xiàng)留學(xué)計(jì)劃原本啟動時間就比較晚,且當(dāng)時國內(nèi)的計(jì)算機(jī)科學(xué)底蘊(yùn)尚淺,姜濤與國外幾所高校溝通留學(xué)事宜都沒有成功。原定于1984年秋天啟程的留學(xué)之旅,便拖了下來。

經(jīng)過漫長的等待,兩封來自美國的錄取通知姍姍而來,一封來自馬里蘭大學(xué),另一封來自明尼蘇達(dá)大學(xué)。這兩所學(xué)校都被是公立名校,但相比較而言,馬里蘭大學(xué)的計(jì)算機(jī)專業(yè)排名要更靠前。

然而,那個年代信息流通緩慢,姜濤找來的一份美國大學(xué)計(jì)算機(jī)科學(xué)專業(yè)的排名(Gourman Report),顯示明尼蘇達(dá)優(yōu)于馬里蘭。所以,拿著這份“過時”的排名,1985年初,姜濤去往明尼蘇達(dá)大學(xué)。

「霰彈槍測序法」推動者、ACM Fellow姜濤:從中科大計(jì)算機(jī),走入AI生命科學(xué)的光輝歲月

1986年于明尼蘇達(dá)大學(xué)

作為中科大計(jì)算機(jī)系的公派留學(xué)生,姜濤這一批學(xué)子擔(dān)負(fù)著學(xué)成歸國任教的任務(wù)。在挑選專業(yè)時,姜濤站在學(xué)校和國家更需要的角度考慮,選擇了當(dāng)時國內(nèi)尚未開設(shè)的軟件工程專業(yè)。

一段時間后,姜濤發(fā)現(xiàn)軟件工程專業(yè)的很多課程自己沒有學(xué)過,很難跟上進(jìn)度。加上當(dāng)年在科大排隊(duì)上機(jī)的經(jīng)歷,讓他在編程功底上欠缺太多,于是決定轉(zhuǎn)向其他研究方向——計(jì)算機(jī)理論。

當(dāng)時的明尼蘇達(dá)大學(xué)計(jì)算機(jī)系中,這個方向的老師并不多,姜濤選擇了其中一位美籍菲律賓教授Oscar Ibarra。這位教授當(dāng)時正在進(jìn)行晶格自動機(jī)(cellular automata,作為并行計(jì)算的一個基本模型)的研究.因此,姜濤博士階段的研究主要圍繞這一主題進(jìn)行。

生計(jì)問題是姜濤在留學(xué)期間的另一重壓力。

國家資助了姜濤留學(xué)第一年的學(xué)費(fèi)與生活費(fèi),次年開始所有的開銷都要自己承擔(dān)。于是姜濤選擇了在當(dāng)時最適合學(xué)生做的兼職——擔(dān)任學(xué)校的教學(xué)助理與科研助理,獲取獎學(xué)金。讀博士期間,姜濤有一半的時間在做教學(xué)助理,另一半的時間在做科研助理。

1987年,姜濤在晶格自動機(jī)通訊復(fù)雜度研究上取得了初步成果,開始參加國際學(xué)術(shù)會議;1988年,攻讀博士學(xué)位不到四年的姜濤已經(jīng)達(dá)到了畢業(yè)標(biāo)準(zhǔn)。

畢業(yè)前夕,姜濤參加在華盛頓特區(qū)舉行的IEEE Structure in Complexity Theory年會時,結(jié)識了會議的一位“圈內(nèi)人物”——李明。

李明已經(jīng)博士后畢業(yè),在美國任教,和姜濤一樣是一位純粹的計(jì)算機(jī)理論研究者,與生物學(xué)的緣分尚未來臨。但這次的會面為二人在加拿大重逢,成為關(guān)系密切的朋友與合作伙伴,共同研究生物信息學(xué)埋下了伏筆。

二十世紀(jì)八十年代末,留學(xué)生想要留美任教手續(xù)十分繁瑣,難以獲得簽證,畢業(yè)后往往要先離開美國一段時間,再回去才能應(yīng)聘教職。作為北美州唯二的兩個發(fā)達(dá)國家,加拿大與美國毗鄰,二者的社會文化環(huán)境、科研條件等都較為相似,幾所杰出的高校也具有很好的科研基礎(chǔ)。

在美國簽證發(fā)放不斷收緊的情況下,姜濤前往加拿大的麥克馬斯特大學(xué)任教,李明也離開了美國前往加拿大工作,先后入職約克大學(xué)與滑鐵盧大學(xué),和姜濤所在的麥克馬斯特大學(xué)車程不到一小時。

「霰彈槍測序法」推動者、ACM Fellow姜濤:從中科大計(jì)算機(jī),走入AI生命科學(xué)的光輝歲月

1994年,姜濤(居中)在麥克馬斯特大學(xué)的科研團(tuán)隊(duì)

初到加拿大,姜濤在當(dāng)?shù)氐挠?jì)算機(jī)理論領(lǐng)域“舉目無親”,不遠(yuǎn)處的李明既是老鄉(xiāng),又是在美國求學(xué)時的舊相識,自然而然地來往密切起來。

“對我來說,李明是一位兄長,我在工作上得到了很多他的幫助和提攜?!?/p>

李明比姜濤年長幾歲,向來不吝惜向姜濤傳授自己的科研經(jīng)驗(yàn),甚至于后來姜濤轉(zhuǎn)向生物信息學(xué)的研究也與李明的鼓勵密分不開。除此之外,兩人在Kolmogorov complexity理論在計(jì)算復(fù)雜性及算法平均復(fù)雜性分析中的應(yīng)用方面也有多項(xiàng)合作,并解決了多個著名難題。

二十世紀(jì)九十年代初,在李明的激勵下,姜濤參與到人類基因組計(jì)劃中的一個重要測序方法——霰彈槍測序法的研究之中。其中一個相關(guān)的重要問題是:當(dāng)給定一組字符串后,怎樣計(jì)算它們的最短公共超串(shortest superstring)。

姜濤首次得到了一個著名算法的線性逼近分析。后來,團(tuán)隊(duì)中又加入了來自荷蘭CWI的John Tromp、 MIT的Avrim Blum、貝爾實(shí)驗(yàn)室的Mihalis Yannakakis三位學(xué)者,合作發(fā)布了一篇STOC論文《 Linear approximation of shortest superstrings》,在當(dāng)時的計(jì)算機(jī)理論領(lǐng)域引起了強(qiáng)烈反響,帶動了一大批做算法的學(xué)者研究這一問題。

「霰彈槍測序法」推動者、ACM Fellow姜濤:從中科大計(jì)算機(jī),走入AI生命科學(xué)的光輝歲月

2006年,姜濤(右一)和李明(左一)合影

可以說,霰彈槍測序法是姜濤的生物信息學(xué)入門之作。

1994年,姜濤和他在麥克馬斯特大學(xué)的第一個博士生王魯生,以及加州大學(xué)伯克利分校的Eugene Lawler教授(著名組合數(shù)學(xué)家;已故),合作開發(fā)了一個關(guān)于多序列比對的快速近似算法。

這一算法在當(dāng)時引起不小的震動。不少本領(lǐng)域的權(quán)威人士,如Pavel Pevzner、Eugene Myers、Webb Miller等都認(rèn)為“這個結(jié)果既 surprising ,又非常deep”,并被寫進(jìn)多本生物信息學(xué)教科書。

1995年,姜濤和王魯生以及另一位在加拿大西安大略大學(xué)的張凱中教授合作,一起開發(fā)了一種比較樹結(jié)構(gòu)的方法,稱為“樹比對”,并于當(dāng)年發(fā)表。這種方法較傳統(tǒng)樹結(jié)構(gòu)比較方法(樹編輯)在計(jì)算上有多種優(yōu)越性,所以也在生物信息領(lǐng)域之外(如數(shù)據(jù)庫查詢,XML數(shù)據(jù)處理等)得到廣泛應(yīng)用。

這一研究的份量在姜濤看來不輕,因?yàn)殚L期以來生物信息學(xué)總是借鑒其他領(lǐng)域的方法,如,機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘、自然語言、圖像處理,“而它是為數(shù)不多的,將生物信息學(xué)方法推廣到其它領(lǐng)域的范例之一”。

這是姜濤從計(jì)算復(fù)雜性理論轉(zhuǎn)向算法研究的分水嶺,卻不能算是他進(jìn)入生物信息學(xué)領(lǐng)域的標(biāo)志,“這時候我還從還沒有真正看過生物數(shù)據(jù),只是做了一些算法問題?!?/p>

直到1995年學(xué)術(shù)休假時,李明建議姜濤,“生物信息學(xué)現(xiàn)在非常重要,我們應(yīng)該盡早涉入?!?br/>

拜師計(jì)算機(jī)理論大佬

出于對李明的信任和尊敬,姜濤決定利用學(xué)術(shù)休假學(xué)習(xí)生物信息學(xué)。

1995年,姜濤利用一年的學(xué)術(shù)休假“拜師”Richard M. Karp。Karp(1985年圖靈獎獲得者)是一位計(jì)算機(jī)理論、算法領(lǐng)域的大師,一生有諸多傳奇。1968年,他離開工作十年的IBM沃森研究中心,前往加州大學(xué)伯克利分校(UC Berkeley)工作。

那里是計(jì)算機(jī)科學(xué)理論的一個著名研究中心,Stephen Cook(1982年圖靈獎獲得者)、Manuel Blum(1995年圖靈獎獲得者) 、姚期智(2000年圖靈獎獲得者)等一批知名學(xué)者都先后在此任教,學(xué)術(shù)氣氛十分濃厚。

不過,這樣一位計(jì)算機(jī)科學(xué)界的頂級大佬,在90年代初期來了一個“大轉(zhuǎn)彎”——將研究重心移到了生物信息學(xué)領(lǐng)域。

這在學(xué)術(shù)圈是轟動性的大事。很多學(xué)者猜測是由于HGP(人類基因組計(jì)劃)的啟動,使得Karp看到了計(jì)算科學(xué)在基因組測序及分析方面的潛力。沒過多久,Karp本人就親自證實(shí)了這一猜測。

姜濤是最早得知Karp研究變動的人。1995年,在姜濤發(fā)去拜師郵件后,很快便收到了Karp的回信:“我即將搬去華盛頓大學(xué)(西雅圖),你有沒有興趣同往?”

1993年,人類基因組計(jì)劃的發(fā)展如潮水般兇猛,自動化基因測序儀的誕生推動HGP進(jìn)入了實(shí)質(zhì)性的運(yùn)作階段。1994年,3000個(原計(jì)劃為600- 1500) 標(biāo)簽分辨率為1CM (即1%重組率)的遺傳圖譜的繪制,標(biāo)志著HGP進(jìn)入一個新階段——物理圖譜繪制階段。

Karp之所以要動身去往西雅圖,一個重要原因是HGP的研究中心之一設(shè)在了“西雅圖華盛頓大學(xué)基因組測序中心”?,F(xiàn)在,有一個機(jī)會擺在姜濤面前。

這個中心里,領(lǐng)導(dǎo)者是物理圖譜領(lǐng)軍人士及人類基因組計(jì)劃發(fā)起人之一Maynard Olson,具體合作者包括Gane Wong及于軍,大家共同創(chuàng)立了當(dāng)時世界上最嚴(yán)謹(jǐn)、精確、系統(tǒng)的基因組物理圖譜制作方法——多酶完全水解物理圖譜,還將其用于規(guī)?;锢韴D譜制作,并為基于克隆的DNA測序提供直接材料。

那時候姜濤還沒到35歲,但覺得時間過得飛快。這是一段繪制人類DNA圖譜的“軍備競賽”,醫(yī)藥公司以及私營企業(yè)實(shí)驗(yàn)室加入競爭,迫使人類基因組計(jì)劃陷入一場瘋狂角逐。

姜濤逐漸認(rèn)識到,“在生物學(xué)問題里,不能再為了做出漂亮的算法而只關(guān)注簡化后的數(shù)學(xué)問題,必須直面所有真實(shí)的生物數(shù)據(jù)?!?/p>

如今,姜濤仍對那段經(jīng)歷印象深刻,很大一部分原因是此前他從未脫離老本行,即便是合作一些生物課題,也是將自己定義為一名計(jì)算機(jī)理論學(xué)者。

Karp看出了姜濤的疑慮,臨別之際他送給了姜濤一句話,“沒有關(guān)系,都是科學(xué),不要太關(guān)注領(lǐng)域的界限?!?/p>

「霰彈槍測序法」推動者、ACM Fellow姜濤:從中科大計(jì)算機(jī),走入AI生命科學(xué)的光輝歲月

姜濤與Richard Manning Karp教授

重回麥克馬斯特大學(xué),姜濤趕上了被譽(yù)為“加拿大基因組計(jì)劃”的CGAT項(xiàng)目(Canadian Genome Analysis and Technology)。該項(xiàng)目計(jì)劃耗資2200萬美元,為期5年,用以資助加拿大學(xué)者從人類染色體圖譜繪制和小鼠免疫系統(tǒng)基因測序,到社會問題研究的所有項(xiàng)目。

姜濤與李明再續(xù)合作,順利申請到第一批經(jīng)費(fèi),約十幾萬加元。

姜濤稱,“盡管這筆經(jīng)費(fèi)并不算多,但提供了認(rèn)真去做生物信息學(xué)的良機(jī)?!?/p>

不過,加拿大啟動基因組計(jì)劃,只是HGP推動各國參與生命科學(xué)大討論的冰山一角。

自1999年以來,伴隨著測序儀的改進(jìn)和新的用于組裝和注釋軟件的開發(fā),人類基因組測序已在全球數(shù)十個主要研究中心全面展開。這也意味著,HGP培育了一種新的科學(xué)研究協(xié)作文化。

1999年,姜濤去往美國加州大學(xué)河濱分校(University of California - Riverside,UCR),任計(jì)算機(jī)科學(xué)與工程系教授。對于這次任職,姜濤一是想認(rèn)真做生物信息學(xué),二是加強(qiáng)與生物學(xué)背景的學(xué)者合作。

因此,即使李明已經(jīng)邀請他去往滑鐵盧大學(xué)任職,但考慮到河濱分校擁有世界級水平的植物系,姜濤還是選擇了后者。

他講到,“我在工作面試中能感覺到,該校的教授們非常愿意和計(jì)算背景的人合作?!笔孜幌蚪獫斐鲩蠙熘Φ木褪且晃恢参镞z傳學(xué)大咖——剛上任UCR自然科學(xué)與農(nóng)學(xué)院長不久的Michael T. Clegg教授。

「霰彈槍測序法」推動者、ACM Fellow姜濤:從中科大計(jì)算機(jī),走入AI生命科學(xué)的光輝歲月

Michael T. Clegg教授

Clegg希望在任期內(nèi)完成一件事:重振正在衰退的統(tǒng)計(jì)系,發(fā)展新興學(xué)科。

因此,他對生物信息學(xué)很感興趣。姜濤的到來讓他看到了希望,兩人迅速討論決定合作研究一些植物基因的遺傳機(jī)制并全面分析植物基因組中的各種重復(fù)序列。

經(jīng)歷了半年的前期準(zhǔn)備工作,2000年,兩人與當(dāng)時剛搬到加州大學(xué)圣巴巴拉分校的李明合作,成功申請到了NSF-ITR第一批大規(guī)模項(xiàng)目。

對他們來說,此舉相當(dāng)有振奮意義?!斑@個項(xiàng)目不僅是由美國國家科技署發(fā)起的支持信息技術(shù)優(yōu)先領(lǐng)域的特殊項(xiàng)目,而且第一批大規(guī)模項(xiàng)目的命中率不到1%,結(jié)果還是由白宮直接官宣。”

毫無疑問,姜濤也借此打響了在美國任教的第一槍。

“算法是終身興趣,生信是一生事業(yè)”

今年是姜濤在河濱分校任教的第23個年頭。這些年里,姜濤發(fā)表論文300余篇,是一位名副其實(shí)的“多產(chǎn)型學(xué)者”,也是一位炙手可熱的“合作者”。

2001年,姜濤被第二位合作對象“鎖定”,植物病理系的James Borneman教授。

Borneman是一位微生物學(xué)家,多年來一直與多個實(shí)驗(yàn)室合作,希望了解微生物在病原體和疾病中的作用。

當(dāng)時他敏銳地注意到,“DNA微芯片技術(shù)”正成為各國學(xué)術(shù)界和工業(yè)界研究和開發(fā)的熱點(diǎn),尤其在1998年6月29日美國宣布正式啟動“基因芯片計(jì)劃”,聯(lián)合私人投資機(jī)構(gòu)投入了20億美元以上的研究經(jīng)費(fèi)后,以基因芯片為核心的相關(guān)產(chǎn)業(yè)迅速在全球崛起。

這對Borneman來說無疑是他從事微生物研究的最佳窗口期。他難掩激動,“這場研究消除了人工培養(yǎng)微生物的環(huán)節(jié),將推動我們研究成千上萬的微生物。”

所以,對于這場“豪賭”,Borneman必須選對團(tuán)隊(duì)。

他注意到,姜濤的豐富算法研究經(jīng)驗(yàn)將對芯片探針的設(shè)計(jì)至關(guān)重要,加上他在生物信息學(xué)中的積累,正是此次項(xiàng)目的最佳合作人選。

在姜濤的幫助下,系里的熱衷于算法的同事Marek Chrobak也加入進(jìn)來。

這是一位波蘭學(xué)者,早年工作與姜濤在加拿大時從事的計(jì)算復(fù)雜性分析有不少交集,此次姜濤親自邀請自然是熱情接受,姜濤因此感慨,“我來UCR做起了生物信息學(xué),至少系里有一個人能夠理解自己?!?/p>

緊接著Della Vedova Gianluca(來自Milan Bicocca University的一位訪問學(xué)生)、UCR博士生Andres Figueroa的加入,五人團(tuán)隊(duì)的人選正式敲定。

「霰彈槍測序法」推動者、ACM Fellow姜濤:從中科大計(jì)算機(jī),走入AI生命科學(xué)的光輝歲月

James Borneman、姜濤、Marek Chrobak

2001年,以Borenman教授及姜濤為主導(dǎo)開發(fā)的OFRG技術(shù)(Oligonucleotide Fingerprinting of rRNA Genes),一度成為當(dāng)時最先進(jìn)的微生物群體分析手段,可以用來分析植物根部土壤中的微生物群體組成。

時隔多年,姜濤站在更長遠(yuǎn)的視角上,認(rèn)為“這次研究在基因研究歷史上影響并不大,很快便被大規(guī)模測序技術(shù)普及所替代”,但值得一提的是,這次研究卻奠定了姜濤此后的一個研究主線:利用計(jì)算機(jī)科學(xué)的手段解決實(shí)際的生物學(xué)問題。

此后,姜濤頻繁開展相關(guān)領(lǐng)域的合作,其中之一是與同校的分子生物學(xué)家Frances M. Sladek合作。

她多年通過實(shí)驗(yàn)手段研究核受體的調(diào)控機(jī)制,于2002年找到姜濤想通過計(jì)算方法來擴(kuò)大研究范圍,加快研究進(jìn)程。因此二人研究發(fā)明了一種新型馬爾科夫鏈(當(dāng)時起名為optimized Markov chains,后被人改稱為permutated Markov chains),并建立一個重要核受體(HNF4a)綁定位點(diǎn)當(dāng)時最大的數(shù)據(jù)集。

「霰彈槍測序法」推動者、ACM Fellow姜濤:從中科大計(jì)算機(jī),走入AI生命科學(xué)的光輝歲月


2003年,姜濤(紅衣居中)與UCR科研團(tuán)隊(duì)

除此之外,姜濤還趕了一個“時髦”。

在RNA-seq技術(shù)出現(xiàn)不久之后,基于RNA-Seq數(shù)據(jù)的轉(zhuǎn)錄組組裝,即從數(shù)百萬個短讀段中重建所有全長mRNA轉(zhuǎn)錄本并確定它們的峰度,成為分子生物學(xué)學(xué)界的一大挑戰(zhàn)。

2010年,姜濤和UCR博士生李煒、清華大學(xué)訪問學(xué)生馮建興,共同提出了一個通過RNA-seq讀段來重建轉(zhuǎn)錄組,并估計(jì)每個mRNA轉(zhuǎn)錄本(isoforms,也叫基因異構(gòu)體)峰度的算法,稱為Isoinfer,屬于這方面最早的方法之一。

2011年,姜濤與團(tuán)隊(duì)利用數(shù)據(jù)的稀疏性,對這個算法做了進(jìn)一步改進(jìn),稱為Isolasso,并得到了更廣泛地應(yīng)用。這一研究的影響是廣泛的、雙重的。

首先,由于下一代測序(NGS)技術(shù)的快速發(fā)展,及其對生命科學(xué)和醫(yī)學(xué)的潛在影響,RNA-Seq數(shù)據(jù)分析在生物信息學(xué)中屬于時興主題。

其次,盡管許多RNA-Seq應(yīng)用程序取得了成功,但在RNA-Seq數(shù)據(jù)分析中仍然存在不少挑戰(zhàn),其中之一來自RNA-Seq讀取中的偏差的理解和處理。

因此,姜濤等人提出的處理RNA-Seq偏差的方法,屬于結(jié)合了統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)和組合算法的技術(shù)典范。

2002年夏天,姜濤開始頻繁回國訪問并到清華擔(dān)任客座教授,為新世紀(jì)初的中國生物信息學(xué)事業(yè)做出了重要貢獻(xiàn)。而他做的第一件事,就是和大學(xué)同學(xué)鐘揚(yáng)恢復(fù)了聯(lián)系。

實(shí)際上,兩人自畢業(yè)后已經(jīng)十七年未見。但當(dāng)年鐘揚(yáng)在復(fù)旦大學(xué)研究植物多樣性及進(jìn)化并開始對生物信息學(xué)發(fā)生興趣。通過同學(xué)關(guān)系聯(lián)系上姜濤后兩人一拍即合,確定了合作關(guān)系,并共同承擔(dān)了國家基金委第二期“龍星計(jì)劃”生物信息學(xué)在復(fù)旦的授課。

2005年,兩人首次提出了一個利用基因在基因組上的順序來分析直系同源基因的一個新方法,解決了同源基因序列極其相似的難題。

「霰彈槍測序法」推動者、ACM Fellow姜濤:從中科大計(jì)算機(jī),走入AI生命科學(xué)的光輝歲月

2002年,姜濤與鐘揚(yáng)于虹橋機(jī)場,2010年鐘揚(yáng)在姜濤所在的UCR實(shí)驗(yàn)室。

值得一提的是,2002年徐鷹回國創(chuàng)辦了生物信息國際研討會(IBW),不僅打開了國內(nèi)外學(xué)術(shù)交流的通道,更在此次會議中討論做出決定:“以后每屆的IBW會議,都在會議所在地,開會前辦五天的龍星計(jì)劃。”

如此一來,國內(nèi)生信隊(duì)伍原本各自為營,但在徐鷹等學(xué)者的努力下聚集起來,有力的推動了生物信息學(xué)在國內(nèi)的發(fā)展,姜濤在此后的很長時間里,也成為IBW會議的“常備軍”。

「霰彈槍測序法」推動者、ACM Fellow姜濤:從中科大計(jì)算機(jī),走入AI生命科學(xué)的光輝歲月

第三屆IBW議特邀代表與部分學(xué)生(姜濤在前排左一)

幾乎在同一時間,2003年,姚期智在清華計(jì)算機(jī)系成立了一個“計(jì)算機(jī)理論講席教授組”,姜濤成為最早入組的學(xué)者之一。

實(shí)際上,這正是姚期智在清華開創(chuàng)的特殊教育模式。

為培養(yǎng)中國的計(jì)算機(jī)精英研究生,姚期智希望吸引海外人學(xué)者回國授課,但每位教授回國時間又很有限。

“姚先生想到了當(dāng)時清華初起的一個好辦法,成立一個6-10人講課團(tuán)隊(duì),每個人講一兩個月的課,加起來就是一整年的課程,保證了對學(xué)生培養(yǎng)的連續(xù)性?!?/p>

「霰彈槍測序法」推動者、ACM Fellow姜濤:從中科大計(jì)算機(jī),走入AI生命科學(xué)的光輝歲月

 姚期智教授

由此,清華的計(jì)算機(jī)學(xué)科第一次集齊了理論、應(yīng)用、系統(tǒng)結(jié)構(gòu)和軟件四大領(lǐng)域的優(yōu)秀學(xué)者,分別為姜濤、鄧小鐵(香港城市大學(xué))、堵丁柱(德州大學(xué)達(dá)拉斯分校)、李明(滑鐵盧大學(xué))、蔡進(jìn)一(威斯康星大學(xué))、尹依群(普林斯頓大學(xué))、滕尚華(波士頓大學(xué))、劉燕虹(紐約大學(xué)石溪分校)、Ko Ker-I(紐約大學(xué)石溪分校)、邵中(耶魯大學(xué))。

到2007年,姚期智建立了清華大學(xué)理論計(jì)算機(jī)科學(xué)研究中心,擴(kuò)招研究生,同時組建了第二屆講席教授組20人,其中美國國家科學(xué)院院士4名、美國人文科學(xué)院院士2名、美國國家工程院院士1名、奈望林納獎得主2名。

隨著各個講席教授組在清華的成功,自動化系決定成立一個“計(jì)算生物學(xué)講席教授組”。通過李衍達(dá)院士,張學(xué)工教授及美國冷泉港實(shí)驗(yàn)室的張奇?zhèn)ィㄖ锌拼?7級)的努力,這一想法很快得到實(shí)現(xiàn)。

2008年5月,清華大學(xué)自動化系下的“生物信息學(xué)與系統(tǒng)生物學(xué)講席教授組”正式成立,美國南加州大學(xué)教授、計(jì)算生物學(xué)奠基人之一Michael S. Waterman教授受聘為講席教授組首席科學(xué)家,講席教授組的成員包括姜濤、張奇?zhèn)?、王永雄、劉軍、孫豐珠(博士師從Waterman),陳挺等著名世界級學(xué)者。

至此,我國第一個生物信息學(xué)與系統(tǒng)生物學(xué)研究中心誕生了。

「霰彈槍測序法」推動者、ACM Fellow姜濤:從中科大計(jì)算機(jī),走入AI生命科學(xué)的光輝歲月

2012年長城上,姜濤(前排左一)與Michael Waterman  (居中白帽者)、張奇?zhèn)ィ◣R者)等清華同事以及學(xué)生合影

近些年來,姜濤長期在清華大學(xué)訪問,和多位教授合作培養(yǎng)了六名博士生,研究領(lǐng)域主要集中在算法及機(jī)器學(xué)習(xí)方法在生物信息學(xué)領(lǐng)域的應(yīng)用上,尤其是RNA異構(gòu)體功能的預(yù)測。在與雷峰網(wǎng)(公眾號:雷峰網(wǎng))的交流中,姜濤極認(rèn)真地說到,“算法是我的終身興趣,生物信息學(xué)是我一生的事業(yè)。因?yàn)樯蓬I(lǐng)域有大量數(shù)據(jù),包括不同物種的測序數(shù)據(jù),是機(jī)器學(xué)習(xí)理想的應(yīng)用場景。同時,這一領(lǐng)域缺乏基準(zhǔn)真相(ground truth或標(biāo)簽),又極具有挑戰(zhàn)性。”基于這個想法,姜濤多年來的研究主線從未出現(xiàn)偏差。這是正是很多計(jì)算機(jī)科學(xué)出身的學(xué)者極為重視的一點(diǎn)。只不過,姜濤的態(tài)度很明確,他是一個依舊談?wù)摗袄硐搿钡娜?。“我希望建立一個像基因功能數(shù)據(jù)庫Gene Ontology (GO)一樣的基因異構(gòu)體功能標(biāo)注數(shù)據(jù)庫,并得到廣泛應(yīng)用,讓基因異構(gòu)體之間的功能差異得到更多生物學(xué)家的重視,使得今后我們每當(dāng)談到基因功能時,必想到不同的異構(gòu)體。”為了這個理想,姜濤還有很長的一段路要走。

未知是最大的動力

有意思的是,這么多年過去,姜濤一直沒做兩件事,一是管理工作,二是發(fā)朋友圈。

這是姜濤刻意為之。他堅(jiān)持認(rèn)為,自己的性格不適合做管理工作。早在中科大讀書之時,他就已做了取舍:寧可泡在圖書館里找課題做研究,空余時間在足球場上踢出一身汗,也沒有考慮去競爭學(xué)生會組織工作。

近年來,姜濤的博士生每年穩(wěn)定在五名以上,高峰時曾經(jīng)到過十來名,他更不考慮謀個管理職位,而是省出時間多和學(xué)生一對一交流。

“你能想象,如果和每個學(xué)生每周都深聊的話,還是非常忙的。”

至于朋友圈,他談到,“作為一位理論研究工作者,我寫作的速度跟思考的速度遠(yuǎn)遠(yuǎn)不匹配,所以發(fā)朋友圈對我來講跟寫論文一樣,是件大事,需要認(rèn)真計(jì)劃。”

但這樣一位學(xué)者,卻對社會學(xué)、心理學(xué)很感興趣,總覺得自己的科研和興趣愛好終究會聯(lián)系在一起。

“當(dāng)年出國時基本上對美國社會一無所知,很長時間是通過看美劇來了解美國的家庭及朋友圈文化。

但在美國生活了這么多年,孩子們長大以后卻告訴我電視劇所描述的與真實(shí)生活差別還蠻大的?!?/p>

在對生活和研究上,姜濤的態(tài)度都是一樣,未知是最大的動力。

「霰彈槍測序法」推動者、ACM Fellow姜濤:從中科大計(jì)算機(jī),走入AI生命科學(xué)的光輝歲月

作者注:

1993年,中國參與人類基因組計(jì)劃,生物信息學(xué)科迎來大爆發(fā)。在近三十年的時間里,一大批生物、化學(xué)、物理、計(jì)算等專業(yè)的學(xué)者,前仆后繼加入到學(xué)科的產(chǎn)研建設(shè),那是一個靈感迸發(fā)、情誼綿長的年代,也是一個走出質(zhì)疑、迷茫的年代。

目前,雷峰網(wǎng)啟動《生物信息學(xué)的三十年往事》專題,將陸續(xù)推出徐鷹、潘毅、周耀旗、許東、姜濤、張奇?zhèn)?、唐建等新老學(xué)者的人物故事,記錄光輝歲月,以照后人之路。

關(guān)于生物信息學(xué)的更多故事,歡迎與本文作者吳彤交流,微信號:icedaguniang

雷峰網(wǎng)

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知

分享:
相關(guān)文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說