丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
醫(yī)療AI 正文
發(fā)私信給任平
發(fā)送

0

人類基因組計劃「先行者」張奇?zhèn)ィ何遗c中國生物信息學的二十年往事

本文作者: 任平 2023-05-15 11:41
導語:陳竺、陳潤生、孫之榮、饒子和張奇?zhèn)?..一段中國生信學科草創(chuàng)、崛起的故事。

與許多傳統(tǒng)學科“尖深慢”不同,生物信息是“廣淺快”。

作為這個領域的華人開拓者,張奇?zhèn)ピ趪鴥韧庀碛惺⒚?,早?002年成為冷泉港實驗室首位取得正教授職位的華人學者。但國內很多人只熟悉“Michael Zhang”,并不熟悉中文名。

早期生物信息大牛Webb Miller曾跟他開玩笑,“Michael不要發(fā)那么多文章,讓我們大家都很難看”。同事們通常把張奇?zhèn)シQ為“百科全書”,向他請教各種問題,甚至在張奇?zhèn)ピO計生物實驗時,連實驗學家都驚嘆他對生物了解之深,完全看不出他是理論出身。

華盛頓大學數(shù)學系組織的一次研討課上,邀請張奇?zhèn)サ臄?shù)學系主任Spencer T. Olin吃驚道,張奇?zhèn)ヅc他們討論的是最前沿的純數(shù)學問題(如討論Kerov的書“無限維對稱群表示理論及其在數(shù)學分析中的應用”)。

但在四十多年前,擺在張奇?zhèn)ッ媲暗囊坏离y題卻是失去讀書的機會。和那個年代的諸多知識青年一樣,留守農村,接受貧下中農再教育,將他們引向人生的轉折點。

少年期的他,因為父母工作原因,一人擔負起弟弟妹妹的生活起居,本當讀書的年紀也因為反復的停課復課頗有欠缺之處,要么課本已被砍到學不到什么東西,要么只得經(jīng)常課外請教被打倒的老教師,或者干脆拎起書本自學。

正如清華李衍達院士近年來總結,“張奇?zhèn)サ淖畲筇攸c,是總能提前感知和引領生物信息發(fā)展的下一個高潮”,最善于把最復雜難懂的東西,用最通俗易懂的方式講解出來,深入淺出,功底深厚”。

人類基因組計劃「先行者」張奇?zhèn)ィ何遗c中國生物信息學的二十年往事

在風起云涌的80年代,一個前所未有的機會落在了張奇?zhèn)ド砩稀?/p>

時任全國青年聯(lián)合會主席的胡啟立,計劃在團中央籌辦一個大學部,以便與愈來愈多的國際間大學往來聯(lián)絡。團委書記遠澤清找到張奇?zhèn)?,希望他放棄出國,調到團中央出任第一任大學部部長。在請教了三位中科大的副校長之后,他放棄了學而優(yōu)則仕的坦途。

1981年,張奇?zhèn)ヌど狭孙w往紐約的飛機。他及百名中國學子,即將在歷史上寫下重要一筆。

“恢復高考”后的第一代大學生

1977年,恢復高考。12月10日,570萬考生走進考場,成為書寫中國教育事業(yè)風云變遷的重要一批人。

與過去的招生慣例不同,這是我國教育史上唯一一次冬季高考,也是年齡懸殊最大的一屆考試。

從1966年至1977年,絕大多數(shù)城鎮(zhèn)戶口的初中或高中畢業(yè)生只能“上山下鄉(xiāng)”、“接受貧下中農再教育”,而農村戶口的則回鄉(xiāng)務農。當國家一決定恢復高考,成千上萬的人重新拿起書本,有資格報考的人蜂擁而至,甚至不少父子、母女、兄弟、姐妹、師生攜手參加考試。

三年前,這是被分配村里做知青的張奇?zhèn)プ鰤舳荚谄笈蔚氖虑椤?/p>

1974年,張奇?zhèn)ジ咧挟厴I(yè),被分配到京郊懷柔縣城關公社劉各長村做知青隊長,開始了三年艱苦的插隊生活。和當年廣大熱血青年一樣,他并不能理解為什么上大學的機會被剝奪。粉粹“四人幫”、鄧小平復出后,廣大年輕人盼望已久的高考恢復,插隊知青陸續(xù)招工回城。

時間有限,恢復高考的消息在1977年10月21日才登報,離開考期只有一個多月。從前途著想,張奇?zhèn)プ龅牡谝粋€選擇——留在村里,看場院,利用晚上時間緊張復習。

“身居鄉(xiāng)村小茅屋,心懷四化大目標”,成為張奇?zhèn)サ恼鎸崒懻铡?/p>

在這道跨越“穿草鞋”與“穿皮鞋”的分水嶺上,21歲的張奇?zhèn)ジ叻挚既胫袊茖W技術大學近代力學系。

與應屆學生相比,張奇?zhèn)ツ挲g稍大成熟,選擇什么學校、學什么專業(yè)都有了自己的打算。

他講到,“我的擇校標準只有一條,離開北京,不要在家門口上學,不再受父母管教。至于專業(yè),那個年代錢學森是小學校友、大眾偶像,當時最大的心愿進入飛行器力學專業(yè)學習航天器設計,畢業(yè)后成為一名火箭科學家。”1978年開春,張奇?zhèn)プ鳛楦呖蓟謴秃蟮牡谝淮髮W生來到合肥。

人類基因組計劃「先行者」張奇?zhèn)ィ何遗c中國生物信息學的二十年往事

1978年,中科大77-78屆校學生會干部留影,團委書記遠澤清(桌角),學生會主席張奇?zhèn)ィㄕ咀澜牵?/span>

作為中科院所建設的唯一一所大學,彼時的中科大的重要任務是為我國培養(yǎng)尖端科學研究技術干部。教育恢復后,該校匯集了各所著名研究員任教。

近代力學系機械更是由“中國航天事業(yè)奠基人”錢學森于1958年親自創(chuàng)建,并任首屆系主任。在錢學森的帶領下,同時代精銳全體出動。如吳文俊教“高等數(shù)學”、嚴濟慈、錢臨照教“普通物理”、沈志榮教“固體力學”、龔升教“數(shù)學力學”、吳杭生教“統(tǒng)計力學”、溫元凱教“化學”、方勵之副校長教“天體力學”。

錢學森對學生鼓舞道:“我把科學院的‘大炮’都給你們請來了!”

當時的中科大因為戰(zhàn)備疏散原因搬遷至合肥,盡管遠離中央,但一切工作都是“保住中國的科技苗子”。為了實現(xiàn)行政權力和學術權力的均衡,學校特意成立了一些委員會,比如學術委員會、學位委員會、專業(yè)技術職務評審委員會。此外,不僅老師要民主,學生也被鼓勵通過網(wǎng)絡、調研、座談等形式發(fā)表意見。

原中科大校黨委副書記、副校長李定帶頭定調,“官本位在中科大是沒有市場的,任何創(chuàng)新都源于思想自由。”

這也證明,盡管那時候中國剛剛步入改革開放元年,但中科大學生身上的批判和實踐思維卻讓人記憶猶新。

在張奇?zhèn)ゴ差^,幾本康德或黑格爾的英文原著被翻得起皺。從寢室同學的視角看上去,張奇?zhèn)ケ砻嫔掀届o無波,并且一成不變,“靜靜閱讀,堅持筆記”。

但張奇?zhèn)ワ@然不是一個只顧埋頭看書的人,入學后他當選1977屆校學生會主席,很快便發(fā)起諸多英文學習和文體活動。成立“美國之音”英語900句學習小組、教唱“音樂之聲”電影中的英文插曲、邀請外教每天早晨廣播英語教程。

關于此,中科大77、78級同學的書信和報道中都有記載,飯后在‘四牌樓’外讀英文蔚然成風?!贝送?,張奇?zhèn)ズ臀乃嚥客瑢W組織全校大型交際舞會,邀請安徽醫(yī)學院、安徽大學、藝術學院女生來幫助活躍中科大學生們的業(yè)余生活。張奇?zhèn)サ耐嗤瑢W湯超、徐沖(班里文體委員),因為舞跳得棒,每次都是明星參加者。

人類基因組計劃「先行者」張奇?zhèn)ィ何遗c中國生物信息學的二十年往事

1979年中科大775班留影:徐沖(文體委員),湯超(學習委員),張奇?zhèn)ィ▽W生會主席),張執(zhí)戈(班長)

有意思的是, 作為校學生會主席,張奇?zhèn)ヒ矝]少因為維護學生利益和校領導談判。

印象最深的一次,方毅任中科大副總理兼科學院院長,并接任郭沫若擔任名義校長,在征求學生生活意見的座談會上,張奇?zhèn)プ鳛閷W生代表大量申述學校在伙食、衛(wèi)生、取暖、供水、買火車票難等方面的系列問題,直言學校領導不作為。沒等會議結束,陪同方毅前來的黨委書記楊海波臉色已經(jīng)非常難看。

即便如此,問題該提還是提,學校對頂尖學生的培養(yǎng)絲毫不打折扣。甚至正是由于擔任學生會主席的原因,張奇?zhèn)ズ头絼钪毙iL多次接觸,反而被鼓勵學生干部應帶頭積極參與第一批CUSPEA(李政道先生組織的中美聯(lián)合培養(yǎng)物理類研究生計劃)項目。

人類基因組計劃「先行者」張奇?zhèn)ィ何遗c中國生物信息學的二十年往事

張奇?zhèn)?、湯超、李明,坐火車去北京參加CUSPEA面試時留影

張奇?zhèn)ヌ岬?,那個年代物理科學對年輕人有極大的吸引力,當他準備復習CUSPEA考試后,干脆直接放棄學習本專業(yè)的課程,每天一門心思聽物理課。課后還和準備考試的小組成員們聚在一起辯論,并邀請方勵之校長參加討論。

在這個自發(fā)性的討論小組中,每次都有兩個人慷慨善辯,一個就是張奇?zhèn)サ耐嗤瑢W,2019年當選為中國科學院院士的湯超;另外一個,則是1981年以全國第一名成績通過CUSPEA,現(xiàn)任MIT物理系教授的文小剛。實際上,中學時湯超最喜歡物理,但高考那年中科大和北大的物理系在江西都不招生,只好選擇了中科大力學系。出于對物理的熱愛,大學時湯超自學了不少物理,還常去旁聽物理系的課,直到CUSPEA項目才圓了他的“物理夢”。而這,也讓湯超與張奇?zhèn)ビ辛顺D曷?lián)絡的可能。后來,湯超去往芝加哥大學攻讀統(tǒng)計物理學,師從統(tǒng)計物理大師Leo Kadanoff,張奇?zhèn)トネ_格斯大學,同樣攻讀統(tǒng)計物理,師從當時頗有聲望的Joel L. Lebowitz教授。那時,兩人一個23歲,一個25歲。

物理學在啃老骨頭,生物學遍地是新大陸

1981年,在李政道夫婦的不懈努力下,100多名首屆CUSPEA赴美留學生,成為最先走出國門的知識分子。張奇?zhèn)ブ北济绹鴸|北部的羅格斯大學,是同批學生中離家極遠的一位。

到美國,姑媽建議張奇?zhèn)ビ糜⑽拿諱ichael(Mike)便于當?shù)厝朔Q呼(因為美國人不會發(fā)Qi的音),還成為Joel L. Lebowitz教授的弟子。

就在張奇?zhèn)グ輲煹那耙荒辏?0歲的Lebowitz憑借在非平衡態(tài)統(tǒng)計力學領域的工作,當選為美國國家科學院院士。在美國學術界,這一榮譽僅次于諾獎。此后,Lebowitz包攬了諸多頂級物理學榮譽,包括玻爾茲曼獎章(1992年)、美國物理學會尼科爾森獎章(1994 年)、亨利龐加萊獎(2000 年)、沃爾泰拉獎(2001 年)和馬克斯普朗克獎(2007 年)。

不久前,92歲的Lebowitz還與另外兩位物理學家共同獲得“2022年狄拉克獎”,以表彰他們對經(jīng)典和量子物理系統(tǒng)的統(tǒng)計力學理解所做的開創(chuàng)性、數(shù)學上嚴格的貢獻。

值得一提的是,Lebowitz在統(tǒng)計物理領域有如此大的成就,與他的博士后導師Lars Onsager密不可分。

人類基因組計劃「先行者」張奇?zhèn)ィ何遗c中國生物信息學的二十年往事

Joel L. Lebowitz             Lars Onsager

Lars Onsager是挪威裔的美國化學家,理論物理學家,甚至可視為“20世紀的傳奇人物”,1968年因為對不可逆過程熱力學理論的貢獻獲得了諾貝爾化學獎。

此外,Onsager對統(tǒng)計物理的一個突出貢獻,是他出人意料地求出了二維伊辛模型(-2D-Ising)的嚴格解(通俗可理解為液體氣體臨界狀態(tài)方程的解),為所有復雜系統(tǒng)相變、對稱破缺和重整化群理論奠定了基石。

這件事情讓當時的物理學家們頗為震撼。楊振寧當年曾經(jīng)兩次努力試圖看懂Onsager的方法都未能成功,直至第三次才成功并繼續(xù)計算了二維伊辛模型的磁化率,并和李政道一起研究伊辛模型在復平面的解析性,暗示與黎曼猜想的聯(lián)系。

或許是研究使然,Onsager的諸多成果在當時很少有人能夠理解,他的工作常常被忽視,他所研究的問題和產生的想法往往得不到同事的響應。

曾有人在Onsager故去后唏噓,“Onsager是走在他那個時代20年后的人”。

此事讓張奇?zhèn)ジ杏|頗多,他談到,“這并非發(fā)生在Onsager身上的孤例,另一位統(tǒng)計物理的大師玻爾茲曼又何嘗不是,甚至更悲慘,他選擇了自殺,希望以此結束自己在動理方程和H定理上所遭遇的激烈詰難。”

但正因如此,Onsager的很多經(jīng)典研究被諸多學者接棒。

張奇?zhèn)フ劦?,他在Lebowitz那里一待就是六年,期間,因為Lebowitz的辦公室在數(shù)學系,并擔任應用數(shù)學中心主任,經(jīng)常有著名的數(shù)學物理學家到此做訪問學者,“而大家的共同志趣是將Onsager的相變理論,推廣到非平衡態(tài)系統(tǒng)(即有能量耗散且更復雜的系統(tǒng))中去?!?/p>

對張奇?zhèn)ザ?,非平衡態(tài)統(tǒng)計物理學也是他博士期間的主要課題。

“我的主要工作是用大型超級計算機模擬非平衡態(tài)Ising模型,證明相變仍然存在,且臨界指數(shù)發(fā)生極化?!彼M一步講到,“這一研究主要用于模擬等離子流體系統(tǒng)低溫下的相變圖(通俗來講,在電場作用下穩(wěn)流也會發(fā)生平行的氣-液分離),可應用于廣泛的流體熱力學系統(tǒng)。然而迄今為止,非平衡態(tài)統(tǒng)計力學始終還沒有多少嚴格理論或解析解(嚴格解)?!?/p>

有關讀博的日子,張奇?zhèn)テ届o而又松弛。實際上,這也是他日后教育育人的風格。

在學術上,他師出名門,很快便意識到對科學問題的選擇比解決科學問題本身更重要,且大數(shù)據(jù)模擬是做理論不可或缺的,并爭取獲得了由美國國家科學基金會所頒發(fā)的“普林斯頓超級計算機獎學金”(NSF-Princeton Super-computer Fellowship)。

在生活上,他的妻子攻讀Rutgers統(tǒng)計系碩士學位,婚后兩人住在學校分的一套兩居室的房子里,不久后有了第一個孩子??臻e時間,他還游歷美國,諸如芝加哥一號堆(世界第一反應堆)、西爾斯大廈(當時世界最高的建筑)、普林斯頓-羅格斯大學聯(lián)合舉辦的數(shù)學物理年度度假靜修會,等等。

人類基因組計劃「先行者」張奇?zhèn)ィ何遗c中國生物信息學的二十年往事

1987年收獲季節(jié):兒子剛滿一歲,張奇?zhèn)ィú┡c妻子(碩)、妹妹(碩)同時畢業(yè)

當身邊的一切事情向好時,抓住一切機會留在美國讀書的想法在張奇?zhèn)バ睦镌赂?/p>

多年后,他曾在一篇回憶錄中寫道,“那時我的思想發(fā)生了巨大變化,我開始意識到:本科生的能力評估是知識的吸收程度,而研究生則要是知識的生產。”

此后,張奇?zhèn)ソo自己定的下一個指標:每年至少能發(fā)表一篇論文。

1987年,張奇?zhèn)ケ粚煹暮糜?,紐約大學Courant數(shù)學科學研究所(CMCL)的Jerry Percus(Percus–Yevick 理論的創(chuàng)立者)“點名”做自己的博士后,繼續(xù)統(tǒng)計力學研究。

人類基因組計劃「先行者」張奇?zhèn)ィ何遗c中國生物信息學的二十年往事

1990年,張奇?zhèn)ィㄓ乙唬┰俅我姷絃ebowitz(中),Percus(右二)

紐約大學成立于1831年,是美國唯一一座坐落于紐約心臟地帶的名校。紐約大學的特殊之處,莫過于整所大學并沒有嚴格意義上的校園,教學樓與城市融為一體,隨處可見高高掛起的紫色火炬校標。

早在張奇?zhèn)淼郊~約大學之前,他已經(jīng)得知CMCL素有“數(shù)學神級殿堂”的美譽,而他選擇的應用數(shù)學方向,更是連續(xù)多年在U.S .News排名中位列全美第一。

讓張奇?zhèn)ビ∠笊羁痰囊淮?,是傳說中被譽為“時代的第二位歐拉”的匈牙利“流浪數(shù)學家”保羅·埃爾德什(Paul Erd?s),幾乎每年都在紐約大學克朗所一間毫不起眼的演講大廳里發(fā)表即興演講,“現(xiàn)場人潮擁擠,年輕的聽眾卻熱情洋溢,每次都有一些人聲稱解決某個‘埃爾德什問題’,因此可以獲得埃爾德什親自頒發(fā)的獎金。”

人類基因組計劃「先行者」張奇?zhèn)ィ何遗c中國生物信息學的二十年往事

Paul Erd?s

事實上,埃爾德什是一個博學的人,對歷史了如指掌,但長大后只專注數(shù)學,對任何其他事情毫不關心。國際數(shù)學圈甚至將數(shù)學家劃分為:Erd?s#1(與Erd?s直接合作者,比如Lax),Erd?s#2(與Erd?s#1合作者,比如張奇?zhèn)プ鳛長ax的合作者)。

張奇?zhèn)グ阎饕ν度霐?shù)學和物理領域,在Jerry Percus教授的指導下,進行非均勻流體模型的密度或熵泛函的博士后研究。

他回憶道,“Percus和Lebowitz,Onsager一樣,著迷在嚴格可解的統(tǒng)計力學理論模型,致力于研究該領域最復雜、多年懸而未解的那一類?!?/p>

那種難度有多大?張奇?zhèn)バ稳?,“直到我們師徒倆研究兩年后,才逐漸意識到,嚴格解和可積性在數(shù)學上有很深的聯(lián)系。”第三年,張奇?zhèn)フ业紺MCL前所長Peter Lax教授,希望能夠獲得這位偏微分方程領域權威的指導。

實際上,這樣的“毛遂自薦”張奇?zhèn)ゲ⒉簧僮?。早在他博士第二年的寒假?983冬),就曾一人奔赴美國最負盛名的物理學研究中心--費米實驗室,敲開高能物理Thomas J. Devlin教授辦公室的門,要求在他所領導的國際對撞機高能實驗團隊從事寒假工作。

人類基因組計劃「先行者」張奇?zhèn)ィ何遗c中國生物信息學的二十年往事

1983年寒假,芝加哥費米實驗室,和Prof. Thomas J. Devlin留影

時隔八年后,張奇?zhèn)ト匀槐3种白约赫页雎贰钡呐深^,也讓他的研究終于在博士后最后一年出現(xiàn)轉機。

1991年2月,由他獨立署名的論文發(fā)表在數(shù)學物理界的最高期刊《Communications in Mathematical Physics》。

能登上這一期刊的論文,大多是數(shù)學物理方向的奠基性研究成果,甚至被學界視為摘得菲爾茲獎(因諾貝爾獎未設置數(shù)學獎,故該獎被譽為“數(shù)學界的諾貝爾獎”)的“風向標”。

因此,如果在張奇?zhèn)パ刂鴶?shù)學這條道路走下去,大概率是能夠做出領域更高水準的工作。但事實上,在1990年10月投稿不久,他便決定1991年伊始入職冷泉港實驗室,徹底從一位“數(shù)學物理學者”變成了“生物學者”。

這種橫跨多學科的變化在當時并不少見,可以說,自20世紀40年代以來,物理學家投入生物學研究就已蔚然成風,包括1962年因發(fā)現(xiàn)“DNA雙螺旋結構”而獲得諾貝爾獎的三位科學家——James Watson、Francis Crick和Maurice Wilkins。

此后,這場跨界之舉直接帶來了20世紀生物學研究的爆發(fā)式成長,并催生了“分子生物學”的誕生。然而,當所有人追根溯源尋找變革之初的那根“導火索”,發(fā)現(xiàn)是一本出自物理學家薛定諤(Erwin Schr?dinger),僅僅二百余頁的書刊--《生命是什么》。

但對張奇?zhèn)ザ裕缤瑢芏嗲拜叄ò↗ames Watson)一樣,這本書也打開了他走向生物學研究的大門。很快,越來越多關于未來人類基因組計劃的討論和報道,如潮水般向他襲來。

人類基因組計劃「先行者」張奇?zhèn)ィ何遗c中國生物信息學的二十年往事

1944年出版的《生命是什么?》

薛定諤本人也是受Max Delbrück(物理出身、諾貝爾獎得主、分子生物學之父)工作的啟發(fā)

1988年,張奇?zhèn)ピ凇睹绹茖W家》上看到Charles DeLisi(時任美國能源部健康與環(huán)境研究項目主任)的兩篇文章,一篇是《人類基因組計劃》,另一篇是《Science》上的《分子生物學中的計算機:當前應用和新趨勢》。

其中一句話寫到,“作為生物學的第一個‘大科學’項目,繪制和破譯人類DNA的完整序列,將刺激從計算機技術到理論化學等領域的研究。”

張奇?zhèn)ヮA感一場史無前例的生物醫(yī)學革命正在逼近。

1989年,冷泉港研究所(CSHL)的創(chuàng)始所長James Watson,兼任美國國立衛(wèi)生研究院(NIH)人類基因組研究辦公室的第一任主任。

一年后(1990年),他將原任職于Los Alamos國家實驗室(全球Top10,最早建立Genbank的地方)的數(shù)據(jù)庫專家Tom Marr請到CSHL,組建起冷泉港第一個生物信息學中心和基因組數(shù)據(jù)庫。

此時正值美國,英國發(fā)起的人類基因組計劃開始階段,后來逐步涉及世界上幾乎所有國家,包括發(fā)達國家和發(fā)展中國家,聯(lián)合國的大多數(shù)機構。同時,這一項目也吸引了眾多領域科學家的參與,既有成熟的遺傳學家,物理學家、計算機科學家、也有年輕的實習生或學生。

毫無疑問,這是歷史上第一次當一個科學項目成為全球研究焦點的真實反應。

Tom Marr通過朋友各處招聘頂尖計算人才分析海量基因組數(shù)據(jù)。1991年,張奇?zhèn)?、William Chang(伯克利計算機科學系Eugene Lawler的博士生,后來到百度做創(chuàng)始CTO)、Wentian Li(Columbia University物理系,現(xiàn)就職Feinstein Institutes for Medical Research)一起,作為助研加入冷泉港的生物信息學中心,與Rich Roberts、Adrian Krainer、David Beach、Dick McCombie等諸多分子生物學和基因組學科學家一起工作,開始了自己全新而漫長的生命科學研究的生涯。

“事實上,一個人永遠不知道畢業(yè)后外面的世界會發(fā)生什么,正如羅馬人說的:運氣是當準備遇到機會時發(fā)生的?!睍r隔多年,當張奇?zhèn)セ厥鬃约荷砩系淖兓?,他覺得那是一種意料之外的必然。

人類基因組計劃的一戰(zhàn)成名

如今來看,人類基因組計劃已成為生物科學和人類健康取得重大進展的基石。

但在上世紀八、九十年代,那些尚未被歷史具名的人們,很長時間都在和爭議懷疑、希望憧憬所抗爭。

被譽為“生物信息學之父”的Michael S. Waterman曾回憶那段草莽期,“晚飯后,Walter Gilbert(分子生物學的早期研究者之一,在Watson實驗室從物理轉到分子生物,因發(fā)明化學DNA測序方法拿到諾獎)回到工位,一邊喝著白蘭地,一邊琢磨著怎么才能有精力去做那些無聊而重復的測序工作。他不止一次提出強烈而離譜的建議:我們應該用犯人來做這項工作。

人類基因組計劃「先行者」張奇?zhèn)ィ何遗c中國生物信息學的二十年往事

Walter Gilbert

對所有人來說,這一曠世項目都是一次精神和智識上的轉變。

那時張奇?zhèn)?5歲,對嶄新的生命科學有無法抑制的激動,筆記的一頁中寫道,“還有什么比破解生命密碼和理解我們自己的DNA更有趣?”

但作為一名長期使用數(shù)學語言的學者,如何才能找到有價值的生物學問題,是張奇?zhèn)ッ媾R的首道難題。

根據(jù)分子生物學“中心法則”,生物信息由基因到表型經(jīng)過“DNA-RNA-蛋白質”不同的調控層次。

當時基因組DNA測序步驟,先將DNA隨機打斷,再把這些片段(~150kb)克隆到酵母載體中去,通過雙端測序得到“anchor”DNA序列,利用anchor序列聚類將隨機DNA片段連續(xù)排列得到“Physical Mapping”,最后對最短路徑中每一個DNA克隆片段打斷進行“shotgun sequencing”(霰彈槍測序)和序列組裝。

因此,如何快速定量估計Mapping和sequencing的覆蓋率,是每個基因組中心面臨的一件大事。

張奇?zhèn)セㄙM大量時間,閱讀了經(jīng)典的Lander-Waterman泊松模型(它可以應用于簡單的克隆片段單端測序“Fingerprinting”覆蓋率估計)后,他馬上意識到,雙端測序“anchoring”方法可以大大加快meeting速度和覆蓋率,而且正好可以用上跟導師Percus學到的“Hard-rod Fluid”方法,得到“anchoring mapping”的數(shù)學嚴格解。

果然,計算結果很快得到了證實,而且在簡化為單端“Fingerprinting”和連續(xù)性近似特出情況下,推出Lander-Waterman公式。

這一方法也在冷泉港基因組的“Physical Mapping”實驗中得到了證實,促使他順利將成果發(fā)布于世界四大頂級期刊之一的——PNAS。

張奇?zhèn)ゲ⒉粷M足只做理論計算。他意識到,要在新領域打天下,不能靠以前的導師和知識,必須深入了解生物實驗數(shù)據(jù)的產生過程,還要掌握新領域所用的名詞術語。

張奇?zhèn){借第一個重要工作——PNAS文章,拿到了NIH新成立的基因組所設立的5年“K01基金”,專門獎勵從非生物專業(yè)轉行從事基因組研究的年輕PI(學術帶頭人),使得張奇?zhèn)ゾ哂型耆慕?jīng)濟獨立性。

張奇?zhèn)シQ,90年代初,他能參與德州貝勒醫(yī)學院基因組中心創(chuàng)始人Richard Gibbs舉辦的“高通量基因組測序與分析學習班”,CSHL舉辦的“分子遺傳學、細胞生物學和裂變酵母細胞周期課程”,都是得益于此。

通過親自動手做一個個經(jīng)典實驗,張奇?zhèn)ンw會到一個跨學科研究者,尤其是面向生物學上的原始數(shù)據(jù)時,“首要任務不是深入分析,而是了解數(shù)據(jù)是如何產生的、誤差的主要來源、數(shù)據(jù)的質量和數(shù)量是否充足?!?/p>

人類基因組計劃「先行者」張奇?zhèn)ィ何遗c中國生物信息學的二十年往事

1993年,張奇?zhèn)ィㄗ笠唬﹨⒓覥SHL酵母分子遺傳實驗集訓課程

作為這些課程中唯一一個華人面孔,張奇?zhèn)サ倪@份勤奮相繼獲得了同事的欣賞和信任。而這其中的一個重要人物,就是被稱為“斷裂基因與RNA剪切發(fā)現(xiàn)鼻祖”的英國人Rich Roberts。Roberts是最早提倡生物信息研究的人之一,由他主編的NAR雜志每年都有生物信息數(shù)據(jù)庫和算法的特刊,1993年,在他剛剛離開CSHL就拿到了“發(fā)現(xiàn)RNA剪接”的諾獎,還因此被英國女王親封為英國皇家爵士,入選英國皇家科學院院士。

人類基因組計劃「先行者」張奇?zhèn)ィ何遗c中國生物信息學的二十年往事

Rich Roberts

說起與Rich Roberts的緣分,張奇?zhèn)シQ,從自己一進CSHL,就經(jīng)常跑到隔壁Rich Roberts辦公室請教各種問題。因此,一些經(jīng)典研究常常在兩人一問一答間誕生:

當張奇?zhèn)柕?,“拿到基因組序列最重要的問題是什么”,Rich答,“找基因最難點”,馬上Rich又補上一句,“正確識別外顯子-內含子(exon-intron)”。

就這樣,張奇?zhèn)プ哌M了這一課題。1996年,這一研究成果投到PNAS個人署名的工作MZEF(Michael Zhang Exon Finder)。

后來大量應用證明,MZEF在分析難度大(低GC)的第21號染色體、特別是著名的老年癡呆相關的超長基因APP(~300kb, ~20exons)發(fā)揮了重大作用。此外,這種Exon-centric方法正好與全基因gene-centric方法,如在MZEF發(fā)布的三個月后,Samuel Karlin(國際頂尖應用概率學家)的學生Burge發(fā)表的著名的HMM方法Genscan,可以與之完美互補。

實際上,張奇?zhèn)ゲ⒉皇瞧渲凶罹呱飳W背景的人,DNA的功能原件預測(即外顯子-內含子研究)也只是HGP計劃中的最早期工作,但他在數(shù)次合作中全身心投入,屢次顯示出自己的數(shù)學物理才能。到1996年,張奇?zhèn){借MEZF工作獲得了第一個R01獎,升任助理教授,成立獨立的計算生物學實驗室,此后便開始大量參與人類基因結構預測工作。

張奇?zhèn)ブ匦率崂磉^去研究,首次將人類全部外顯子系統(tǒng)劃分為16類,意外發(fā)現(xiàn)新一類“dual splice-site”(雙重剪接位點)可以形成“零長度外顯子”,名聲漸大并迅速被諸多教授點名合作。

他與Adrian Krainer、Xiangdong Fu、Robert Darnell、Josh Huang等實驗室,在RNA剪接調控和RNA蛋白結合方面建立起密切而長期的合作關系,便從那時開始。

人類基因組計劃「先行者」張奇?zhèn)ィ何遗c中國生物信息學的二十年往事

2001年,張奇?zhèn)ズ虯ravinda Chakravarti(現(xiàn)任紐約大學人類遺傳學與基因組學中心主任,和張奇?zhèn)ヒ黄鹋e辦冷泉港第一屆計算生物學國際會議);張奇?zhèn)ズ?B. Stillman(冷泉港研究所所長)

諸多合作者不吝贊賞,“張奇?zhèn)ι窠?jīng)細胞重要因子REST/NRSF 、Pumilio、Rbfox調控網(wǎng)絡的研究以堪稱經(jīng)典。

他開發(fā)的ESEfinder、SpliceTrap、Olego、HITS-CLIP分析方法等RNA剪接計算分析工具,一直為全世界生信領域多數(shù)實驗室或生物制藥公司所廣泛應用。”

直到最近,張奇?zhèn)プC明,單細胞RNA-seq可以通過精細計算分出不同poly-A尾巴(last-exon)的mRNA isoform,并以此劃分不同功能的神經(jīng)元細胞??梢哉f,RNA分析是所有分子生物實驗室的“bread&butter”(謀生之道),跟隨不斷更新的實驗技術開發(fā)新的計算方法,也是張奇?zhèn)嶒炇医?0年沒有停止的工作。

進入新世紀以來,美國社會環(huán)境不斷變化,從2001年“9.11”恐怖襲擊到2008年金融海嘯,張奇?zhèn)ヒ彩艿讲簧儆绊憽?/p>

他稱,一邊是妻子早出晚歸在世貿中心工作,長輩在紐約老人院床位緊張,一邊是他自己,需要抽出越來越多的時間去申請不斷緊縮的政府基金(CSHL100%靠基金)。

2009年,正好有機會,德州政府要加大癌癥研究投資,同時德克薩斯大學達拉斯分校(UT Dallas)邀請張奇?zhèn)トプ龅谝蝗蜗到y(tǒng)生物學資深講席教授,并創(chuàng)建系統(tǒng)生物學中心。此事籌劃一年,等兩個孩子都上了大學,2010年張奇?zhèn)グ讶疫w到達拉斯,開啟了教書育人的新篇章。

雖然重建實驗室和教書對科研有所影響,但張奇?zhèn)ジ吓笥讶伪〞r任UCSD表觀遺傳聯(lián)合研究中心主任)的合作從未停止。他們在國際上率先發(fā)表了染色體結構關鍵因子CTCF在人體細胞基因組上所有的結合位點、TFBS motif,等張奇?zhèn)グ岬経TD后,兩人將Roadmap Epigenome Project(表觀基因組路線圖項目)的合作項目圓滿完成。

后來,任兵繼續(xù)參加美國的4D核糖體(4D Nucleome)計劃,而作為客座教授的張奇?zhèn)マD而指導清華基因組研究團隊,開發(fā)了一系列染色體3D結構實驗技術的算法,并和阮一駿(Jackson Lab,現(xiàn)在浙江大學)合力推動中國3D基因組研究和人才培養(yǎng)。

這些年來,在開展生物學研究方面,張奇?zhèn)サ难芯款I域隨著HGP計劃深入和拓展而逐漸發(fā)展,包括從基因到啟動子到增強子等順式調控元件,從轉錄到RNA剪接等轉錄后調控,從表觀遺傳學到4D基因組,從單細胞組學到組織器官時空多組學。最近,為了能夠更好的實現(xiàn)從分子--細胞--組織--器官--個體系統(tǒng)生物學的跨越,張奇?zhèn)ビ珠_始了“早期胚胎發(fā)育中細胞-細胞相互作用網(wǎng)絡”的研究。

科學無止境,他那活到老學到老的精神給年輕一代樹立了典范。而對于張奇?zhèn)ケ救硕?,他則認為,“生物學問題一環(huán)扣一環(huán)、缺一不可。在生物信息領域,新方法層出不窮,如同要瞄準不斷變化運動中的目標,難度要比解百年不變的數(shù)學難題大得多?!?/p>

也正因如此,使得他更加期盼 Walter Gilbert(哈佛大學教授,前面提到的)教授在1991年的預言早日到來:新的研究范式正在興起,當所有基因都被找到(被保存在數(shù)據(jù)庫中),理論研究將是生物學研究的起點。

2001年,第一張人類基因組草圖發(fā)表,預言成真。但如果站在科學的角度上審視,這一成功并非盡善盡美。哈佛大學John Quackenbush曾在2021年指出,“二十年前兩個人類基因組幾乎同時發(fā)表,這里面既有科學和技術的勝利,也有政治妥協(xié)的成分?!輬D’的概念非常模糊,導致了很多怪事——2001年宣布草圖完成,2006年宣布最長的1號染色體測序完成,而其它染色體完成時間還要更晚,比如X染色體在2020年才宣布完成,Y染色體至今沒有消息。

2021年,一份完整的人類基因組才終于發(fā)表在bioRxiv上(文章于2022年發(fā)表于Science)。

目前關于基因組還有很多問題有待回答,比如人類基因的數(shù)量、基因的定義等等,我們目前得到的任何版本的基因組都仍然是不完美、不精確的?!?/p>

在基因組計劃后的二十余年里,大數(shù)據(jù)的產生和計算效率的提升,促使無數(shù)學者為完善人類基因組,解碼它的遺傳發(fā)育功能以及治病的機理而持續(xù)努力。

張奇?zhèn)ブv到, “因為無論如何,HGP已經(jīng)引領了一條不歸路,在我們看到真正的光明之前,還有很長的路要走?!?br/>

中國生物信息學的20年往事

張奇?zhèn)W術生涯的另一面,扎在了中國。

1999年,湯超受李政道委托,開始籌建北大定量生物學中心的前身——北大理論生物學中心。最初湯超每年寒暑假回來兩三個月,后來有了北大來魯華、佘振蘇、歐陽頎等教授的幫助,2001年中心正式成立,張奇?zhèn)ケ惚谎垞螌W術委員會顧問。

人類基因組計劃「先行者」張奇?zhèn)ィ何遗c中國生物信息學的二十年往事

2002年,李政道理論物理中心樓前:李振勤(中科大1981第一批CUSPEA第一名),來魯華、張奇?zhèn)?、佘振蘇

那時張奇?zhèn)ヒ呀?jīng)離故土二十年了,參與培育和扶持一批年輕的國內生物信息學研究人員,成為他的一大心愿。

他意識到,加大與中國學者交流,將是最好的“突破口”。

2000年,張奇?zhèn)谀享nPohang生物技術大會發(fā)言,結識了代表上海中國南方基因組中心發(fā)言的陳竺,并相約兩年后在上海見面。那一年,陳竺被任命為中科院副院長,從上海轉戰(zhàn)到北京,主管生物技術局和國際合作局。對于這次結識,陳竺高興,張奇?zhèn)バ老?,一個想推動中國生信與國際接軌,一個想為國家學科發(fā)展做些事情。

2002年4月,按約定張奇?zhèn)トド虾⒓佑申愺弥鞒值摹?002年全球人類基因組大會(HGM2002)”,會后陳竺還委派趙國屏(時任中科院上海生命科學研究院副院長)帶其參觀了南方基因組中心、蔣華良的藥物所、上海交大賀林遺傳病實驗室,以及李亦學組建的上海生物信息技術研究中心(下稱“中心”)。

值得一提的是,自2000年李亦學回國之后,一手創(chuàng)建了中科院上海生命科學研究院生物信息學中心。后來,他繼續(xù)整合上海生物信息學主要研究力量,有,中國科學院上海生命科學研究院、國家人類基因組南方研究中心、復旦大學、上海交通大學、上海醫(yī)藥工業(yè)研究院等11家科研單位,最終才在2002年組建為中心。

張奇?zhèn)バ纳磁?,“短短幾年,中心已成為國家生物信息技術研究的支撐基地。”而這也再次印證2003年徐鷹教授回國創(chuàng)辦IBW(國際生物信息學研討會),首屆會議定在上海實屬良策。

實際上,那時陳竺心里還有一個大膽的想法,希望將德國馬普學會(Max-Planck-Gesellschaft,MPG)引入上海。

作為長期盤踞在世界科研機構前三甲的科研巨佬,馬普學會在體量和結構上可以對標中國的中科院。而陳竺的打算正是強強聯(lián)合,成立“中國科學院-馬普學會計算生物學伙伴研究所”(下稱“馬普所”)。

人類基因組計劃「先行者」張奇?zhèn)ィ何遗c中國生物信息學的二十年往事

選第一屆馬普所所長時留影:Dr. Andreas Dress (前排右二),陳竺(前排右四)

2004年,陳竺和裴鋼(時任上海生科院院長,后擔任同濟校長)試圖招募張奇?zhèn)窝芯克魅沃?,盡管盛情難卻,但張奇?zhèn)タ紤]到金力(Cavalli-Sforza博士后)已經(jīng)是復旦生命科學學院院長,便將金力推向臺前。

這也讓金力后來總跟張奇?zhèn)ラ_玩笑,“不應讓我頂替你的位置?!?/p>

但張奇?zhèn)ズ秃掳亓忠黄鹦廊唤邮芰丝茖W顧問委員會成員,后來正是他大力舉薦韓敬東(博士后師從哈佛Dana Farber)擔任馬普所第二任輪值所長(現(xiàn)任北大教授)。

為何張奇?zhèn)]有選擇留在上海?

陳潤生院士對《雷峰網(wǎng)》講到,“當時張奇?zhèn)ハ胍貒黾媛毥淌?,北大生命學院院長周曾銓已到冷泉港和他談好,而他家人的清華出身則希望他同??妥!?/p>

后來的事情便是孫之榮、程京、饒子和得到了陳潤生的消息,三位教授迅速出面,說服張奇?zhèn)シ艞壉贝?。再后來,擔心張奇?zhèn)フ猩粔?,陳潤生還將他在華大基因培養(yǎng)的最好博士生送去冷泉港。

人類基因組計劃「先行者」張奇?zhèn)ィ何遗c中國生物信息學的二十年往事


陳潤生、孫之榮、程京、饒子和

2008年5月,在張奇?zhèn)?,張學工(清華自動化系教授),李衍達院士(清華自動化系前系主任)三位學者的籌措下,我國第一個生物信息學與系統(tǒng)生物學講席教授組發(fā)展開來。

在此期間,張奇?zhèn)ミ^去廣濟人脈的長處派上用場,生物信息學的奠基人之一的Michael S. Waterman受聘為講席教授組首席科學家,姜濤、王永雄、劉軍、孫豐珠(博士師從Waterman)等多位海外杰出學者紛至沓來。

2010年,張奇?zhèn)ト肼毭绹喜康牡驴怂_斯大學達拉斯分校。他說到,“正好有個契機,他們找到我頭上,到州立學校無需一天到晚寫基金申請標書,浪費時間,又能有機會為清華做些事情?!?/p>

回首看,21世紀以來我國的生物信息學研究快速發(fā)展、人才大量涌現(xiàn),離不開老一輩學者堅守陣地,也離不開一批批留洋海外的年輕一輩反哺。對于張奇?zhèn)ザ?,他總是感慨選擇不易,堅定走出一條自己風格的道路更是難得。

實際上,在他通過CUSPEA考試準備出國留學前,還有一段小插曲。

1979年,張奇?zhèn)⒓又腥A全國學聯(lián)第十八次代表大會,和北大學生會主席袁純清(一年后李克強接任)、清華學生會主席孫建京(一年后林炎志接任)、伍紹祖等人共同當選第十八屆全國學聯(lián)副主席,受到華國鋒、鄧小平等領導接見。江湖傳說,清北中科大這樣的學生會主席是正廳級待遇,因為次年總有機會出任副部級單位全國青聯(lián)、學聯(lián)的職務。

在風起云涌的1980年代,這批學子思想積極活躍,對中國的前途命運有更多憂慮,確實有很多人藉此通往政壇,走向仕途,諸如袁純清、林炎志、朱善璐、劉能元、陸昊、趙辰昕、陳光浩、周長奎等多位優(yōu)秀才??;或是商海浮沉,誕生了“明天系”資本帝國掌門人肖建華、北大光華董事長李明春和周燕軍等人物。

當時,一個前所未有的機會落在了張奇?zhèn)ド砩稀?/p>

張奇?zhèn)シQ,“在獲得CUSPEA錄取通知書不久,我準備去上海外語學院參加集訓英語,團委書記遠澤清找到我,帶來了一個重要消息:時任全國青年聯(lián)合會主席的胡啟立,計劃在團中央籌辦一個大學部,以便與愈來愈多的國際間大學往來聯(lián)絡,希望我能跟家人商量,放棄出國,調到團中央出任第一任大學部部長。”

這一機會難得,張奇?zhèn)コ伺c家人商量,還親自跑到三位中科大副校長家中請教。楊承宗(化學家,也是遠澤清的老丈人)、錢臨照、方勵之的一番鼓勵,最終促使張奇?zhèn)P棄“學而優(yōu)則仕”,抓住改革開放的良機,走出國門,堅定走科研之路。

人類基因組計劃「先行者」張奇?zhèn)ィ何遗c中國生物信息學的二十年往事


多年后,李政道與CUSPEA學生的一次聚會,張奇?zhèn)ィㄓ乙唬?/span>

時光荏苒,往事已成故事。張奇?zhèn)フ劦剑说囊簧怯泻芏鄼C遇和選擇的,能夠不受名利地位誘惑,如同“浮士德抵制魔鬼的誘惑”,卻是很不容易的。

1981年,在飛往紐約的飛機上,張奇?zhèn)ゼ鞍倜袊鴮W子,即將在世界歷史上寫下重要一筆。

作者注:

1993年,中國參與人類基因組計劃,生物信息學科迎來大爆發(fā)。在近三十年的時間里,一大批生物、化學、物理、計算等專業(yè)的學者,前仆后繼加入到學科的產研建設,那是一個靈感迸發(fā)、情誼綿長的年代,也是一個走出質疑、迷茫的年代。

目前,雷峰網(wǎng)(公眾號:雷峰網(wǎng))啟動《生物信息學的三十年往事》專題,已陸續(xù)推出徐鷹、潘毅、周耀旗、許東、姜濤、張奇?zhèn)サ葘W者的人物故事,記錄光輝歲月,以照后人之路。

關于生物信息學的更多故事,歡迎與本文作者吳彤交流,微信號:icedaguniang

人類基因組計劃「先行者」張奇?zhèn)ィ何遗c中國生物信息學的二十年往事

雷峰網(wǎng)雷峰網(wǎng)

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉載。詳情見轉載須知。

分享:
相關文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設置密碼以方便用郵箱登錄
立即設置 以后再說