丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
生物醫(yī)藥 正文
發(fā)私信給任平
發(fā)送

0

許東的「AI生命科學」進化史:從90年代泡沫繁榮,到深度學習復興

本文作者: 任平 2022-09-08 14:41
導語:人生中最大的幸事,莫過于在富于創(chuàng)造力的壯年發(fā)現(xiàn)了自己的使命。

命運攸關的時刻充滿戲劇性,在個人的一生及歷史的進程中都是難得出現(xiàn)的;這種時刻可能集中在某一天、某一時,甚至常常發(fā)生在某一分鐘,但它們的決定性影響超越時間。對于許東來說,這一分鐘,可能在志愿填報單上、在出國的飛機上、在1995年的那一場會議上。

許東在密蘇里大學哥倫比亞分校生活了二十年。

2003年,38歲的許東來到該校計算機科學系,開始了他第一份教職。這也是他近二十年來唯一一份教職。許東在這所學校安了家,做起科研,2007年成為了該校最年輕的系主任。

這所學校坐落在美國密蘇里州的第四大城市哥倫比亞。因為所處土地廣闊,農業(yè)發(fā)達,被稱為美國中部大農村,得名“哥村”。

許東總說,自己是被這座小城留住,研究了半輩子的生物信息學。

這些年里,許東主動投入到跨學科研究風潮中,先后為蛋白質結構預測、單細胞數(shù)據(jù)分析、DNA序列、蛋白序列分析、系統(tǒng)生物學建模、圖像文本分析、中醫(yī)舌相、分子動力學模擬等,做出了每個時期好用的算法工具。

2001年,許東憑借蛋白質結構預測工具——Prospect,與好友徐鷹(現(xiàn)任佐治亞大學校董事會教授)共同獲得《R&D》100獎。該獎項由《R&D Magazine》1963年創(chuàng)設,被國際科技領域譽為科技界的“創(chuàng)新奧斯卡獎”。

此后,許東又在2015年和2020年接連當選美國科學促進會(AAAS)會士和美國醫(yī)學與生物工程院(AIMBE)會士,并成為了密蘇里大學的校董事會教授。

許東的「AI生命科學」進化史:從90年代泡沫繁榮,到深度學習復興

這些高光時刻,映射了他人生中的黃金三十年。

二十五年前,他趟過生物信息學泡沫期;十五年前,他成為密大最年輕的系主任;十年前,他先于大多數(shù)人換到深度學習賽道。

在那些時刻,許東大放異彩。正如茨威格在《人類群星閃耀時》的第一章“巴爾博亞發(fā)現(xiàn)太平洋” 中寫到:人生中最大的幸事,莫過于在富于創(chuàng)造力的壯年發(fā)現(xiàn)了自己的使命。

18歲的決定:寧選北大,不去清華

“教育是一個很特殊的行業(yè),很難高質量地批量生產,培養(yǎng)一個人效率低、成才的確定性也不高?!?/p>

站在父母的高起點上,許東對這句話深有體會。

新中國成立后四五年里,許東父母考入清華,就讀于電子工程系。

隨后,父親留在了本校,在工程力學系(現(xiàn)航天航空學院)任教,并于1981年在國家支持下赴丹麥讀博,成為了中國最早出國研究流體力學的一批人。母親則去了北京燈泡二廠、燈泡總廠擔任廠長,并在八九十年代擔任了十多年的北京電光源研究所所長。

這是一個標準的知識分子家庭,許東稱,雖算不上大戶人家,倒有機會從小接觸到教授級的叔叔阿姨。

回憶起來,許東覺得那是一種無差別的人際交往,”絕想不到其中一個人就是某一領域的領軍人物?!?/p>

但許東沒去清華,而是選擇了北大。

相比于清華的工程師氣息,北大要更加自由,尤其是北大沒有校訓,沒有校歌,甚至北大校園中的標志性湖泊,也被錢穆先生帶頭喚為“未名湖”。

在許東看來,這代表了北大上上下下的一種求學態(tài)度,要敢于不合群,不聽話、既要批判,也要兼容,做中國維新圖強的“先鋒者”。

1983年,十八歲的許東走進了北大物理系。

許東的「AI生命科學」進化史:從90年代泡沫繁榮,到深度學習復興

這是在中國高校中設立的第一個物理系。許東入校時,北大物理系已經走過70年歲月,期間還誕生了四個首創(chuàng)學科,如我國第一個原子能人才培養(yǎng)基地——物理研究室、我國第一個半導體專業(yè)、我國第一個地球物理專業(yè)、我國第一個計算機系微電子專業(yè)。

而與北大頗有淵源的西南聯(lián)合大學物理系,也走出了李政道、楊振寧、朱光亞、鄧稼先、黃昆等一大批杰出科學家。

這是許東第一次感受到國內學科的昂揚姿態(tài),“原來中國人在物理方面做得很好,我也躍躍欲試?!?/p>

一進大學,許東被各種“奇奇怪怪”的研究吸引住。大一上學期快要結束時,他無意中看到學生宿舍里貼著一個告示——“自然之謎研究會,研究氣功、特異功能等人體科學現(xiàn)象”。許東對這些神奇現(xiàn)象特別好奇,加上告示中寫到能夠去北京師范學院(現(xiàn)首都師范大學)做研究特異功能的實驗,當即報上了名。

大一寒假,許東都泡在了實驗室。盡管沒有研究出什么名堂,但許東卻產生了非常多的奇思妙想,還寫成了一份挺長的實驗報告,全文論證人體特異現(xiàn)象的真實性和其中的問題。

許東的「AI生命科學」進化史:從90年代泡沫繁榮,到深度學習復興

1983年寒假,許東(前排左二)在北京師范學院和部分研究人員及特異功能人士合影

為此,許東還擔任了一屆的自然之謎研究會會長。

80年代前后,人體特異現(xiàn)象研究方興未艾,時任國防科委科技委副主任的錢學森和主任張震寰兩位,都是特異功能現(xiàn)象的支持者與參與者。

尤其是錢學森,他認為,人還沒有能動地去發(fā)掘人體的潛在能力,今后應該用現(xiàn)代科學技術進行研究,對中醫(yī)理論、氣功、特異功能等,都要科學地進行研究。

那段時間,各種人體特異功能研究會成立,從科學界到醫(yī)學界,一場關于人類生命現(xiàn)象的研究開始風靡全國。

北大加入了這場研究中,由許東所在的協(xié)會協(xié)助承辦了人體特異功能的表演,錢學森到場觀看。

這之后,許東對生命現(xiàn)象的研究熱情更加高漲,他對很多同學講到,“我跟錢學森握過手了,雖然沒說過話?!?/p>

許東的「AI生命科學」進化史:從90年代泡沫繁榮,到深度學習復興

1983年錢學森成立人體特異功能研究所,與90年代的氣功熱

但許東沒想到,到了90年代,“氣功熱”出現(xiàn)神論傾向,冒出了氣功治病、滅火、攔截核武器等言論,學術研究也受此波及,被視為偽科學研究。1994年,國家下達《關于加強科學普及工作的若干意見》,一部分嘗試用現(xiàn)代科學做出解釋的科學家就此偃旗息鼓。

給許東講授固體物理課的嚴守勝教授,也曾勸大家不要研究這個方向。他講到,布賴恩·約瑟夫森三十歲出頭就拿了物理學諾貝爾獎,之后專注于超自然神秘現(xiàn)象研究,卻一生沒有實質性的進展。

這也讓許東決定留在北大繼續(xù)做物理研究。他被保送碩士研究生,選擇了固體物理方向,師從磁學研究的導師周文生教授。

在周教授的指導下,許東將研究放在了固體物理中一個基礎問題——自旋玻璃。

簡單來說,自旋玻璃理論研究的是物理學中的復雜系統(tǒng),對于理解無序自旋相互作用系統(tǒng)發(fā)揮了非常重要的作用,近年來該理論框架為約束滿足、組合優(yōu)化、統(tǒng)計推斷、神經網絡等理論研究提供了眾多啟發(fā)。

但在當時,自旋玻璃更多體現(xiàn)在陶瓷、高溫超導等應用領域,需要用到大量的實驗研究,記錄不同陶瓷所用的配方,測量陶瓷的屬性。

許東將其描述為“工匠型”研究,每天就是燒爐子、測材料屬性。他發(fā)現(xiàn)自己的動手能力不強,實驗做得不好,還把老師的儀器弄壞了。

回憶起那段經歷,許東稱,“我最大的實驗結論,就是我不適合做實驗?!?/p>

既然實驗不成功,許東也不再硬著頭皮做,他開始想著兌現(xiàn)自己的理論天賦,經常在碩士論文中順著幾個實驗結果自我發(fā)揮,寫出十幾張紙的理論猜想。

在導師看來,這些猜想毫無根據(jù),多次提醒許東不需要寫進畢業(yè)論文,許東就在草稿上繼續(xù)寫。

現(xiàn)在看來,盡管那些猜想稱不上科研,甚至沒什么價值,卻在無意中鍛煉了許東舉一反三、觸類旁通的能力。這是一種天賦,冥冥之中決定了他將終生與理論研究打交道。

一生中最重要的導師

許東博士就讀于美國的伊利諾伊大學厄巴納—香檳分校(University of Illinois at Urbana-Champaign,UIUC),但前面還有段小序曲。

1990年,許東碩士畢業(yè)后,來到美國紐約市立大學皇后學院讀起了物理博士。但因為當時女朋友(現(xiàn)在的妻子)讀研選在了UIUC,許東果斷轉校。次年5月,許東向西出發(fā),跨越千里與愛人會和。

他與妻子在北大結識,妻子就讀于化學系,比他小三屆,兩人從相戀時就約定去更遠的地方,從北大到UIUC,兩所學校成了二人從相識到婚姻的重要見證。

這段經歷有一位見證人——許東的博士導師Klaus J. Schulten教授,也是許東一生中最重要的一位導師。

許東的「AI生命科學」進化史:從90年代泡沫繁榮,到深度學習復興

Klaus J. Schulten教授

Klaus是一位理論物理學家、也是一位計算生物學家,博士師從諾貝獎獲得者Martin Karplus(從學術脈絡上看,現(xiàn)在深圳灣實驗室周耀旗的博士后導師也是Martin Karplus,與許東一脈相承)。

早在1978年,Klaus就較為完整地描述了磁感應和動物遷徙的Radical Pair假說(也稱為化學指南針假說),此后便投身到生物學領域。

1991年許東加入時,Klaus實驗室已經非?;钴S,他本人是UIUC里最搶手的導師之一。許東的導師首選是Klaus。

但進入Klaus組里,許東覺得多少沾了些運氣。

UIUC有一個重要的導師雙選機制,學生可以和許多導師單獨見面,由學生提交5個導師的排序志愿,導師也排序選擇5個和他(她)見過面的學生交到系里,由系里協(xié)調分配。

所以,這份實力和運氣兼具的選擇機制總會伴隨意外和驚喜。

談到被選的原因,許東猜測,或許是自己初到UIUC時一次性通過了博士資格考試,一下子讓Klaus注意到了。但其他同學就沒有這么幸運了,很多美國同學在這場入學考試中表現(xiàn)吃力,或者沒有參加,兩次補考也有一半的博士生沒有通過考試,被降為了碩士。

時至今日,談起選擇導師時的經歷,許東還深有感慨,“我們是選擇了彼此,夸張點說,師生關系對職業(yè)的發(fā)展可能不亞于配偶關系?!?/p>

許東的「AI生命科學」進化史:從90年代泡沫繁榮,到深度學習復興

許東博士畢業(yè)時和Klaus J. Schulten教授的合影

進了Klaus組之后,許東在校內的貝克曼研究所(Beckman Institute)做研究。

這是伊利諾伊大學里一棟專門為跨學科研究而建設的大樓,主要集中在工程和物理科學、生命和行為科學方面的研究,超越了當時眾多傳統(tǒng)大學在組織和結構方面所存在的眾多內在局限性,一切服務于跨學科交流。

在那里,許東第一次同時運用起“生物、計算機、物理”三門學科的知識。

對許東來講,最難的還是補上生物的背景。組里的同學一起成立了“學習小組”,一起讀沃森等人寫的《細胞分子生物學》一書,每人輪流負責主講一章,相互交流學習筆記。只用了半年,許東連同組的同學,都補上了生物知識。

從事交叉學科研究仍不輕松。那個年代的學術界有一種說法:只有在本領域做得不好的人,或者在本領域做到了天花板,才會轉向交叉學科。90年代初,生物信息學甚至不能被看作一門學科,Klaus所領導的小組對外也是自稱為“理論生物物理研究組”。

許東談到,他所認識的物理系同學中,轉向生物物理的人并不多,甚至有人不理解許東的轉行。但許東相信自己的選擇,導師Klaus就是一顆定心丸。他也曾在父親多年的流體力學研究中,感受過交叉學科的魅力。

對于走上生物信息學這條路,他只做出過一次解釋,“就像在計算機上設計波音777飛機,可以先根據(jù)數(shù)據(jù)建立模型并預測結果,等確定設計無誤,再實際建構飛機,既省力、省時,也省錢。

同樣的道理,生物信息學剛剛起步,主要結合生物、計算機、統(tǒng)計三門學科的知識,發(fā)展計算軟件,用來分析生物數(shù)據(jù)、建立模型、預測結果,從而輔助設計藥物,或者改良農作物。”

這種說法遭到嘲笑,許東確實遇到了一些問題。

他研究的是當時最火的蛋白質結構的分子動力學問題,簡而言之就是研究蛋白質怎么運動。由于蛋白質的生物功能與結構動力學特征緊密相關,并且其研究對象為蛋白質分子個體,所以也是一門與分子生物學互補的研究。

但在90年代初,計算機內存容量太小,用計算機模擬分子運動常常受限,算力局限導致能做的事情也不是特別多。

許東稱,“當時最好的機器才一個G,學生們都要搶著用,這與現(xiàn)在用云平臺模擬出來的效果不能相提并論?!?/p>

在那個環(huán)境下,但他與導師做的第一個工作——《光合反應中心蛋白質運動與電子轉移的耦合:在自旋玻色子模型框架下研究低溫行為》,發(fā)揮理論研究優(yōu)勢。

許東借鑒了系里另一位教授安東尼·萊格特(2003年諾貝爾物理獎得主)的自旋波色子理論,在量子力學的知識體系下做出了一個新的理論模型,細致解釋了光和反應中電子在蛋白質里電子傳遞的現(xiàn)象,在領域內得到了高度認可。

直到許東畢業(yè)十幾年后,Klaus還會經常提到許東的這項研究。此后,在與導師的合作中,許東接連發(fā)出了9篇論文,其中6篇發(fā)布于1995年,與當時最火的分子動力學、活細胞中超分子系統(tǒng)等領域相關。

回憶起那段時光,許東稱,在學術上對他影響最大的人就是Klaus,在遇到Klaus之前,他的理論天賦被隱匿以來,甚至不能寫在論文中,他一度質疑什么才算是真正的科研。直到遇到Klaus,許東才有種找到了科研大門的感覺。

許東至今對一個場景印象深刻:半夜兩點鐘,Klaus為了一篇論文把許東叫到家里改稿,尖銳的點評與詳細的建議劈頭蓋臉般地過來,一直改到他滿意為止。

“我就是在批評中成長起來的“,許東稱,”世界上有一些領域可以自無師自通,但在科研上,我還沒有見過誰是自學成才的,每一個真正會做科研的人,至少是被另一個科研高手口傳心授、精心調教,才能入得了科研的門?!?/p>

Klaus屬于那種“嚴父型”的教授,但他對學生卻不乏真誠的關心和驕傲。在他的實驗室里有一面特殊的墻,上面掛滿了學生們的論文封面,一一做了裝裱。

許東的「AI生命科學」進化史:從90年代泡沫繁榮,到深度學習復興

在許東的印象中,Klaus每天只睡4個小時,從不鍛煉、從不養(yǎng)生,卻能每周高效率地工作上百小時。

2016年,Klaus去世。許東回到那所實驗室,對墻感嘆,“或許我一生都到不了Klaus那樣的高度,他完全是用生命做科研?!?/p>

葬禮那天,在西式的吊唁中,歡聲笑語與掩面拭淚同步進行。Klaus在遺言中留給大家的最后一句話——“我不喜歡你們這樣消沉,打起精神,還是像過去那樣想起我?!?/p>

回顧起與導師相處的那四年,許東說到,Klaus是最感染自己的是他對自然與生命之美的洞察與摯愛。Klaus把自己大分子模擬的工作當成“分子顯微鏡”。他告訴朋友,生命之大美不僅僅在春天歡快的小鹿身上和秋天斑斕的落葉里面,也在我們肉眼看不到的生物大分子中間。他雖然不在了,他的學生們會繼續(xù)他的事業(yè),去探索更多的生命之美。

直到現(xiàn)在,許東也堅信,Klaus是他人生中最重要的一位老師。

90年代的生信研究“寒武紀”

1990年10月,經美國國會批準的人類基因組計劃正式啟動。

這項大約耗資30億美元來測定30億個堿基對的國際計劃,從美國迅速席卷到英、日、法、德、中等國家。

與此同時,這項研究也從多國政府間的合作小組,分散到諸多私營性質的基因研究機構中。

其中,最具代表性的就是文特爾(J. C. Venter)創(chuàng)立了塞萊拉基因公司,并用1991年提出的“散彈法”新型測序技術,多次走到“國際人類基因計劃”的前面。

一場公私之間的科研賽跑,在三十年前拉開帷幕。

1994年,由美國科學家約翰·莫爾特(John Moult)發(fā)起的全球蛋白質結構預測競賽(CASP),召集科研界所有人士,開始了真正的較量。

這個兩年舉辦一次的競賽,一亮相便吸引了計算機科學、生物物理學等不同領域的專家參與到蛋白質三維結構預測中。在那個年代,基因測序和蛋白質結構預測如火如荼,生物信息學(Bioinformatics)也成為了一門正式學科。

許東的「AI生命科學」進化史:從90年代泡沫繁榮,到深度學習復興

貝克曼研究所大樓

那是波詭云譎的90年代,一段即將進入生命科學時代的“寒武紀大爆發(fā)”。許東所在的貝克曼研究所,就站在了浪潮最前沿。

1993年,在那所大樓第五層的國家超級計算機應用中心(NCSA)中誕生的Mosaic瀏覽器,迅速在整棟大樓中傳開。這樣一個純粹好玩兒的作品,成為點燃后來互聯(lián)網熱潮的火種之一。

后來,網景導航者瀏覽器的開發(fā)工作,聘用了許多原有的Mosaic瀏覽器工程師,但是沒有采用Mosaic網頁瀏覽器的任何代碼。傳承網景瀏覽器代碼的后裔為Firefox瀏覽器。

在計算機技術的支持下,生物信息學迎來第一次黃金期,成為當時的前沿學科之一。

1995年,許東博士畢業(yè)。他來到美國國立衛(wèi)生研究院的國家癌癥研究所,拿到了一份博士后工作?!霸诿绹邔W術這條路必須要讀博士后,Ruth Nussinov做的是蛋白的相互作用,我就進了她的組?!?/p>

許東的「AI生命科學」進化史:從90年代泡沫繁榮,到深度學習復興

許東在博士后辦公室里

工作測序工作與生物信息學大火,帶動了工業(yè)界對人才的渴求。

在拜師Ruth門下時,許東曾看到一個制藥公司一口氣招了80多個生物信息學背景的人——全職。甚至一家公司獵頭打電話找到許東,開出了他博士后的三倍薪資,“會寫C(語言)就夠了,你還會用BLAST工具(生物大分子序列比對搜索工具),明天就來上班?!?/p>

許東至今仍對那段時期印象深刻,盡管已經走上進了學術的大門,但依舊有不少公司想讓他加入。

去公司拿高額薪水,還是只拿三分之一做博士后?這個問題,事關內心最真實的選擇。

幫許東做決定的,是一場會議。

這場會議由美國國立衛(wèi)生研究院舉辦,邀請知名學者做分享,其中三位就是后來的2013年諾貝爾獎得主——Martin Karplus、Michael Levitt、Arieh Warshel。

當天,許東趕到現(xiàn)場。他忘了那三位學者說了什么,但他對臺上三個人侃侃而談的樣子記憶猶新。那種感覺讓他心動,有幾秒鐘讓他好像看到自己未來的樣子。

那一晚從會議里走出來,許東心里有了答案。許東把希望放在了新的研究領域。

此前在分子動力學領域,他經常受限于動力學的模擬時間,只能做小部分的生物學問題?,F(xiàn)在跳出來后,他想試試能不能做一些更廣譜的問題。

談起導師Ruth,許東稱她是一位極具科研情懷的科學家,并且身為一位以色列女性學者,科研道路十分奇妙:Ruth在碩士畢業(yè)后做了八年的全職母親,而后跟隨丈夫來美國伴讀,突然萌生了對生物化學的興趣,才再讀了博士、博士后,走上了學術道路。

許東表示,許多科學家對科研都有真愛,但Ruth對科研的鐘愛與專注程度相當罕見,她對RNA、毒物蛋白的工作精益求精,要求極高。

許東的「AI生命科學」進化史:從90年代泡沫繁榮,到深度學習復興

Ruth Nussinov教授

Ruth曾在1978年提出了用于RNA二級結構預測的動態(tài)規(guī)劃算法(Nussinov Algorithm),迄今該算法及其變種仍在業(yè)內廣泛使用,是生物信息學課程中常談到的方法。

另外,她挑戰(zhàn)了生物化學教科書中長達半個世紀倡導的生物大分子識別理論(誘導擬合機制),許東讀研究生時學的就是這一理論,那時被告知生物大分子就像變形金剛一樣可以粘到別的分子上,至于怎么變形及如何被驅動一直眾說紛紜,沒有靠譜的解釋。

直到九十年代后期,Ruth用構象分布與選擇替代的理論成功解釋了許多分子識別的現(xiàn)象,并得到同行越來越多的支持,一舉改寫了教科書。

回憶起和Ruth相處的那兩年,許東能想起很多場景。一天,許東做了一個小工作,想找個低端點的雜志草草發(fā)了。但和Ruth討論好,并迅速寫好文章交給她后,Ruth并沒有像以往一樣馬上給許東改文章,而是直接退了回來。

Ruth找到許東說,不能因為低分雜志就不認真。接下來的日子,她和許東一起反復推敲科研細節(jié),文章也是改了又改,最終那篇文章(《蛋白質相互作用界面的氫鍵和鹽橋》)沒有少花時間,卻成為了一篇高被引的論文(被引五百余次)。

還有一次,許東和Ruth一起到香港一所大學做大會主題報告,許東提議兩人出去轉一轉,以盡地主之誼,卻遭到了Ruth的一口回絕,“我沒時間,做完講座要馬上返程了,有太多的工作等著我呢。”

此后多年,許東慢慢跳出了分子動力學和生物大分子的研究范圍,與Klaus以及Ruth的研究漸行漸遠,但要說從Klaus和Ruth身上傳承到什么,那就是想象力和精益求精。

“他們從不想著自己要老了,無所謂了,總覺得還有非常多的未知要解開。你會看到,他們的學術生命都很長,一生都未退休?!?/p>

博士后結束的二十多年后,許東仍對導師充滿敬佩,他在朋友圈歷數(shù)Ruth過往,并在最后寫下了一段話:對于基礎科學工作者來說,最高的成就莫過于把自己的學說寫在教科書上,或者將自己的姓氏冠名于某個定理、算法,能做到其中之一的在學術界都是鳳毛麟角,Ruth卻把兩件事都做到了。

1997年6月,許東博士后工作結束,注意到橡樹嶺國家實驗室的一份招人廣告——需要生物背景,從事蛋白質結構預測?!斑@份工作很合適我,雖然不是一份教職,但也不是去了工業(yè)界,算是找到了一份折中又適合的工作?!?/p>

把許東招進來的,正是擔任蛋白質折疊項目組長的徐鷹。

彼時,徐鷹剛剛從橡樹嶺的數(shù)學與計算機科學部轉到生命科學部。他們一拍即合,徐鷹偏數(shù)學計算背景,許東偏生物物理背景,而橡樹嶺的另一位研究員——俄國數(shù)學家Victor Olman博士,則具備統(tǒng)計學背景。

1997年,他們組成了橡樹嶺的“三劍客”,在此后的6年時間里合作了40多篇論文,在蛋白質結構預測領域打出了名堂。

許東的「AI生命科學」進化史:從90年代泡沫繁榮,到深度學習復興

許東、徐鷹2001年在R&D100的領獎儀式上

那段時間里,許東和徐鷹還一起做出了那個時代中最好的蛋白三維結構預測工具——Prospect,在人類基因組測序中刻下了重要一筆。2001年,兩人以此拿下R&D100獎,在新世紀初拿下開頭彩。

橡樹嶺實驗室坐落在山溝溝里,偏僻冷清卻環(huán)境優(yōu)美,是個安心做學問的好地方?!霸谀抢铮斋@的不僅僅是科研論文,更是一種經歷,對國家實驗室如何運作,科研水平有了更深入的了解。實驗室提倡科研合作,也逐漸學會與他人相處、共同進步?!?/p>

2003年實驗室改組后,限于經費問題,原生命科學部大部分人去了工業(yè)界,許東和其他人也各自踏上了教職之路。

當最年輕的系主任遇上深度學習

許東一行人是幸運的,這群從橡樹嶺出來的人在美國高校大受歡迎。

新世紀初,幾乎所有高校都在建設生物信息研究所,徐鷹最終去到佐治亞大學,成為了該校生信研究所的首任所長,并拉去了Victor Olman,兩人繼續(xù)共事。許東則去了密蘇里大學的哥倫比亞分校(University of Missouri,Columbia,下稱“密大”)。

2003年8月,許東以計算機科學系副教授、James C. Dowell講座副教授,以及Christopher S. Bond生命科學中心研究員的身份,被正式引進到該校。

而他將在這個被稱為“哥村”的地方,一待近二十年。

2007年底,42歲的許東擔任該校計算機科學系的系主任,成為了密大所有系主任中最年輕的一位。這是許東人生中的一個重要時刻,也是在美國高校管理人員中為數(shù)不多的華人面孔。

許東的「AI生命科學」進化史:從90年代泡沫繁榮,到深度學習復興

2007年,許東任職系主任時留影在這個非母語環(huán)境中,許東不善言辭,但這次任職,卻收獲了全院的支持。

許東說到,“如果要說我有什么合適的地方,或許是我學問做得還不錯,文章比較多,更重要的是,大家覺得我不會借機給自己謀什么福利?!?/p>

上任第一件事,就是設計課程。許東在橡樹嶺這所千人實驗室的經歷派上了用場。他考慮了系內近20名教授的專長,準備將研究方向集中于三個領域,分別為網絡、多媒體、生物信息。許東認為,計算機學科領域太廣,必須專精才能突出。

”當時的密大計算機系有50名博士生,人力資源豐富,如果善加整合,提供明確研究方向,必能協(xié)助教授,做出量多質佳的研究,提高計算機系的整體素質?!?/p>

許東將學術機構則比作私人企業(yè),學術合作的關鍵在于最后的產值,而系主任就是拉拉隊鼓舞士氣,讓團隊有最好表現(xiàn)。

那些年里,許東也長期奔走在國內高校,一邊做學術講座,一邊推動國內大學與密蘇里大學3+2、2+2等聯(lián)合培養(yǎng)項目。

許東回憶,他跑遍了中國幾十所雙一流高校,回國次數(shù)不計其數(shù)。特別是吉林大學,他每年都去講學,并擔任過大約十年的唐敖慶客座教授,和許多的老師同學建立了深厚的友誼,合作發(fā)了幾十篇論文。比如,時任吉林大學計算機學院副院長的梁艷春教授,也有十年每年到密蘇里大學許東的實驗室訪問、合作。

許東的「AI生命科學」進化史:從90年代泡沫繁榮,到深度學習復興

2015年許東到西安電子科技大學訪問交流(右四),近年許東和梁艷春教授在密蘇里河畔

在擔任系主任的那段時間,許東參加了很多的領導培訓課程,看到課件上將領導人打上四類標簽:冒險型、守成型、改革型和善后型。

許東沒想那么多,“天底下很多東西都有專業(yè),但做領導是沒有專業(yè)的,沒有誰見到哪個系科是專門培養(yǎng)領導的,就算是MBA,教的也是金融的東西。”他反而覺得,不如從過去的經歷中找養(yǎng)分,看看能不能把一個系管理得井井有條。

直到2016年,密大計算機系與電機系合并,許東十年的系主任正式卸任。

許東的「AI生命科學」進化史:從90年代泡沫繁榮,到深度學習復興

2022年8月的Digital Biology Lab

這十年里,學校資源沒有大幅擴大,許東所在的計算機系師資穩(wěn)定在16~18人,學生人數(shù)卻增加了一倍(從2007年的279人到2016年的700多人),科研經費也增加了一倍。

而他自己的實驗室(Digital Biology Lab),也從2003成立初的七個人,到如今他直接指導13個博士生,還有一些職員和不少的碩士、本科生,在實驗室待過三個月以上的成員前后有兩百多人,其中三十幾位目前在中國國內任教職。

許東的「AI生命科學」進化史:從90年代泡沫繁榮,到深度學習復興

2018年,許東(右五)實驗室15周年慶?;顒恿粲?/span>

此外,許東的一個重要工作,是2012年密大的BS-CS課程通過了美國工程與技術認證委員會(ABET)的正式認證。如此一來,國內外的密大訪學人員便獲得了中美兩國的雙向學位認證。

去年,許東與兒子騎行到密蘇里州最大的毛刺橡樹那里,在那棵哥村的地標大橡樹下,許東回憶起過去的點點滴滴。他對兒子講到,“過去十幾年,密大接待了很多國內的學生和學者,許多人在神樹下打卡紀念,這棵樹陪伴了他們的重要時刻??鋸堻c說,這棵樹就是中美友好的見證,我希望越來越多的人到這棵神樹下打卡?!?/p>

許東的「AI生命科學」進化史:從90年代泡沫繁榮,到深度學習復興

2012年,是許東學術生涯中的一個重要轉折。此時,距離Alphafold運用深度學習算法在生物信息學領域一炮而紅還有6年。

這一年,學術界發(fā)生了一件大事。

在李飛飛號召的ImageNet競賽中,多倫多大學的Geoffrey Hinton、Ilya Sutskever和Alex Krizhevsky提出了一種深度卷積神經網絡結構:AlexNet,奪得了ImageNet冠軍,成績比當時的第二名高出一大截。

競賽結束后,一場關于深度學習算法的討論在學術界傳開。

業(yè)內有種聲音,如果這種使用大規(guī)模數(shù)據(jù)集所做出的決策結果是真實的,那么它將走出計算機視覺、神經語言處理和語音識別等子領域的研究困境,就連生物信息學領域的蛋白質結構預測、基因測序等問題也都迎刃而解。

但在當時,大多數(shù)人對此持強烈的懷疑和批判態(tài)度,“深度學習無非是大號的神經網絡,換個馬甲而已,結果也是作弊來的?!?/p>

這種想法不無道理。許東稱,當時深度學習在決策準確度上一舉增加了10個點。在此之前,無數(shù)學者在十幾年的研究過程中,每年幾乎都是0.1%式的、非常微弱的進步。

因此,對于辛苦鉆研的學者來說,深度學習的碾壓式進步會讓他們產生一種深深的“無力感”,甚至會產生一種難以言說的憤怒。

兩股思潮的碰撞,許東身在密蘇里州也聽到各種聲音。

密蘇里州一直以來都因為“show me state”出名,意為“索證之州”。許東把所有的細節(jié)都看了一遍,也讓組里的人也測試深度學習。結果不出所料,深度學習在幾個生物信息學的問題上有很大的提高。

2012年,許東不顧所有人的質疑轉向了深度學習,這是他人生中第二個重要時刻。

此后,許東的課題組把深度學習在生物、醫(yī)學上的應用作為第一研究方向,合作對象也從本系擴大到美國、中國高校。

在深度學習的影響下,許東關注到農業(yè)植物作物、中醫(yī)研究、單細胞數(shù)據(jù)分析、蛋白的分析、修飾、定位,結構預測等其他領域的課題。

過去三年,許東第一大合作對象是俄亥俄州立大學的馬勤教授,基于深度學習做單細胞基因測序的問題上發(fā)表了7篇有影響的文章。

許東的課題變化依然有,但主線已放在了深度學習上。

許東最直觀的感受是,跳出原有的分子動力學模擬的框架后,反而做的東西更多了,合作對象也更多了。一個顯著特點是,過去二十多年,許東所發(fā)表的論文中,作者少則四五人,多則十幾人,合著期刊論文近300篇,會議論文和著作章節(jié)共計超百篇。

在不同時刻,許東與不同人結成戰(zhàn)友,迅速沖到科研落地最前線,而他自己,也從一名物理學者,逐漸蛻變?yōu)樯镂锢韺W者、再到生物信息學者。

許東坦言,“我們做交叉學科,誰都無法把一個問題的方方面面都解決,所以需要很多合作,在我身上就非常明顯。”

許東的老友徐鷹也講過,許東做出了非常多的計算工具,如果沒有他的生物物理背景,是做不出來的。

在許東的理解里,他并不覺得自己成了“工具人”,而是在那些合作中,和別人一起成就更多的事,而不是把研究僅僅當作飯碗或工作量。

同是物理出身,后轉向理論生命科學研究的郝柏林院士也曾講過,“要想做生物,不能當票友,這是一個義無反顧、全心全意研究生物的“中心” ,而不是出身物理學的人參與一些生物學的問題?!?/p>

給18歲的許東一個答案

在密大做研究,許東已經不知不覺做了二十年了。

他每天七點起床,十二點前睡覺,每周都要審一篇稿,并且花大量的時間(包括周末和晚上)和組員及合作者討論科研,這是許東二十多年來的常態(tài)。

這些年來,許東好像沒什么變化,他依舊同樣對外界充滿新鮮感。

他愛拍照,出門時常帶著一臺相機,習慣將鏡頭對向自己之外的人。在他那里,好像隨時能將視角切換到其他人,永遠都有一種置身事外的能力。

對于許東個體和科研總體而言,時常的“局外人”身份具有重要的意義,科學研究不能總以自己的位置作為參照,要時不時跳出來,在復雜多變的現(xiàn)象中看清最深刻自然的本質。

許東的「AI生命科學」進化史:從90年代泡沫繁榮,到深度學習復興

許東所攝:仰望日食的阿米什人,拉斯維加斯羚羊谷

正是如此,在過去三十多年的時間里,許東趟過了生物信息學的泡沫期,與導師在那棟交叉研究大樓一起拼搏、與橡樹嶺同事們組成了生物信息學三劍客、又在密大親身推動了交叉學科的建設、最后在漫長的科技長河中,找到了深度學習這對船槳。

人過半百,許東還在做著他最喜歡的交叉學科研究?;蛟S這也是即將58歲的許東,要給18歲的自己的一個回答。

最后,許東談到自己,說到,“或許我永遠做不到Klaus、Martin Karplus、Ruth那樣的頂流?!?/p>

他停頓了一下,“但我會延續(xù)他們的學術熱情,抻長我的學術生命,始終站在科研的一線?!?/p>


作者注:

1993年,中國參與人類基因組計劃,生物信息學科迎來大爆發(fā)。

在近三十年的時間里,一大批生物、化學、物理、計算等專業(yè)的學者,前仆后繼加入到學科的產研建設,那是一個靈感迸發(fā)、情誼綿長的年代,也是一個走出質疑、迷茫的年代。

目前,雷峰網(公眾號:雷峰網)啟動《生物信息學的三十年往事》專題,將陸續(xù)推出徐鷹、潘毅、周耀旗、許東、唐建等新老學者的人物故事,記錄光輝歲月,以照后人之路。

關于生物信息學的更多故事,歡迎與本文作者吳彤交流,微信號:icedaguniang

許東的「AI生命科學」進化史:從90年代泡沫繁榮,到深度學習復興

雷峰網雷峰網

雷峰網原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知。

分享:
相關文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經綁定,現(xiàn)在您可以設置密碼以方便用郵箱登錄
立即設置 以后再說