0
本文作者: 任平 | 2024-04-25 10:40 |
生物信息學(xué)和醫(yī)學(xué),能碰撞出什么火花?
余光創(chuàng)教授的科研實(shí)踐,給出了這一問題的答案。
作為南方醫(yī)科大學(xué)基礎(chǔ)醫(yī)學(xué)院生物信息學(xué)系的主任和教授,余光創(chuàng)的關(guān)注點(diǎn)在于,生物醫(yī)學(xué)、數(shù)學(xué)和計(jì)算機(jī)科學(xué)的交叉融合。
這不算一條科研捷徑,多學(xué)科的知識(shí)儲(chǔ)備曾嚇退一眾學(xué)者。對(duì)于余光創(chuàng)來說,其中也有冒險(xiǎn)的成分。
他的學(xué)術(shù)之路起于華南農(nóng)業(yè)大學(xué)的生物技術(shù)專業(yè),到安徽醫(yī)科大學(xué)的生物化學(xué)與分子生物學(xué),再到香港大學(xué)公共衛(wèi)生學(xué)院的系統(tǒng)發(fā)育研究,再到如今的南醫(yī)大基礎(chǔ)醫(yī)學(xué)院的教研工作,每一步似乎都愈發(fā)偏離原來的軌跡。
但用余光創(chuàng)的話來說,這是他的“特色”、“趕上了好時(shí)機(jī)”。
實(shí)際上,這段經(jīng)歷中還有段小插曲,他原本碩士報(bào)考的是中科院上海生命科學(xué)研究院,復(fù)試環(huán)節(jié)失之交臂,才有了調(diào)劑的一說,從此結(jié)下與醫(yī)科類大學(xué)的不解之緣。
2018年,一通來自南醫(yī)大生信系的前任系主任李金明教授的電話,將余光創(chuàng)的科研生涯扎在了那里。
應(yīng)聘、入職、次年擔(dān)任該系副主任、協(xié)調(diào)全系改革入選教育部“雙萬計(jì)劃”,拔得全國唯一入選生信專業(yè)的高校頭籌,這些工作開展得緊鑼密鼓。
目前,余光創(chuàng)的研究重點(diǎn)集中在組學(xué)數(shù)據(jù)分析和工具開發(fā)。
他的團(tuán)隊(duì)通過多組學(xué)研究,開發(fā)了能夠預(yù)測代謝組數(shù)據(jù)的 MMINP 工具,以及專門用于單細(xì)胞和空間轉(zhuǎn)錄組學(xué)研究的 SVP 軟件包。
這些研究成果,為從微生物生態(tài)和系統(tǒng)發(fā)育關(guān)系的角度進(jìn)行研究提供了新的切入點(diǎn),更在疾病機(jī)理探索、藥物靶點(diǎn)發(fā)現(xiàn)等領(lǐng)域展現(xiàn)出巨大的潛力。
如今,“生信人”已經(jīng)成為余光創(chuàng)的一個(gè)重要標(biāo)簽。
他指出,生物信息學(xué)已經(jīng)從輔助性角色轉(zhuǎn)變?yōu)榭蒲械闹鲗?dǎo)力量。隨著高通量數(shù)據(jù)的普及和成本的降低,生物信息學(xué)在數(shù)據(jù)分析和解讀方面的重要性日益凸顯。
同時(shí),他也鼓勵(lì)年輕學(xué)者積極投身于跨學(xué)科研究,“不同的學(xué)科背景意味著不同的視角,沒有哪個(gè)背景絕對(duì)優(yōu)越”,要善于利用不同學(xué)科的視角和方法,開展有特色、有創(chuàng)新性的工作。
近期,2024年度「第二屆生物信息與轉(zhuǎn)化醫(yī)學(xué)大會(huì)」落下帷幕。本屆大會(huì)以 “人工智能時(shí)代的轉(zhuǎn)化醫(yī)學(xué)”為主題,由北京攜云啟源科技有限公司承辦,余光創(chuàng)教授受邀參會(huì)。
借此契機(jī),雷峰網(wǎng)與余光創(chuàng)教授進(jìn)行了深入對(duì)話,以下為對(duì)話全文(經(jīng)編輯):
雷峰網(wǎng):首先,請(qǐng)您分享下教育背景和研究領(lǐng)域?當(dāng)時(shí)主要課題是什么,它們?nèi)绾嗡茉炝四膶I(yè)技能和研究視角?
余光創(chuàng):我本科是華南農(nóng)業(yè)大學(xué)生物技術(shù)專業(yè)。那是在2001年,正值人類基因組計(jì)劃公布草圖,生物技術(shù)迎來它的黃金時(shí)代。
本科期間,我對(duì)計(jì)算機(jī)科學(xué)產(chǎn)生了濃厚的興趣,并自學(xué)了相關(guān)知識(shí)。碩士階段,我本想轉(zhuǎn)向生物信息學(xué)領(lǐng)域,但由于這是一個(gè)新興學(xué)科,國內(nèi)能提供該專業(yè)研究生教育的機(jī)構(gòu)并不多。后來去了安徽醫(yī)科大學(xué),專業(yè)是生物化學(xué)與分子生物學(xué),師從秦宜德教授。
碩士期間,我有幸跟隨軍事醫(yī)學(xué)科學(xué)院的伯曉晨教授,繼續(xù)從事生物信息學(xué)研究,并在他的指導(dǎo)下深入學(xué)習(xí)了編程和數(shù)據(jù)分析技能。當(dāng)時(shí),我們主要進(jìn)行微陣列(microarray)數(shù)據(jù)分析,盡管二代測序技術(shù)開始興起,但在國內(nèi)尚不普遍。此外,我們還探索了基于“基因本體學(xué)語義相似性度量”的一些計(jì)算方法,這在當(dāng)時(shí)也是一個(gè)較新的研究領(lǐng)域。
碩士畢業(yè)后,我在暨南大學(xué)生命健康工程研究院工作,主要進(jìn)行蛋白質(zhì)組學(xué)研究。在那里,我參與了與腫瘤相關(guān)的蛋白質(zhì)組數(shù)據(jù)分析工作,專注于蛋白質(zhì)層面的研究。
工作幾年后,我意識(shí)到,僅有碩士學(xué)位在學(xué)術(shù)界的發(fā)展受限,因此決定攻讀博士學(xué)位,并最終選擇了香港大學(xué)。在那里,我加入了管軼(港大公共衛(wèi)生學(xué)院)教授的實(shí)驗(yàn)室,管教授在非典疫情期間做出了重要貢獻(xiàn)。在管教授的指導(dǎo)下,我從事了與流感等傳染病相關(guān)的系統(tǒng)發(fā)育研究。
可以說,碩博期間讓我接觸到了截然不同的研究課題,也讓我認(rèn)識(shí)到拓寬思維和視野很有必要。
目前,我在南方醫(yī)科大學(xué)基礎(chǔ)醫(yī)學(xué)院,主要進(jìn)行組學(xué)數(shù)據(jù)分析和工具開發(fā)工作。盡管我現(xiàn)在不直接從事系統(tǒng)發(fā)育研究,但我一直在思考,是否可以從系統(tǒng)發(fā)育和微生物生態(tài)的角度,探索組學(xué)數(shù)據(jù)分析的新方法。
當(dāng)前,無論是宏基因組還是單細(xì)胞空間轉(zhuǎn)錄組研究,都是對(duì)群體的測量,這為我們從微生態(tài)和系統(tǒng)發(fā)育關(guān)系的角度進(jìn)行研究提供了新的切入點(diǎn)。
雷峰網(wǎng):什么契機(jī)下加入了南方醫(yī)科大學(xué)基礎(chǔ)醫(yī)學(xué)院?如今擔(dān)任生物信息學(xué)系系主任,要承擔(dān)哪些工作?
余光創(chuàng):在港大畢業(yè)后,我留在了管教授的課題組,繼續(xù)從事博士后工作,同時(shí)尋找工作機(jī)會(huì)。 當(dāng)時(shí),南方醫(yī)科大學(xué)生物信息學(xué)的老主任李金明教授打來電話,向我介紹了學(xué)校和專業(yè)情況。李教授的介紹打動(dòng)了我,我來到這里應(yīng)聘,并在2018年順利加入。
事實(shí)上,2018年和2019年是南方醫(yī)科大學(xué)引進(jìn)高層次人才的高峰期,不僅我們學(xué)校,許多其他學(xué)校也在大力引進(jìn)人才。隨著時(shí)間的推移,尤其是疫情的影響,學(xué)校經(jīng)費(fèi)有所減少,人才引進(jìn)的力度也有所減弱?,F(xiàn)在,學(xué)校更傾向于引進(jìn)海外人才,并依托學(xué)校申請(qǐng)相關(guān)項(xiàng)目。我算是趕上了好時(shí)機(jī)。
2019年7月以來,我開始擔(dān)任生信系主任,我的工作涉及更多的行政和教學(xué)任務(wù),主要是為學(xué)生和系里的教師服務(wù)。
實(shí)際上,我們的生信本科專業(yè)成立于2005年,是國內(nèi)較早開設(shè)此類專業(yè)的院校之一。就在2019年4月,教育部推出了“雙萬計(jì)劃”,旨在建設(shè)一萬個(gè)“國家級(jí)”一流本科專業(yè)、一萬個(gè)“省級(jí)”一流本科專業(yè)。我們?cè)趯I(yè)建設(shè)上做了很多工作,包括硬件、軟件、教材和課程改革。我們的專業(yè)也成為首批入選國家級(jí)一流本科專業(yè)建設(shè)點(diǎn),而且是首批入選的生物信息學(xué)專業(yè)。
我認(rèn)為,作為教師,除了科研,教學(xué)同樣重要。這不僅有助于我個(gè)人成為一名更全面的教師,而且對(duì)教育下一代、促進(jìn)社會(huì)和國家的可持續(xù)發(fā)展具有重要意義。
雷峰網(wǎng):因?yàn)樯镄畔W(xué)融合了多個(gè)學(xué)科,包括生物醫(yī)學(xué)、數(shù)學(xué)、計(jì)算機(jī)科學(xué),您為什么對(duì)交叉研究感興趣?
余光創(chuàng):這要追溯到本科時(shí)代。那時(shí)我在圖書館偶然發(fā)現(xiàn)了一本名為《Developing Bioinformatics Computer Skills》的書,這本書可以說是我的啟蒙之作,讓我對(duì)生物信息學(xué)產(chǎn)生了濃厚的興趣。
從那本書里我了解到,生物信息學(xué)是一個(gè)融合生物醫(yī)學(xué)、數(shù)學(xué)和計(jì)算機(jī)科學(xué)的交叉學(xué)科。
我本身學(xué)習(xí)生物,而當(dāng)時(shí)大家對(duì)生物技術(shù)的前景非??春茫由衔覍?duì)計(jì)算機(jī)有著濃厚的興趣,我認(rèn)為這正好是我專業(yè)和興趣的結(jié)合點(diǎn)。
因此,我決心朝這個(gè)方向發(fā)展,雖然當(dāng)時(shí)還處于一個(gè)相對(duì)懵懂的狀態(tài),但內(nèi)心充滿了向往。
但我是直到研究生加入了伯曉晨老師課題組,才真正開始接觸生物信息學(xué),學(xué)習(xí)計(jì)算機(jī)和數(shù)學(xué)知識(shí),并將其應(yīng)用于生物學(xué)研究。
這讓我有了實(shí)實(shí)在在的一手研究經(jīng)驗(yàn),并且我對(duì)這一領(lǐng)域始終保持著濃厚的興趣。多年來,無論是工作還是繼續(xù)深造,我都保持著這種興趣驅(qū)動(dòng),這對(duì)我來說非常重要。
雷峰網(wǎng):您剛才提到了人類基因組計(jì)劃,這個(gè)全球性的項(xiàng)目對(duì)整個(gè)研究領(lǐng)域帶來了哪些變化?生物信息學(xué)領(lǐng)域經(jīng)歷了哪些發(fā)展階段,直至您目前的研究領(lǐng)域?
余光創(chuàng):人類基因組計(jì)劃對(duì)現(xiàn)代生物醫(yī)學(xué)研究產(chǎn)生了深遠(yuǎn)的影響。
在該計(jì)劃之前,研究工作主要集中在克隆單個(gè)基因及其產(chǎn)物上,研究進(jìn)展相對(duì)緩慢。許多研究者可能一生都在研究一個(gè)基因或一個(gè)蛋白,而且通常是針對(duì)那些已知與疾病相關(guān)的基因。當(dāng)時(shí),我們對(duì)基因間相互作用的理解還非常有限。盡管人類與小鼠或黑猩猩的基因差異很小,但在調(diào)控層面的復(fù)雜性卻有很大差異。
人類基因組計(jì)劃完成后,我們獲得了完整的人類基因組序列和較為完善的注釋信息,這使得研究范式發(fā)生了根本性變化。
用一個(gè)比喻來說,以前的研究就像是在釣魚,而現(xiàn)在則像是撒網(wǎng)捕魚。
當(dāng)下,我們可以先獲取大量數(shù)據(jù),然后讓數(shù)據(jù)驅(qū)動(dòng)研究,從而發(fā)現(xiàn)一些之前未曾預(yù)料到的線索。這種數(shù)據(jù)驅(qū)動(dòng)的研究方式,不僅改變了研究策略,也加速了許多研究領(lǐng)域的發(fā)展,包括精準(zhǔn)醫(yī)學(xué)等。
如果沒有人類基因組計(jì)劃奠定的基礎(chǔ),這些進(jìn)展是不可能實(shí)現(xiàn)的。
雷峰網(wǎng):您目前的研究重點(diǎn)是哪塊?近期有哪些新進(jìn)展?
余光創(chuàng):目前我的研究重點(diǎn)是組學(xué)數(shù)據(jù)分析和工具開發(fā)。我們進(jìn)行了多組學(xué)研究,并針對(duì)微生物組學(xué)開發(fā)了 MicrobiotaProcess、MMINP、SVP 等軟件包。
之于MicrobiotaProcess ,我們?cè)O(shè)計(jì)了一套數(shù)據(jù)結(jié)構(gòu)來管理微生物組學(xué)數(shù)據(jù),并提供了一系列分析工具。
之于MMINP ,可以通過微生物組學(xué)數(shù)據(jù)預(yù)測代謝組數(shù)據(jù)。許多人通過宏基因組或16S rRNA測序來鑒定腸道微生物,但往往缺乏相應(yīng)的代謝物組學(xué)數(shù)據(jù)。我們開發(fā)的這個(gè)工具可以填補(bǔ)這一空白,做出更全面的分析。
此外,我們還開發(fā)了SVP軟件包,專門用于單細(xì)胞和空間轉(zhuǎn)錄組學(xué)研究,可以在單細(xì)胞水平對(duì)細(xì)胞功能進(jìn)行刻畫,基于此,我們可以鑒定具有空間特異性的生物學(xué)功能。
目前,我們的工作主要集中在基礎(chǔ)研究領(lǐng)域,尚未有具體的轉(zhuǎn)化應(yīng)用。但我認(rèn)為這些研究成果是具有轉(zhuǎn)化潛力的。
例如,我們通過預(yù)測得到的代謝物信息,理論上可以幫助我們節(jié)省研究成本。我們可以先通過計(jì)算方法進(jìn)行初步探索,然后再通過靶向驗(yàn)證等方法進(jìn)行深入研究。
雷峰網(wǎng):您在開發(fā)生物大數(shù)據(jù)分析算法和軟件時(shí),有哪些方法論?這些工具如何幫助科研人員更好地探索和分析數(shù)據(jù)?
余光創(chuàng):在開發(fā)算法和軟件時(shí),我們主要關(guān)注下游需求和應(yīng)用場景。
在生物信息學(xué)領(lǐng)域,上游算法如序列比對(duì)等,通常注重準(zhǔn)確性、速度和計(jì)算性能,而我們更專注于下游方法的開發(fā)和軟件設(shè)計(jì)。即,如何將這些技術(shù)與生物學(xué)需求相結(jié)合,為生物學(xué)家提供實(shí)際幫助,發(fā)現(xiàn)分子機(jī)制。
在方法論和心得方面,我認(rèn)為最重要的是,面向用戶群體和軟件生態(tài)系統(tǒng)。一個(gè)良好的生態(tài)系統(tǒng)和社區(qū)可以顯著降低開發(fā)門檻,并促進(jìn)不同軟件包之間的協(xié)作與功能互補(bǔ)。
以我們開發(fā)的 clusterProfiler 軟件為例,它面向廣泛的科研人員,通過功能富集的數(shù)據(jù)分析,幫助他們探索分子機(jī)制,闡明各種生物學(xué)過程和通路如何受到擾動(dòng)。
這種分析可以應(yīng)用于多種疾病的研究,不局限于特定領(lǐng)域,而是可以適用于廣泛的研究場景,因此它的使用范圍非常廣泛,受眾群體也很大。
雷峰網(wǎng):與此同時(shí),這個(gè)過程中最大的挑戰(zhàn)是什么?
余光創(chuàng):在開發(fā)過程中,我主要是針對(duì)具體的應(yīng)用場景,我們經(jīng)常在數(shù)據(jù)分析中遇到一些問題,且手頭并沒有合適的工具。
其次,當(dāng)前大數(shù)據(jù)時(shí)代,我們面臨的一個(gè)主要挑戰(zhàn)是計(jì)算能力,但算力并不總是容易獲得。
例如,美國對(duì)中國的顯卡出口限制對(duì)許多研究工作構(gòu)成了限制。此外,許多大型IT公司也在進(jìn)行類似的研究,與它們相比,高校在硬件資源上往往難以匹敵。
第三,問題的復(fù)雜性日益增加,團(tuán)隊(duì)合作變得越來越重要。當(dāng)然團(tuán)隊(duì)協(xié)作可能是解決這些問題的一個(gè)關(guān)鍵因素,這本身也是一個(gè)挑戰(zhàn)。
雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng)):您目前的合作項(xiàng)目和伙伴有誰?
余光創(chuàng):我目前有一個(gè)合作項(xiàng)目是與一位婦產(chǎn)科主任(寧波大學(xué),陳夏)合作的,我們正在研究腸道菌群與多囊卵巢綜合癥之間的關(guān)系。
在這個(gè)項(xiàng)目中,我們收集了大量的宏基因組和代謝組數(shù)據(jù)。
在研究腸道微生物時(shí),以往大多數(shù)研究都集中在細(xì)菌上。但我希望從噬菌體的角度來探討這個(gè)問題,因?yàn)槭删w可以感染細(xì)菌并調(diào)控其功能,并影響整個(gè)微生物群落的生態(tài)。
我們希望通過分析宏基因組數(shù)據(jù),來探索噬菌體與宿主細(xì)菌之間的關(guān)系。此外,我們還自行收集了一些樣本,使用特定技術(shù)捕獲細(xì)菌和噬菌體之間的相互作用,并進(jìn)行了相應(yīng)的序列分析。
另一個(gè)合作項(xiàng)目是與神經(jīng)生物學(xué)家(南方醫(yī)科大學(xué),曹雄和陶濤)合作,我們使用了小鼠抑郁癥模型進(jìn)行空間轉(zhuǎn)錄組研究。
我們?cè)谛∈蟠竽X具有代表性腦區(qū)的五個(gè)不同位置進(jìn)行了空間轉(zhuǎn)錄組測序,希望通過這些數(shù)據(jù)找到與抑郁癥相關(guān)的分子機(jī)制和信號(hào)通路??臻g轉(zhuǎn)錄組技術(shù)能夠在原位測試細(xì)胞,這對(duì)于神經(jīng)科學(xué)研究來說是一個(gè)非常有前景的應(yīng)用。
這項(xiàng)技術(shù)相對(duì)較新,我們目前正在進(jìn)行這方面的合作和探索。
雷峰網(wǎng):您在The Innovation、Gut Microbes、Molecular Biology and Evolution等期刊發(fā)表的論文中,有哪些特別有影響力的工作?這些研究成果對(duì)于生物醫(yī)學(xué)領(lǐng)域的長遠(yuǎn)影響是什么?
余光創(chuàng):如果要談?wù)撚绊懥?,我認(rèn)為我們最有影響力的工作是之前提到的 clusterProfiler 工具。
它的第一版發(fā)表于2012年,已經(jīng)過去十多年了。2021年,我們?cè)凇禩he Innovation》雜志上發(fā)表了一個(gè)新版本。這個(gè)工具被廣泛使用,目前引用次數(shù)已超過25000次,對(duì)我們領(lǐng)域的研究產(chǎn)生了一定的影響。
實(shí)際上,許多學(xué)生和研究人員告訴我,他們?cè)趯W(xué)習(xí)生物信息學(xué)時(shí),首先接觸到的就是我開發(fā)的這個(gè)工具包。因?yàn)樗褂闷饋硐鄬?duì)簡單,能夠快速為初學(xué)者提供反饋。分析完成后,我們可以得到許多可視化的結(jié)果,這有助于他們立即理解分析結(jié)果。
此外,另一個(gè)我認(rèn)為有較大影響的工作是,我在博士期間開始的系統(tǒng)發(fā)育相關(guān)研究。
我們開發(fā)了一系列軟件包,這些軟件包不僅能夠整合和可視化系統(tǒng)發(fā)育數(shù)據(jù),還能幫助研究人員解析和映射各種數(shù)據(jù)到系統(tǒng)發(fā)育樹上。隨著實(shí)驗(yàn)技術(shù)的發(fā)展,我們現(xiàn)在擁有越來越多的高通量數(shù)據(jù)。將這些數(shù)據(jù)或分析結(jié)果映射到系統(tǒng)發(fā)育樹上,可以幫助我們發(fā)現(xiàn)新的或意想不到的演化模式。
這些工作發(fā)表在《Molecular Biology and Evolution》雜志上,共有三篇文章;還有一篇文章最早發(fā)表在2017年的《Methods in Ecology and Evolution》上,后來該雜志在慶祝創(chuàng)刊十周年時(shí),將這篇文章選為“十篇代表作”之一。
我還寫了一本介紹這些工作的英文書籍,由國外的CRC出版社出版。這本書后來被翻譯成中文版,并在國內(nèi)由電子工業(yè)出版社出版。這本書受到了讀者的喜愛,在京東上一度售罄。
這些工作可以說是我最具影響力的成果。很多研究成果的影響需要時(shí)間來驗(yàn)證,一開始可能不會(huì)立即被大家認(rèn)為特別好,但隨著時(shí)間的推移,如果使用的人越來越多,就說明這些工作經(jīng)受住了時(shí)間的考驗(yàn)。
雷峰網(wǎng):除了開發(fā)這些工具外,您是否也有數(shù)據(jù)庫開發(fā)工作?
余光創(chuàng):我們沒有直接開發(fā)數(shù)據(jù)庫。盡管數(shù)據(jù)庫在生物信息學(xué)中扮演著非常重要的角色,但我們的研究重點(diǎn)并不在此。
當(dāng)然,數(shù)據(jù)庫的建立可能是一些研究者的工作重點(diǎn),他們可能通過收集數(shù)據(jù)并發(fā)表文章來展示其成果。但有一個(gè)現(xiàn)象是,很多人為了發(fā)表論文而開發(fā)工具或數(shù)據(jù)庫,一旦文章發(fā)表,他們就不再繼續(xù)投入。
但我認(rèn)為,數(shù)據(jù)庫的真正價(jià)值在于,它能夠持續(xù)積累數(shù)據(jù)資源,并促進(jìn)研究者自身課題的研究進(jìn)展。
雷峰網(wǎng):您入選全球高被引學(xué)者、全球前2%頂尖科學(xué)家榜單和中國高被引學(xué)者。您能談?wù)勀难芯砍晒粡V泛認(rèn)可的經(jīng)歷嗎?
余光創(chuàng):對(duì)于我來說,我對(duì)自己開發(fā)的工具充滿感情,始終在不斷地維護(hù)和更新。比如,我之前提到的那個(gè)工具,從2012年發(fā)表文章到2021年發(fā)布新版本,這中間的九年時(shí)間里,我一直在持續(xù)進(jìn)行維護(hù)和更新。
這種長期的維護(hù)和更新是可以看到的,也形成了一定的口碑。隨著時(shí)間的推移,大家對(duì)我工作的認(rèn)可度越來越高。因此,這也是一個(gè)積累的過程。當(dāng)大家普遍認(rèn)可你的工作,愿意使用你開發(fā)的方法和工具時(shí),引用量自然會(huì)增加。正是由于大家的認(rèn)可和支持,我才有幸入選了這些高被引學(xué)者的榜單。
雷峰網(wǎng):我之前撰寫了一系列關(guān)于生物信息學(xué)過去30年發(fā)展歷程的文章,一些教授會(huì)提到過去生信研究者會(huì)處于一個(gè)尷尬的位置,可以說是輔助性角色,而非課題的主導(dǎo)者?,F(xiàn)在這種狀況有所改變嗎?
余光創(chuàng):情況確實(shí)在逐漸改善。
過去,我們的角色更像是輔助性的,因?yàn)槲覀儾恢苯赢a(chǎn)生數(shù)據(jù)。其他課題組或基礎(chǔ)研究、臨床研究的同事產(chǎn)生數(shù)據(jù)后,他們可能不會(huì)分析,于是找到我們希望合作,我們基本上就成為了提供幫助的輔助方。
而且,我們?cè)谶M(jìn)行生物信息數(shù)據(jù)分析時(shí),有時(shí)會(huì)遇到挑戰(zhàn),包括我剛才提到的,有時(shí)需要自己開發(fā)工具來解決問題,這并不容易,需要一定的專業(yè)背景和科研經(jīng)驗(yàn)積累。
在基礎(chǔ)研究或臨床研究的同事眼中,他們有時(shí)可能會(huì)低估我們的貢獻(xiàn),認(rèn)為我們只是個(gè)跑程序的工具人,因此我們的貢獻(xiàn)在他們看來可能相對(duì)較小。這可能是因?yàn)樗麄冏约旱恼J(rèn)知限制,難以準(zhǔn)確評(píng)估合作者的貢獻(xiàn)。這種情況以前讓研究者感到尷尬。
但現(xiàn)在,情況有所好轉(zhuǎn)。我們這一代可能比前輩們面臨的挑戰(zhàn)要小一些。
首先,現(xiàn)在獲取數(shù)據(jù)的可及性更高。許多大型項(xiàng)目產(chǎn)生的大量數(shù)據(jù)都是公開的,我們可以根據(jù)這些公開數(shù)據(jù)進(jìn)行研究。
而且產(chǎn)生數(shù)據(jù)的成本越來越低,以前數(shù)據(jù)生成成本很高,因此產(chǎn)生數(shù)據(jù)的研究者感到自己很重要。但現(xiàn)在,隨著高通量數(shù)據(jù)方法的成本降低,我們?cè)絹碓饺菀咨蓴?shù)據(jù),生物信息學(xué)在分析和解讀數(shù)據(jù)方面的需求和重要性越來越大。
另外,我們也可以通過數(shù)據(jù)驅(qū)動(dòng)的方式,找到好的研究點(diǎn)或重要發(fā)現(xiàn)。繼而可以尋找合作者來驗(yàn)證我們的假設(shè)和發(fā)現(xiàn),這樣我們就能夠在一定程度上主導(dǎo)研究。
所以總的來說,隨著生物大數(shù)據(jù)的普及,越來越多的研究者開始認(rèn)識(shí)到生物信息學(xué)的重要性,它不是一個(gè)輔助學(xué)科,而是一個(gè)獨(dú)立的學(xué)科,甚至在主導(dǎo)研究方面的作用將會(huì)變得越來越明顯,認(rèn)可度也會(huì)逐漸提高。
雷峰網(wǎng):您認(rèn)為未來幾年內(nèi),這一領(lǐng)域?qū)?huì)有哪些新的趨勢或突破?以及,您有哪些規(guī)劃?
余光創(chuàng):在規(guī)劃方面,我認(rèn)為當(dāng)前的一個(gè)重點(diǎn)主題是人工智能。
這是一個(gè)無法回避的時(shí)代發(fā)展趨勢,我們不期望人工智能完全取代或顛覆現(xiàn)有的方法,但至少能夠賦予我們更多的能力,幫助我們解決更多問題。
在生信的應(yīng)用場景中,人工智能的應(yīng)用肯定會(huì)越來越多。眾所周知,在蛋白質(zhì)結(jié)構(gòu)預(yù)測等領(lǐng)域,人工智能已經(jīng)開始發(fā)揮作用,并有可能在轉(zhuǎn)化研究中發(fā)揮更大作用。
雖然我和團(tuán)隊(duì)并非人工智能領(lǐng)域的研究者,但必須要擁抱人工智能,我的規(guī)劃是,在我們擅長的領(lǐng)域內(nèi)探索與人工智能的結(jié)合點(diǎn)。
雷峰網(wǎng):關(guān)于人工智能,您和團(tuán)隊(duì)之前有在使用相關(guān)技術(shù)嗎?
余光創(chuàng):我們主要是用傳統(tǒng)的機(jī)器學(xué)習(xí)方法。至于深度學(xué)習(xí),我們之前并沒有太多涉及。不過,在空間轉(zhuǎn)錄組分析中,我們正在嘗試?yán)蒙疃葘W(xué)習(xí)技術(shù)。
當(dāng)前我們進(jìn)行空間轉(zhuǎn)錄組的測量時(shí),雖然是在談?wù)摽臻g信息,但實(shí)際上我們處理的是二維的組織切片。我們正在嘗試通過深度學(xué)習(xí)技術(shù)重建這些數(shù)據(jù)為三維結(jié)構(gòu),目前在這方面正在進(jìn)行一些探索。
雷峰網(wǎng):關(guān)于跨學(xué)科合作,您個(gè)人在這方面有哪些經(jīng)驗(yàn)?或者對(duì)年輕學(xué)者有什么建議?
余光創(chuàng):跨學(xué)科合作的經(jīng)驗(yàn),我認(rèn)為關(guān)鍵在于多溝通、多交流。因?yàn)椴煌瑢W(xué)科背景的人交流時(shí),可能會(huì)存在語言和概念上的障礙。有時(shí)候你說的我聽不懂,我說的你也聽不懂。增加交流可以更好地理解彼此的需求和目標(biāo)。
此外,跨學(xué)科交流還能打破學(xué)科界限,拓寬思路。無論是在合作項(xiàng)目中,還是在參加學(xué)術(shù)會(huì)議時(shí),多聽聽別人的報(bào)告,都能開闊視野和思維。
對(duì)于年輕學(xué)者,我的建議是,跨學(xué)科學(xué)習(xí)確實(shí)不易,如我碩士導(dǎo)師所說,你需要準(zhǔn)備好付出額外的努力。
但這并不等于,需要等到掌握了所有相關(guān)學(xué)科的基礎(chǔ)知識(shí)才開始工作。這種方法是不現(xiàn)實(shí)的,因?yàn)槟愫茈y全面掌握所有知識(shí),而且可能會(huì)偏離你的研究課題。相反,應(yīng)該以項(xiàng)目為驅(qū)動(dòng),邊做邊學(xué)。
當(dāng)然,跨學(xué)科也有其優(yōu)勢。不同的學(xué)科背景意味著不同的視角,沒有哪個(gè)背景絕對(duì)優(yōu)越。如果你能利用好自己的學(xué)科背景優(yōu)勢,并找到合適的切入點(diǎn),你就能做出有特色、有特點(diǎn)的工作。
雷峰網(wǎng):您現(xiàn)在還在指導(dǎo)學(xué)生嗎?他們主要的專業(yè)背景是什么?
余光創(chuàng):是的,我要指導(dǎo)學(xué)生。目前我的學(xué)生大多數(shù)是生物信息學(xué)專業(yè)的。他們?cè)诒究齐A段可能就已經(jīng)學(xué)習(xí)生物信息學(xué),因?yàn)槲覀儗W(xué)校本身就有這個(gè)專業(yè)。
此外,還有一些學(xué)生來自生物技術(shù)、生物制藥等生物領(lǐng)域。
計(jì)算機(jī)科學(xué)的學(xué)生在我們這里相對(duì)較少,因?yàn)槲覀兪轻t(yī)科大學(xué),學(xué)生可能更關(guān)注與生物醫(yī)學(xué)相關(guān)的領(lǐng)域,因此這類背景的學(xué)生更傾向于選擇我們。
我目前指導(dǎo)畢業(yè)的學(xué)生還不多。有的學(xué)生出國深造,有的在醫(yī)院擔(dān)任科研人員,還有人進(jìn)入公司工作,從事生物信息技術(shù)開發(fā)和數(shù)據(jù)分析等與我們專業(yè)緊密相關(guān)的工作。
所以,他們的就業(yè)方向通常與生物信息學(xué)領(lǐng)域相關(guān),無論是在高校、醫(yī)院還是公司。
本文作者 吳彤 長期關(guān)注人工智能、生命科學(xué)和科技一線工作者,歡迎同道微信交流:icedaguniang
雷峰網(wǎng)雷峰網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。