0
“學生不僅要站著開會,為了能跟上諸位特邀嘉賓的報告進度,更是直接坐在地上記筆記,就連會場放水的桌子上都坐滿了‘杰青’?!?br/>
這就是前不久在廣州召開的第11屆全國生物信息學與系統(tǒng)生物學大會(下稱“全國生信大會”)的現(xiàn)場。
本屆大會由中國生物信息學會(籌)主辦,廣東省生物信息學會及中山大學承辦,主題為《生物信息學與系統(tǒng)生物學及其應用的最新前沿研究》,共設(shè)3個特邀主會場和16個分會場,參會人數(shù)達1600多人,創(chuàng)造歷史新高。
實際上,如今的全國生信大會已經(jīng)走過二十五載歲月,已成功舉辦十屆,但每屆會議都無一例外地吸引到各地生信專家和學者。不少人交口稱贊,“這一大會已發(fā)展為中國生信領(lǐng)域?qū)W術(shù)水平最高、影響最大的全國盛會,是當之無愧的品牌會議?!?/p>
孫之榮教授
談起本屆大會的盛況,大會主席孫之榮教授頗有感慨,“舉辦一場生信會議的念頭由來已久,大概要追溯到1998年之前。早期小范圍辦會只取了一個“華北地區(qū)生物信息學研究會”的名字,清北、中科院、天津、內(nèi)蒙古多地教授予以支持。新世紀后生信大會因為非典原因停辦六年,后來有了各地高校教授的幫助,會議愈發(fā)成熟,成了一個大團隊,感謝同道的幫助?!?/p>
事實上,本屆會議原定于去年10月,因疫情爆發(fā)兩次延后,直到今年年初管控放開,各地高校教授的的參會熱情已經(jīng)非常高漲。
作為組織者和參會者之一,本屆大會執(zhí)行秘書長為中山大學數(shù)學學院的張家軍教授。他對雷峰網(wǎng)(公眾號:雷峰網(wǎng))表示,“這會更加考驗團隊凝聚力和執(zhí)行力問題。從決定舉辦并確定日期算起,留給我們的實際籌備時間僅有3個月,而往屆會議會有一年的籌備時間。”
在人手有限、疫情干擾以及時間壓縮的情況下,本屆大會在會議嘉賓和內(nèi)容以及節(jié)奏的把控上,都獲得了極高的評價。
張家軍教授(居中)與本屆大會志愿學生
其一,分會場覆蓋面更廣,農(nóng)林畜牧等學科人才面孔增多,一線醫(yī)生參會熱情高漲。
該屆大會覆蓋了基因組學信息學、轉(zhuǎn)化信息學與數(shù)據(jù)安全、生物醫(yī)學數(shù)據(jù)挖掘與計算、人工智能與生命科學、非編碼RNA與RNA信息學、重大疾病組學信息學、生物信息學算法研究、農(nóng)林信息學、生物分子結(jié)構(gòu)預測與模擬、網(wǎng)絡生物學、多組學與整合生物學、計算合成生物學等生物信息學與系統(tǒng)生物學的多個前沿方向,共3個特邀主會場和16個分會場。
張家軍教授表示,“諸如各地農(nóng)林畜牧方向高校、研究所學者積極應邀。此外,大會還專設(shè)了重大疾病組學信息學分會,來自各地附屬醫(yī)院、醫(yī)學研究所、高校醫(yī)學院的一線醫(yī)生都趕到了現(xiàn)場。”
而這也意味著,隨著科學研究深入發(fā)展,組學研究才是最大化研究價值的出路。
墻報展區(qū)
其二,老中青學者齊聚,“全員出動”成為一道風景線。
本屆大會聚集了來自全國各地1600多名專家、學者和行業(yè)從業(yè)者,覆蓋了生命科學、物理學、信息學、醫(yī)學等學科,包括南方醫(yī)科大學侯凡凡院士、北京大學湯超院士、北京大學張澤民教授、哈佛大學劉小樂教授(線上)、中科大劉海燕教授、中科院生化所陳洛南、清華大學張強鋒等7位學者,從各自的研究方向出發(fā)進行了40分鐘的特邀報告。
侯凡凡、湯超、張澤民、劉小樂、劉海燕、陳洛南、張強鋒
孫之榮教授表示,本屆大會也在主會場專設(shè)了國家杰出青年學者的25分鐘報告環(huán)節(jié)。
如,山東大學數(shù)學與交叉科學研究中心楊建益、清華自動化系汪小我、北京北京國際數(shù)學研究中心張磊、上海交通大學數(shù)學科學學院周棟焯、中南大學計算機學院李敏、復旦大學類腦人工智能科學與技術(shù)研究院趙興明、中山大學生命科學學院楊建華、北大公共衛(wèi)生學院葛顥、中山大學數(shù)學學院張家軍等9位學者。
值得一提的是,雷峰網(wǎng)在會場觀察到,不少教授攜實驗室學生全體出動。
浙江工業(yè)大學信息工程學院的張貴軍教授表示,“盡管是第三次參會,但這次參會人數(shù)最多,師生十人同行?!?/p>
華中農(nóng)業(yè)大學信息學院則直接是由院長張紅雨、副院長李國亮帶隊,龔靜、牛曉輝、全源、周強偉、王云龍、朱志賢、王振吉等多名師生參加會議。據(jù)該學院相關(guān)負責人介紹,“這次會議對促進與同行和行業(yè)從業(yè)者的交流和合作建立了可能。”
張貴軍教授(中間戴胸牌)與實驗室學生
其三,熱鬧的不止于大會參會人員,本次大會的展商區(qū)也云集了十多家相關(guān)公司。
如,位列“明星展位”的中科曙光、火山引擎、亞馬遜科技,以及“標準展位”的毅碩科技、深圳國家基因庫、曼迪匹艾(北京)、萬乘科技、上海序禎達生物、安諾優(yōu)達、北京并行科技、深圳華大智造。
據(jù)其中一家展商介紹,“線下參展的好處是,能直觀感受到產(chǎn)學研各界的熱情,不再是一頭熱一頭冷?,F(xiàn)在我們最大的挑戰(zhàn)是時不我待,只爭朝夕?!?/strong>
這句話也詮釋了如今的生信大會正在從“小而美”走向“大而強”。而在這場變革中,小到前沿學科建設(shè)、中端技術(shù)轉(zhuǎn)化、后端產(chǎn)業(yè)承載,都在嘗試作出最有力的回應。
本屆大會如此火爆,很大程度上證明了生命科學產(chǎn)業(yè)風云變幻,機遇叢生。
正如全國人大常委會副委員長陳竺在賀信中所言,“當前新一輪科技革命和產(chǎn)業(yè)革命加速發(fā)展,生命科學創(chuàng)新突破方興未艾,生物產(chǎn)業(yè)與信息產(chǎn)業(yè)深度融合,對全球生命健康事業(yè)發(fā)展和世界經(jīng)濟復蘇具有十分重大的意義?!?/p>
其中,考慮到技術(shù)轉(zhuǎn)化的難易程度,蛋白質(zhì)預測與設(shè)計成為本屆會議的兩大看點,山東大學楊建益教授、中科大劉海燕教授的兩場報告廣受關(guān)注。
楊建益教授
山東大學數(shù)學與交叉科學研究中心的楊建益教授,以《AI在蛋白質(zhì)結(jié)構(gòu)預測中的應用》為題進行報告。
據(jù)悉,楊建益教授研究方向包括蛋白質(zhì)結(jié)構(gòu)與功能預測、RNA結(jié)構(gòu)預測等,并與密歇根是大學張陽、華盛頓大學David Baker等學者合作,成功開發(fā)I-TASSER 和trRosetta等著名結(jié)構(gòu)預測算法。在去年的CASP15比賽中,楊建益教授帶隊獲蛋白質(zhì)單體結(jié)構(gòu)預測組第一名。
會上,楊建益教授首先詳細介紹了蛋白質(zhì)結(jié)構(gòu)預測的基本原理與應用。
他表示,蛋白質(zhì)結(jié)構(gòu)預測的目標是從蛋白質(zhì)的氨基酸序列出發(fā),通過算法設(shè)計和開發(fā),構(gòu)建準確的三維結(jié)構(gòu)模型。隨著深度學習的發(fā)展,如今蛋白質(zhì)結(jié)構(gòu)預測方法主要分為三種:基于模版的同源建模、基于蛋白質(zhì)分子電子結(jié)構(gòu)的第一性原理的從頭預測、基于深度學習的蛋白質(zhì)結(jié)構(gòu)預測。
而后者又可以分為兩部分,其一是從二維圖到三維結(jié)構(gòu)的“兩步走”法,代表性方法有AlphaFold1(DeepMind)、trRosetta(楊建益)、ProFold(卜東波)、RaptorX(許錦波);其二從神經(jīng)網(wǎng)絡到三維結(jié)構(gòu)的端到端預測方法,涵蓋AlphaFold2(DeepMind)、RoseTTAFold(David Baker)。
隨后,楊建益教授結(jié)合CASP15的比賽表現(xiàn),進一步介紹了兩種方法的融合方式。
他表示,trRosetta的方法主要包括兩部分,一是通過深度學習算法預測蛋白質(zhì)殘基間的幾何信息、二是把這些信息轉(zhuǎn)化為Rosetta的能量項,通過能量最小化方法快速從頭預測蛋白質(zhì)結(jié)構(gòu)。而參賽的trRosettaX2,是在以前trRosettaX的基礎(chǔ)上,改進了氨基酸距離和角度的預測,并用trRosetta的能量函數(shù)進行折疊。而對于trRosetta預測不好的結(jié)構(gòu),則直接使用了AlphaFold2的預測結(jié)果。
劉海燕教授
此外,在本次會議中,劉海燕教授以《基于AI的蛋白質(zhì)從頭設(shè)計》為題進行了特邀報告。
劉海燕教授于1990年畢業(yè)于中科大生物系,1996年1月獲中科大博士學位。1998年11月-2000年11月先后在美國杜克大學化學系、北卡羅來納大學生物化學與生物物理系作訪問研究。2001年起在中國科學技術(shù)大學生命科學學院擔任教授,博士生導師。主要研究方向為蛋白質(zhì)設(shè)計、蛋白質(zhì)分子動力學模擬方法及應用,在相關(guān)領(lǐng)域發(fā)表學術(shù)論文90余篇。
近年來,劉海燕教授主要開展數(shù)據(jù)驅(qū)動蛋白質(zhì)設(shè)計方法研究,提出并實驗驗證了統(tǒng)計能量模型SCUBA和ABACUS,可分別用于主鏈結(jié)構(gòu)和氨基酸序列的從頭設(shè)計。
會上,他詳細介紹了以上兩種模型。他表示,近年來,國際上蛋白質(zhì)從頭設(shè)計的代表性工作主要采用RosettaDesign——使用天然結(jié)構(gòu)片段作為構(gòu)建模塊來拼接產(chǎn)生人工結(jié)構(gòu)。然而,這種方法存在設(shè)計結(jié)果單一、對主鏈結(jié)構(gòu)細節(jié)過于敏感等不足,顯著限制了設(shè)計主鏈結(jié)構(gòu)的多樣性和可變性。
因此,劉海燕教授,陳泉副教授及團隊,基于數(shù)據(jù)驅(qū)動原理,開辟出一條全新的蛋白質(zhì)從頭設(shè)計路線,在蛋白質(zhì)設(shè)計這一前沿科技領(lǐng)域?qū)崿F(xiàn)了關(guān)鍵核心技術(shù)的原始創(chuàng)新,為工業(yè)酶、生物材料、生物醫(yī)藥蛋白等功能蛋白的設(shè)計奠定了堅實的基礎(chǔ)。
據(jù)悉,該團隊首先建立了給定主鏈結(jié)構(gòu)設(shè)計氨基酸序列的ABACUS模型,進而發(fā)展了能在氨基酸序列待定時從頭設(shè)計全新主鏈結(jié)構(gòu)的SCUBA模型。理論計算和實驗證明,用SCUBA設(shè)計主鏈結(jié)構(gòu),能夠突破只能用天然片段來拼接產(chǎn)生新主鏈結(jié)構(gòu)的限制,從而顯著擴展從頭設(shè)計蛋白的結(jié)構(gòu)多樣性,甚至設(shè)計出不同于已知天然蛋白的新穎結(jié)構(gòu)。
劉海燕教授表示:“SCUBA模型+ABACUS模型,構(gòu)成了能夠從頭設(shè)計具有全新結(jié)構(gòu)和序列的人工蛋白完整工具鏈,是RosettaDesign之外目前唯一經(jīng)充分實驗驗證的蛋白質(zhì)從頭設(shè)計方法,并與之互為補充。”
值得注意的是,相關(guān)成果已于2022年2月10日發(fā)表于《Nature》,目前論文展示了9種從頭設(shè)計的蛋白質(zhì)分子的高分辨晶體結(jié)構(gòu),其中5種蛋白質(zhì)具有不同于已知天然蛋白的新穎結(jié)構(gòu)。
但從另一方面而言,盡管上述兩項技術(shù)研發(fā)已經(jīng)有了明顯的進展,但生信學者還需要著眼于未來。
“預測和設(shè)計的技術(shù)實現(xiàn)是一回事,但設(shè)計出適合下游工業(yè)生產(chǎn)的特定功能蛋白,又是一回事?!?/strong>張貴軍教授分兩方面指出,
“就預測而言,最大的問題是無法做到冷凍電鏡一樣的動態(tài)預測,AI模型擬合出來的是靜態(tài)的蛋白質(zhì)結(jié)構(gòu);就設(shè)計而言,脫離實驗室條件,人工設(shè)計的蛋白質(zhì)安全性、穩(wěn)定性、耐藥性如何都不得而知,而能否適合工業(yè)生產(chǎn)又有很多不確定性?!?/p>
龔新奇教授進一步補充道,“可以理解為,高校學者和業(yè)界學者,對于技術(shù)轉(zhuǎn)化的周期估計并不相同,業(yè)界認為轉(zhuǎn)化成果將很快出現(xiàn)?!?/strong>
他舉了兩個例子,比如,西湖歐米創(chuàng)始人郭天南教授,與醫(yī)院合作研究新冠病毒感染者多器官的蛋白組表達差異,將推動藥物和治療方法等產(chǎn)品轉(zhuǎn)化;清華丘成桐教授也與北京政府合作,在雁棲湖建立應用數(shù)學研究院,希望招聘300個世界最好的數(shù)學家,專門做“AI+生物醫(yī)學”的事情。此前丘成桐建立的清華三亞國際數(shù)學論壇,目前也在向生物育種領(lǐng)域靠攏。
周耀旗教授形容道,“數(shù)學家也想要做技術(shù)轉(zhuǎn)化,看來生命科學是塊‘大油田’?!?/strong>
周耀旗教授、龔新奇教授
總體來看,作為一門交叉學科,生信整合數(shù)學、物理、計算機等理工學科,以及生命科學、醫(yī)學、藥學等醫(yī)農(nóng)學科。但直到今天,生信的學科價值愈發(fā)體現(xiàn)在轉(zhuǎn)化應用。
換句話說,當數(shù)學家、生信學者以及各行各業(yè)都在考慮技術(shù)轉(zhuǎn)化時,或許生命科學的帷幕才被徐徐拉開。
這些年來,全國生信大會在各地高校留下根基,先后在哈爾濱醫(yī)科大學、東南大學、電子科技大學、澳門大學、同濟與復旦、四川大學舉辦。時至今日,大會主席孫之榮仍能清晰記得每屆承辦單位的主要負責人:
華中科技大學肖翌、浙江大學鐘伯雄,陳銘、哈爾濱醫(yī)科大學李霞、東南大學孫嘯、成都電子科技大學郭鋒彪,黃健、澳門大學張曉華、上海同濟大學張勇,復旦大學趙興明,田衛(wèi)東、四川大學沈百榮、以及本屆會議負責人,中山大學周天壽,張家軍。
最后,孫之榮教授對所有生信同道作出寄語,“在各位同行的努力下,生物信息學在中國蓬勃發(fā)展,已經(jīng)產(chǎn)生了大量重要研究成果,其在生物醫(yī)藥等研究領(lǐng)域的引領(lǐng)作用日益凸顯;生物信息學的發(fā)展前景非常好,希望領(lǐng)域內(nèi)的研究人員能夠不斷創(chuàng)新,堅持初心,傳承精神。我們也要更加緊密團結(jié)在中國生物信息學學會(籌)的旗幟下,為祖國的強盛和人民的幸福做貢獻。”
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。