0
本文作者: 任平 | 2023-09-12 20:07 |
AI 藥物研發(fā)是人工智能未來應(yīng)用的重要方向之一。
自新冠病毒(SARS-CoV-2)首次爆發(fā)以來,新冠病毒的小分子藥物研發(fā)備受關(guān)注,于近期舉行的首屆 AI 藥物研發(fā)算法大賽便聚焦于此。
在比賽中,來自微軟研究院科學(xué)智能中心的團(tuán)隊(duì),憑借創(chuàng)新的 AI 模型系統(tǒng) AI2BMD 和 ViSNet 取得了絕佳的成績(jī),斬獲桂冠。
近日,由清華大學(xué)藥學(xué)院、百度飛槳、百度智能云和臨港實(shí)驗(yàn)室聯(lián)袂主辦的首屆 AI 藥物研發(fā)算法大賽公布了比賽結(jié)果,來自微軟研究院科學(xué)智能中心的團(tuán)隊(duì),利用研發(fā)的量子精度動(dòng)力學(xué)模擬系統(tǒng) AI2BMD 和通用分子三維結(jié)構(gòu)網(wǎng)絡(luò) ViSNet 在初賽、復(fù)賽、決賽中均位列第一,并獲得大賽的總冠軍,展現(xiàn)了 AI 在促進(jìn)藥物研發(fā)方面的應(yīng)用潛力。
微軟研究院科學(xué)智能中心團(tuán)隊(duì)獲得首屆 AI 藥物研發(fā)算法大賽冠軍
本次大賽由中國(guó)藥學(xué)會(huì)等機(jī)構(gòu)支持,共有來自全球的878支團(tuán)隊(duì)參賽。作為一場(chǎng)全球性的技術(shù)創(chuàng)新活動(dòng),此次大賽聚焦于新冠病毒(SARS-CoV-2)小分子藥物研發(fā)。
事實(shí)上,自新冠病毒首次爆發(fā)以來,新冠病毒的小分子藥物研發(fā)就備受關(guān)注。
若要抵抗新冠病毒肆虐,深入了解病毒復(fù)制與感染機(jī)制至關(guān)重要。其中,新冠病毒主蛋白酶(Mpro)作為關(guān)鍵酶,負(fù)責(zé)感染過程中剪切病毒產(chǎn)生的蛋白質(zhì)前體,促進(jìn)病毒復(fù)制,所以主蛋白酶是一個(gè)潛在的治療靶點(diǎn),抑制其活性可有效干擾病毒的復(fù)制過程,為治療方法提供突破口。
因此,本次比賽的初賽階段,參賽者需要使用深度學(xué)習(xí)、分子對(duì)接等方法進(jìn)行建模,預(yù)測(cè)小分子抑制主蛋白酶活性的概率,復(fù)賽則重點(diǎn)關(guān)注小分子在 Caco 細(xì)胞上抑制新冠病毒復(fù)制的概率。
在初賽對(duì)新冠病毒主蛋白酶的藥物預(yù)測(cè)中,面對(duì)常用分子對(duì)接軟件無法有效區(qū)分正負(fù)樣本與靶點(diǎn)蛋白結(jié)合自由能的問題,微軟研究院科學(xué)智能中心團(tuán)隊(duì)利用了最新開發(fā)的 AI2BMD 模擬系統(tǒng),將藥物預(yù)測(cè)精度顯著提升。
AI2BMD 模擬系統(tǒng)實(shí)現(xiàn)了對(duì)超10000原子的各種蛋白質(zhì)能能量和力的精確計(jì)算,并具有廣泛的適用性。相較于密度泛函理論(DFT),AI2BMD 模擬系統(tǒng)的計(jì)算時(shí)間縮短了數(shù)個(gè)數(shù)量級(jí)。
憑借幾百納秒的動(dòng)力學(xué)模擬,AI2BMD 展現(xiàn)了在探索蛋白質(zhì)構(gòu)象空間、預(yù)測(cè)核磁共振實(shí)驗(yàn)數(shù)據(jù)以及模擬蛋白質(zhì)折疊過程等方面的卓越能力。與傳統(tǒng)分子對(duì)接、經(jīng)典動(dòng)力學(xué)模擬方法相比,AI2BMD 系統(tǒng)在計(jì)算結(jié)合自由能方面也有明顯優(yōu)勢(shì)。
AI2BMD 模擬系統(tǒng)論文鏈接:https://www.biorxiv.org/content/10.1101/2023.07.12.548519v1
復(fù)賽中,團(tuán)隊(duì)運(yùn)用自主開發(fā)的分子建模幾何深度學(xué)習(xí)模型 ViSNet 化合物分子進(jìn)行了表征學(xué)習(xí)。ViSNet 是 AI2BMD 模擬系統(tǒng)中的機(jī)器學(xué)習(xí)勢(shì)能函數(shù)。
作為一種等變的幾何增強(qiáng)圖神經(jīng)網(wǎng)絡(luò),ViSNet 能在線性計(jì)算的復(fù)雜度下提取幾何特征(距離、角度、二面角等)。在多個(gè)分子動(dòng)力學(xué)基準(zhǔn)(包括 MD17、rMD17 和 MD22)上,ViSNet 表現(xiàn)均優(yōu)于其他先進(jìn)方法,同時(shí)也在 QM9 和 Molecule3D 數(shù)據(jù)集上實(shí)現(xiàn)了卓越的量子化學(xué)性質(zhì)預(yù)測(cè)。
團(tuán)隊(duì)在復(fù)賽階段,還利用自主研發(fā)的首個(gè)蛋白大分子全構(gòu)象空間數(shù)據(jù)集 AIMD-Chig 和小分子公開數(shù)據(jù)集 OGB 分別對(duì)蛋白和小分子的三維結(jié)構(gòu)表征進(jìn)行了預(yù)訓(xùn)練,然后通過多任務(wù)學(xué)習(xí)對(duì)模型進(jìn)行微調(diào)。
該方法不僅取得了最佳的預(yù)測(cè)精度,而且以大比分領(lǐng)先比賽的第二名團(tuán)隊(duì)。在最終的決賽答辯中,微軟研究院科學(xué)智能中心團(tuán)隊(duì)的新冠藥物預(yù)測(cè)算法方案取得了總分99.60分的絕佳成績(jī),相較比賽亞軍90.76分、季軍85.31分的最終成績(jī)具有顯著優(yōu)勢(shì)。
微軟研究院科學(xué)智能中心團(tuán)隊(duì)提出的新冠藥物預(yù)測(cè)算法方案
通過此次藥物研發(fā)大賽,微軟研究院科學(xué)智能中心開發(fā)的量子精度動(dòng)力學(xué)模擬系統(tǒng) AI2BMD 展現(xiàn)了出色的實(shí)際應(yīng)用潛力。
未來,AI2BMD 有望在生命活動(dòng)的分子機(jī)理解釋、藥物設(shè)計(jì)、酶催化等方面進(jìn)行更廣泛的探索,助力 AI 藥物研發(fā)的加速發(fā)展。
雷峰網(wǎng)雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。