0
本文作者: 任平 | 2023-11-03 09:51 |
大約五年前,谷歌最多產(chǎn)的以AI為中心的研究實(shí)驗(yàn)室之一,DeepMind,推出了 AlphaFold。這是一種可以準(zhǔn)確預(yù)測(cè)人體內(nèi)許多蛋白質(zhì)結(jié)構(gòu)的人工智能系統(tǒng)。
從那時(shí)起,DeepMind 對(duì)系統(tǒng)進(jìn)行了改進(jìn),于 2020 年發(fā)布了更新且功能更強(qiáng)大的 AlphaFold 版本--AlphaFold 2。
實(shí)驗(yàn)室的工作仍在繼續(xù)。
10月31日,DeepMind表示,最新版本 AlphaFold 已經(jīng)出爐,不少人將其取名為“AlphaFold 3”。
據(jù)悉,最新的 AlphaFold 系統(tǒng)由DeepMind及其衍生公司 Isomorphic Labs (專(zhuān)注于利用 AI 做藥物發(fā)現(xiàn))共同開(kāi)發(fā),不再局限于蛋白質(zhì)折疊,還能夠在配體、蛋白質(zhì)、核酸以及翻譯后修飾等方面生成高度精確的結(jié)構(gòu)預(yù)測(cè)。且 Isomorphic Labs 公司已經(jīng)將該系統(tǒng)用于藥物發(fā)現(xiàn)工作。
不過(guò)最新版本的“ AlphaFold 3 ”還處于預(yù)覽階段,后續(xù)開(kāi)發(fā)工作還在進(jìn)行。
AlphaFold新版本有哪些升級(jí)?
第一大升級(jí):預(yù)測(cè)蛋白質(zhì)數(shù)據(jù)庫(kù)(PDB)中大多數(shù)分子類(lèi)型的結(jié)構(gòu),達(dá)原子精度。
根據(jù)DeepMind的說(shuō)法,AlphaFold可以預(yù)測(cè)蛋白質(zhì)數(shù)據(jù)庫(kù)(一個(gè)廣泛使用的科學(xué)數(shù)據(jù)庫(kù))中幾乎所有分子的結(jié)構(gòu)。DeepMind聲稱(chēng),該模型通常以“原子精度”生成這些預(yù)測(cè)。
AlphaFold 新版本不僅可以估計(jì)蛋白質(zhì)的形狀,還可以估計(jì)其他生物分子的形狀。包括:小分子(配體)、蛋白質(zhì)、核酸(DNA和RNA)、具有翻譯后修飾(PTM)的分子。
第二大升級(jí):預(yù)測(cè)相關(guān)配體的結(jié)構(gòu)。
所謂配體,是指其他不同分子與蛋白質(zhì)結(jié)合,并導(dǎo)致蛋白質(zhì)功能方式發(fā)生變化。配體在細(xì)胞信號(hào)傳導(dǎo)中起著重要作用,細(xì)胞信號(hào)傳導(dǎo)是細(xì)胞相互影響行為的關(guān)鍵生物過(guò)程。
一種情況是,當(dāng)配體附著或結(jié)合到蛋白質(zhì)上時(shí),組合結(jié)構(gòu)稱(chēng)為“蛋白質(zhì)-配體復(fù)合物”。研究人員歷來(lái)使用一種稱(chēng)為“對(duì)接”的方法評(píng)估這種復(fù)合物的形狀。但這一方法的局限性是,只有當(dāng)有大量關(guān)于蛋白質(zhì)-配體復(fù)合物的蛋白質(zhì)成分的數(shù)據(jù)可用時(shí),才能使用這種方法。
根據(jù) DeepMind 的說(shuō)法,新版本的 AlphaFold 新版本可以比“對(duì)接”方法更準(zhǔn)確地預(yù)測(cè)蛋白質(zhì)-配體復(fù)合物的形狀。與這些方法相比,AlphaFold 新版本需要的數(shù)據(jù)要少得多。
DeepMind最新模型為蛋白質(zhì)-配體結(jié)構(gòu)預(yù)測(cè)設(shè)定了新的標(biāo)準(zhǔn),在預(yù)測(cè)蛋白質(zhì)-配體相互作用方面,新AlphaFold的性能比傳統(tǒng)方法高出約20%,并且還可以預(yù)測(cè)尚未進(jìn)行結(jié)構(gòu)表征的全新蛋白質(zhì)。
因此,AlphaFold 新版本可能會(huì)使科學(xué)家更容易研究新發(fā)現(xiàn)的蛋白質(zhì)-配體復(fù)合物,而這些復(fù)合物的信息很少,而且可以幫助科學(xué)家識(shí)別和設(shè)計(jì)潛在的藥物新分子。
Isomorphic Labs 最新公布了3個(gè)案例實(shí)驗(yàn):抗癌分子的結(jié)合(PORCN)、關(guān)鍵癌癥靶標(biāo)的共價(jià)配體結(jié)合(KRAS),脂質(zhì)激酶變構(gòu)抑制劑(PI5P4Kγ)的結(jié)構(gòu)預(yù)測(cè)。結(jié)果顯示,該模型預(yù)測(cè)的結(jié)構(gòu)與案例實(shí)驗(yàn)中測(cè)定的結(jié)構(gòu)非常接近。
這一舉動(dòng)引起相關(guān)學(xué)者和藥企的關(guān)注。有人在國(guó)內(nèi)外社交平臺(tái)表示:“設(shè)計(jì)新的分子比開(kāi)發(fā)工具更重要,開(kāi)發(fā)類(lèi)似工具的人可能要改行,畢竟設(shè)計(jì)新的高價(jià)值的分子才可能是更好的生財(cái)之道?!?/p>
不過(guò),也有人希望新版本能力再做進(jìn)一步提升:很多時(shí)候,最新的 Alphafold 的相對(duì)準(zhǔn)確率(RMSD誤差<2A)也只有50-60%,這對(duì)于藥物設(shè)計(jì)來(lái)說(shuō)往往會(huì)有很多問(wèn)題。
更進(jìn)一步說(shuō),蛋白質(zhì)和小分子復(fù)合物的結(jié)構(gòu)預(yù)測(cè),應(yīng)該是結(jié)合了AI和CADD兩種方法,即分別基于數(shù)據(jù)庫(kù)和物理原理,
第三大升級(jí):預(yù)測(cè)核酸、以及翻譯后修飾結(jié)構(gòu)。
核酸是關(guān)鍵遺傳信息的攜帶者,并破譯翻譯后修飾--即蛋白質(zhì)誕生后發(fā)生的化學(xué)變化。
例如,在 CasLambda 與 crRNA 以及 DNA 結(jié)合的結(jié)構(gòu)中,CasLambda 共享 CRISPR-Cas9 系統(tǒng)的基因編輯能力,通常被稱(chēng)為“基因剪刀”,研究人員可以利用它來(lái)改變動(dòng)植物和微生物的DNA,而 CasLambda 的較小尺寸可能使其在基因編輯中更加有效。
據(jù)一位從事藥物設(shè)計(jì)的公司創(chuàng)始人評(píng)價(jià):做核酸藥物的人有福了,至少有個(gè)結(jié)果。不過(guò)結(jié)果是否準(zhǔn)確,還需找個(gè)有經(jīng)驗(yàn)的CADD(計(jì)算機(jī)輔助藥物設(shè)計(jì))研究員來(lái)評(píng)估。
此外,也有人指出,“我更關(guān)心 Alphafold 3 是否可以用于預(yù)測(cè)病毒的蛋白質(zhì)結(jié)構(gòu)。AFDB(數(shù)據(jù)庫(kù))中有很多預(yù)測(cè)結(jié)構(gòu),幾乎涵蓋了所有物種,但沒(méi)有病毒。而且新版本對(duì)RNA結(jié)構(gòu)預(yù)測(cè)還不太好?!?/p>
總體而言,至于 AlphaFold 3 具體性能表現(xiàn),DeepMind 和 Isomorphic Labs 研究人員透露:
?考慮到比較系統(tǒng)使用已知的蛋白質(zhì)結(jié)構(gòu)作為基礎(chǔ),AlphaFold 3 在配體對(duì)接的準(zhǔn)確性方面,優(yōu)于開(kāi)源分子建模模擬軟件 AutoDock Vina 等傳統(tǒng)系統(tǒng);
?與AlphaFold 2.3相比,AlphaFold 3 在預(yù)測(cè)蛋白質(zhì)-蛋白質(zhì)結(jié)構(gòu)方面,抗體結(jié)合結(jié)構(gòu)顯著增強(qiáng);
?此在蛋白質(zhì)-核酸相互作用方面,AlphaFold 3 優(yōu)于其他競(jìng)爭(zhēng)方法,如RoseTTA2FoldNA等;
?在 RNA 結(jié)構(gòu)預(yù)測(cè)方面,AlphaFold 3 優(yōu)于自動(dòng)化技術(shù),但略低于頂級(jí)CASP 15 參賽者,后者涉及專(zhuān)家手動(dòng)干預(yù)。
但饒有意味的是,針對(duì)最新版本,DeepMind的博客文章并沒(méi)有介紹方法,也沒(méi)有對(duì)比薛定諤的方法。這可能是競(jìng)爭(zhēng)關(guān)系的原因。
無(wú)論如何,從表面上看,AlphaFold 3 的功能有了大幅度的提升,如果真如DeepMind所說(shuō),那么新版模型擴(kuò)展的功能和性能提升可以加速生物醫(yī)學(xué)突破,為疾病通路、基因組學(xué)、生物可再生材料、植物免疫、潛在治療靶點(diǎn)、藥物設(shè)計(jì)機(jī)制提供各種全新的可能性。
“AlphaFold 3 ”能否繼續(xù)開(kāi)源?
盡管 AlphaFold 最新版本推出不到兩天,但已經(jīng)有不少人已經(jīng)開(kāi)始期盼望繼續(xù)開(kāi)源,“因?yàn)閷W(xué)術(shù)界對(duì)蛋白質(zhì)的研究已經(jīng)空前高漲。”
一個(gè)典型例子是:
盡管 OpenAI 的 ChatGPT 在 2022 年底亮相時(shí)就席卷全球,但 2022 年被引用次數(shù)最多的論文并非關(guān)于生成人工智能(AIGC),甚至不是來(lái)自大型科技公司,而是歐洲分子生物學(xué)實(shí)驗(yàn)室(EMBL-EBI)和 DeepMind 出版的“AlphaFold 蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫(kù)”,被引次數(shù)為 1331 次。
更有趣的是,引用量第二同樣屬于“蛋白質(zhì)折疊模型”--ColabFold。該系統(tǒng)由馬克斯·普朗克多學(xué)科科學(xué)研究所(MPG)打造,引用次數(shù)為 1138 次。
從一定程度上說(shuō),盡管企業(yè)界將2022年描述為“生成人工智能年”,但學(xué)術(shù)界則認(rèn)為:2022年絕對(duì)是“蛋白質(zhì)折疊預(yù)測(cè)年”。
“目前 Alphafold 擁有3項(xiàng)以上的專(zhuān)利,這不該是理所當(dāng)然的,也不該是常態(tài)。不過(guò)AF歷代版本確實(shí)是目前生物領(lǐng)域最先進(jìn)的工具,沒(méi)有之一?!?/p>
更有人指出,“閉源不是最好的解決方案,為什么大多數(shù)國(guó)家都傾向于使用AlphaFold ?我有點(diǎn)懷疑大多數(shù)國(guó)家是否有人才和預(yù)算,來(lái)制造像AlphaFold 和蛋白質(zhì)數(shù)據(jù)庫(kù)這樣的東西。”
據(jù)悉,DeepMind在 AlphaFold 3發(fā)布當(dāng)天披露,已累計(jì)超過(guò)140萬(wàn)用戶(hù)(來(lái)自190多個(gè)國(guó)家)訪(fǎng)問(wèn)了AlphaFold蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫(kù)。
不過(guò)未來(lái)“AlphaFold 3” 能否真正推動(dòng)藥物開(kāi)發(fā),還有待時(shí)間去驗(yàn)證。
具體細(xì)節(jié)可查閱原始博客:https://storage.googleapis.com/deepmind-media/DeepMind.com/Blog/a-glimpse-of-the-next-generation-of-alphafold/alphafold_latest_oct2023.pdf
雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))雷峰網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。