丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
醫(yī)療AI 正文
發(fā)私信給任平
發(fā)送

0

深圳灣實驗室周耀旗:填補AlphaFold 2缺口,開啟所有蛋白質(zhì)結(jié)構(gòu)的高精度預(yù)測時代

本文作者: 任平 2023-12-04 11:11
導(dǎo)語:人類能否參透微觀世界的奧秘?

人類能否參透微觀世界的奧秘?

如果把這個問題放在生命科學(xué)領(lǐng)域,直接指向就是遺傳信息的最終生成物——蛋白質(zhì)。

人類的體內(nèi)有10萬種以上的蛋白質(zhì),它們都是由20種氨基酸排列組合產(chǎn)生的。數(shù)十到數(shù)百的氨基酸集合成為擁有各種立體結(jié)構(gòu)的蛋白質(zhì),這些蛋白質(zhì)在它們的“坑洼”處和特定的物質(zhì)相結(jié)合,而發(fā)揮其各種各樣固有的機能。

這也就是說,只要拿到了每一種蛋白質(zhì)的結(jié)構(gòu),就能得知它的功能。

那么更進(jìn)一步地,人類想要在通過蛋白質(zhì)結(jié)構(gòu)輔助設(shè)計、新藥分子設(shè)計,研制出可以帶來領(lǐng)域變革的原創(chuàng)新藥,就變的“十拿九穩(wěn)”。

這并非隨意而下的定論。以醫(yī)藥研發(fā)行業(yè)公認(rèn)的“雙十定律”來看,創(chuàng)新藥從開始研發(fā)到上市最少需要10年,耗資最少10億美元。但即使?jié)M足時間和金錢的雙重成本,創(chuàng)新藥研發(fā)成功的概率依然只有不足10%。

“這是一個蛋白質(zhì)結(jié)構(gòu)預(yù)測時代。”厘清生命科學(xué)的底層邏輯,在基礎(chǔ)科學(xué)與臨床藥物之間搭起一座橋梁,是無數(shù)人的終生理想。

在蛋白質(zhì)這一命題上,曾有全球科技巨頭谷歌旗下的前沿人工智能企業(yè)DeepMind,將機器學(xué)習(xí)和系統(tǒng)神經(jīng)科學(xué)的最先進(jìn)技術(shù)結(jié)合起來,建立強大的通用學(xué)習(xí)算法,最搶眼的一大成果便是在蛋白質(zhì)結(jié)構(gòu)預(yù)測上的應(yīng)用。

2020年底,其人工智能系統(tǒng)“AlphaFold 2”一戰(zhàn)成名,將人工智能預(yù)測的蛋白質(zhì)結(jié)構(gòu)達(dá)到了實驗測定的精確度。直到今年10月底,DeepMind對蛋白質(zhì)結(jié)構(gòu)的研究仍在繼續(xù),并對外劇透:AlphaFold 3即將推出,已用于藥物設(shè)計。

具體細(xì)節(jié)可點擊文章:「AlphaFold 3」要來了?DeepMind最新推出新一代蛋白質(zhì)結(jié)構(gòu)預(yù)測工具,已用于藥物設(shè)計

除了工業(yè)界的這位常青選手外,不少學(xué)術(shù)派也置身其中。

不過,一個最新里程碑進(jìn)展已經(jīng)出現(xiàn):人類可望實現(xiàn)對所有蛋白質(zhì)結(jié)構(gòu)進(jìn)行高精度預(yù)測,彌補了AlphaFold 2對那些在天然蛋白質(zhì)中難以找到同源序列的蛋白質(zhì)無法進(jìn)行高精度結(jié)構(gòu)預(yù)測的不足。

這一成果來自深圳灣實驗室周耀旗教授團隊(湯金樂、張哲、詹劍、周耀旗),目前該論文成果已經(jīng)上線預(yù)印本網(wǎng)站bioRxiv 。

深圳灣實驗室周耀旗:填補AlphaFold 2缺口,開啟所有蛋白質(zhì)結(jié)構(gòu)的高精度預(yù)測時代

鏈接:https://biorxiv.org/cgi/content/short/2023.11.22.568372v1

補上AlphaFold 2的一塊缺口

眾所周知,通過實驗技術(shù)確定“高分辨率蛋白質(zhì)結(jié)構(gòu)”,既昂貴又耗費力。直到AlphaFold 2的出現(xiàn),開啟了一個基于深度學(xué)習(xí)的計算預(yù)測時代。

但,這一方法也僅適用于那些天然存在的、已有足夠同源序列的蛋白質(zhì)。

這是因為AlphaFold 2主要依賴于進(jìn)化信息進(jìn)行預(yù)測。它是通過端到端的深度學(xué)習(xí)、利用大數(shù)據(jù)和大模型,找到了多個同源序列與相應(yīng)的“單一”結(jié)構(gòu)之間的關(guān)系。

也就是說,AlphaFold2強烈依賴于多序列比對(MSA)中的進(jìn)化和協(xié)同進(jìn)化信息。對于找不到太多同源序列的蛋白質(zhì)(例如抗體,孤兒蛋白,病毒蛋白,復(fù)合物等),AlphaFold 2預(yù)測的精確度就會大幅度下降。

數(shù)據(jù)顯示,雖然估計AlphaFold 2可以覆蓋大約98.5%的人類蛋白質(zhì)組,但只有58%的殘基可以被可靠地預(yù)測,而只有36%的殘基可以被高置信度地預(yù)測。

拿抗體來說??贵w本身是針對新的抗原進(jìn)行的快速突變,進(jìn)化時間相對較短。它們是基于抗體庫中挑選出來的,因此抗體的序列并不多樣化,這導(dǎo)致過去AlphaFold 2難以準(zhǔn)確預(yù)測其結(jié)構(gòu)。

但這并非沒有解法。

解決同源序列不足的蛋白質(zhì)結(jié)構(gòu)預(yù)測的兩種方法是:

用新解析的基因組或宏基因組數(shù)據(jù)更新序列數(shù)據(jù)庫,并提高同源搜索的靈敏度。這可能對某些蛋白質(zhì)有效,但不能解決那些缺乏天然同源序列的蛋白質(zhì)的問題。

另外一種方法是,通過學(xué)習(xí)數(shù)據(jù)庫中的其他進(jìn)化序列,使用隱含進(jìn)化信息的蛋白質(zhì)語言模型。

然而,這兩種方法均無法對不同的蛋白質(zhì)實現(xiàn)一致的、高精度的預(yù)測。

“如果天然同源序列不充分,是否可以采用人工生成的同源序列來改進(jìn)結(jié)構(gòu)預(yù)測?”

周耀旗教授作了一個形象比喻:既然上述蛋白質(zhì)沒有那么多兄弟姐妹,能否人為地制造多個,再用AlphaFold 2來預(yù)測結(jié)構(gòu)。

但這一方法的難度在于:

其一,與大多數(shù)經(jīng)過數(shù)十億年進(jìn)化的天然序列不同,人工生成的同源序列是在實驗室進(jìn)化的短時間內(nèi)產(chǎn)生的,目前尚不清楚高度同源序列(>95%序列同一性),是否可以直接用于AlphaFold 2或相關(guān)的預(yù)測工具。

其二,大多數(shù)深度突變掃描實驗都是通過功能篩選進(jìn)行的。例如抗生素抗性蛋白、熒光蛋白和具有特異結(jié)合性能的蛋白。鑒于數(shù)千種蛋白質(zhì)功能,不可能針對不同的功能開發(fā)不同的篩選技術(shù),更不用說并不是所有的蛋白質(zhì)功能都適合高通量研究。

因此,利用人工同源序列進(jìn)行結(jié)構(gòu)推斷,將需要一種技術(shù),它是基于結(jié)構(gòu)穩(wěn)定性來篩選結(jié)構(gòu)上同源的序列。

原則上,這種技術(shù)可以適用于所有依賴穩(wěn)定結(jié)構(gòu)發(fā)揮功能的蛋白質(zhì),無論其功能類型如何。現(xiàn)有的監(jiān)測蛋白質(zhì)折疊穩(wěn)定性的方法,主要依賴于蛋白酶誘導(dǎo)的蛋白質(zhì)水解或蛋白質(zhì)片段互補實驗。

然而,每種技術(shù)都有其局限性,如篩選能力或靶蛋白的大小限制。更重要的是,這些技術(shù)并不是為預(yù)測蛋白質(zhì)結(jié)構(gòu)而設(shè)計或測試的。

針對上述問題,周耀旗教授介紹,“我們發(fā)現(xiàn),采用人工生成的、基于結(jié)構(gòu)穩(wěn)定性篩選的、并通過高通量測序所獲得的同源序列,作為AlphaFold2的輸入,可以實現(xiàn)蛋白質(zhì)結(jié)構(gòu)的高精度預(yù)測?!?/p>

深圳灣實驗室周耀旗:填補AlphaFold 2缺口,開啟所有蛋白質(zhì)結(jié)構(gòu)的高精度預(yù)測時代

周耀旗教授

實驗結(jié)果表明:

?僅一輪帶有少量突變的大規(guī)模篩選,就足以實現(xiàn)結(jié)構(gòu)的高精度預(yù)測。

?對于實驗的5個蛋白質(zhì)中的4個,只進(jìn)行了一輪深度突變序列的篩選,就足以使預(yù)測結(jié)構(gòu)的準(zhǔn)確度達(dá)到小于2? RMSD。其中3個蛋白質(zhì)的表現(xiàn)甚至優(yōu)于使用天然同源序列的AlphaFold2。

?唯一一個預(yù)測結(jié)構(gòu)RMSD大于2?(2.92?)的蛋白質(zhì),有一個完全暴露在表面上的β發(fā)夾,在非結(jié)晶條件下可能是可以靈活變動的構(gòu)象。

值得注意的是,該研究通過將簡單的分子生物學(xué)實驗(深度突變掃描加體內(nèi)或體外篩選)與高通量測序相結(jié)合,顯著降低蛋白質(zhì)結(jié)構(gòu)測定的成本,并提高周轉(zhuǎn)效率。

也就是說,這種具有成本效益的技術(shù)可以在任何分子生物學(xué)實驗室進(jìn)行,而不需要昂貴的設(shè)備。相比用實驗方法解析這些結(jié)構(gòu),如X射線衍射或冷凍電鏡等,費用要低至少一個量級,而且該方法實驗操作簡單,后續(xù)有望改寫蛋白質(zhì)結(jié)構(gòu)的研究范式。

此外,這一技術(shù)可以進(jìn)一步擴展到預(yù)測蛋白質(zhì)復(fù)合物,以及具有翻譯后修飾的蛋白質(zhì)的結(jié)構(gòu)。

據(jù)悉,這一方法命名為“Sibs-Seq”,兄弟姐妹的測序。

目前該論文成果已經(jīng)上線預(yù)印本網(wǎng)站 bioRxiv,標(biāo)題為《Effective High-Accuracy Prediction of Protein Structures from Easily Obtainable Artificial Homologous Sequences by Structure-Stability-Based Selection》(基于結(jié)構(gòu)穩(wěn)定性的篩選,從容易獲得的人工同源序列中高效高精度地預(yù)測蛋白質(zhì)結(jié)構(gòu))。

回到新藥研制的社會話題上,該方法也將有極大的應(yīng)用價值。

通過預(yù)測蛋白質(zhì)的結(jié)構(gòu)和變化,可以更好地了解蛋白質(zhì)與藥物相互作用的機制、抗體與抗原相互作用機制,從而設(shè)計出更有效的藥物。

此外,該方法還可以應(yīng)用于合成生物學(xué)領(lǐng)域。通過預(yù)測蛋白質(zhì)的結(jié)構(gòu)和變化,可以更好地了解合成生物學(xué)中的生物系統(tǒng)如何響應(yīng)外部刺激,從而優(yōu)化生物系統(tǒng)的設(shè)計和性能。

“低突變無用論”成為過去

“在我們的工作過程中有一大驚喜,反而成為了這一研究的重要轉(zhuǎn)折點。”

周教授意思是指,利用AlphaFold 2進(jìn)行蛋白結(jié)構(gòu)預(yù)測時,如何處理自然進(jìn)化和人為變異的差異方面,已經(jīng)有了一些新發(fā)現(xiàn)。

由于自然進(jìn)化需要幾千萬年甚至幾億年的時間,這個過程中許多氨基酸發(fā)生了變化,且氨基酸變化的范圍廣泛且變化量大。因此,許多人在處理進(jìn)化信息時會排除相似同源的信息,認(rèn)為這些信息量太少沒有用處。

周耀旗團隊雖然認(rèn)為人工低突變同源序列很有用,可以從中萃取出比較準(zhǔn)確氨基酸接觸圖,并在RNA上證明了這一點,但AlphaFold 2是用高突變的同源序列來訓(xùn)練的,可能需要人工進(jìn)行多輪進(jìn)化的多突變序列,才能到達(dá)一定的效果。他們沒想到,即使只改變一個或兩個氨基酸,只要有足夠的數(shù)量就可以使用AlphaFold 2來預(yù)測蛋白質(zhì)結(jié)構(gòu),達(dá)原子精度。

他們這次實驗一共做了的5個蛋白質(zhì),里面有3個,利用獲得的人工同源序列,預(yù)測的蛋白質(zhì)結(jié)構(gòu)比用天然同源序列還要精確,這是一個意外的發(fā)現(xiàn)。這表明,盡管天然同源序列對許多蛋白質(zhì)可以通過搜索獲取,但人工同源序列有它的優(yōu)勢。

周教授認(rèn)為:

首先,突變少,意味著對結(jié)構(gòu)的影響小,完全相同結(jié)構(gòu)的可能性遠(yuǎn)遠(yuǎn)超過天然同源序列,因此大量少突變的人工同源序列比少量多突變的天然同源序列應(yīng)該對結(jié)構(gòu)預(yù)測更有用。其次,不像天然同源序列,人工同源序列的數(shù)量是可控的,如果覆蓋率不夠高,可以再做幾輪實驗來達(dá)到目標(biāo)。

其次,自然進(jìn)化的序列還受功能以及其它與折疊不完全相關(guān)的因素決定,也包含著測序、比對可能錯誤等過程帶來的噪音,而人工同源序列則信噪比好很多。

最后,該方法不同于利用功能篩選的方案,比如抗性基因的功能,利用結(jié)構(gòu)的穩(wěn)定性來篩選,保證了方法的普適性以及突變序列與原來序列結(jié)構(gòu)的一致性。

據(jù)周耀旗介紹,這一方法包括深度突變、穩(wěn)定性篩選、高通量測序和結(jié)構(gòu)預(yù)測等四大關(guān)鍵步驟。

1,深度突變:對基因進(jìn)行深度突變。這意味著對基因的整個序列進(jìn)行隨機突變,以單突變和雙突變?yōu)橹?,涵蓋了所有的位置,突變種類至少10^?6次方以上。

2,穩(wěn)定性篩選:突變后的>10^?6的基因庫會被裝入一個設(shè)計成能夠進(jìn)行穩(wěn)定性篩選的質(zhì)粒,并電轉(zhuǎn)到大腸桿菌里,其中突變后的蛋白質(zhì)結(jié)構(gòu)穩(wěn)定性高的基因變體,它會把鼠源二氫葉酸還原酶兩個片段拉在一起,形成有功能的結(jié)構(gòu),導(dǎo)致甲氧芐啶耐藥性,大腸桿菌能夠在甲氧芐啶存在的條件下生存,繁殖,和擴增,導(dǎo)致穩(wěn)定性高的基因變體被富集。反之,對于那些突變后的蛋白質(zhì)結(jié)構(gòu)不穩(wěn)定的基因變體,大腸桿菌沒有甲氧芐啶耐藥性,從而這些變體會減少或者消失。

3,高通量測序:在經(jīng)過一段時間(如12-36小時)的培養(yǎng)后,穩(wěn)定性高的蛋白質(zhì)會生長得更快,這樣其序列數(shù)目就會更多。通過高通量測序可以測量出很多序列,其中有些序列的數(shù)量特別多,有些則非常少,還有的序列已經(jīng)消失。

4,預(yù)測結(jié)構(gòu):通過比較不同突變體的富集度,可以估算其穩(wěn)定性。然后把結(jié)構(gòu)穩(wěn)定的蛋白變體作為同源序列放到AlphaFold 2進(jìn)行結(jié)構(gòu)預(yù)測。這個預(yù)測結(jié)構(gòu)的過程就是該方法的最后一步。

回國以來的里程碑工作

2021年3月,周耀旗結(jié)束了長達(dá)36年國外留學(xué)及教學(xué)生涯,加入深圳灣實驗室,擔(dān)任系統(tǒng)與物理生物學(xué)研究所副所長。

現(xiàn)階段主要工作是蛋白質(zhì)和RNA結(jié)構(gòu)的預(yù)測、功能蛋白質(zhì)設(shè)計、以及開發(fā)和應(yīng)用蛋白質(zhì)和RNA新語言模型。

在RNA結(jié)構(gòu)預(yù)測上,周耀旗團隊成功地開發(fā)了目前最大的核酸序列數(shù)據(jù)庫MARS,大大改進(jìn)了通過RNAcmap進(jìn)行優(yōu)質(zhì)同源序列的搜索,并由此發(fā)展了RNA同源序列比對語言模型RNA-MSM,可以更加準(zhǔn)確地預(yù)測RNA的二級結(jié)構(gòu)和三級結(jié)構(gòu)穩(wěn)定的堿基對。

此外,團隊也發(fā)展了一個基于接觸圖神經(jīng)網(wǎng)絡(luò)的蛋白質(zhì)設(shè)計模型SPIN-CGNN,比目前的方法在多個計算指標(biāo)上有不少的進(jìn)步。

而此次所有蛋白質(zhì)結(jié)構(gòu)的高精度預(yù)測工作,也是周耀旗這兩年來研究工作的一大里程碑。

“這是我回國后比較滿意的一個工作?!敝芤毂硎?。

同時他也指出,“在AlphaFold出現(xiàn)之前,靠測序來解析結(jié)構(gòu)這個念頭就有了。我2006年之后在美國印第安納大學(xué)開始做這個項目,在澳洲與詹劍、張哲、熊鵬等合作利用RNA證明了低突變的同源序列具有高質(zhì)量的結(jié)構(gòu)信息,如今在湯金樂加入團隊后總算證明了人工同源序列的獨特優(yōu)勢?!?/p>

該文以湯金樂,張哲為共同一作,詹劍和周耀旗為共同通信作者發(fā)在預(yù)印本網(wǎng)站 bioRxiv。先發(fā)預(yù)印本,周教授期望能夠得到更多的同行們的建議和指正。

詹劍,于2004年、2010年獲得中科大學(xué)士和博士學(xué)位。2010-2013年在美國印第安納大學(xué)與普渡大學(xué)印第安納波里斯聯(lián)合分校作為博士后,2013-2021年在澳大利亞格里菲斯大學(xué)糖組學(xué)研究所做研究員,現(xiàn)在是深圳灣實驗室研究員,最近作為創(chuàng)始人建立了礪博生物,從事靶向RNA的小分子藥開發(fā)。

湯金樂,于2016年獲得蘇州大學(xué)的博士,2016-2021年在北京大學(xué)深圳研究生院化學(xué)生物學(xué)與生物技術(shù)學(xué)院做博士后和助理研究員,2021年起加入周耀旗課題組擔(dān)任助理研究員。

張哲,2013年本科畢業(yè)于中科大生物技術(shù)專業(yè),2021年通過GU-CAS聯(lián)合培養(yǎng)博士項目,獲得澳大利亞格里菲斯大學(xué)哲學(xué)博士學(xué)位,后續(xù)跟隨周耀旗回國加入深圳灣實驗室,今年6月起留任周耀旗課題組擔(dān)任助理研究員,主要研究方向為RNA相關(guān)的結(jié)構(gòu)生物信息學(xué)。

深圳灣實驗室周耀旗:填補AlphaFold 2缺口,開啟所有蛋白質(zhì)結(jié)構(gòu)的高精度預(yù)測時代

詹劍、湯金樂、張哲

值得注意的是,回國以來,周耀旗教授也開始做一些比較偏應(yīng)用和轉(zhuǎn)化方向的工作。

2022年9月,他聯(lián)手詹劍、方超,利用三人分別在計算、生物和化學(xué)領(lǐng)域的專長,共同創(chuàng)立了礪博生物(Ribopeutic),從事靶向RNA的小分子藥物的開發(fā)。目前基于人工智能、干濕閉環(huán)的RNA靶標(biāo)發(fā)現(xiàn)平臺,礪博生物已發(fā)現(xiàn)多個選擇性高、活性好,靶向 RNA 的小分子,在癌癥、罕見病和病毒性感染等領(lǐng)域布局。

據(jù)周耀旗介紹,他們正在進(jìn)行另一個與RNA相關(guān)的工作,并預(yù)計很快就可以投稿。

“在RNA結(jié)構(gòu)預(yù)測上,我們希望能夠在RNA結(jié)構(gòu)數(shù)量少的情況下,建立可以泛化的、有較高精度的預(yù)測模型。為產(chǎn)業(yè)界,特別是我們礪博生物的靶向RNA的小分子藥物研發(fā)引入AI4S的前沿進(jìn)展,并提供一系列基于基礎(chǔ)科學(xué)研究的源頭創(chuàng)新?!?/p>


|深圳灣實驗室周耀旗課題組,博士后招聘中

周耀旗教授,于2021年3月起作為資深研究員全職加入了深圳灣實驗室。

他于1984年獲中國科技大學(xué)學(xué)士學(xué)位,于1990年獲美國紐約州立石溪大學(xué)博士學(xué)位。

曾在北卡州立大學(xué)、哈佛大學(xué)進(jìn)行博士后研究,師從諾獎得主Martin Karplus教授。相繼在紐約州立布法羅大學(xué)擔(dān)任助理教授、終身副教授,在印第安納大學(xué)任終身正教授,在澳大利亞格里菲斯大學(xué)任正教授。主要從事蛋白質(zhì)/RNA的序列、結(jié)構(gòu)與功能和表型關(guān)系方面的基礎(chǔ)研究,以及生物分子檢測、藥物開發(fā)方面的應(yīng)用研究。

周耀旗課題組主要圍繞著RNA和蛋白質(zhì)的序列、結(jié)構(gòu)及功能之間的關(guān)系,以及生物高分子的應(yīng)用開發(fā)等幾方面進(jìn)行科學(xué)研究。

課題組研究的特色是結(jié)構(gòu)生物信息計算和現(xiàn)代高通量、自動進(jìn)化生物技術(shù)相結(jié)合來實現(xiàn)對序列、結(jié)構(gòu)及功能之間關(guān)系的深刻理解,從而達(dá)到生物高分子在多方面應(yīng)用的這個目標(biāo),其中包括精準(zhǔn)醫(yī)療服務(wù)的針對性藥物設(shè)計和個性化生物標(biāo)志物的檢測。

課題組主頁:http://zhouyq-lab.szbl.ac.cn/

有意向者請發(fā)送至郵箱:zhouyq@szbl.ac.cn


本文作者吳彤,長期關(guān)注醫(yī)療科技方向,歡迎添加微信互通有無:icedaguniang 雷峰網(wǎng)(公眾號:雷峰網(wǎng))雷峰網(wǎng)

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知

分享:
相關(guān)文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說