丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
生物醫(yī)藥 正文
發(fā)私信給喬燕薇
發(fā)送

0

GAIR Live|AI藥物發(fā)現(xiàn)平臺(tái),如何與傳統(tǒng)醫(yī)藥企業(yè)打出「組合拳」?(下)

本文作者: 喬燕薇 2023-06-21 15:30
導(dǎo)語(yǔ):AI制藥平臺(tái)化勢(shì)必成為醫(yī)藥行業(yè)的一股革命性力量。

作為藥物發(fā)現(xiàn)階段的研究核心,先導(dǎo)結(jié)構(gòu)的發(fā)現(xiàn)和優(yōu)化往往需要花費(fèi)數(shù)年時(shí)間,投入數(shù)億美元,長(zhǎng)期被視為藥物研發(fā)的關(guān)鍵技術(shù)瓶頸。

從20世紀(jì)70年代以來(lái),計(jì)算機(jī)輔助藥物設(shè)計(jì)(CADD)作為一個(gè)日趨完善的藥物發(fā)現(xiàn)手段,主要包括虛擬篩選和藥物從頭設(shè)計(jì)兩種策略,曾極大提升新藥設(shè)計(jì)和開(kāi)發(fā)的效率。

“我們即將迎來(lái)生物醫(yī)學(xué)大爆發(fā)的時(shí)刻,但這一成果的取得,不僅取決于生物學(xué)家與醫(yī)學(xué)家的努力,甚至更大程度上取決于數(shù)學(xué)、物理學(xué)、化學(xué)、計(jì)算機(jī)技術(shù)等的發(fā)展以及與生物醫(yī)學(xué)的結(jié)合?!?/p>

“隨著AI技術(shù)的成熟,蛋白質(zhì)、基因組學(xué)數(shù)據(jù)的積累,AI制藥平臺(tái)化勢(shì)必成為醫(yī)藥行業(yè)的一股革命性力量,從根本上改變傳統(tǒng)藥物設(shè)計(jì)試錯(cuò)流程,未來(lái)AI大模型技術(shù)又將引發(fā)新的期待?!?/p>

近日,由雷峰網(wǎng)GAIR Live&《醫(yī)健AI掘金志》舉辦的《「人機(jī)協(xié)同」模式下的新藥研發(fā)》線上圓桌論壇落幕,五位具有投資、企業(yè)、藥物實(shí)驗(yàn)、AI制藥背景的專家表達(dá)出這樣的愿景。

本次論壇,由浙江大學(xué)藥學(xué)院教授謝昌諭主持,北京大學(xué)藥學(xué)院研究員劉振明、騰訊醫(yī)療健康A(chǔ)IDD技術(shù)負(fù)責(zé)人劉偉、浙江工業(yè)大學(xué)智能制藥研究院院長(zhǎng)段宏亮、清華大學(xué)智能產(chǎn)業(yè)研究院戰(zhàn)略發(fā)展與合作部主任張煜參與討論。

在上篇中,他們共同辨析了人機(jī)協(xié)同模式下的藥物研發(fā)歷程、近幾年AI制藥領(lǐng)域的算法和模型突破、以及與傳統(tǒng)藥物研發(fā)手段相比AIDD的優(yōu)劣性。

在下篇中,則探討了我國(guó)創(chuàng)新藥研發(fā)的痛點(diǎn)、AI制藥的數(shù)據(jù)之困,以及新一輪AI浪潮下藥物研發(fā)的可能性。近期AI大模型爆火,歡迎添加作者微信(微信號(hào):qiaoyw186),互通有無(wú)。

GAIR Live|AI藥物發(fā)現(xiàn)平臺(tái),如何與傳統(tǒng)醫(yī)藥企業(yè)打出「組合拳」?(下)

“全球人工智能與機(jī)器人大會(huì)”(GAIR)始于2016年雷峰網(wǎng)與中國(guó)計(jì)算機(jī)學(xué)會(huì)(CCF)合作創(chuàng)立的CCF-GAIR大會(huì),旨在打造人工智能浪潮下,連接學(xué)術(shù)界、產(chǎn)業(yè)界、投資界的新平臺(tái),而雷峰網(wǎng)“連接三界”的全新定位也在此大會(huì)上得以確立。

經(jīng)過(guò)幾年發(fā)展,GAIR大會(huì)已成為行業(yè)標(biāo)桿,是目前為止粵港澳大灣區(qū)人工智能領(lǐng)域規(guī)模最大、規(guī)格最高、跨界最廣的學(xué)術(shù)、工業(yè)和投資領(lǐng)域盛會(huì)。

GAIR Live作為雷峰網(wǎng)旗下視頻直播品牌,旨在輸出新鮮、深度、原創(chuàng)的大咖訪談與對(duì)話內(nèi)容,打造輻射產(chǎn)、學(xué)、研、投的特色線上平臺(tái)。

以下是主題論壇的現(xiàn)場(chǎng)內(nèi)容,雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))《醫(yī)健AI掘金志》做了不改變?cè)獾木庉嫼驼怼?/p>

中國(guó)的新藥研發(fā)存在哪些痛點(diǎn)?

國(guó)內(nèi)外AI制藥技術(shù)是否存在代際差異?

張煜:從歷史來(lái)看,我們國(guó)家的西藥研發(fā)確實(shí)跟隨著歐美的步伐在前進(jìn),歐美國(guó)家很早就有了相關(guān)的行業(yè)標(biāo)準(zhǔn)和規(guī)定,使新藥研發(fā)有規(guī)律可循,并且在發(fā)展的過(guò)程中培養(yǎng)了大量的行業(yè)人才。在行業(yè)標(biāo)準(zhǔn)性、規(guī)范性以及人才培養(yǎng)上,我們都還有很長(zhǎng)的路要走。

過(guò)去那套新藥研發(fā)的機(jī)制,包括前期的研發(fā)、IND(Investigational New Drug,新藥臨床研究審批)、臨床實(shí)驗(yàn)等環(huán)節(jié)在內(nèi),都需要很長(zhǎng)的時(shí)間和資金的積累。在國(guó)外,已經(jīng)有了很成熟的新藥研發(fā)體系,不論資本、人才還是機(jī)制都非常成熟。

而國(guó)內(nèi)還處于起步階段,雖然國(guó)家正在大力推動(dòng)國(guó)產(chǎn)藥物創(chuàng)新,但是在新藥研發(fā)機(jī)制上,我們還有很多的課要補(bǔ)。

在技術(shù)積累、人才培養(yǎng)、實(shí)驗(yàn)機(jī)制等方面,我們前段時(shí)間去了幾家國(guó)際知名的大藥廠進(jìn)行學(xué)習(xí),發(fā)現(xiàn)他們的流程化做得非常好,國(guó)內(nèi)的企業(yè)目前也在學(xué)習(xí)中,但整體上看還是跟隨著歐美的腳步,其中存在很多痛點(diǎn)。

與國(guó)外的AI制藥技術(shù)相比,我國(guó)的相關(guān)技術(shù)仍舊存在著代際差異,并且是系統(tǒng)性的差異,而非某一兩個(gè)因素。在追趕的過(guò)程中,國(guó)家要發(fā)揮更大的作用。

新藥研發(fā)的投入是巨大的,雖然如今行業(yè)內(nèi)已經(jīng)劃分出CDMO( Contract Development Manufacture Organization,合同研發(fā)生產(chǎn)組織)、CRO(Clinical Research Organization,臨床試驗(yàn)業(yè)務(wù))等不同的研發(fā)階段,但仍舊是一件費(fèi)時(shí)、費(fèi)力、費(fèi)錢(qián)的事情。

對(duì)國(guó)外已經(jīng)發(fā)展成熟的大藥廠來(lái)說(shuō),他們有成型的平臺(tái)和多年的資源積累,探索AI輔助新藥研發(fā)的成本會(huì)更低一些,而國(guó)內(nèi)目前還處于摸索階段,試錯(cuò)的時(shí)間和金錢(qián)成本要更高,標(biāo)準(zhǔn)成本也更高,還需要國(guó)家的支持。

AI制藥是否能成為國(guó)產(chǎn)藥的創(chuàng)新彎道超車(chē)的機(jī)會(huì),我認(rèn)為這是一定的。新的技術(shù)要素造就新的格局,每一次產(chǎn)業(yè)革命都是由新技術(shù)的變革所帶來(lái)的,AI制藥正是我們國(guó)家趕超歐美的一個(gè)新機(jī)會(huì)。

幾位老師在前面的討論中也講到,AI制藥不能僅僅停留在計(jì)算的階段,最終還是要落實(shí)到實(shí)際的藥物療效上,所以必須要和干濕實(shí)驗(yàn)結(jié)合起來(lái),從過(guò)往的經(jīng)驗(yàn)來(lái)看,濕實(shí)驗(yàn)更多的是正向?qū)嶒?yàn)。

如今很多企業(yè),特別是新的AI制藥企業(yè)都引入了干濕實(shí)驗(yàn)實(shí)驗(yàn),從正反兩方面進(jìn)行驗(yàn)證,使算法收斂的速度和優(yōu)化的效率都得以大幅提高。

所以,我們的AI制藥技術(shù)和國(guó)際上差距在不斷縮短,但是從創(chuàng)新程度上來(lái)看,歐美如今還是創(chuàng)新的源頭,我們?nèi)蕴幱诟S和學(xué)習(xí)的階段。

段宏亮:創(chuàng)新藥的研究國(guó)內(nèi)起步比較晚,距今還不過(guò)十余年時(shí)間,在此之前一直以仿制藥為主。當(dāng)然,這也和我們國(guó)家所處的發(fā)展階段相關(guān),很多研究都要從零開(kāi)始發(fā)展,創(chuàng)新藥也是如此。

在人才培養(yǎng)、新藥研發(fā)流程方面的欠缺,導(dǎo)致我們和美國(guó)、歐洲、日本等國(guó)家之間,存在著非常大的差距。

但是從最近十年國(guó)內(nèi)從零開(kāi)始做創(chuàng)新藥開(kāi)始,能夠看到國(guó)內(nèi)以恒瑞、百濟(jì)神州等為代表的公司,已經(jīng)有一些產(chǎn)品在國(guó)際上具備了一定的競(jìng)爭(zhēng)力和影響力,比如百濟(jì)神州開(kāi)發(fā)的BTK抑制劑,這表明我們國(guó)家的藥物行業(yè)有很強(qiáng)的學(xué)習(xí)能力,尤其是在一些相對(duì)較新的藥物研發(fā)細(xì)分領(lǐng)域。

比如ADC抗體偶聯(lián)藥物,最近一兩年間,國(guó)內(nèi)的制藥公司向國(guó)外制藥巨頭轉(zhuǎn)讓了數(shù)個(gè)金額達(dá)幾十億美金的ADC藥物。

在類似的新興細(xì)分領(lǐng)域中,歐美國(guó)家也沒(méi)有太多的積累。AI制藥也是類似于ADC領(lǐng)域的新興賽道,相比我們國(guó)家,歐美國(guó)家的技術(shù)積累也不太多。

雖然國(guó)內(nèi)的制藥行業(yè)相比國(guó)際上還落后一些,但我們的AI技術(shù)在全世界是非常一流的,我們國(guó)內(nèi)憑借先進(jìn)的AI技術(shù)水平,和相對(duì)落后的創(chuàng)新藥研發(fā)進(jìn)行結(jié)合,形成AI制藥這樣的新行業(yè)形態(tài)雖然只發(fā)展了短短幾年的時(shí)間,但整個(gè)資本市場(chǎng)這個(gè)行業(yè)的反響都非常熱烈,甚至比歐美國(guó)家的投入還要大得多。在大量資源的扶持之下,我們或許能在短時(shí)間內(nèi)取得一定的成果。

在新藥研發(fā)領(lǐng)域,我們和歐美依然存在著代際差異,尤其是小分子這一板塊,我們幾乎沒(méi)有做First In Class的新藥開(kāi)發(fā)能力,國(guó)內(nèi)的First In Class屈指可數(shù),更多的是Fast Follow或者M(jìn)e-too、Me-better的項(xiàng)目。

但是在AI 制藥領(lǐng)域差距卻沒(méi)有那么大,國(guó)外這方面發(fā)展得也并不順利,以薛定諤、Recursion等為代表的各大AI制藥公司,在資本市場(chǎng)的表現(xiàn)并不算好,一些研發(fā)項(xiàng)目進(jìn)展緩慢。

這就為我們贏得了很多時(shí)間和機(jī)會(huì),如果國(guó)內(nèi)能夠繼續(xù)保持研發(fā)的勁頭,在這樣一個(gè)全新的賽道中,完全可以彎道超車(chē)。

劉振明:這個(gè)問(wèn)題很值得討論,在許多公開(kāi)的報(bào)告、討論中,我曾經(jīng)反復(fù)提過(guò)一件事情:中國(guó)的創(chuàng)新藥被迫起航。從這句話當(dāng)中,我們可以感受到切膚之痛。

就在去年和前年,國(guó)內(nèi)的一家知名藥企裁員一千人,因?yàn)檫@些員工做的是仿制藥業(yè)務(wù),而非創(chuàng)新藥;另一家藥企自斷臂膀,將自己所謂的創(chuàng)新藥項(xiàng)目砍掉了八十多個(gè)。

這就是他們的切膚之痛,他們做的藥物,放在五年前可能都是寶貝,但是在創(chuàng)新藥時(shí)代就變成了累贅。

為什么會(huì)出現(xiàn)這種局面?我從一個(gè)從事藥學(xué)研究的工作人員的角度來(lái)分析,首先,2021年國(guó)家藥監(jiān)局藥審中心發(fā)布了第46號(hào)文《以臨床價(jià)值為導(dǎo)向的抗腫瘤藥物臨床研發(fā)指導(dǎo)原則》,做腫瘤藥物的熱潮一下子就熄火了。

標(biāo)準(zhǔn)是人家制定的,要和他們競(jìng)爭(zhēng)你的能耐在哪里?監(jiān)管部門(mén)要考慮這些問(wèn)題,這些都是長(zhǎng)痛,而非短痛。

其次,大家都在講AI,我們?cè)谘芯恐嘘P(guān)注適應(yīng)癥更多一些,比如PD和AD對(duì)市場(chǎng)來(lái)說(shuō)是很好的適應(yīng)癥,為什么大家不做?

以往基于Aβ蛋白,基于乙酰膽堿酯酶抑制劑研究積累的數(shù)據(jù),對(duì)我們建模、做PD和AD的藥物研究,究竟是助力還是阻礙?這些問(wèn)題都需要思考。

2021年,國(guó)家正式啟動(dòng)科技創(chuàng)新2030“腦科學(xué)與類腦研究”項(xiàng)目,在目前的研究水平之下,我們對(duì)一些腦部疾病的認(rèn)知還太膚淺,甚至于前期研發(fā)的相關(guān)藥物使用的都是“假”數(shù)據(jù)。

雖然現(xiàn)在大模型的概念玩的很嗨,但是到了真正練兵的時(shí)候估計(jì)作用有限。我個(gè)人感受,AI目前炒的太熱了,我們科技組的很多學(xué)生,水平都還未達(dá)到培養(yǎng)要求的標(biāo)準(zhǔn),就已經(jīng)被企業(yè)爭(zhēng)搶得一塌糊涂,人才更是這個(gè)行業(yè)的痛點(diǎn)。我擔(dān)心繁華過(guò)后留下的是一地雞毛。

當(dāng)然,我們希望大模型的發(fā)展不會(huì)像當(dāng)年的互聯(lián)網(wǎng)泡沫破裂一樣經(jīng)歷漫長(zhǎng)的寒冬,但前提是從業(yè)者能夠腳踏實(shí)地地為人才儲(chǔ)備做一些扎實(shí)的工作,才能讓這個(gè)行業(yè)經(jīng)歷過(guò)現(xiàn)在的短痛以后,不再經(jīng)歷未來(lái)的長(zhǎng)痛。

關(guān)于國(guó)內(nèi)的AI 技術(shù)與國(guó)外相比是否存在代際,我的觀點(diǎn)與其他幾位老師相同,是不存在的。但中國(guó)目前的創(chuàng)新藥研發(fā)能力和國(guó)外存在代際差異。

為什么我們一直在強(qiáng)調(diào)基礎(chǔ)原創(chuàng)研究?很多研究藥學(xué)領(lǐng)域的老師都明確講過(guò),我們的很多藥效模型和國(guó)外相差至少二十年,比如幾年前的IDO抑制劑藥物,國(guó)外的研究項(xiàng)目下線后,國(guó)內(nèi)的相關(guān)項(xiàng)目也全部下馬,因?yàn)楹诵牡脑瓌?chuàng)研究不在我們手里。此外,在藥劑和遞送技術(shù)、藥物研發(fā)環(huán)境等方面,我們和國(guó)外都存在代際差距。

至于AI制藥能否成為國(guó)產(chǎn)藥創(chuàng)新、彎道超車(chē)的機(jī)會(huì),AI一定能讓創(chuàng)新藥的研發(fā)起步姿態(tài)非常美,但是能不能跑到終點(diǎn),目前還不知道。彎道超車(chē)要有一個(gè)前提條件,它得有道。

我們做藥的人常常講,當(dāng)一款藥物成功以后,我們講出來(lái)的故事往往都是完美的。但如果回過(guò)頭重新走一遍這條路,也許最終得到的結(jié)果卻很不一樣。

簡(jiǎn)而言之,做藥這件事情除了實(shí)力以外,還需要一點(diǎn)點(diǎn)的運(yùn)氣。因此,我只認(rèn)可AI技術(shù)能夠讓藥物研發(fā)的起跑姿態(tài)更美,能否超車(chē)仍是未知數(shù)。

謝昌諭:整體而言,這一階段新藥研發(fā)存在的痛點(diǎn)比較多,不論是整體的大生態(tài)還是人才、數(shù)據(jù)或其他方面,各位老師剛剛已經(jīng)講過(guò)很多,我就不再重復(fù)了。但如果就聚焦在AI制藥的領(lǐng)域,尤其是聚焦在算法模型的層面,我認(rèn)為不存在代際差異。

當(dāng)前的AI技術(shù)以及整個(gè)社區(qū),相對(duì)來(lái)說(shuō)比較開(kāi)源、透明,世界各國(guó)的研究者們不入歐有新的研究成果或進(jìn)展,大家都可以快速地通過(guò)發(fā)表的論文,開(kāi)源的代碼以及各種線上講座等方式來(lái)相互了解和學(xué)習(xí)。

但由于基礎(chǔ)設(shè)施的差距,在新藥研發(fā)過(guò)程中藥企之間反而很難像AI技術(shù)一樣迅速實(shí)現(xiàn)技術(shù)的學(xué)習(xí)和共享。彎道超車(chē)少不了AI技術(shù)的支持,但僅僅依靠AI技術(shù)可能還是無(wú)法實(shí)現(xiàn)。

AI大模型RLHF等技術(shù)紅利如何影響AI制藥?

能否一定程度上降低對(duì)龐大數(shù)據(jù)量的依賴?

謝昌諭:ChatGPT做的RLHF依賴專家標(biāo)注的數(shù)據(jù)量還是比較大的。RLHF應(yīng)用在藥學(xué)領(lǐng)域的挑戰(zhàn)在于,人類專家很多時(shí)候沒(méi)法“一拍腦袋”就輕易地對(duì)大模型輸出的不同答案進(jìn)行評(píng)價(jià)和排序,判斷好壞。

在藥學(xué)領(lǐng)域,研究者還要對(duì)大模型輸出的結(jié)果進(jìn)行更多的計(jì)算或?qū)嶒?yàn),才能確認(rèn)哪個(gè)選擇是更好的。

如果說(shuō)大模型輸出的結(jié)果非常容易分辨,比如設(shè)計(jì)出的新分子與口袋靶點(diǎn)是否能形成關(guān)鍵的相互作用,或者較為簡(jiǎn)單的物理化性質(zhì)的評(píng)估等等,專家一看就能分辨,那么這個(gè)大模型學(xué)習(xí)到的相關(guān)知識(shí)可能還還是十分有限。

這也是ChatGPT與新藥研發(fā)在使用上的底層邏輯不同的需求。ChatGPT 更多的時(shí)候只要做到人類專家的水平即可,然而AI制藥往往期望 AI 可以做的比專家和之前的CADD 都更為準(zhǔn)確的判斷。

當(dāng)然,正如剛剛劉偉老師講到的,目前已有不少優(yōu)秀的分子生成模型是通過(guò)強(qiáng)化學(xué)習(xí)來(lái)進(jìn)行調(diào)試的,所以這項(xiàng)技術(shù)肯定還是有用的。

但是具體在什么樣的場(chǎng)景下才能將這項(xiàng)技術(shù)用得更好,真正在一定程度上可以降低對(duì)龐大數(shù)據(jù)量的依賴,還有待我們?nèi)ネ诰颉?/p>

劉振明:我們特別看好大模型未來(lái)對(duì)AI制藥行業(yè)的賦能。目前,大模型更多的應(yīng)用場(chǎng)景是在社交領(lǐng)域,而在AI制藥領(lǐng)域,大模型的商業(yè)價(jià)值的實(shí)現(xiàn)會(huì)更加緩慢,未來(lái)五到十年內(nèi)大模型應(yīng)用場(chǎng)景會(huì)發(fā)生切換,對(duì)AI制藥產(chǎn)生一定的影響。

以我們關(guān)注的化學(xué)制藥為例,化學(xué)制藥的合成實(shí)際上就是速控步,需要基于經(jīng)驗(yàn)來(lái)完成,否則就要依靠外包。SCIFinder這類知識(shí)庫(kù)也許很快就會(huì)被大模型取代。

在未來(lái),即便一個(gè)經(jīng)驗(yàn)怎么不豐富的合成學(xué)家,借助大模型這個(gè)“軍師”也能完成合成工作,只要向大模型提問(wèn)合成反應(yīng)的結(jié)構(gòu)式、不同反應(yīng)條件的選擇等等,大模型都能夠給出指導(dǎo)。

在優(yōu)化環(huán)節(jié),使用者哪怕只是給出“這個(gè)結(jié)果不太對(duì)”的回應(yīng),大模型都能夠據(jù)此對(duì)結(jié)果進(jìn)行優(yōu)化。

最近幾年,我和國(guó)內(nèi)做創(chuàng)新藥的投資人接觸比較多,感覺(jué)他們特別不容易,一方面帶著興奮,堅(jiān)信生物醫(yī)藥絕對(duì)是一個(gè)創(chuàng)新的朝陽(yáng)行業(yè);另一方面帶著迷茫,沒(méi)有深厚醫(yī)藥背景的他們很難看懂這個(gè)行業(yè)。

未來(lái)大模型的發(fā)展,也許能夠讓這批投資人更好地理解創(chuàng)新藥的研發(fā),對(duì)行業(yè)的影響反而更大。

投資人雖然不做藥,但是他們?cè)诖竽P偷闹С窒?,他們能夠與做創(chuàng)新藥的人更好地對(duì)話,省去了進(jìn)行底層教育的時(shí)間。

我遇到的很多投資人都不敢投創(chuàng)新藥行業(yè),大模型更像一個(gè)軍師,我們也特別希望它未來(lái)能成為投資界的一個(gè)強(qiáng)有力的助手,使創(chuàng)新藥的投資門(mén)檻更低一些。

劉偉:預(yù)訓(xùn)練AI大模型出來(lái)之后,我們這些做AI的人歸納起來(lái),認(rèn)為它帶給了我們兩個(gè)比較震撼的改變過(guò)去認(rèn)知的東西,一是改變了AI的范式,二是改變我們對(duì)效果的認(rèn)知。

過(guò)去我們做AI通常是基于監(jiān)督學(xué)習(xí),或是規(guī)模不大的預(yù)訓(xùn)練的模型加微調(diào),比如BERT+finetune?,F(xiàn)在的大模型在應(yīng)用場(chǎng)景中不依賴微調(diào),只需要用海量的無(wú)標(biāo)簽數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練,再用提示學(xué)習(xí)等方法小規(guī)模數(shù)據(jù)進(jìn)行優(yōu)化,這跟以前的預(yù)訓(xùn)練的大模型加微調(diào)是非常不一樣的。

這是一種新的范式,反映到AI制藥行業(yè)也是存在的。比如基因,蛋白質(zhì)序列,各種大規(guī)?;衔锓肿拥臄?shù)據(jù)庫(kù)等等,數(shù)據(jù)量可能達(dá)到幾十億到幾百萬(wàn)億的量級(jí),并且其中絕大多數(shù)都沒(méi)有標(biāo)簽,這與自然語(yǔ)言的情況是比較類似的。

這種情況下,如果我們能夠?qū)⑦@些數(shù)據(jù)拿過(guò)來(lái)對(duì)模型進(jìn)行訓(xùn)練,這些數(shù)據(jù)庫(kù)中所涵蓋專家知識(shí)的量是人類專家很難企及的。 這些數(shù)據(jù)全都拿來(lái),并且能夠進(jìn)行有效的表示和學(xué)習(xí),能夠帶來(lái)的想象空間是非常大的。

當(dāng)大模型學(xué)習(xí)了大量的基因數(shù)據(jù)、蛋白質(zhì)數(shù)據(jù)或者分子數(shù)據(jù)后,也許就能夠發(fā)現(xiàn)新的分子生物學(xué)的機(jī)理,甚至是發(fā)現(xiàn)一種新的治療方法,這在不久的將來(lái)都是能夠想象得到的。

另一點(diǎn)對(duì)效果認(rèn)知的改變也十分顯著,過(guò)去我們認(rèn)為多輪對(duì)話并且具有一定的邏輯推理能力的AI非常難以實(shí)現(xiàn),也許需要三五十年才能打造這樣一個(gè)通用的人工智能,當(dāng)下的大模型所展現(xiàn)的智能涌現(xiàn)的現(xiàn)象,是以前從未出現(xiàn)過(guò)的。

智能涌現(xiàn)叫做emergence,來(lái)源于凝聚態(tài)物理和復(fù)雜系統(tǒng)的研究中,即復(fù)雜系統(tǒng)中的較低層次的子系統(tǒng)通過(guò)相互聚集、相互作用構(gòu)筑較高層次的系統(tǒng),會(huì)在較高層次的系統(tǒng)層面誕生一些子系統(tǒng)所不具備的新屬性或新規(guī)律。

比如凝聚態(tài)物理中的超導(dǎo)、超流等相變現(xiàn)象,就是物理學(xué)中的典型涌現(xiàn)現(xiàn)象。

在以前的AI模型訓(xùn)練中,從未出現(xiàn)過(guò)涌現(xiàn)的現(xiàn)象,即模型參數(shù)量以及訓(xùn)練的數(shù)據(jù)量跨過(guò)一個(gè)坎后,出現(xiàn)大幅度的性能提升,也就是出現(xiàn)相變。在以往的普遍認(rèn)知中,增加數(shù)據(jù)量后,模型的效果會(huì)出現(xiàn)一定的提升,但只是線性或亞線性的增長(zhǎng),而非涌現(xiàn)的那種突變。

以前的很多研究工作由于性能提升緩慢沒(méi)能再繼續(xù)下去,在大模型的背景下,這些工作可能又值得繼續(xù)研究下去。

大模型也為AI制藥的研究提供了源頭活水,如果我們有一個(gè)以分子化合物為基座的大模型,利用數(shù)十億量級(jí)的數(shù)據(jù)庫(kù)對(duì)大模型進(jìn)行預(yù)訓(xùn)練,其中少量帶有標(biāo)簽的數(shù)據(jù)可以來(lái)自濕實(shí)驗(yàn),或是來(lái)自專業(yè)領(lǐng)域的知識(shí)、人類專家的反饋,然后對(duì)基座的大模型進(jìn)行微調(diào)與強(qiáng)化。

行業(yè)內(nèi)已經(jīng)有很多公司在進(jìn)行相關(guān)的研究工作,訓(xùn)練蛋白質(zhì)、基因或分子的大模型,將這套范式搬到藥物AI的場(chǎng)景下,這是一個(gè)非常值得投入的研發(fā)方向。

至于大模型在藥物AI領(lǐng)域能否像自然語(yǔ)言處理領(lǐng)域一樣,出現(xiàn)智能涌現(xiàn)的現(xiàn)象,達(dá)到一定的訓(xùn)練量和參數(shù)量后,效果實(shí)現(xiàn)顯著提升,目前還是一個(gè)開(kāi)放性的問(wèn)題,有待我們進(jìn)行進(jìn)一步的研究。

段宏亮:專業(yè)領(lǐng)域的大模型與ChatGPT等常識(shí)性大模型相比不同的地方在于,對(duì)于ChatGPT來(lái)說(shuō),來(lái)自全球的幾十億人都可以作為數(shù)據(jù)的生成人員與ChatGPT進(jìn)行人機(jī)互動(dòng),但如果我們研發(fā)一個(gè)藥學(xué)大模型,能夠生成數(shù)據(jù)的人相對(duì)而言比較有限,可能只有幾十萬(wàn)或是幾百萬(wàn)的量級(jí)。

從大模型要處理的工作來(lái)看,藥物研發(fā)的難度比ChatGPT中自然語(yǔ)言處理的問(wèn)題難得多,所以,藥學(xué)的大模型的研發(fā)和訓(xùn)練顯得更加困難。

藥學(xué)領(lǐng)域的很多數(shù)據(jù)都依賴于實(shí)驗(yàn),或許幾周、幾個(gè)月的時(shí)間才能產(chǎn)生幾個(gè)數(shù)據(jù)反饋給計(jì)算機(jī)模型,無(wú)法像ChatGPT一樣從互動(dòng)聊天中即時(shí)獲得大量的信息,迅速迭代。

當(dāng)數(shù)據(jù)量或是產(chǎn)生數(shù)據(jù)的人較少時(shí),藥學(xué)大模型是否還能像ChatGPT一樣,迅速地根據(jù)人類反饋優(yōu)化,使模型的智商在訓(xùn)練中增長(zhǎng),還是一個(gè)未知數(shù)。

但是從數(shù)據(jù)的角度來(lái)說(shuō),藥學(xué)大模型,或許可以成為收集藥學(xué)數(shù)據(jù)的方式。正如劉老師剛才所講,用聯(lián)邦學(xué)習(xí)平臺(tái)收集數(shù)據(jù)是不可行的,藥企的戒備心很重,無(wú)法放心地將數(shù)據(jù)放到聯(lián)邦學(xué)習(xí)平臺(tái)之中,擔(dān)心數(shù)據(jù)會(huì)泄露。

但藥物研發(fā)人員在與大模型的交流互動(dòng)過(guò)程中,會(huì)以一種隱蔽的方式將數(shù)據(jù)傳輸給大模型。大模型可以將這些零散的數(shù)據(jù)收集起來(lái),將時(shí)間線拉長(zhǎng),在幾年、幾十年后,數(shù)據(jù)積累到一定程度,也許某一天藥學(xué)大模型就會(huì)豁然開(kāi)朗。

AI制藥下一輪技術(shù)應(yīng)用爆發(fā)的突破口是什么?

張煜:蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)技術(shù)的突破,讓大家看到了更多的可能性,也讓人們開(kāi)始暢想這個(gè)行業(yè)未來(lái)的模樣。

不僅僅是AI制藥領(lǐng)域,整個(gè)社會(huì),包括專業(yè)的學(xué)術(shù)領(lǐng)域、技術(shù)領(lǐng)域、企業(yè)界和資本界,都對(duì)制藥產(chǎn)生了更多的關(guān)注和期望,所以即使沒(méi)有技術(shù)的突破,相關(guān)應(yīng)用的發(fā)展也會(huì)進(jìn)入快車(chē)道。

至于相關(guān)應(yīng)用突破和爆發(fā)的可能性,從技術(shù)角度來(lái)看可能的發(fā)展方向有以下幾個(gè)。

首先是藥物設(shè)計(jì),肯定會(huì)更快、更精準(zhǔn)、成本更低,這本來(lái)也是AIDD要實(shí)現(xiàn)的目標(biāo),在技術(shù)驅(qū)動(dòng)下會(huì)向著這樣的方向發(fā)展。

在具體應(yīng)用的層面,病癥的治療會(huì)更加個(gè)性化和精準(zhǔn)化。過(guò)去在治療普通病癥時(shí),需要服用的藥物劑量都是一片、兩片,兒童減半,但治療一些特殊病癥時(shí)藥物的劑量需要非常精準(zhǔn),沒(méi)辦法用傳統(tǒng)的方法來(lái)定量,但AI可以解決這一問(wèn)題,通過(guò)計(jì)算給出精準(zhǔn)的藥物配比和劑量。

其次是在一些特殊方向上的應(yīng)用,比如抗衰老藥物的研發(fā)。干細(xì)胞的研究與個(gè)體相關(guān),要進(jìn)行很多的實(shí)驗(yàn),成本非常高,如果用AI技術(shù)來(lái)輔助進(jìn)行研究,或許能夠大幅降低成本。

罕見(jiàn)病的相關(guān)研究。藥物研發(fā)以數(shù)據(jù)為基礎(chǔ),通常需要大量數(shù)據(jù)。但罕見(jiàn)病的稀有性則注定無(wú)法取得大規(guī)模的病例數(shù)據(jù)。如果使用AI技術(shù),或許能夠使這些小樣本或小數(shù)據(jù)量的藥物設(shè)計(jì)成為可能,這也是未來(lái)可能的突破方向。

迅速反應(yīng)和預(yù)測(cè)。當(dāng)年SARS病毒出現(xiàn)時(shí),研究機(jī)構(gòu)花了很長(zhǎng)時(shí)間才確認(rèn)毒株,而四年前的新型冠狀病毒出現(xiàn)后,僅僅花了一周時(shí)間就確認(rèn)了毒株的整體結(jié)構(gòu),從而快速找到應(yīng)對(duì)措施。在AI的輔助下,我們對(duì)大規(guī)模傳染性疾病的防治或許會(huì)取得更好的效果,甚至在AI的支持下,可以預(yù)測(cè)病毒的變異和進(jìn)化,從而提前研發(fā)面向未來(lái)的疫苗和抗體。不借助AI手段這些是無(wú)法實(shí)現(xiàn)的。

復(fù)合療法。目前的單抗、雙抗或是其他療法,通常相關(guān)性很強(qiáng)。在未來(lái),某些疾病可能需要相關(guān)性不太強(qiáng)的療法,比數(shù)字療法加藥物療法,或是其他不同的療法綜合進(jìn)行疾病治療,其理論基礎(chǔ)和實(shí)驗(yàn)都非常難,以我們目前的手段幾乎無(wú)法實(shí)現(xiàn),AI技術(shù)或許能夠使綜合性的療法成為可能。

藥物遞送。藥物遞送與藥物設(shè)計(jì)、靶點(diǎn)發(fā)現(xiàn)同為藥物研發(fā)中的三大難題,就目前的技術(shù)手段來(lái)看,藥物遞送還存在很多問(wèn)題,也許只有AI技術(shù)能夠解決。

中藥。中藥研發(fā)過(guò)程中涉及到的機(jī)理和各種要素比較復(fù)雜,規(guī)律性比較差,用傳統(tǒng)的研究方法很難實(shí)現(xiàn),用AI技術(shù)進(jìn)行研究或許能取得比較好的效果。

段宏亮:隨著蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)技術(shù)和大模型這兩個(gè)跨時(shí)代的新技術(shù)的應(yīng)用,對(duì)新藥研發(fā)工作的改變會(huì)非常大。

在小分子藥物的研發(fā)上,如果要做小分子藥物和蛋白藥物的相互作用,本身就需要蛋白質(zhì)結(jié)構(gòu),蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)技術(shù)剛好可以解決這個(gè)問(wèn)題,

當(dāng)然,更大的影響或許在蛋白藥物的開(kāi)發(fā)以及多肽藥物的開(kāi)發(fā)這些領(lǐng)域。

AlphaFold2做的主要是單體的蛋白結(jié)構(gòu)預(yù)測(cè),而蛋白質(zhì)復(fù)合物、以及蛋白和多肽復(fù)合物的預(yù)測(cè),和蛋白質(zhì)藥物、多肽藥物等的研發(fā)相關(guān)性會(huì)更高,DeepMind后來(lái)開(kāi)發(fā)的AlphaFold Multimer就做了很多這方面的工作,本質(zhì)上與AlphaFold2一樣,都是氨基酸的相互作用。

如果能夠沿著這條路走下去,在蛋白質(zhì)復(fù)合物的研究上投入更多精力,把精度做得更加準(zhǔn)確,那么在抗體藥物、蛋白質(zhì)藥物、合成生物學(xué)等方向,或許會(huì)出現(xiàn)一些顛覆性的應(yīng)用,這會(huì)是未來(lái)幾年中我們可能看到的重大突破。

劉偉:從AlphaFold2出現(xiàn)以后,蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)做得越來(lái)越多了,但是目前仍然沒(méi)有將這項(xiàng)技術(shù)非常好地應(yīng)用落地在藥物臨床前的各個(gè)研究階段,并且取得比較大的提升,我覺(jué)得這一塊在未來(lái)是一個(gè)很重要的突破口。

剛才段老師提到,可以用蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)用在抗體的研究上,可以實(shí)現(xiàn)很多以前沒(méi)有做過(guò)的工作。

我們?cè)鴧⒓舆^(guò)CASP14競(jìng)賽,自研了tFold,近年也在tFold的基礎(chǔ)之上擴(kuò)展出tFold-Ab,用于抗體結(jié)構(gòu)的研究,同時(shí)我們也測(cè)試了蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)在不同場(chǎng)景下的性能表現(xiàn),比如單體、二聚體、三聚體、抗體抗原等體系下的性能,在有些情況下還存在比較大的誤差。

業(yè)界也有不少論文中提到了類似的測(cè)試結(jié)果,因此有人質(zhì)疑AlphaFold2是否真的能夠應(yīng)用于實(shí)際的藥物研發(fā)。

針對(duì)這一情況,我們團(tuán)隊(duì)專注于tFold在抗體抗原體系中的研究,在tFold模型的基礎(chǔ)上,設(shè)計(jì)了基于大規(guī)模預(yù)訓(xùn)練的單序列結(jié)構(gòu)預(yù)測(cè)方法,能夠快速預(yù)測(cè)出抗體重輕鏈復(fù)合體的三維結(jié)構(gòu),這項(xiàng)研究成果已經(jīng)發(fā)表在 NeurIPS2022的機(jī)器學(xué)習(xí)與結(jié)構(gòu)生物學(xué)研討會(huì)(《Fast and Accurate Antibody Structure Prediction without Sequence Homologs》),目前該成果也已經(jīng)和多家藥企進(jìn)行了相關(guān)合作。

劉振明:AlphaFold2在生物醫(yī)藥領(lǐng)域中的應(yīng)用會(huì)帶來(lái)很多影響,解決了靶標(biāo)的問(wèn)題,激活了以抗體設(shè)計(jì)為代表的大分子藥物設(shè)計(jì)領(lǐng)域。

有很多投資人問(wèn)過(guò)我們?yōu)槭裁床蛔龃蠓肿樱蛔鲂》肿?。他們認(rèn)為大分子更復(fù)雜,但實(shí)際上抗體抗原設(shè)計(jì)中80%以上的東西是一致的,而小分子相對(duì)來(lái)說(shuō)要復(fù)雜得多。

AlphaFold2的應(yīng)用也不會(huì)讓結(jié)構(gòu)生物學(xué)家們失業(yè),我有一個(gè)學(xué)生在做鹵化酶的研究,他明確地講過(guò)AlphaFold2對(duì)他所研究的鹵化酶的預(yù)測(cè)是錯(cuò)的。鹵化酶并不是很復(fù)雜的一類蛋白,但AlphaFold2預(yù)測(cè)出的結(jié)果與實(shí)際情況的確存在出入。

這意味著AlphaFold2或許在統(tǒng)計(jì)學(xué)上做得很好,整體來(lái)看在蛋白質(zhì)預(yù)測(cè)領(lǐng)域表現(xiàn)很出色,但它并不是萬(wàn)能的,在某些細(xì)分領(lǐng)域的預(yù)測(cè)不一定準(zhǔn)確,依然需要結(jié)合試驗(yàn)結(jié)果,由人類專家?guī)椭鷥?yōu)化。

其次,AlphaFold2用來(lái)做訓(xùn)練的數(shù)據(jù)是靜態(tài)數(shù)據(jù),而蛋白質(zhì)在人體內(nèi)發(fā)揮作用時(shí)是動(dòng)態(tài)的,通過(guò)結(jié)構(gòu)的變化來(lái)產(chǎn)生功效,這是AlphaFold2目前的數(shù)據(jù)集中所缺少的數(shù)據(jù),但是在藥物研發(fā)的過(guò)程中,必須要考慮這種動(dòng)態(tài)變化。

AlphaFold2走出了一個(gè)很好的開(kāi)端,但是未來(lái)要走的路還有很長(zhǎng)。

如果未來(lái)的藥物領(lǐng)域出現(xiàn)了AlphaDrug,它要回答的一個(gè)最重要的問(wèn)題,某個(gè)疾病用什么“新”藥來(lái)治療?(不是簡(jiǎn)單的用藥推薦)。

只有大數(shù)據(jù)能夠回答這個(gè)問(wèn)題的時(shí)候,才真正實(shí)現(xiàn)了AlphaDrug。大夫可以和大模型進(jìn)行對(duì)話,將疾病的癥狀用定量的方式進(jìn)行描述,然后大模型在無(wú)窮大的倉(cāng)庫(kù)中找出疾病的診斷結(jié)果與治療方案。

就像AIDD這個(gè)行業(yè),不論算得再準(zhǔn),最終要交付的還是品種。在我前幾天參加的一場(chǎng)答辯中,一位藥物化學(xué)領(lǐng)域的前輩提出,所有能被藥化學(xué)家看出來(lái)的東西都不是AIDD。品種交付能力一定是未來(lái)技術(shù)突破中要關(guān)注的問(wèn)題。

我是傳統(tǒng)的藥物化學(xué)家,目前還在負(fù)責(zé)一本歐洲藥物化學(xué)雜志《EJMC》。我們?cè)诤椭骶幱懻摃r(shí),經(jīng)常說(shuō)起兩靶點(diǎn)、三靶點(diǎn)、四靶點(diǎn),我們知道每一個(gè)疾病的發(fā)生和治療絕對(duì)不是單靶點(diǎn),這就反向給我們提出了一個(gè)問(wèn)題:在一個(gè)疾病的治療中,究竟什么樣的靶點(diǎn)群是有效的?

如果未來(lái)AI技術(shù)能夠解決這個(gè)問(wèn)題,AI制藥也將取得很大的突破?,F(xiàn)在最大的問(wèn)題在于,第一臨床數(shù)據(jù)太少,第二噪音背景太大,或許大模型技術(shù)已經(jīng)出現(xiàn)了很多好的文章,但是距離真正解決問(wèn)題還需要一定的時(shí)間。

謝昌諭:各位老師剛剛也提到,在如今的AI+Science浪潮之下,很多不同的領(lǐng)域都有可能成為下個(gè)產(chǎn)生重大突破的焦點(diǎn)。

從我個(gè)人感興趣和能夠參與的領(lǐng)域來(lái)講,我很期看到AI能夠和基于理論的計(jì)算科學(xué)的傳統(tǒng)算法產(chǎn)生新的融合,從而加速在量子化學(xué)、蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)、分子動(dòng)力學(xué)等等領(lǐng)域內(nèi)的計(jì)算范式的突破。

AI的深遠(yuǎn)影響,甚至超過(guò)了制藥的范疇。我們對(duì)大語(yǔ)言模型的挖掘也遠(yuǎn)遠(yuǎn)沒(méi)有結(jié)束,它在生物醫(yī)藥領(lǐng)域還有其他的可能性。

比如剛剛曾提到過(guò)的,在高緯度空間中的數(shù)據(jù)分析,多模態(tài)的多組學(xué)等等,我們?nèi)绾胃玫貜闹辛私鈴?fù)雜的生物網(wǎng)絡(luò),從而挖掘新靶點(diǎn)的新生物標(biāo)志物,這應(yīng)該是未來(lái)幾年中將會(huì)看到越來(lái)越多成果的方向。

除ChatGPT以外,目前已經(jīng)有AutoGPT能夠更好地規(guī)劃如何使用各種工具去完成更復(fù)雜的任務(wù)。由AutoGPT主導(dǎo)的干濕實(shí)驗(yàn)結(jié)合,加上可解釋性AI等技術(shù),能夠?qū)崿F(xiàn)更好的人機(jī)互動(dòng),使干濕實(shí)驗(yàn)結(jié)合達(dá)到一個(gè)新的高度。

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

分享:
相關(guān)文章

主筆

關(guān)注醫(yī)療科技領(lǐng)域。微信號(hào):qiaoyw186
當(dāng)月熱門(mén)文章
最新文章
請(qǐng)?zhí)顚?xiě)申請(qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說(shuō)