0
“有些進(jìn)入AI制藥行業(yè)的人,尤其是風(fēng)險(xiǎn)投資者。他們只有計(jì)算機(jī)的背景,缺乏藥學(xué)背景,并不真正了解藥物設(shè)計(jì),只是在跟風(fēng)炒作一個(gè)概念?!?/strong>
華東理工大學(xué)藥學(xué)院教授唐赟在計(jì)算機(jī)輔助藥物設(shè)計(jì)、化學(xué)信息學(xué)、網(wǎng)絡(luò)藥理學(xué)、計(jì)算毒理學(xué)、計(jì)算生物學(xué)等領(lǐng)域深耕多年。在此次對(duì)話中,唐赟也向《醫(yī)健AI掘金志》表達(dá)了他對(duì)于AI制藥行業(yè)當(dāng)前情況的擔(dān)憂。
唐赟教授畢業(yè)于中國科學(xué)院上海藥物研究所,師從中國科學(xué)院院士陳凱先先生,曾先后在瑞典卡羅林醫(yī)學(xué)院、美國國家衛(wèi)生研究院癌癥研究所等機(jī)構(gòu)從事研究工作。
2004年,唐赟回國任復(fù)旦大學(xué)教授,后受中國科學(xué)院院士蔣華良邀請(qǐng),協(xié)助創(chuàng)建華東理工大學(xué)藥學(xué)院。
ChatGPT的出現(xiàn),讓AI制藥重回三年前爆火時(shí)的盛況。
在今年的春季GTC大會(huì)上,英偉達(dá)宣布將與三井物產(chǎn)株式會(huì)社(Mitsui)就Tokyo-1項(xiàng)目合作,通過高分辨率分子動(dòng)力學(xué)模擬和AIGC等技術(shù),提高日本制藥實(shí)力;
百度文心一言首個(gè)落地醫(yī)藥行業(yè)的產(chǎn)品GBI-Bot(醫(yī)藥垂類對(duì)話機(jī)器人)也于近期發(fā)布,基于百度靈醫(yī)智惠在醫(yī)療健康行業(yè)的技術(shù)積累,實(shí)現(xiàn)了文心一言與GBI專業(yè)數(shù)據(jù)庫的有機(jī)結(jié)合。
越來越多的資本涌入AI制藥行業(yè),試圖在AlphaFold2之后,再次借助AIGC技術(shù)掀起生命科學(xué)領(lǐng)域新的革命。
但繁榮背后也有聲音指出,“AI藥物研發(fā)領(lǐng)域充滿了投資人用錢堆出的泡沫,很快將要迎來自證實(shí)力的過渡期。”
唐赟指出,藥物研發(fā)自有其發(fā)展規(guī)律,一些投資人期待兩三年就能從中得到回報(bào),這是不現(xiàn)實(shí)的,AI技術(shù)驅(qū)動(dòng)研發(fā)的藥物距離上市至少還要五年時(shí)間。
這個(gè)行業(yè),還要經(jīng)過一場(chǎng)大浪淘沙。
近日,雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))&《醫(yī)健AI掘金志》推出《AI制藥十人談》系列,探究AI制藥的前景與隱憂。
以下為《醫(yī)健AI掘金志》與唐赟的對(duì)話內(nèi)容,《醫(yī)健AI掘金志》做了不改變?cè)獾木庉嬇c整理。
醫(yī)健AI掘金志:您早在1991年研究生期間就曾進(jìn)行過計(jì)算機(jī)、神經(jīng)網(wǎng)絡(luò)等在藥物設(shè)計(jì)中的應(yīng)用相關(guān)研究,是國內(nèi)非常早期進(jìn)行這一領(lǐng)域研究的學(xué)者,您是怎么開始在藥物設(shè)計(jì)的過程中嘗試計(jì)算機(jī)相關(guān)技術(shù)的?
唐赟:我本科畢業(yè)于同濟(jì)大學(xué)應(yīng)用化學(xué)專業(yè),當(dāng)時(shí)中國科學(xué)院上海藥物研究所的陳凱先先生剛從國外回來工作不久,只有四十多歲,是國內(nèi)最早一批進(jìn)行計(jì)算機(jī)輔助藥物設(shè)計(jì)(CADD)的學(xué)者之一。
我本科的老師說,陳先生年輕有為,有很多好的想法,跟著他一定沒錯(cuò),我就報(bào)考了中科院上海藥物所陳先生的研究生。
我從1991年讀研究生開始,到1996年博士畢業(yè),五年的時(shí)間專門跟陳先生學(xué)習(xí)計(jì)算機(jī)輔助藥物設(shè)計(jì)。
當(dāng)時(shí)做這個(gè)方向研究的人很少,也很少有學(xué)生會(huì)選擇這樣一個(gè)方向,我那時(shí)候?qū)λ幬镌O(shè)計(jì)也不是很懂,但是我們相信跟著陳先生一定能做出一些東西來。
一入學(xué),陳先生就給了我?guī)灼⑽奈墨I(xiàn),是他與國外同行交流時(shí)收到的文章單行本,就成為了我的第一個(gè)課題,將神經(jīng)網(wǎng)絡(luò)方法應(yīng)用到藥物定量構(gòu)效關(guān)系(QSAR)研究中。
當(dāng)時(shí)學(xué)習(xí)這個(gè)很艱苦,能找到的資料非常有限,也沒有軟件,我就自己學(xué)習(xí)用C語言寫了一個(gè)有1400多行的神經(jīng)網(wǎng)絡(luò)計(jì)算程序,后來用這個(gè)程序發(fā)表了3篇英文文章。
沒想到神經(jīng)網(wǎng)絡(luò)現(xiàn)在又火起來了,變成了深度學(xué)習(xí),并帶動(dòng)了AI制藥的發(fā)展。
之后陳凱先先生又帶領(lǐng)我們參加了國家“863”計(jì)劃的第一個(gè)藥物設(shè)計(jì)項(xiàng)目“基于蛋白質(zhì)和核酸三維結(jié)構(gòu)知識(shí)的藥物設(shè)計(jì)”,其中我主要承擔(dān)了兩個(gè)方面的研究。
首先是“G蛋白偶聯(lián)受體(GPCR)三維結(jié)構(gòu)模建和藥物作用機(jī)制”的研究,我們是國內(nèi)最早做“GPCR同源模建”的團(tuán)隊(duì)。
中國科學(xué)院院士金國章教授,當(dāng)時(shí)正在研究“左旋千金藤啶堿(l-SPD)對(duì)多巴胺受體亞型結(jié)構(gòu)的選擇性”問題,我們幫助金院士模建了多巴胺D1、D2受體亞型結(jié)構(gòu),將左旋千金藤啶堿與多巴胺受體相結(jié)合的幾個(gè)場(chǎng)景單獨(dú)取出來,用量子力學(xué)半經(jīng)驗(yàn)分子軌道法進(jìn)行計(jì)算,并探索了四氫小檗堿類似物的選擇性機(jī)制,幫助金國章院士解決了這個(gè)問題。
當(dāng)時(shí),我們還與池志強(qiáng)院士合作,模建了μ阿片受體三維結(jié)構(gòu),并預(yù)測(cè)了羥甲芬太尼的三個(gè)可能結(jié)合位點(diǎn),后來經(jīng)過點(diǎn)突變實(shí)驗(yàn)對(duì)此進(jìn)行了證實(shí)。
其次,我采用三維定量構(gòu)效關(guān)系(3D-QSAR)的方法,為氟喹諾酮類藥物的結(jié)構(gòu)改造提供了重要信息。
上海藥物研究所2009年上市的安妥沙星,早期的研究工作就有我的參與,研發(fā)人員在我們研究的3D-QSAR指導(dǎo)之下,合成了比氧氟沙星具有更好抗菌活性的藥物分子。
1996年,在“863”計(jì)劃十周年成果展上,上海藥物所將這些工作作為成果進(jìn)行了匯報(bào)展示,受到好評(píng),并于1997年獲得中國科學(xué)院自然科學(xué)二等獎(jiǎng)。
大家以前都覺得計(jì)算機(jī)輔助藥物設(shè)計(jì)離自己很遠(yuǎn),和日常的新藥研究沒有什么關(guān)系。
通過我們?cè)凇?63”項(xiàng)目中取得的研究成果,上海藥物所的藥物化學(xué)家和藥理學(xué)家也逐漸認(rèn)可了計(jì)算機(jī)輔助藥物設(shè)計(jì)的價(jià)值。
如果只是口頭介紹這個(gè)東西有價(jià)值,別人看不到它的效果,是不會(huì)認(rèn)可的,我們必須拿出實(shí)際的案例才有說服力。
我們做了非常多類似的基礎(chǔ)性工作,推動(dòng)計(jì)算機(jī)輔助藥物設(shè)計(jì)在藥物研發(fā)中的應(yīng)用。
同時(shí),由于當(dāng)時(shí)國內(nèi)做“計(jì)算機(jī)輔助藥物設(shè)計(jì)”的人非常少,我在做研究的同時(shí),也做了很多知識(shí)普及類的工作,把國外這一領(lǐng)域的文獻(xiàn)、知識(shí)寫成中文綜述發(fā)表出來,一共有十來篇。
1996年,我博士畢業(yè)出國后,我的師兄蔣華良院士在國內(nèi)繼續(xù)推動(dòng)相關(guān)工作,并于2000年成立了“藥物發(fā)現(xiàn)與設(shè)計(jì)中心”,現(xiàn)在計(jì)算機(jī)輔助藥物設(shè)計(jì)這個(gè)學(xué)科已經(jīng)發(fā)展得非常好了。
醫(yī)健AI掘金志:AI制藥是一個(gè)交叉型的領(lǐng)域,更需要具有藥物研發(fā)與AI交叉背景的從業(yè)者,華東理工大學(xué)藥學(xué)院在培養(yǎng)交叉型人才的學(xué)科建設(shè)和師資配置、教學(xué)方案等方面,您有何心得?
唐赟:我2004年回國,開始是在復(fù)旦大學(xué)藥學(xué)院任教,后來師兄蔣華良院士找到我,邀請(qǐng)我和他一起到華東理工大學(xué)新建一個(gè)藥學(xué)院。
建院時(shí)的想法就是將藥物設(shè)計(jì)作為藥學(xué)學(xué)科的特色方向,并且聘請(qǐng)多名上海藥物所藥物設(shè)計(jì)方向畢業(yè)的博士來充實(shí)師資隊(duì)伍。
2004年的時(shí)候,國內(nèi)已經(jīng)有不少人在做藥物設(shè)計(jì),但還沒有系統(tǒng)性培養(yǎng)學(xué)生的方案。
我們當(dāng)時(shí)就已經(jīng)意識(shí)到國家將來肯定需要這方面的人才,所以很早就開始培養(yǎng)這個(gè)方向的學(xué)生,目標(biāo)就是為張江藥谷培養(yǎng)藥物設(shè)計(jì)人才。
2005年到2015年這十年間,我一直在管理本科教學(xué),牽頭創(chuàng)辦了藥學(xué)專業(yè),將藥物設(shè)計(jì)學(xué)及藥物設(shè)計(jì)實(shí)驗(yàn)作為本科生的必修課程,成為國內(nèi)本科藥學(xué)專業(yè)中最早開設(shè)相關(guān)必修課程的高校之一。
從2006年起,本科生正式開始上藥物設(shè)計(jì)理論課和實(shí)驗(yàn)課,由我和我團(tuán)隊(duì)里的幾個(gè)教師一起授課,講義也是我們自己編寫的,還有一些配套的課程,這樣培養(yǎng)的本科生具有較好的理論知識(shí)和動(dòng)手能力,有許多畢業(yè)生后來選擇在藥物設(shè)計(jì)方向進(jìn)行深造。
我根據(jù)多年教學(xué)經(jīng)驗(yàn)編寫的《藥物設(shè)計(jì)學(xué)》教材,2020年由化學(xué)工業(yè)出版社出版;我們編寫的“藥物設(shè)計(jì)實(shí)驗(yàn)”教程則包含在我主編的《藥學(xué)專業(yè)實(shí)驗(yàn)》中,也在2020年由化學(xué)工業(yè)出版社出版。
在研究生培養(yǎng)方面,我非常注重對(duì)學(xué)生專業(yè)知識(shí)和技能的培養(yǎng),既強(qiáng)化學(xué)生的新藥研發(fā)背景知識(shí),也要修一些計(jì)算機(jī)、數(shù)學(xué)類的課程,掌握編程的基本功,AI如今已成為學(xué)生們需要掌握的基本技能。
因此,我們實(shí)驗(yàn)室培養(yǎng)的研究生都具有較好的藥物設(shè)計(jì)能力,深受業(yè)界歡迎。
現(xiàn)在我們課題組已經(jīng)培養(yǎng)了近百名碩博生進(jìn)入業(yè)界,恒瑞醫(yī)藥、翰森藥業(yè)、海雁醫(yī)藥、藥明康德、康龍化成、晶泰科技等等,不論傳統(tǒng)藥企還是新興的AI制藥公司,都有我們的學(xué)生。我平時(shí)到外面做報(bào)告、講課的時(shí)候,總有制藥公司的人來問我要學(xué)生。
醫(yī)健AI掘金志:在AI制藥領(lǐng)域,您和您的團(tuán)隊(duì)與業(yè)界之間有哪些比較印象深刻的合作項(xiàng)目?
唐赟:前幾年和企業(yè)的合作不太多,這幾年AI火起來了,找上門來合作的人就多了。
去年我們和重慶藥友制藥公司建立了合作,這是上海復(fù)星醫(yī)藥旗下一個(gè)全資醫(yī)藥公司,華東理工大學(xué)有很多校友在藥友制藥工作,他們的董事長劉強(qiáng)也是其中之一。
藥友制藥內(nèi)部做藥物設(shè)計(jì)的人不多,又想做創(chuàng)新藥,于是就回母校來找我合作。
這是一個(gè)抗乙肝病毒的藥物設(shè)計(jì)研究,我們利用深度學(xué)習(xí)方法,對(duì)一些活性已知的抗乙肝病毒的分子結(jié)構(gòu)進(jìn)行學(xué)習(xí),生成了一批類似的分子結(jié)構(gòu),藥友制藥從中選擇了一部分進(jìn)行合成與生物活性測(cè)試,測(cè)試的結(jié)果他們非常滿意。
我們提供的這些設(shè)計(jì)分子的方法,其中有一些還沒有實(shí)際應(yīng)用過,不知道設(shè)計(jì)分子的效果如何,但最后出來的結(jié)果很好,他們很滿意,我們也很滿意,因?yàn)樽C實(shí)了我們方法的價(jià)值。
目前他們正在和我們談第二個(gè)合作項(xiàng)目,腫瘤藥物的分子設(shè)計(jì)研究。
另一家做AI制藥的公司索智生物,總部在嘉興,在上海有分部,也跟我們合作過一年多。
索智生物對(duì)我們的網(wǎng)絡(luò)藥理學(xué)方法感興趣,將我們的方法植入到他們自己的分子設(shè)計(jì)平臺(tái)中,作為他們的研究工具之一去設(shè)計(jì)藥物分子。
隨后他們?cè)诔闪⒉坏絻赡甑臅r(shí)間里,已獲得3個(gè)PCC(臨床前候選化合物)分子,進(jìn)展很不錯(cuò)。
學(xué)校和企業(yè)之間是互惠互利的關(guān)系,我們?yōu)槠髽I(yè)提供先進(jìn)的研究方法,企業(yè)為我們提供具有實(shí)際需求的課題和實(shí)驗(yàn)驗(yàn)證的機(jī)會(huì)。
以前沒有和企業(yè)合作的時(shí)候,我們研究出來的方法只能發(fā)篇文章就結(jié)束了,也沒辦法了解它的效果。現(xiàn)在通過與企業(yè)的合作,能夠?qū)⒀芯砍晒虍a(chǎn)業(yè)轉(zhuǎn)化方向再推進(jìn)一步。
相應(yīng)地,企業(yè)把他們的需求告訴我們,我們利用AI等方法技術(shù)幫他們解決難題,也能將風(fēng)險(xiǎn)前置,從而降低分子合成與后期驗(yàn)證的成本。
醫(yī)健AI掘金志:從計(jì)算機(jī)工具到AI工具的變革,對(duì)藥物設(shè)計(jì)產(chǎn)生了哪些推動(dòng)作用?
唐赟:現(xiàn)在行業(yè)里很多人號(hào)稱在做AIDD(人工智能藥物發(fā)現(xiàn)),實(shí)際上卻并不是真正地了解這個(gè)行業(yè)的背景知識(shí),而是最近兩三年才“改行”進(jìn)入這個(gè)行業(yè)。
他們有計(jì)算機(jī)背景,但是缺乏藥學(xué)背景。
以我的理解,不論CADD(計(jì)算機(jī)輔助藥物設(shè)計(jì)),還是AIDD,都是做藥物設(shè)計(jì),但藥物設(shè)計(jì)應(yīng)該包括兩個(gè)方面:一是結(jié)構(gòu)驅(qū)動(dòng),二是數(shù)據(jù)驅(qū)動(dòng)。
傳統(tǒng)的CADD是基于分子模擬技術(shù),通過計(jì)算機(jī)的模擬、計(jì)算和預(yù)測(cè)藥物與靶標(biāo)之間的相互作用,從而設(shè)計(jì)和優(yōu)化先導(dǎo)化合物結(jié)構(gòu),這叫做結(jié)構(gòu)驅(qū)動(dòng)。
新興的AIDD是基于AI技術(shù),叫做數(shù)據(jù)驅(qū)動(dòng)。CADD中也有數(shù)據(jù)驅(qū)動(dòng),叫做QSAR,AIDD就是QSAR的延伸,是CADD的一部分。
現(xiàn)在很多人把CADD和AIDD當(dāng)作兩種事物來看,有的人甚至將二者對(duì)立起來,這是不對(duì)的,AIDD只是CADD的一個(gè)高級(jí)階段。
我在外面參加學(xué)術(shù)交流時(shí)一直說,結(jié)構(gòu)驅(qū)動(dòng)與數(shù)據(jù)驅(qū)動(dòng),相當(dāng)于一個(gè)硬幣的兩面,缺一不可,不能把它們割裂開來。
我們?cè)谧鏊幬镌O(shè)計(jì)的時(shí)候,肯定是不能只靠數(shù)據(jù)驅(qū)動(dòng)這一樣?xùn)|西,必須要采用一些傳統(tǒng)的CADD技術(shù)。
現(xiàn)在只是因?yàn)檫M(jìn)入了大數(shù)據(jù)和人工智能(AI)的時(shí)代,才會(huì)出現(xiàn)這個(gè)AIDD的概念。也是由于AIDD的出現(xiàn),讓世界范圍內(nèi)更多的人關(guān)注藥物研發(fā)這個(gè)領(lǐng)域。
我們以前做CADD的時(shí)候,默默無聞,沒有人關(guān)注我們做什么,只能通過國家自然科學(xué)基金等申請(qǐng)一些小的科研課題。
那時(shí)候搞新藥研發(fā)的企業(yè)也不多,我們想和企業(yè)進(jìn)行合作也比較困難。
AIDD出現(xiàn)后,這個(gè)行業(yè)才受到更多的重視,找上門來合作的企業(yè)也越來越多,研究資金也要多一些。
粗略統(tǒng)計(jì),截至2022年底國內(nèi)已經(jīng)成立了73家AI制藥公司,其中大部分成立于2019年—2021年間,也為行業(yè)引入了更多的風(fēng)險(xiǎn)資金,推動(dòng)了整個(gè)行業(yè)的發(fā)展。
但是我對(duì)目前的情況也有一些憂慮,很多進(jìn)入這個(gè)行業(yè)的人,尤其是風(fēng)險(xiǎn)投資者,有些只有計(jì)算機(jī)的背景,缺乏藥學(xué)背景,并不真正了解藥物設(shè)計(jì),只是在炒作一個(gè)概念,有些急功近利。
有人認(rèn)為只要兩三年就做出新藥開始盈利,這是不現(xiàn)實(shí)的。甚至有些公司的目標(biāo)并不是去做出幾款新藥,而是想借助這個(gè)風(fēng)口吸引到更多的資金,盡早上市。
將來一定會(huì)大浪淘沙,一些企業(yè)會(huì)倒閉,一些資金會(huì)退出去,最終留下的才是真正做藥物研發(fā)的企業(yè),畢竟我們制藥人的初衷是做成藥,做好藥。
醫(yī)健AI掘金志:虛擬篩選是先導(dǎo)化合物發(fā)現(xiàn)的主流方法,去年您的團(tuán)隊(duì)發(fā)布的適用于虛擬篩選的wSDTNBI算法,獲得藥明康德生命化學(xué)研究獎(jiǎng),這項(xiàng)新研究主要解決了虛擬篩選中的哪些問題?
唐赟:這是我們提出的一個(gè)新的虛擬篩選途徑。傳統(tǒng)的虛擬篩選途徑:一個(gè)是基于靶標(biāo)結(jié)構(gòu)的方法,一個(gè)是基于配體的方法。雖然都取得了一定的成功,但也存在一些局限性。
比如,基于靶標(biāo)結(jié)構(gòu)的虛擬篩選,嚴(yán)重依賴于靶標(biāo)的三維結(jié)構(gòu),如果找不到這個(gè)靶標(biāo)結(jié)構(gòu)的話,最終效果就要大打折扣。
從目前的情況來看,絕大部分靶標(biāo)的蛋白結(jié)構(gòu)還沒有被測(cè)定出來。
雖然AlphaFold2號(hào)稱已經(jīng)預(yù)測(cè)出2億多個(gè)蛋白的結(jié)構(gòu),在蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)方面取得了很大的進(jìn)步,但這些結(jié)構(gòu)還存在一些問題,導(dǎo)致應(yīng)用在虛擬篩選時(shí)成功率不太高,或者說,還難以滿足基于結(jié)構(gòu)虛擬篩選的需要。
基于配體的虛擬篩選,則需要依賴配體陰性樣本數(shù)。
這也是我們從十幾年前就開始嘗試解決的問題,化合物進(jìn)入人體之后并沒有那么聽話,不是你想讓它和哪個(gè)靶標(biāo)作用,它就會(huì)和哪個(gè)靶標(biāo)發(fā)生作用,而是可能會(huì)與人體內(nèi)的很多蛋白發(fā)生作用,使結(jié)果變得不可控。
為了克服這些局限性,我們提出了“加權(quán)的基于子結(jié)構(gòu)-藥物-靶標(biāo)網(wǎng)絡(luò)推理(wSDTNBI)的方法”。
基于網(wǎng)絡(luò)推理的方法,最早是應(yīng)用在社會(huì)學(xué)領(lǐng)域中,我們學(xué)校商學(xué)院的周煒星教授,在2008年左右就開始研究社會(huì)領(lǐng)域中人與商品的網(wǎng)絡(luò)關(guān)系與推薦算法。
他發(fā)現(xiàn)“人與商品的二元關(guān)系”和“藥物與靶標(biāo)的二元關(guān)系”是一樣的,因此將這一方法推薦給我們。
我們也派了學(xué)生到他的團(tuán)隊(duì)合作學(xué)習(xí),一起進(jìn)行相關(guān)研究,在此對(duì)周教授的方法推薦表示感謝。
后來在這些研究的基礎(chǔ)上,我們又進(jìn)行了很多改進(jìn),最終形成了目前的一系列算法,也就是我們目前的研究方向--網(wǎng)絡(luò)藥理學(xué)。
相比其他虛擬篩選的方法,這個(gè)方法的優(yōu)勢(shì)在于,既不依賴于靶標(biāo)三維結(jié)構(gòu),也不依賴于陰性樣本。
我們僅僅需要使用實(shí)驗(yàn)測(cè)定的“藥物-靶標(biāo)相互作用”數(shù)據(jù)如K(i)、IC(50)值,建立藥物-靶標(biāo)相互作用網(wǎng)絡(luò),就能夠完成虛擬篩選。
此外,該方法還有一些突出優(yōu)點(diǎn),比如可以同時(shí)針對(duì)多個(gè)靶標(biāo)進(jìn)行虛擬篩選,了解化合物的多向藥理學(xué)性質(zhì),運(yùn)算速度非??臁?/p>
在我們的案例中,利用wSDTNBI方法僅耗費(fèi)數(shù)十秒時(shí)間,就完成了超過一萬三千個(gè)化合物和近兩千個(gè)人體靶標(biāo)之間的相互作用預(yù)測(cè)。
這項(xiàng)研究成果2022年初發(fā)表在Chemical Science上,算法已整合到我們團(tuán)隊(duì)研發(fā)的免費(fèi)在線預(yù)測(cè)系統(tǒng)NetInfer中(http://lmmd.ecust.edu.cn/netinfer/)。
使用wSDTNBI方法進(jìn)行活性化合物篩選的示意圖
醫(yī)健AI掘金志:目前AI驅(qū)動(dòng)研發(fā)的藥物有些已經(jīng)進(jìn)入臨床階段,您認(rèn)為AI技術(shù)在藥物研發(fā)過程中,哪些工作是不可取代的?相比傳統(tǒng)手段,AI技術(shù)更高效的成果是什么?
唐赟:這個(gè)問題要從AI的概念上入手去理解,AI的優(yōu)勢(shì)在于,可以對(duì)大量的數(shù)據(jù)進(jìn)行學(xué)習(xí),透過現(xiàn)象找到其內(nèi)在聯(lián)系,這是人工所難以做到的。
而藥物分子設(shè)計(jì)過程,實(shí)際上是一個(gè)多目標(biāo)優(yōu)化的過程。既要使設(shè)計(jì)的分子具有良好的生物活性和安全性,又要保證分子具有良好的化學(xué)穩(wěn)定性和藥代動(dòng)力學(xué)性質(zhì)。
這個(gè)多目標(biāo)優(yōu)化過程就會(huì)涉及到大量數(shù)據(jù)處理的環(huán)節(jié),AI承擔(dān)著不可替代的作用,比如QSAR的作用就是如此。
我三十年前就在做這方面的工作,那時(shí)候還沒有AIDD的概念,QSAR還屬于CADD的范疇,但實(shí)際上,AI就是在QSAR的基礎(chǔ)上進(jìn)行的更深入的研究,因此在藥代動(dòng)力學(xué)和毒性預(yù)測(cè)、分子結(jié)構(gòu)生成、虛擬篩選等方面具有自己的獨(dú)特優(yōu)勢(shì)。
醫(yī)健AI掘金志:雖然已經(jīng)有少數(shù)藥物進(jìn)入臨床階段,但到目前為止,AI驅(qū)動(dòng)研發(fā)的藥物仍然沒有一款成功獲批上市,AI技術(shù)研發(fā)的藥物距離上市還有多遠(yuǎn)?
唐赟:AIDD技術(shù)在發(fā)現(xiàn)藥物的過程中會(huì)起到很大的作用。我也看到一些統(tǒng)計(jì)數(shù)字,比如一個(gè)藥物研發(fā)項(xiàng)目,從啟動(dòng)到進(jìn)入臨床研究階段,傳統(tǒng)管線要五六年,現(xiàn)在利用AI制藥技術(shù)可以縮短到一~二年。
這就是AIDD的優(yōu)勢(shì),主要體現(xiàn)在藥物發(fā)現(xiàn)的階段。
但后期的臨床試驗(yàn)階段仍然要占據(jù)很多的時(shí)間,而AI技術(shù)在臨床階段能起到的作用卻十分有限。
因?yàn)榕R床試驗(yàn)的工作仍然需要人工來完成,無法依靠AI技術(shù)來大幅縮短時(shí)間。
目前市面上已有一些公司,聲稱旗下進(jìn)入臨床研究階段的候選藥物是通過AI技術(shù)研發(fā)的,卻一直沒有藥物成功上市,就是因?yàn)楹笃诘呐R床試驗(yàn)階段非常困難,我估計(jì)至少還要5年才能走完這個(gè)流程。
樂觀估計(jì),未來5至10年內(nèi),應(yīng)該會(huì)有AI驅(qū)動(dòng)研發(fā)的藥物上市,畢竟AI這個(gè)概念進(jìn)入藥物研發(fā)領(lǐng)域也才短短幾年時(shí)間。新藥研發(fā)有自身的規(guī)律,還需時(shí)間來驗(yàn)證。
在藥物發(fā)現(xiàn)的環(huán)節(jié),AI技術(shù)也面臨著一些困難,尤其是數(shù)據(jù)不足的問題。
AIDD本身要依賴大量的數(shù)據(jù)進(jìn)行工作,但在新藥研發(fā)領(lǐng)域,目前的數(shù)據(jù)量只在中小規(guī)模之間。
在以往的會(huì)議討論中,我也提出過一個(gè)觀點(diǎn),就是AIDD未來的發(fā)展需要行業(yè)內(nèi)部共享數(shù)據(jù)。
但很多制藥公司不會(huì)把自己的數(shù)據(jù)公布出來,這是最要命的東西,即便是自己用不上的數(shù)據(jù),也藏得像個(gè)寶貝一樣,不會(huì)拿出來和人共享。
打破行業(yè)壁壘的關(guān)鍵就在于數(shù)據(jù)共享,目前行業(yè)中每個(gè)人都掌握了一些數(shù)據(jù),但每個(gè)人的數(shù)據(jù)又都只有一部分。
我們?cè)诟咝W鲅芯?,也只能用公開的一小部分?jǐn)?shù)據(jù),建模只能用公開數(shù)據(jù),這對(duì)模型的準(zhǔn)確率影響很大,只能達(dá)到百分之八九十。
數(shù)據(jù)、算法、算力是人工智能三要素,其中的關(guān)鍵就是數(shù)據(jù),數(shù)據(jù)的質(zhì)量與數(shù)量都非常重要,只要在數(shù)據(jù)上取得突破,其他問題都會(huì)跟著突破的。
醫(yī)健AI掘金志:您對(duì)計(jì)算生物學(xué)有十分深入的研究,三年前AlphaFold2橫空出世,掀起了蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)領(lǐng)域的革命,如今以ChatGPT為代表的AIGC技術(shù)再次引爆全球,您覺得將為行業(yè)帶來什么樣的影響?
唐赟:AlphaFold2的出現(xiàn),提高了制藥領(lǐng)域?qū)I技術(shù)的關(guān)注度,以往蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)是非常困難的事情。
同時(shí),盡管AlphaFold2在這方面已經(jīng)取得了很大的成功,但目前也只能預(yù)測(cè)一些單體蛋白,而多聚體蛋白或蛋白復(fù)合物,以及蛋白各亞基之間的結(jié)合模式的預(yù)測(cè),AlphaFold2目前還難以實(shí)現(xiàn)。
畢竟,目前PDB庫中雖然有超過二十萬個(gè)蛋白結(jié)構(gòu),但其中只有八萬多個(gè)純蛋白,人體蛋白更是僅有三千個(gè),更多的則是一些容易測(cè)定的蛋白與不同配體形成的復(fù)合物。等將來PDB庫中的純蛋白結(jié)構(gòu)更多一些,AlphaFold2預(yù)測(cè)的結(jié)構(gòu)也會(huì)更加準(zhǔn)確些。
AIGC技術(shù)也是如此,分子結(jié)構(gòu)生成就屬于AIGC的一種,通過使用者輸入的結(jié)構(gòu)去隨機(jī)生成一些相似結(jié)構(gòu),但它也很難去產(chǎn)生一個(gè)完全新的結(jié)構(gòu)。
AI技術(shù)就是這樣,你輸入了哪些東西,它才能學(xué)習(xí)到哪些東西,再據(jù)此進(jìn)行新的產(chǎn)出。
如果我們本身所具備的數(shù)據(jù)、知識(shí)不足,AI也不可能無中生有。所以AIGC的關(guān)鍵還是在數(shù)據(jù)。
但AI技術(shù)目前已經(jīng)能夠?yàn)槲覀兲峁┖芏噙x擇,并且能夠在已有的相似結(jié)構(gòu)中找出最好的那一個(gè),這也是很大的幫助。雷峰網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。