丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
醫(yī)療AI 正文
發(fā)私信給劉海濤
發(fā)送

0

百圖生科首席AI科學家宋樂:AI,幫助制藥人逃逸“雙十”怪圈

本文作者: 劉海濤 2021-12-31 16:47
導語:AI不能包治百病,但已是不可或缺的“真香”工具

7 月 30 日,成立不到一年的百圖生科(BioMap)宣布完成上億美元的 A 輪融資,這家由李彥宏牽頭發(fā)起并親任董事長、原百度風投 CEO 劉維作為聯(lián)合創(chuàng)始人兼 CEO 掌舵的「中國首家生物計算驅(qū)動的生命科學平臺公司」向外界放出雄心:

公司致力于用高性能生物計算和多組學數(shù)據(jù)技術(shù)加速創(chuàng)新藥物和早篩早診等精準生命科學產(chǎn)品的研發(fā),力圖讓更多疾病可預警、可控制、可治愈,為行業(yè)提供更好的生物地圖(BioMap),幫助藥廠找到化合物,幫助醫(yī)生找到生物標志物,幫助科研人員找到各種生物數(shù)據(jù)背后的意義。

不久之前,國際機器學習大牛又宋樂加入李彥宏生物計算軍團。為世界知名機器學習專家,他領(lǐng)導著百圖生科 AI 算法團隊,為獨具特色的生物計算引擎研發(fā)提供技術(shù)動力。

宋樂博士是著名的機器學習和圖深度學習專家,曾任美國佐治亞理工學院計算機學院終身教授、機器學習中心副主任,阿聯(lián)酋 MBZUAI 機器學習系主任,螞蟻金服深度學習團隊負責人(P10)、阿里巴巴達摩院研究員,國際機器學習大會董事會成員,具有豐富的 AI 算法和工程經(jīng)驗。

自 2008 年起,宋樂博士在 CMU 從事生物計算相關(guān)的研究,利用機器學習技術(shù)對靶點挖掘、藥物設(shè)計取得了一系列突破性成果,獲得 NeurIPS、ICML、AISTATS 等主要機器學習會議的最佳論文獎。社區(qū)服務(wù)方面,他曾擔任 NeurIPS、ICML、ICLR、AAAI、IJCAI 等 AI 頂會的領(lǐng)域主席,并將出任 ICML 2022 的大會主席,他還是同行評議期刊 JMLR、IEEE TPAMI 的副主編。

近日,由雷峰網(wǎng)(公眾號:雷峰網(wǎng)) & 醫(yī)健AI掘金志主辦的GAIR「醫(yī)療科技高峰論壇」在深圳正式召開。

這一次,醫(yī)健AI掘金志以「醫(yī)療AI的破局與新生 」為主題,將話筒傳遞給四位院士、5位IEEE Fellow、19位行業(yè)領(lǐng)袖,由他們以分別從歷盡鉛華的醫(yī)學影像AI、和風勁正濃的AI制藥兩大賽道出發(fā),為行業(yè)的發(fā)展提出自己的判斷。

論壇之上,百圖生科首席AI科學家,ICML 2022大會主席宋樂,以《用人工智能賦能新藥研發(fā)》為題,發(fā)表了一場演講。

宋樂教授提到,大家在憧憬AI可以在新藥發(fā)現(xiàn)領(lǐng)域展現(xiàn)巨大作用的同時,還有三個問題要提前考慮。

第一個挑戰(zhàn),了解復雜疾病的困難。例如胃癌,因為胃連接不同器官;細胞層面上,每個器官有不同細胞進行不同作用,細胞之間通性也是很復雜的網(wǎng)絡(luò);分子層面,細胞里有各種各樣蛋白質(zhì)等分子產(chǎn)生相互作用,也形成了很復雜的網(wǎng)絡(luò)。所以,如果為一種胃部疾病找合適治療靶點,就需要對整個網(wǎng)絡(luò)有透徹的了解。

需要測量每一個環(huán)節(jié)、每一個尺度,包括整個機體組織尺度,整個組織的切片,細胞之間如何通信,如何表達這些基因。甚至要看到細胞里的蛋白質(zhì)互相作用,收集這些數(shù)據(jù)會非常復雜。

例如,需要測量單個細胞基因表達量,蛋白質(zhì)表達量。甚至還需要同時測量單個細胞基因表達、不同細胞在空間、組織里面的表達。

第二,對于包括基因?qū)用娴幕驕y序、表觀組,蛋白質(zhì)表達、蛋白質(zhì)代謝,組織層面、機理層面等多維度、多尺度的數(shù)據(jù),如何進行復雜且多樣化的融合處理。

傳統(tǒng)方式是對每個維度分開分析,再通過人來做整合;現(xiàn)在可以用AI將多尺度、多樣化數(shù)據(jù)整合。 除了數(shù)據(jù)多樣性問題,數(shù)據(jù)量增加也非???,生物數(shù)據(jù)每7個月翻一倍。

 第三個挑戰(zhàn),行業(yè)配合問題。數(shù)據(jù)分析與實驗往往是兩波人,他們之間的溝通缺乏一個非常高效的系統(tǒng),將預測、模型輸出和試驗系統(tǒng)進行整合,加速迭代。

通常情況下,都是數(shù)據(jù)分析員根據(jù)根據(jù)已有知識在腦海里形成假設(shè),然后讓實驗員做實驗;有了數(shù)據(jù)后,再給數(shù)據(jù)分析團隊分析,驗證假設(shè)是否成立,決定下一次實驗。

整個實驗-數(shù)據(jù)分析-模型環(huán)節(jié)比較開環(huán),但不是完全開環(huán),缺少一個非常高效的系統(tǒng),將預測或模型輸出和實驗系統(tǒng)整合,加速迭代過程。

以下是演講的全部內(nèi)容,雷峰網(wǎng)做了不改變愿意的整理和編輯:

今天我分享一下對人工智能賦能醫(yī)藥的理解以及行業(yè)現(xiàn)狀,人工智能在這個領(lǐng)域能做些什么。

首先,這個行業(yè)面臨很大的挑戰(zhàn),我將其定義為雙十挑戰(zhàn)。

第一,醫(yī)藥研發(fā)漫長;每個新藥從研發(fā)到上市需要10年時間甚至更多,藥物篩選過程非常艱難。

很多藥物都是小分子或蛋白質(zhì),種類極多,篩選空間甚至有10的60次方,從這么大范圍找出最終的藥物分子,并推到上市,其實非常艱難。 

計算節(jié)點上,要從10的60次方中找到1萬種,再從里面選幾百個做Preclinical測試,之后再做臨床試驗,整個過程中每一步都有很高的失敗率。 

而且,前期篩選經(jīng)常預測不到后期屬性,導致產(chǎn)物后期無法使用,就要從頭重新篩選,周而復始。

百圖生科首席AI科學家宋樂:AI,幫助制藥人逃逸“雙十”怪圈

第二個“十”是指,開發(fā)一個新藥大約需要10億美金左右的造價。1950年還有很多比較容易治療的疾病未被治愈,

如果當時有10億美金投入,可以發(fā)現(xiàn)幾十個藥物。但現(xiàn)在面對的都是比較難的疾病,并且現(xiàn)在我們對藥物的療效、副作用減少的要求越來越高,監(jiān)管要求越來越嚴。

所以10億美金只能發(fā)現(xiàn)一個新藥物。如果我們能把新藥研發(fā)的造價降低、成功率提升的話,也可以節(jié)約研發(fā)經(jīng)費,這個市場是巨大的。

百圖生科首席AI科學家宋樂:AI,幫助制藥人逃逸“雙十”怪圈 

所以AI新藥研發(fā)面對的是一個非常廣闊的市場,但大家在憧憬AI可以在新藥發(fā)現(xiàn)領(lǐng)域展現(xiàn)巨大作用的同時,還有三個問題要提前考慮:

第一個挑戰(zhàn),了解復雜疾病的困難。例如胃癌,因為胃連接不同器官;

細胞層面上,每個器官有不同細胞進行不同作用,細胞之間通性也是很復雜的網(wǎng)絡(luò);

分子層面,細胞里有各種各樣蛋白質(zhì)等分子產(chǎn)生相互作用,也形成了很復雜的網(wǎng)絡(luò)。

所以,如果為一種胃部疾病找合適治療靶點,就需要對整個網(wǎng)絡(luò)有透徹的了解。

需要測量每一個環(huán)節(jié)、每一個尺度,包括整個機體組織尺度,整個組織的切片,細胞之間如何通信,如何表達這些基因。甚至要看到細胞里的蛋白質(zhì)互相作用,收集這些數(shù)據(jù)會非常復雜。

例如,需要測量單個細胞基因表達量,蛋白質(zhì)表達量。甚至還需要同時測量單個細胞基因表達、不同細胞在空間、組織里面的表達。

百圖生科首席AI科學家宋樂:AI,幫助制藥人逃逸“雙十”怪圈 

第二,對于包括基因?qū)用娴幕驕y序、表觀組,蛋白質(zhì)表達、蛋白質(zhì)代謝,組織層面、機理層面等多維度、多尺度的數(shù)據(jù),如何進行復雜且多樣化的融合處理。

傳統(tǒng)方式是對每個維度分開分析,再通過人來做整合;現(xiàn)在可以用AI將多尺度、多樣化數(shù)據(jù)整合。 

除了數(shù)據(jù)多樣性問題,數(shù)據(jù)量增加也非??欤飻?shù)據(jù)每7個月翻一倍。

但是傳統(tǒng)方式分析效率卻不高,所以就需要AI模型用HPC方式,把數(shù)據(jù)里有用或微弱的信息整合。

百圖生科首席AI科學家宋樂:AI,幫助制藥人逃逸“雙十”怪圈

第三個挑戰(zhàn),行業(yè)配合問題。數(shù)據(jù)分析與實驗往往是兩波人,他們之間的溝通缺乏一個非常高效的系統(tǒng),將預測、模型輸出和試驗系統(tǒng)進行整合,加速迭代。

通常情況下,都是數(shù)據(jù)分析員根據(jù)根據(jù)已有知識在腦海里形成假設(shè),然后讓實驗員做實驗;有了數(shù)據(jù)后,再給數(shù)據(jù)分析團隊分析,驗證假設(shè)是否成立,決定下一次實驗。

整個實驗-數(shù)據(jù)分析-模型環(huán)節(jié)比較開環(huán),但不是完全開環(huán),缺少一個非常高效的系統(tǒng),將預測或模型輸出和實驗系統(tǒng)整合,加速迭代過程。

百圖生科首席AI科學家宋樂:AI,幫助制藥人逃逸“雙十”怪圈為了解決這三個挑戰(zhàn),有必要形成一個AI-實驗的閉環(huán)系統(tǒng),把預測和濕試驗的環(huán)節(jié)打通到同一個系統(tǒng)。

百圖生科建立了干濕試驗閉環(huán)的高通量平臺,這個平臺在AI模型有一個巨大的場景,可以整合現(xiàn)有的數(shù)據(jù),產(chǎn)生異構(gòu)的、復雜的知識圖譜。

 基于知識圖譜可以進行AI模型擬合,或者整合這些數(shù)據(jù)并且產(chǎn)生預測。例如要探究某個蛋白質(zhì)是不是某個疾病的靶點,或者我們設(shè)計出方案是不是針對這個靶點有效,直接發(fā)放給實驗系統(tǒng),收集到的可能是生物實驗數(shù)據(jù),可能是翻譯的數(shù)據(jù),甚至是圖像數(shù)據(jù),很快可以通過AI模型或者計算機視覺方法更新,再進行下一個實驗。百圖生科首席AI科學家宋樂:AI,幫助制藥人逃逸“雙十”怪圈

接下來,我再介紹一下AI主要在每個環(huán)節(jié)可以做什么,大概分為三部分:

第一,在藥物發(fā)現(xiàn)階段找到新靶點;

第二,根據(jù)靶點設(shè)計新的藥物分子;

第三,在試驗閉環(huán)階段進行交互學習。

下面具體列舉幾個案例:

第一個案例,AI找出目標蛋白質(zhì),例如在復雜蛋白質(zhì)相互作用網(wǎng)絡(luò),或信號通路里找出蛋白質(zhì)。

細胞膜上有很多蛋白質(zhì),阻斷或激活膜蛋白的作用就會產(chǎn)生細胞間的生物作用。而且,每個蛋白質(zhì)在不同疾病里,對應(yīng)蛋白質(zhì)表達單元也不一樣。

尋找針對某個疾病表現(xiàn)的蛋白質(zhì),就需要把得到的細胞基因表達數(shù)據(jù)、蛋白質(zhì)表達數(shù)據(jù)整合到同一網(wǎng)絡(luò)里。

過去,有很多生物學家做了這方面研究,模型做得很復雜,將很多復雜的AI模型遷移到生物網(wǎng)絡(luò)里。 

例如在生物計算領(lǐng)域,蛋白質(zhì)之間連接產(chǎn)生了非常復雜相互作用網(wǎng)絡(luò)。

這個網(wǎng)絡(luò)不單是兩兩蛋白質(zhì)作用,也可能有三、四個蛋白質(zhì)相互形成作用。蛋白質(zhì)又關(guān)系到關(guān)鍵基因表達,每個節(jié)點有非常復雜的屬性,就需要用圖神經(jīng)網(wǎng)絡(luò)進行推理。

百圖生科首席AI科學家宋樂:AI,幫助制藥人逃逸“雙十”怪圈

我們也可以借鑒其他領(lǐng)域的圖神經(jīng)網(wǎng)絡(luò)模型,融合在一起學習更好的模型。

圖神經(jīng)網(wǎng)絡(luò)是現(xiàn)在比較火的領(lǐng)域,大量搜索的經(jīng)驗都可以遷移到靶點發(fā)現(xiàn)領(lǐng)域,讓靶點發(fā)現(xiàn)變得更有效,融合各種各樣信息。   

第二個案例,AI怎樣針對靶點設(shè)計有效藥物。一般藥物都是有機小分子或大分子,或蛋白質(zhì)或RNA。

所以,設(shè)計藥物就要涉及很多小分子性質(zhì)和大分子結(jié)構(gòu)預測。例如AlphaFold 2可以根據(jù)給定序列預測蛋白質(zhì)結(jié)構(gòu)。

蛋白質(zhì)的結(jié)構(gòu)對其功能、作用非常關(guān)鍵,如果知道蛋白質(zhì)功能結(jié)構(gòu)就可以更好了解其功能,所以,準確蛋白質(zhì)結(jié)構(gòu)對設(shè)計結(jié)構(gòu)非常關(guān)鍵。

除了蛋白質(zhì),AI領(lǐng)域還能看到各種各樣搜索。例如RNA分子二級結(jié)構(gòu)、三級結(jié)構(gòu),如果AI預測出這些結(jié)構(gòu)對RNA藥物設(shè)計也有幫助。

除此之外,各種各樣小分子以及它們的屬性,毒性、水溶性,針對某一個靶點的有效性,也都可以通過AI模型預測。

其實,生物制藥的數(shù)據(jù)形態(tài)與傳統(tǒng)互聯(lián)網(wǎng)差異較大,生物制藥數(shù)據(jù)中很多是圖數(shù)據(jù),而傳統(tǒng)互聯(lián)網(wǎng)主要以網(wǎng)絡(luò)數(shù)據(jù)、人的行為數(shù)據(jù)為主。 

在生物制藥領(lǐng)域,如果想對一張圖結(jié)構(gòu)數(shù)據(jù)進行預測,或者對生成的小分子、大分子等生物序列比對,就需要各種各樣圖數(shù)據(jù)模型和VAE模型,甚至還要基于VAE模型學習小分子表征,進行小分子搜索和優(yōu)化。

除了預測結(jié)構(gòu)和功能外,AI在小分子性質(zhì)優(yōu)化上也有很多應(yīng)用,例如已知一個小分子是潛在藥物,利用AI更高效合成這些小分子,這就涉及到AI模型和博弈數(shù)搜索的結(jié)合。 

目前,AI在小分子、大分子的應(yīng)用已經(jīng)非常完善,AlphaFold2本身就是非常復雜的AI模型。

百圖生科首席AI科學家宋樂:AI,幫助制藥人逃逸“雙十”怪圈

第三個案例,預測RNA二級結(jié)構(gòu)折疊,通過RNA序列來預測結(jié)構(gòu)。

我認為RNA藥物未來可能是AI制藥非常好的應(yīng)用方向。

這是RNA二級結(jié)構(gòu)預測演示,先輸入RNA序列,如果需要預測RNA結(jié)構(gòu)。就要在RNA 序列遠端位點折疊,使空間上比較接近,位點接近程度用接觸圖表征。

百圖生科首席AI科學家宋樂:AI,幫助制藥人逃逸“雙十”怪圈

AI模型可以在其中基于序列輸入預測接觸圖,目前最好的手段就是深度學習,它的完善程度甚至超越了一些計算機視覺類模型。

用AI分析這樣的數(shù)據(jù),首先需要對序列分析,例如可以通過自然語言處理模型表征生物學序列。

這時,Transformer模型預測的是2D的結(jié)果,如果要生成圖像數(shù)據(jù),還需要做卷積神經(jīng)網(wǎng)絡(luò)產(chǎn)生特征,再預測接觸圖。

而且還要考慮結(jié)構(gòu)的限制,AlphaFold 2就是采用類似的策略,這相比傳統(tǒng)模型確實有巨大提高。

百圖生科首席AI科學家宋樂:AI,幫助制藥人逃逸“雙十”怪圈

實驗和AI模型閉環(huán)情況下,除了基因表達數(shù)據(jù)、蛋白質(zhì)表達數(shù)據(jù)之外,AI還可以解決有細胞圖像的數(shù)據(jù)。

細胞圖像數(shù)據(jù)圖像可能有六個頻道熒光圖像,如何基于熒光圖像,描述出微妙的細胞狀態(tài)變化,就需要做很多模型開發(fā)和設(shè)計。

此外,AI還可以提升一些信息含量比較高的實驗的效率。

第四個案例,有效打標簽。這不止是AI模型問題,也是系統(tǒng)設(shè)計的問題,而且也需要專家知識。

往往一開始只能獲得少量精標簽,訓練一個尚可的模型。

但是如果讓這個模型變成更準確的模型,就需要閉環(huán)的系統(tǒng),讓AI模型對大量沒有標簽的圖像打標簽,并呈現(xiàn)給無專業(yè)背景篩選,再給專家進行精標簽;精標簽打完后,再回流到AI模型更新,進行下一環(huán)。

整個過程如果在閉環(huán)情況下,就更有可能在少量精標簽情況下,讓模型繼續(xù)對大量沒有精標簽的圖像打標簽。

此外,AI還可以輸出分割標準,以及選擇什么樣圖片打標簽,在各個環(huán)節(jié)都有很多可以做東西,有很多可以提高的空間。  

百圖生科首席AI科學家宋樂:AI,幫助制藥人逃逸“雙十”怪圈

最后總結(jié)一下,我們目前面臨的都還是非常復雜的問題,即使有很多觀測手段,收集到大量數(shù)據(jù),有如此多的AI模型,也還是杯水車薪。

未來,如何把AI模型、專家知識和實驗手段結(jié)合在一起,還需要交叉學科的團隊一起努力,希望感興趣的同學加入這個領(lǐng)域,把生物計算交叉學科研究做得更好。 

百圖生科首席AI科學家宋樂:AI,幫助制藥人逃逸“雙十”怪圈

這是今天我想講的就是以上這些,如果感興趣,額外的信息可以關(guān)注我們公司的公眾號并訪問我們的網(wǎng)站。謝謝大家!

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

分享:
相關(guān)文章

編輯

專注AI醫(yī)療的新勢力和投融資丨微信ID:Daniel-six
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說