0
據(jù)雷鋒網(wǎng)消息,近日,來自莫斯科物理科技學院(MIPT),InSilico Medicine和 Mail.Ru集團的研究人員首次將生成神經(jīng)網(wǎng)絡(generative neural network )應用在研發(fā)擁有特定醫(yī)療屬性的藥物上。這種用生成對抗網(wǎng)絡(Generative Adversarial Networks ,GANs)發(fā)展、訓練新的分子結構的方法,能大幅度減少尋找有潛在藥物特性物質的時間和其他成本。研究人員表示,將把該技術應用在腫瘤、心血管疾病甚至抗感染等多個醫(yī)療領域。(雷鋒網(wǎng)此前曾在《硬創(chuàng)公開課》中和大家分享過有關GANs的原理、應用和走向等內(nèi)容,詳情請點擊這里)
無機分子基( inorganic molecule base)包含數(shù)億種物質,但其中只有少數(shù)能被人類應用在醫(yī)療領域。研究人員用藥理學方法研制藥物通常會基于前人的研究成果。例如,阿司匹林很早以前就已經(jīng)被用作藥物,但藥理學家以后還會基于當下的成果繼續(xù)研究它,為該化合物增加其他成分以減少它的副作用、提高藥效。今年早些時候,來自 Insilico Medicine的科學家向公眾展示了用深層神經(jīng)網(wǎng)絡減少搜索藥物范圍的有效性。但如今他們正面臨著一個新的挑戰(zhàn):是否能用大量分子結構去訓練深層神經(jīng)網(wǎng)絡,然后讓該網(wǎng)絡創(chuàng)造一種概念上的新型分子?
生成對抗自動編碼器(Generative Adversarial Autoencoder ,AAE)結構是GANs的延伸。研究人員把它作為基礎,加上已知的醫(yī)療特性和有效濃度,將之用在訓練神經(jīng)網(wǎng)絡上。研究人員會把和所需化合物相關的信息輸入到網(wǎng)絡中,網(wǎng)絡對其進行調整后會輸出類似的數(shù)據(jù)。 網(wǎng)絡由三個部分構成:編碼器,解碼器和鑒別器。其中每一個在與另兩個“協(xié)作”中都有自己特定的角色。 編碼器與解碼器一起壓縮、恢復母化合物的信息,而鑒別器則使壓縮后的信息更適于恢復。 當網(wǎng)絡已經(jīng)學習過大量已知分子結構后,編碼器和鑒別器則會結束工作狀態(tài),網(wǎng)絡就能用解碼器自動生成對分子的描述。
開發(fā)基于文本輸入而生成高質量圖像的生成式對抗網(wǎng)絡,需要擁有豐富的專業(yè)知識,并且要在高性能計算設備上進行長時間的訓練。 對于生成圖像和視頻而言,研究人員則可以快速判斷生成質量如何。但在生物學中,質量控制不僅不能通過“看”來解決,并且還需要大量的驗證實驗來產(chǎn)生大分子。
在系統(tǒng)中,所有分子均表示為“SMILEs”或化學物質圖形注釋(雷鋒網(wǎng)注:graphical annotations of chemical substances,目的是它們的結構能儲存在系統(tǒng)中)的形式呈現(xiàn)。學校里教授的標準注冊(standard registration)不適于網(wǎng)絡處理。SMILEs也是如此,因為它們的長度是隨機的。而神經(jīng)網(wǎng)絡訓練需要一個相等的描述長度的向量。這時候,分子“指紋”便能解決這個任務,因為它包含關于分子的完整信息。
該技術的其中一個研究人員Andrei Kazennov,和在Insilico Medicine工作的MIPT研究生評論說:
“我們創(chuàng)造了一個生殖類型的神經(jīng)元網(wǎng)絡,也就是說它能夠生成訓練它類似的東西,最終教會該網(wǎng)絡模型根據(jù)指定的屬性創(chuàng)建新的分子“指紋”。
另外,也可以把抗癌藥物數(shù)據(jù)庫用于網(wǎng)絡檢查。 首先,網(wǎng)絡用其中一半的藥物化合物信息進行訓練,然后再檢查另一部分。目的是讓它預測已學習過,但在訓練時未包含在內(nèi)的化合物。結果是網(wǎng)絡識別出了69種預估化合物。
Mail.Ru集團搜索優(yōu)化團隊首席程序員、Insilico醫(yī)學獨立科學顧問Artur Kadurin總結道。
“GANs是神經(jīng)科學領域相當前沿的研究領域。很明顯,與生成圖像、音樂相比,它的應用范圍更廣。我們已經(jīng)在生物信息學中嘗試了這種方法,并且獲得了巨大的成果。“
via:dddmag
雷峰網(wǎng)版權文章,未經(jīng)授權禁止轉載。詳情見轉載須知。