0
據(jù)雷鋒網(wǎng)消息,近日,來自莫斯科物理科技學(xué)院(MIPT),InSilico Medicine和 Mail.Ru集團(tuán)的研究人員首次將生成神經(jīng)網(wǎng)絡(luò)(generative neural network )應(yīng)用在研發(fā)擁有特定醫(yī)療屬性的藥物上。這種用生成對(duì)抗網(wǎng)絡(luò)(Generative Adversarial Networks ,GANs)發(fā)展、訓(xùn)練新的分子結(jié)構(gòu)的方法,能大幅度減少尋找有潛在藥物特性物質(zhì)的時(shí)間和其他成本。研究人員表示,將把該技術(shù)應(yīng)用在腫瘤、心血管疾病甚至抗感染等多個(gè)醫(yī)療領(lǐng)域。(雷鋒網(wǎng)此前曾在《硬創(chuàng)公開課》中和大家分享過有關(guān)GANs的原理、應(yīng)用和走向等內(nèi)容,詳情請(qǐng)點(diǎn)擊這里)
無機(jī)分子基( inorganic molecule base)包含數(shù)億種物質(zhì),但其中只有少數(shù)能被人類應(yīng)用在醫(yī)療領(lǐng)域。研究人員用藥理學(xué)方法研制藥物通常會(huì)基于前人的研究成果。例如,阿司匹林很早以前就已經(jīng)被用作藥物,但藥理學(xué)家以后還會(huì)基于當(dāng)下的成果繼續(xù)研究它,為該化合物增加其他成分以減少它的副作用、提高藥效。今年早些時(shí)候,來自 Insilico Medicine的科學(xué)家向公眾展示了用深層神經(jīng)網(wǎng)絡(luò)減少搜索藥物范圍的有效性。但如今他們正面臨著一個(gè)新的挑戰(zhàn):是否能用大量分子結(jié)構(gòu)去訓(xùn)練深層神經(jīng)網(wǎng)絡(luò),然后讓該網(wǎng)絡(luò)創(chuàng)造一種概念上的新型分子?
生成對(duì)抗自動(dòng)編碼器(Generative Adversarial Autoencoder ,AAE)結(jié)構(gòu)是GANs的延伸。研究人員把它作為基礎(chǔ),加上已知的醫(yī)療特性和有效濃度,將之用在訓(xùn)練神經(jīng)網(wǎng)絡(luò)上。研究人員會(huì)把和所需化合物相關(guān)的信息輸入到網(wǎng)絡(luò)中,網(wǎng)絡(luò)對(duì)其進(jìn)行調(diào)整后會(huì)輸出類似的數(shù)據(jù)。 網(wǎng)絡(luò)由三個(gè)部分構(gòu)成:編碼器,解碼器和鑒別器。其中每一個(gè)在與另兩個(gè)“協(xié)作”中都有自己特定的角色。 編碼器與解碼器一起壓縮、恢復(fù)母化合物的信息,而鑒別器則使壓縮后的信息更適于恢復(fù)。 當(dāng)網(wǎng)絡(luò)已經(jīng)學(xué)習(xí)過大量已知分子結(jié)構(gòu)后,編碼器和鑒別器則會(huì)結(jié)束工作狀態(tài),網(wǎng)絡(luò)就能用解碼器自動(dòng)生成對(duì)分子的描述。
開發(fā)基于文本輸入而生成高質(zhì)量圖像的生成式對(duì)抗網(wǎng)絡(luò),需要擁有豐富的專業(yè)知識(shí),并且要在高性能計(jì)算設(shè)備上進(jìn)行長時(shí)間的訓(xùn)練。 對(duì)于生成圖像和視頻而言,研究人員則可以快速判斷生成質(zhì)量如何。但在生物學(xué)中,質(zhì)量控制不僅不能通過“看”來解決,并且還需要大量的驗(yàn)證實(shí)驗(yàn)來產(chǎn)生大分子。
在系統(tǒng)中,所有分子均表示為“SMILEs”或化學(xué)物質(zhì)圖形注釋(雷鋒網(wǎng)注:graphical annotations of chemical substances,目的是它們的結(jié)構(gòu)能儲(chǔ)存在系統(tǒng)中)的形式呈現(xiàn)。學(xué)校里教授的標(biāo)準(zhǔn)注冊(cè)(standard registration)不適于網(wǎng)絡(luò)處理。SMILEs也是如此,因?yàn)樗鼈兊拈L度是隨機(jī)的。而神經(jīng)網(wǎng)絡(luò)訓(xùn)練需要一個(gè)相等的描述長度的向量。這時(shí)候,分子“指紋”便能解決這個(gè)任務(wù),因?yàn)樗P(guān)于分子的完整信息。
該技術(shù)的其中一個(gè)研究人員Andrei Kazennov,和在Insilico Medicine工作的MIPT研究生評(píng)論說:
“我們創(chuàng)造了一個(gè)生殖類型的神經(jīng)元網(wǎng)絡(luò),也就是說它能夠生成訓(xùn)練它類似的東西,最終教會(huì)該網(wǎng)絡(luò)模型根據(jù)指定的屬性創(chuàng)建新的分子“指紋”。
另外,也可以把抗癌藥物數(shù)據(jù)庫用于網(wǎng)絡(luò)檢查。 首先,網(wǎng)絡(luò)用其中一半的藥物化合物信息進(jìn)行訓(xùn)練,然后再檢查另一部分。目的是讓它預(yù)測(cè)已學(xué)習(xí)過,但在訓(xùn)練時(shí)未包含在內(nèi)的化合物。結(jié)果是網(wǎng)絡(luò)識(shí)別出了69種預(yù)估化合物。
Mail.Ru集團(tuán)搜索優(yōu)化團(tuán)隊(duì)首席程序員、Insilico醫(yī)學(xué)獨(dú)立科學(xué)顧問Artur Kadurin總結(jié)道。
“GANs是神經(jīng)科學(xué)領(lǐng)域相當(dāng)前沿的研究領(lǐng)域。很明顯,與生成圖像、音樂相比,它的應(yīng)用范圍更廣。我們已經(jīng)在生物信息學(xué)中嘗試了這種方法,并且獲得了巨大的成果。“
via:dddmag
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。