丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
人工智能 正文
發(fā)私信給江小片
發(fā)送

0

深度學(xué)習(xí)如何解決生物調(diào)試問題?

本文作者: 江小片 2016-10-17 16:57
導(dǎo)語:生物學(xué)現(xiàn)在面臨著調(diào)試的困難。生化系統(tǒng)(細(xì)胞)很復(fù)雜,深入研究它是十分有意義的。

【編者按】深度學(xué)習(xí)在近幾年實(shí)現(xiàn)了巨大的突破,而這一方法也被應(yīng)用到越來越多的領(lǐng)域,用于解決過去在這些領(lǐng)域難以解決的問題。可以預(yù)見,在未來的科研中“深度學(xué)習(xí)+學(xué)科應(yīng)用”將得到更廣闊的應(yīng)用,人工智能和深度學(xué)習(xí)方法也會(huì)變成我們生活和科研中水和電一樣隨處可見的東西。本文就是深度學(xué)習(xí)在生物科學(xué)領(lǐng)域應(yīng)用的一個(gè)例子,原文刊載于20n.com,雷鋒網(wǎng)特此編譯全文,供讀者參考。


生物學(xué)現(xiàn)在面臨著調(diào)試的困難。生化系統(tǒng)(細(xì)胞)很復(fù)雜,深入研究它是十分有意義的。觀察你所了解的化合物是很有難度的,想要看到未知的化學(xué)變化就更難了。調(diào)試問題的挑戰(zhàn),通俗地說就是已知的未知問題和未知的未知問題,正在艱難前行。假如能夠收集大量的多維的、密集的生物數(shù)據(jù),我們想知道深度學(xué)習(xí)能否幫助解決生物調(diào)試問題。

過去的兩年中,我們已經(jīng)設(shè)計(jì)了180多個(gè)酵母菌和病毒細(xì)胞來工業(yè)化生產(chǎn)相關(guān)化合物,例如,其中一個(gè)酵母菌是第一個(gè)能產(chǎn)生對(duì)乙酰氨基酚的細(xì)胞,我們最近也開始觀察人類疾病細(xì)胞。無論是對(duì)修飾后的微生物細(xì)胞還是人類疾病細(xì)胞,鑒定其與正常細(xì)胞的區(qū)別,是極有意義的,在這里,我們一般將正常細(xì)胞(也就是原株和健康細(xì)胞)稱作是對(duì)照細(xì)胞,把另一種細(xì)胞稱作變量(通過基因處理或者人類疾病修飾)。

現(xiàn)代技術(shù):科學(xué)家從現(xiàn)有的數(shù)百萬的化合物中挑選出一個(gè)或幾個(gè),檢查每一個(gè)化合物的變異細(xì)胞是否區(qū)別于對(duì)照細(xì)胞。他們通過分析儀器(比如LC-MS)來比較數(shù)據(jù)來源找到區(qū)別所在。標(biāo)準(zhǔn)的工作流程也有會(huì)極少的誤差,因?yàn)閮x器校正也會(huì)有誤差。LC-MS儀器的有限精確度和不同化合物信號(hào)之間的碰撞都使得這項(xiàng)工作變得復(fù)雜。

LC-MS分析聯(lián)合深度學(xué)習(xí):我們輸入原始LC-MS數(shù)據(jù)(沒有經(jīng)過個(gè)人推測(cè)分子的校正),通過深度學(xué)習(xí)模型來驗(yàn)證變量樣本中哪個(gè)分子是不一樣的。

舉個(gè)例子,我們最近構(gòu)建的能產(chǎn)生對(duì)乙酰氨基酚的酵母菌模型,敲掉幾個(gè)基因后預(yù)測(cè)新的基因插入,這是很新穎的通路搭建。我們用葡萄糖介質(zhì)培育變異株,同時(shí)培育原株酵母菌作為對(duì)照組。把這些菌種放在柱子中,會(huì)有200多個(gè)分子通過柱子。通過柱子出來的第五個(gè)分子的峰如下圖所示。(下圖左側(cè)是變異組,右側(cè)是對(duì)照組)

深度學(xué)習(xí)如何解決生物調(diào)試問題?

同時(shí),系統(tǒng)識(shí)別出達(dá)到峰值時(shí)的化學(xué)物質(zhì)分子式是C8H9NO2。這個(gè)分子式很明確是對(duì)乙酰氨基酚。它也識(shí)別出了下面幾個(gè)結(jié)構(gòu)式(最右邊的是對(duì)乙酰氨基酚),我們?cè)O(shè)計(jì)的這個(gè)通路分析識(shí)別出了這些備選結(jié)構(gòu)中最有可能的是對(duì)乙酰氨基酚。

深度學(xué)習(xí)如何解決生物調(diào)試問題?

這種分析的本質(zhì)是公正的,非靶向性的,這讓我們有信心解決調(diào)試設(shè)計(jì)細(xì)胞問題。它能夠突出變異細(xì)胞組和對(duì)照組之間的主要差別,并且準(zhǔn)確預(yù)測(cè)相應(yīng)的化合物。其他的主要識(shí)別峰可以觀察到副反應(yīng)變化,這些變化是不能通過靶向分析檢測(cè)到的,靶向分析就是只分析特定的產(chǎn)物。我們?nèi)ツ昃褪且恢痹谧鲞@種靶向分析,但是現(xiàn)在我們可以識(shí)別好多我們一直在丟失的數(shù)據(jù):所有的這些附加峰都是在細(xì)胞中加入幾個(gè)基因后的副反應(yīng)所產(chǎn)生的,當(dāng)接下來修飾細(xì)胞化學(xué)結(jié)構(gòu)的時(shí)候這些差異都是應(yīng)該考慮在內(nèi)的。

這種能分析細(xì)胞中每個(gè)變化的非靶向分析是解決生物調(diào)試問題的有力工具,深度學(xué)習(xí)也是解決該問題的關(guān)鍵點(diǎn)。

|通過深度學(xué)習(xí)的非靶向代謝組學(xué)

生物化學(xué)的調(diào)試通路包括以下幾步:

準(zhǔn)備樣品(變異組和對(duì)照組)

液相色譜質(zhì)譜聯(lián)用(LC-MS)

        每次LC-MS跟蹤要收集20億的數(shù)據(jù)點(diǎn),需要跑2000多次,所以我們要通過大量的工程細(xì)胞株存儲(chǔ)4萬 億的數(shù)據(jù)點(diǎn)。

深度學(xué)習(xí)

       識(shí)別變異組和對(duì)照組之間的差別。

SAT計(jì)算

       搜索化學(xué)式來定位相對(duì)應(yīng)變異中的差別的化學(xué)式。

酶的生物化學(xué)的網(wǎng)絡(luò)模型

      預(yù)測(cè)并且排列與細(xì)胞工程相關(guān)的生物化學(xué)中的變化相關(guān)的分子和生物學(xué)通路。

我們來集中看一下深度學(xué)習(xí)模塊。如果我們能從LC-MS中得到幾個(gè)重要參數(shù)(如碎片離子、保留時(shí)間和峰強(qiáng)度),我們就能繪制一個(gè)類似下圖(左側(cè))的3D圖,或者熱點(diǎn)圖(右側(cè))。每種圖像都能生成高分辨率的PDF圖像??s放熱點(diǎn)圖找到高強(qiáng)度的峰(紅色)有助于觀察數(shù)據(jù)的密度。

深度學(xué)習(xí)如何解決生物調(diào)試問題?

總體的視野能觀察到全部數(shù)據(jù),所以我們只看有大約50個(gè)數(shù)據(jù)點(diǎn)的小窗口,也就是全部數(shù)據(jù)的0.0000025%??聪旅孢@個(gè)局部3D圖窗,試著判斷一下它是否是“峰”。

深度學(xué)習(xí)如何解決生物調(diào)試問題?

深度學(xué)習(xí)如何解決生物調(diào)試問題?

你可能會(huì)正確地叫出每個(gè)峰的名稱。當(dāng)我們起初分析這些來源的時(shí)候,我們通過人為的視覺評(píng)估把這些峰分類為“完全是峰”、“不完全是峰”和“可能是峰”三類。

盡管人類可以很容易通過肉眼來分辨LC-MS的峰,但是開發(fā)一種穩(wěn)健的計(jì)算機(jī)方法來分類峰還是有困難的。我們使用深度學(xué)習(xí)來使空間減小到幾十張圖像那么大,這些圖像可以概括數(shù)千個(gè)LC-MS示蹤的結(jié)果。我們可以通過深度學(xué)習(xí)卓有成效地減小LC-MS數(shù)據(jù)的變量和復(fù)雜性,從而能通過示蹤歸納出常見的特征。

我們的第一次重復(fù)使用了簡(jiǎn)單的網(wǎng)絡(luò),并且取得了小小的成功,但是如果使用更深層的、多層的網(wǎng)絡(luò)可能會(huì)更好地學(xué)習(xí)到LC-MS示蹤的細(xì)微差別。正由于這一點(diǎn),我們成功地在一次示蹤中鑒別出好多峰,同時(shí)不包括許多人類一般會(huì)忽略的像峰似的特點(diǎn)。下圖中,左側(cè)是一組通過網(wǎng)絡(luò)學(xué)習(xí)得到的峰(很容易看到主峰),右側(cè)是識(shí)別出的噪聲峰的特征。

深度學(xué)習(xí)如何解決生物調(diào)試問題?

證明了我們能識(shí)別個(gè)別峰之后,我們又致力于歸納出這種方法來做大規(guī)模的不同分析。這種方法能讓科學(xué)家提供一個(gè)實(shí)驗(yàn)的對(duì)照組,并且能在任何情況下都能檢測(cè)分子。

從樣本到遺傳變異

深度學(xué)習(xí)能夠準(zhǔn)確識(shí)別差異,通過建立深度學(xué)習(xí)能把我們的分析拓展到相比細(xì)胞系的基因變化上。整個(gè)柱子匯集了深度學(xué)習(xí)分析的成分和其他成分。一個(gè)專門的生化計(jì)算軟件SAT能夠解析化學(xué)式。能夠理解酶機(jī)制、底物特性和細(xì)胞鏈接的網(wǎng)絡(luò)分析師可以推出分子結(jié)構(gòu)。生物信息學(xué)模塊完成了解釋示蹤結(jié)果中基因變化的最后一步。

深度學(xué)習(xí)如何解決生物調(diào)試問題?

展望:深度學(xué)習(xí)解決生物調(diào)試問題

合成生物學(xué):通過準(zhǔn)確地知道人為修飾或其他修飾的各種影響,生物制品的微生物工程的進(jìn)展急速加快。這些細(xì)胞在可控的環(huán)境下進(jìn)行培養(yǎng),大多數(shù)的新陳代謝都是可以完全調(diào)整的,所以簡(jiǎn)單的深度學(xué)習(xí)模塊有望促進(jìn)生物學(xué)的發(fā)展。

人類診斷:在疾病細(xì)胞和正常細(xì)胞中,人類細(xì)胞是有許多細(xì)微變化的。我們正在嘗試更復(fù)雜的深度學(xué)習(xí)網(wǎng)絡(luò)能夠解決疾病細(xì)胞的非靶向診斷問題。這一點(diǎn)很值得期待。

深度學(xué)習(xí)預(yù)測(cè)化合物特點(diǎn):需要練習(xí)深度網(wǎng)絡(luò)的數(shù)據(jù)量可以從LC-MS中獲得。其他生化數(shù)據(jù)在細(xì)節(jié)上是極度豐富的,但是在數(shù)量上可能沒那么大量?;瘜W(xué)結(jié)構(gòu)預(yù)測(cè)是本質(zhì),這些情況需要我們?cè)谟?xùn)練中有所創(chuàng)造。我們已經(jīng)開展項(xiàng)目來研究更復(fù)雜的模型和訓(xùn)練模式。如果感興趣請(qǐng)發(fā)郵件到info@20n.com來聯(lián)系我們吧。

 

via 20n.com

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

深度學(xué)習(xí)如何解決生物調(diào)試問題?

分享:
相關(guān)文章

專欄作者

永遠(yuǎn)年輕,永遠(yuǎn)熱淚盈眶 。
當(dāng)月熱門文章
最新文章
請(qǐng)?zhí)顚懮暾?qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說