丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
人工智能 正文
發(fā)私信給這只萌萌
發(fā)送

0

谷歌研究院在化學發(fā)力:應用機器學習技術預測分子性質(zhì)

本文作者: 這只萌萌 2017-04-18 10:36
導語:谷歌研究院發(fā)表的兩篇論文,推進了機器學習在化學領域的研究發(fā)展。

最近,機器學習在化學領域的應用有很大進展,特別是化學搜索問題,從藥物篩選、電池設計到OLEDs設計,催化劑的發(fā)現(xiàn)。 歷史上化學家使用薛定諤方程做數(shù)值近似來解決化學檢索問題,如使用密度泛函理論(DFT),然而近似值的計算成本限制了搜索的規(guī)模。 

為了能夠擴大搜索能力,雷鋒網(wǎng)了解到已有幾個研究小組使用DFT生成的訓練數(shù)據(jù),創(chuàng)建ML模型來預測化學性質(zhì),例如Matthias Rupp等用機器學習模型來預測各種有機分子的原子化能,J?rg Behler 和 Michele Parrinello引入DFT勢能面的一種新的神經(jīng)網(wǎng)絡表征。在這些工作的基礎之上,谷歌研究院在QM9基準數(shù)據(jù)集(配有DFT計算的電子,熱力學和振動性質(zhì)的分子集合)上應用了各種機器學習方法。

雷鋒網(wǎng)消息,谷歌研究院發(fā)布了兩篇論文,介紹了他們在這一領域的研究,研究工作由Google Brain團隊,Google Accelerated Science團隊,DeepMind和巴塞爾大學合作完成。 第一篇論文《Fast machine learning models of electronic and energetic properties consistently reach approximation errors better than DFT accuracy》調(diào)查了回歸分子和分子表征的選擇對快速機器學習模型的影響,模型用于構建有機分子的十三個基態(tài)電子性質(zhì),每個回歸/表征/性質(zhì)組合的性能通過學習曲線評估,該曲線描繪近似誤差,以此作為訓練集大小的函數(shù)。論文在QM9基準數(shù)據(jù)集上測試了多種機器學習方法,并集中改進最有希望的深層神經(jīng)網(wǎng)絡模型。

第二篇論文《Neural Message Passing for Quantum Chemistry》描述了一種稱為消息傳遞神經(jīng)網(wǎng)絡(MPNN)的模型族,將其抽象地定義為包含很多對圖形對稱性具有不變性的神經(jīng)網(wǎng)絡模型。研究團隊在MPNN模型族中開發(fā)了新變體,性能明顯優(yōu)于QM9基準測試的所有基準測試方法,另外某些目標的性能改進了近四倍。

從機器學習的角度來看,分子數(shù)據(jù)之所以有趣,原因之一是一個分子的自然表征以原子作為邊界的結點和鍵。能夠利用數(shù)據(jù)中固有對稱性的模型更容易泛化,這很容易理解,卷積神經(jīng)網(wǎng)絡在圖像識別上之所以成功,一部分原因是模型能夠記住圖像數(shù)據(jù)中的一些不變性知識,比如把一種圖片中的狗挪到圖片左邊還是一張狗的照片)。 圖形對稱性這一固有特征是機器學習處理圖像數(shù)據(jù)非常理想的性質(zhì),在這領域也有許多有趣的研究,例如Yujia Li等研究了結構化圖片的特征學習技巧,David Duvenaud等應用圖像神經(jīng)網(wǎng)絡學習分子指紋信息,Steven Kearnes等提出一種機器學習模型用于無向圖的學習。盡管這一領域已有所進展,谷歌研究院希望找到化學(和其他)應用模型的最佳版本,并找出文獻中提到的不同模型之間的聯(lián)系。

谷歌研究院提出的MPNN模型提高了QM9數(shù)據(jù)集任務(預測所有13種化學性質(zhì))的最好性能,在這個特定的數(shù)據(jù)集上,他們的模型可以準確地預測13種性質(zhì)中的11個,這樣的預測性能已經(jīng)足夠準確,能對化學家未來的應用有幫助。另外,此模型比使用DFT模擬要快30萬倍。但是在MPNN模型走向實際應用之前還有很多工作要做。實際上,MPNN模型必須應用于比QM9數(shù)據(jù)更多樣化的分子集合(例如數(shù)目更大,變化更大的重原子集合)。當然,即使有了更真實的數(shù)據(jù)集,模型的泛化性能還是很差??朔陨蟽蓚€挑戰(zhàn)需要解決機器學習研究的核心問題,例如泛化。

預測分子性質(zhì)是一個非常重要的問題,它既是先進的機器學習技術的應用場景,也為機器學習帶來了非常有趣的基礎研究課題。最后,分子性質(zhì)的預測有助于造福人類的新藥物和材料的設計。谷歌科學家們認為傳播研究成果,幫助其他研究者學習機器學習應用都是及其重要的。

封面圖片來自Chemistry Explained,雷鋒網(wǎng)編譯

雷峰網(wǎng)版權文章,未經(jīng)授權禁止轉載。詳情見轉載須知。

谷歌研究院在化學發(fā)力:應用機器學習技術預測分子性質(zhì)

分享:
相關文章
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設置密碼以方便用郵箱登錄
立即設置 以后再說