丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
人工智能學(xué)術(shù) 正文
發(fā)私信給我在思考中
發(fā)送

0

DeepMind用深度強化學(xué)習(xí)研究“人造太陽”!據(jù)說這是秘密進行了3年的工作

本文作者: 我在思考中 2022-02-18 10:21
導(dǎo)語:“AI+物理”成功破圈,DeepMind 怕是要上天。
DeepMind用深度強化學(xué)習(xí)研究“人造太陽”!據(jù)說這是秘密進行了3年的工作
“AI+物理”成功破圈,DeepMind 怕是要上天。

作者 | 王曄

編輯 | 陳彩嫻

北京時間凌晨四點,DeepMind在官方推特上發(fā)布消息,稱其與瑞士洛桑聯(lián)邦理工學(xué)院(EPFL)合作研究出第一個可以在托卡馬克(Tokamak)裝置內(nèi)保持核聚變等離子體穩(wěn)定的深度強化學(xué)習(xí)系統(tǒng),為推進核聚變研究開辟了新途徑,工作已發(fā)表在Nature!

消息一出,立刻引起圍觀,收獲一千多點贊、數(shù)百轉(zhuǎn)發(fā):

DeepMind用深度強化學(xué)習(xí)研究“人造太陽”!據(jù)說這是秘密進行了3年的工作

據(jù)該工作的其中一位成員@317070披露,該工作已經(jīng)秘密進行了三年,并興沖沖地表示:“它真的成功了!深度強化學(xué)習(xí)真的很擅長搞定這些人類迫切想實現(xiàn)的科幻想法?!?/span>

DeepMind用深度強化學(xué)習(xí)研究“人造太陽”!據(jù)說這是秘密進行了3年的工作

我們都知道,DeepMind是全球最早將人工智能應(yīng)用于科學(xué)研究(即“AI for Science”)的研究機構(gòu)之一,在過去的幾年也取得了許多令人矚目的成就,成功地在生物、化學(xué)、數(shù)學(xué)與物理模擬等等領(lǐng)域扎下了AI的影子,并吸引一大批學(xué)者投身“AI for Science”方向的研究工作。

此前,在DeepMind兼職擔(dān)任高級研究科學(xué)家的華人學(xué)者王夢迪便曾對AI科技評論談到,DeepMind有強大的信心將人工智能用于推動人類文明的進步,這種自信也感染了許多年輕的科學(xué)家:

DeepMind的價值觀就是要推動人類文明的進步。我感覺研究人工智能的學(xué)者都非常自信,覺得自己有能力解決世界上最難的問題。這種自信非常棒,會給予自己主觀能動性,也會感染其他學(xué)者,幫助不同學(xué)科的人更快、更好地聯(lián)合在一起,去解決原先以為難于登天的問題。

而近日DeepMind在難度更高的核物理發(fā)布突破成果,無疑更加證明、鞏固了其在“AI for Science”方向的領(lǐng)頭羊地位!

更有意思的是,AI科技評論編輯組還發(fā)現(xiàn),早在五年前(2017年),就有中國網(wǎng)友在知乎上提出將深度強化學(xué)習(xí)系統(tǒng)用于學(xué)習(xí)可控核聚變裝置建造技術(shù)的設(shè)想。莫非 DeepMind 的科研是跟著知乎走的……(手動狗頭)

DeepMind用深度強化學(xué)習(xí)研究“人造太陽”!據(jù)說這是秘密進行了3年的工作

言歸正傳,我們來看看DeepMind這次又搞出了什么花樣!



1

什么是托卡馬克裝置?

首先,為了更好地了解DeepMind此次的突破,以及“AI+核聚變”的奧妙,我們需要知道:什么是托卡馬克(Tokamak)裝置?

此前,知乎上還有一個關(guān)于托卡馬克的討論:“劉慈欣在《三體》中為什么不待見托卡馬克裝置?(托卡馬克裝置有什么弊端)”:

DeepMind用深度強化學(xué)習(xí)研究“人造太陽”!據(jù)說這是秘密進行了3年的工作

鏈接:https://www.zhihu.com/question/31056640/answer/56816872

當時就有網(wǎng)友@Shigen Chin回答:

首先,超導(dǎo)托卡馬克的材料成本相對較高,相比之下激光核聚變只是設(shè)備一次性投資高,而超導(dǎo)托卡馬克對于裝備本身損耗比較嚴重,對于后續(xù)投入是不利因素(尤其是三體成為現(xiàn)實威脅 亟需技術(shù)突破的情況下)。

其次,理論瓶頸,智子已經(jīng)為物理理論研究建立壁壘,而超導(dǎo)托卡馬克作為一種相對而言在可控核聚變研究中出現(xiàn)較早的思路,一直到現(xiàn)在沒有大進展,很大程度上也是受理論研究所累,在沒有取得理論突破的情況下,托卡馬克裝置投入實用的可能性不大

再次,托卡馬克本身的小型化十分困難,因為托卡馬克的實用功率和約束時間和裝備體積正相關(guān),超低溫制冷,磁約束需要較為龐大的設(shè)備,而實現(xiàn)設(shè)備小型化也需要材料等基礎(chǔ)科學(xué)的進步,這些方面的進步又依賴于物理理論的進步(比如建立于原子尺度研究和量子力學(xué)基礎(chǔ)上的電子計算機的發(fā)明和量子計算機概念的提出 帶動了對于晶體管和光量子材料的工藝研究)。

可能是基于以上的原因,大劉認為托卡馬克不適于承擔(dān)帶領(lǐng)人類走入聚變時代的重任(笑)。

言歸正傳:

托卡馬克,又稱“環(huán)磁機”,俄語原文“Токамак”,是一種利用磁約束來實現(xiàn)磁約束聚變的環(huán)形容器,最早由位于蘇聯(lián)莫斯科庫爾恰托夫研究所(NRC KI)的物理學(xué)家伊戈爾·塔姆、安德烈·薩哈羅夫和列夫·阿齊莫維齊等人在1950年代發(fā)明。

根據(jù)百度百科的描述,托卡馬克的中央是一個環(huán)形的真空室,外面纏繞著線圈(如下面動圖)。通電時,托卡馬克的內(nèi)部會產(chǎn)生巨大的螺旋型磁場,將其中的等離子體加熱到很高的溫度,以達到核聚變的目的:

DeepMind用深度強化學(xué)習(xí)研究“人造太陽”!據(jù)說這是秘密進行了3年的工作
圖注:托卡馬卡裝置
維基百科介紹,托卡馬克是當前用于生產(chǎn)受控?zé)岷撕司圩兡苤醒芯孔钌钊氲拇偶s束裝置類型。磁場被用于約束是因為等離子體冷卻會使反應(yīng)停止,而超導(dǎo)托卡馬克可長時間約束等離子體。世界上第一個超導(dǎo)托卡馬克為俄制的T-7(托卡馬克7號):
DeepMind用深度強化學(xué)習(xí)研究“人造太陽”!據(jù)說這是秘密進行了3年的工作
聽起來是不是很玄乎?
一個更直白的例子是,2019年,新聞上報道中國耗資千億的“人造太陽”,就是可控托卡馬克裝置:

DeepMind用深度強化學(xué)習(xí)研究“人造太陽”!據(jù)說這是秘密進行了3年的工作

圖注:中國“人造太陽”
由此可見,可控托卡馬克裝置的研發(fā)費用極高、實現(xiàn)難度也極高。以中國進行的實驗為例,實驗中核燃料的最高溫度達到了1.3億℃,壓力高達100個大氣壓,整個宇宙中沒有任何一種物質(zhì)可以承受如此惡劣的條件。
那么,為什么我們要造一個這樣的裝置呢?原因也很簡單:只有發(fā)展可控的核聚變技術(shù),才有望解決當前人類社會面臨著的嚴峻能源危機和環(huán)保壓力。



2

AI+可控核聚變的前世

事實上,早在AlphaGo擊敗人類世界的圍棋冠軍李世石后,就有網(wǎng)友在知乎上提問:據(jù)說AlphaGo是從零開始自學(xué),運用了深度神經(jīng)網(wǎng)絡(luò)與蒙特卡洛樹狀搜索相結(jié)合的技術(shù),那么是否能讓AlphaGo從零開始學(xué)習(xí)可控核聚變裝置建造技術(shù)呢?
DeepMind用深度強化學(xué)習(xí)研究“人造太陽”!據(jù)說這是秘密進行了3年的工作
鏈接:https://www.zhihu.com/question/41295369/answer/142572075
底下有網(wǎng)友@劉亞問回答,高溫等離子體高自由能與約束的問題是托卡馬克技術(shù)的主要難點,深度學(xué)習(xí)網(wǎng)絡(luò)可能有助于解決這些問題,但難點在于:
  • 托卡馬克裝置在目前的約束技術(shù)條件下,難以小型化
  • 裝置造價,以及氘消耗、等離子體加溫等其它方面運行的成本,使實驗裝置的數(shù)量、運行次數(shù)均受限,難以支持盲目的反復(fù)運行
  • 實驗涉及高溫等離子體,目前約束技術(shù)條件下重復(fù)反復(fù)運行有安全性問題
  • 缺乏獲取大樣本的條件
綜上所述,深度學(xué)習(xí)技術(shù)不一定適合解決托卡馬克可控核聚變裝置。相比托卡馬克,另一類核聚變裝置——反場箍縮裝置(Reversedfieldpinch,RFP)更適合用深度學(xué)習(xí)進行研究,因為:“其內(nèi)外兩套磁場方向相反的磁體合成的特殊磁場,可以穩(wěn)定等離子體的邊緣,體積相對小、運行成本相對低、安全性相對高。”
DeepMind用深度強化學(xué)習(xí)研究“人造太陽”!據(jù)說這是秘密進行了3年的工作
他還分享了資料,稱機器學(xué)習(xí)的研究者從上世紀90年代末就開始將機器學(xué)習(xí)方法用于反場箍縮研究穩(wěn)定等離子體的邊緣的反饋控制:
  • Barana O, Manduchi G, Serri A, et al. A neural network approach for the detection of the locking position in RFX[C]// Fusion Engineering, 1999. Symposium on. IEEE, 1999:575-578.
  • Olofsson K E J. Nonaxisymmetric experimental modal analysis and control of resistive wall MHD in RFPs : System identification and feedback control for the reversed-field pinch[J]. Fusion Plasma Physics, 2012.
除了以上研究,從2014年起,谷歌就和核聚變公司TAETechnology進行合作,將機器學(xué)習(xí)應(yīng)用于不同類型的聚變反應(yīng)堆,以加速試驗數(shù)據(jù)的分析;此外英國中部歐洲環(huán)面JET聯(lián)合設(shè)施也在利用人工智能來預(yù)測等離子體的行為。
隨著核聚變反應(yīng)堆規(guī)模的增大,托卡馬克設(shè)備越來越復(fù)雜,對于可靠性和準確性控制的要求也在不斷提高,人工智能在其中將起到越來越關(guān)鍵的作用。



3

DeepMind如何做?

2月16日,DeepMind與EPFL合作研究的深度強化學(xué)習(xí)系統(tǒng)助力可控核聚變的工作在Nature上發(fā)布:
DeepMind用深度強化學(xué)習(xí)研究“人造太陽”!據(jù)說這是秘密進行了3年的工作
鏈接:https://www.nature.com/articles/s41586-021-04301-9
那么,他們是如何用深度強化學(xué)習(xí)實現(xiàn)在托卡馬克裝置內(nèi)保持核聚變等離子體穩(wěn)定的呢?
托卡馬克裝置研究的一個主要方向是將等離子體的分布構(gòu)建成不同配置的效果,以優(yōu)化穩(wěn)定性、封閉性和能量排放,并為第一個燃燒等離子體實驗ITER提供通知。
而要在托卡馬克內(nèi)限制每個配置,需要設(shè)計一個反饋控制器,通過精確控制幾個與等離子體磁耦合的線圈來操縱磁場,以達到理想的等離子體電流、位置和形狀。這個問題也就是著名的“托卡馬克磁控制問題”。
在傳統(tǒng)方法中,要解決這個時變的、非線性的、多變量的控制問題,首先要解決一個反問題,即:預(yù)先計算一組前饋線圈電流和電壓,然后設(shè)計一組獨立的、單輸入、單輸出的PID控制器,使等離子體保持垂直位置,并控制徑向位置和等離子體電流,所有這些控制器在設(shè)計時也要注意不能相互干擾。
大多數(shù)控制結(jié)構(gòu)都會增加對等離子體形狀的外部控制回路,這就需要對等離子體平衡進行實時估計,以調(diào)制前饋線圈電流??刂破鞯脑O(shè)計建立在線性化模型動力學(xué)的基礎(chǔ)之上,需要進行增益調(diào)度以跟蹤時間變化的控制目標。盡管這些控制器在大多數(shù)情況下表現(xiàn)不錯,但每當目標等離子體配置發(fā)生變化,就需要花費大量的工程努力、設(shè)計努力和專業(yè)知識,同時還要進行復(fù)雜的平衡估計實時計算。
這時,深度強化學(xué)習(xí)就派上了用場:
強化學(xué)習(xí)可以作為一種全新的方法,用來設(shè)計非線性反饋控制器,可以直觀地設(shè)置性能目標,將重點轉(zhuǎn)移到“應(yīng)該實現(xiàn)什么”,而不是“如何實現(xiàn)”。此外,強化學(xué)習(xí)技術(shù)極大簡化了控制系統(tǒng),計算成本低的控制器取代了嵌套的控制結(jié)構(gòu),而內(nèi)部化的狀態(tài)重建消除了對獨立平衡重建的要求。
一句話:這些優(yōu)勢可減少控制器的開發(fā)周期,加速對替代性等離子體配置的研究。
在這個工作中,他們提出了一個由強化學(xué)習(xí)設(shè)計的磁性控制器,可以自主學(xué)習(xí)指揮全套的控制線圈,既可以實現(xiàn)高水平控制,也能滿足物理和操作的約束條件,在生產(chǎn)等離子體配置時大大減少了設(shè)計的工作量。

DeepMind用深度強化學(xué)習(xí)研究“人造太陽”!據(jù)說這是秘密進行了3年的工作

圖注:DeepMind的架構(gòu)為設(shè)計托卡馬克磁約束控制器提供了一種變通方法。該方法主要有三個步驟:1)設(shè)計者為實驗指定控制目標,該目標可能伴隨著時間而變化;2)深度強化學(xué)習(xí)算法與托卡馬克模擬器互動,找到一個滿足指定目標的近乎最優(yōu)的控制策略;3)神經(jīng)網(wǎng)絡(luò)形式的控制策略(零樣本)直接在托卡馬克硬件上運行。
經(jīng)過三年的研發(fā)實驗,他們在托卡馬克 à 的配置變量(TCV)上成功生成并控制了一系列不同的等離子體配置,有形狀傳統(tǒng)、細長的,也有先進的,如負三角形和 “雪花”配置,深度強化學(xué)習(xí)系統(tǒng)可以對這些配置的位置、電流和形狀進行精確地跟蹤。
DeepMind用深度強化學(xué)習(xí)研究“人造太陽”!據(jù)說這是秘密進行了3年的工作
圖注:通過深度強化學(xué)習(xí),托卡馬克裝置中的等離子體電流、垂直穩(wěn)定性、位置和形狀控制情況
此外,他們還介紹了TCV上的可持續(xù)“雨滴” (droplets’),其中兩個獨立的等離子體可同時保持在容器:
DeepMind用深度強化學(xué)習(xí)研究“人造太陽”!據(jù)說這是秘密進行了3年的工作
圖注:在 200 毫秒控制窗口中持續(xù)控制 TCV 上的兩個獨立“雨滴”



4

寫在最后
目前為止,在可控核聚變上取得的最好成績來自歐洲聯(lián)合環(huán)狀反應(yīng)堆(JET),今年的2月9日,JET中的聚變反應(yīng)在5秒內(nèi)以中子的形式釋放出總共59兆焦耳的能量——這個數(shù)值并不高,大概只能燒開幾十壺開水而已。
人類早已實現(xiàn)了輸出能量小于輸入能量的可控核聚變,以JET創(chuàng)下的世界紀錄為例,其Q值(聚變能增益系數(shù),輸出能量與輸入能量之比)約為0.33左右。要實現(xiàn)真正可用的核聚變清潔能源,需要通過新的范式的研究,不斷提高核聚變的Q值。
DeepMind 團隊堅信:他們的深度強化學(xué)習(xí)系統(tǒng)為托卡馬克裝置中的等離子體磁約束提供了一個新的范式。
更重要的是,他們的控制設(shè)計表明了基于機器學(xué)習(xí)的控制方法的優(yōu)勢。
要實現(xiàn)AI+核聚變,需要科學(xué)與工程的雙管齊下,硬件與算法缺一不可。他們相信,深度強化學(xué)習(xí)框架有可能塑造未來的核聚變研究與托卡馬克裝置的研究發(fā)展。
大家怎么看?
參考鏈接:
1.https://www.zhihu.com/question/31056640/answer/56816872
2.https://scitechdaily.com/science-made-simple-what-is-a-tokamak/
3.https://www.zhihu.com/question/41295369/answer/142572075

DeepMind用深度強化學(xué)習(xí)研究“人造太陽”!據(jù)說這是秘密進行了3年的工作

雷峰網(wǎng)(公眾號:雷峰網(wǎng))

雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

DeepMind用深度強化學(xué)習(xí)研究“人造太陽”!據(jù)說這是秘密進行了3年的工作

分享:
相關(guān)文章
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說