0
本文作者: 我在思考中 | 2022-02-08 15:25 |
編輯 | 青暮
人工智能的下一個(gè)目標(biāo)是從模仿認(rèn)知學(xué)習(xí),轉(zhuǎn)向解決一直存在的大規(guī)??茖W(xué)計(jì)算問題,UC伯克利教授Michael Jordan曾經(jīng)強(qiáng)調(diào)。而李國杰院士也曾在與雷峰網(wǎng)的交流中進(jìn)一步指出,人工智能應(yīng)該突破約翰·麥肯錫和艾倫·圖靈定下來的框框,去研究NP-hard級別的大難題,讓基礎(chǔ)科研走向大工程化。也就是說,要用數(shù)據(jù)、算力和算法合力去尋找這類難題的具體解,并落地應(yīng)用,而不僅僅追求理論邊界的證明。
這些具有組合爆炸性特點(diǎn)的難題很早就已存在,并且有非常顯式的定義,但依然由于計(jì)算難題被卡住。而人工智能特別是深度學(xué)習(xí)在層級特征建模、壓縮表征等方面的優(yōu)勢,為解決這類問題帶來了新的曙光。AlphaFold是其中的絕佳范例,再往上一層看,在整個(gè)AI for Science領(lǐng)域中,比如物理、化學(xué)、生物等都存在大量的未解決NP-hard問題,其中就包括了物理學(xué)中的量子多體問題。
比如,確定量子混合態(tài)是否存在糾纏就是一個(gè)NP-hard問題。k-Local Hamiltonian 問題(k-LH)至少是NP-hard問題。它們都涉及量子多體系統(tǒng)。
k-LH問題是指:給定k,在n個(gè)量子比特的系統(tǒng)中,存在一組約束,每個(gè)約束最多涉及k個(gè)量子比特,希望確定系統(tǒng)的基態(tài)能量是高于某個(gè)閾值或低于某個(gè)閾值。它屬于一種量子多體問題,并且k不小于2時(shí),至少是NP-hard的。當(dāng)k=3或以上時(shí),甚至出現(xiàn)了更高階的復(fù)雜性類——QMA完全。
QMA類似于經(jīng)典復(fù)雜性類中的NP,也就是說,如果一個(gè)問題的答案可以在量子計(jì)算機(jī)上以多項(xiàng)式時(shí)間驗(yàn)證(并且至少有2/3的概率是正確的),但無法以多項(xiàng)式時(shí)間給出答案,則該問題的復(fù)雜性類為QMA。同樣,QMA完全也類似于NP完全。
多年以來,量子多體物理領(lǐng)域是凝聚態(tài)物理中最核心和最優(yōu)挑戰(zhàn)性的話題之一。比如物理世界中我們能夠觀測到的一些奇特物理現(xiàn)象和物質(zhì)中,最具代表性的便是超導(dǎo)、超固量子Hall效應(yīng)、超流、玻色-愛因斯坦凝聚和量子自旋液體等,都是基于大量粒子相互作用的量子現(xiàn)象。
著名的物理學(xué)家Phlips Anderson曾說,“More is Different”,這是指我們的世界并非各個(gè)物質(zhì)的簡單疊加,當(dāng)系統(tǒng)中的粒子數(shù)以及元素種類增多的時(shí)候,會導(dǎo)致1+1>2的效果。從理論上來說就是量子多體之間的相互作用所致的結(jié)果。
由于希爾伯特空間隨著粒子數(shù)增加而指數(shù)增長(組合爆炸),量子多體問題的高精度模擬是對于經(jīng)典計(jì)算機(jī)極富挑戰(zhàn)性的問題。近幾年發(fā)展起來的深度學(xué)習(xí)算法為模擬量子多體提供了新的有效的計(jì)算工具。
2021年12月16日,中國科技大學(xué)物理系教授何力新在CNCC 2021“人工智能在超大規(guī)??茖W(xué)計(jì)算領(lǐng)域的應(yīng)用探索”專題論壇上做了題為《深度學(xué)習(xí)算法在新一代神威超算平臺的應(yīng)用:量子多體問題模擬》的學(xué)術(shù)報(bào)告,分享了深度學(xué)習(xí)算法在量子多體模擬問題上的研究工作和領(lǐng)域進(jìn)展。
在報(bào)告中,何力新表示,他們團(tuán)隊(duì)設(shè)計(jì)了基于卷積神經(jīng)網(wǎng)絡(luò)的新算法,對強(qiáng)阻挫的強(qiáng)關(guān)聯(lián)自旋系統(tǒng)實(shí)現(xiàn)了高精度的基態(tài)模擬。他們還在新一代神威超級計(jì)算機(jī)上移植并優(yōu)化了該算法,并計(jì)算了著名的方格J1-J2模型,將計(jì)算的系統(tǒng)規(guī)模及計(jì)算精度提高到了新的高度。在移植、優(yōu)化程序的過程中,通過物理學(xué)-并行優(yōu)化-超算系統(tǒng)三方面交叉團(tuán)隊(duì),成功在新一代神威超算上實(shí)現(xiàn)高性能的量子多體問題模擬,為構(gòu)建國產(chǎn)AI-HPC生態(tài)提供一個(gè)優(yōu)秀的模板示例。
何力新教授是中國科技大學(xué)物理系教授,1997年畢業(yè)于中國科技大學(xué),2003年在美國羅格斯大學(xué)攻讀博士,2003~2006年在美國國家再生能源實(shí)驗(yàn)室從事量子點(diǎn)的理論研究工作,并于2006年回國到中科大中科院量子信息中心進(jìn)行研究工作,2011年獲得杰青稱號,2012年入選IOP Fellow,曾任科技部量子調(diào)控量子通信網(wǎng)絡(luò)和量子仿真關(guān)鍵器件物理實(shí)現(xiàn)之首席科學(xué)家。
以下是演講全文,AI科技評論進(jìn)行了不改變原意的整理:
研究量子多體問題具有極強(qiáng)的科學(xué)意義,可以從兩個(gè)方面進(jìn)行概括。首先在基礎(chǔ)研究的角度上來看,量子多體問題的一個(gè)主要目標(biāo)是發(fā)現(xiàn)和研究新的物質(zhì)形態(tài)。我們可能對生活中常見的固體、液體和氣體形式十分熟悉,但其實(shí)自然界中有很多其他物質(zhì)形態(tài),比如我們之前所說的超導(dǎo)和量子自旋液體等,這些新型的物理形態(tài)都具有各自的存在意義以及研究價(jià)值。
因此通過對新型物質(zhì)形態(tài)的研究,我們便可以洞悉和總結(jié)物理世界的深層規(guī)律和法則。
另一項(xiàng)具有意義的方向是研究其應(yīng)用價(jià)值。例如高溫超導(dǎo)已經(jīng)在能源、交通、精密測量和信息等領(lǐng)域有了廣泛的應(yīng)用。托克馬克裝置需要非常強(qiáng)的磁場進(jìn)行物理約束,因此可以利用超導(dǎo)體產(chǎn)生超強(qiáng)的磁場。此外,拓?fù)湫蛞部梢赃M(jìn)行拓?fù)淞孔佑?jì)算。
在量子多體物理的模型中,有兩個(gè)經(jīng)典模型,即海森堡自旋模型,以及哈伯德電子模型。其中海森堡模型其本質(zhì)是一個(gè)自旋模型,它描述了格點(diǎn)上兩個(gè)自旋量子的相互作用。比如圖中描述了兩個(gè)最近鄰的兩個(gè)量子發(fā)生的交換作用J,如果J>0,則兩個(gè)粒子傾向于自旋反平行。但是當(dāng)J<0時(shí),粒子傾向于自旋平行。
另一個(gè)經(jīng)典模型是哈伯德模型,它描述了電子運(yùn)動的模型。該模型描述了量子在格點(diǎn)上的運(yùn)動,其中第一項(xiàng)表示的是電子從一個(gè)格點(diǎn)跳躍到另一個(gè)格點(diǎn)的過程。第二項(xiàng),描述的是同一格點(diǎn)上電子的庫侖排斥作用。
從局部的角度來看,這兩種模型很容易理解。但是當(dāng)粒子數(shù)逐漸增加的時(shí)候,系統(tǒng)將變得十分復(fù)雜,對其求解將會變得十分困難,算力需求也難以滿足。
計(jì)算困難的根本原因在于量子態(tài)的希爾伯特空間會隨著粒子數(shù)量的增加而呈現(xiàn)指數(shù)級的增長。比如有N個(gè)1/2的自旋粒子,每個(gè)自旋有上下兩個(gè)狀態(tài),那么態(tài)空間將達(dá)到2^N級別。因此如果我們需要對其進(jìn)行嚴(yán)格求解,會遇到“指數(shù)墻”的問題,也就是算力需求巨大。目前我們只能實(shí)現(xiàn)大約40個(gè)格點(diǎn)的自旋系統(tǒng)的嚴(yán)格求解。
此外,我們也有一些其它近似方法,例如量子蒙特卡洛方法。但是它在計(jì)算費(fèi)米系統(tǒng)(電子系統(tǒng))和阻挫系統(tǒng)時(shí)會出現(xiàn)符號問題,即負(fù)幾率問題。而動力學(xué)平均場方法,會對一維和二維等低維度的模型有計(jì)算問題。最后是密度矩陣重整化方法,只能計(jì)算一維和準(zhǔn)一維的問題。
在過去的十幾年間,國際上發(fā)展了一些新的算法,例如張量網(wǎng)絡(luò)態(tài)方法(PEPS算法)。這些算法將量子態(tài)表示為格點(diǎn)上的張量乘積形式。原則上這種方法可以在一定程度上克服已有方法的不足,它可以應(yīng)用于二維系統(tǒng),也不存在對阻挫系統(tǒng)和費(fèi)米系統(tǒng)中的符號問題。
但是另一方面,它的計(jì)算復(fù)雜度很高,尤其是對周期性邊界條件的問題。因此我們目前無法對具有周期性邊界條件的系統(tǒng)進(jìn)行有效的模擬。
在2018年,我們曾經(jīng)在神威機(jī)器上進(jìn)行了PEPS算法的實(shí)現(xiàn)和模擬。當(dāng)時(shí)可以將算法的并行度做到1000萬核。我們可以看到之前工作的算法精度僅能達(dá)到10-3,但是神威機(jī)上的PEPS算法則將精度是提高了2個(gè)量級。但是這個(gè)算法仍舊僅適用于開放邊界條件的問題。
我們知道在AlphaGo在擊敗人類圍棋玩家之后,深度學(xué)習(xí)大熱,引起了很多領(lǐng)域的改革。實(shí)際上,深度學(xué)習(xí)在凝聚態(tài)物理學(xué)中也掀起了一番熱烈討論和嘗試。它可以做實(shí)驗(yàn)數(shù)據(jù)的處理,可以進(jìn)行機(jī)器學(xué)習(xí)勢場模型的模擬和求解,也有工作研究了用AI進(jìn)行分子和晶體結(jié)構(gòu)的分類和預(yù)測,進(jìn)行電子密度的學(xué)習(xí)等。近些年DeepMind的最新工作就是在這些方面進(jìn)行研究和發(fā)現(xiàn),比如使用神經(jīng)網(wǎng)絡(luò)估計(jì)電荷的密度,并且超越了人類的估計(jì)結(jié)果。
大家也在嘗試將深度學(xué)習(xí)和機(jī)器學(xué)習(xí)用在量子多體問題中。上圖是2017年的一篇Science工作,它使用受限玻爾茲曼機(jī)模型研究海森堡自旋模型,將系統(tǒng)的粒子波函數(shù)利用玻爾茲曼機(jī)進(jìn)行表示和學(xué)習(xí),通過優(yōu)化系統(tǒng)的能量,得到神經(jīng)網(wǎng)絡(luò)的最佳參數(shù)。
在量子多體系統(tǒng)中,算法的好壞判斷標(biāo)準(zhǔn)是計(jì)算的能量是否最優(yōu)。從結(jié)果中我們看到,該計(jì)算能量的精度已經(jīng)到達(dá)10-3量級,甚至超過了(我們神威工作)之前PEPS的算法效果。
但是該神經(jīng)網(wǎng)絡(luò)也面臨一些問題,它只能描述簡單的物理模型,無法模擬具有競爭相互作用的物理系統(tǒng)。
那么什么是相互競爭作用呢?我們結(jié)合這里的模型進(jìn)行解釋。J1-J2模型是一個(gè)典型的具有競爭相互作用的自旋模型。我們看到圖中每個(gè)格點(diǎn)上有一個(gè)自旋,它們與近鄰的自旋有相互作用,其中J1描述兩個(gè)最近臨的格點(diǎn)上的自旋相互作用,J2則描述了兩個(gè)次近鄰格點(diǎn)上自旋的相互作用,也就是對角線上的相互作用。如果相互作用的J大于0,則意味著這兩個(gè)格點(diǎn)的自旋都傾向反平行。當(dāng)J1, J2 都大于0時(shí)就會出現(xiàn)問題,即如果近鄰格點(diǎn)是反平行,那么次近鄰格點(diǎn)就一定是平行的,這就和J2相互作用的要求矛盾。該種帶有競爭相互作用的系統(tǒng)被稱為阻挫系統(tǒng)。
打個(gè)比方,一個(gè)員工可能有兩個(gè)老板,其中一個(gè)老板要求你向東走,另一個(gè)要求向西走。則此時(shí)會產(chǎn)生矛盾(Frustrated Interaction)。當(dāng)然,如果其中一個(gè)老板很強(qiáng)勢,我們跟著強(qiáng)勢的走。但是如果兩個(gè)老板勢均力敵,你就會很迷茫。
對J1-J2模型也是如此,如果J1較為強(qiáng)勢,那么系統(tǒng)中的自旋會傾向于做出棋盤形狀的持續(xù)排列。如果J2更強(qiáng)勢,自旋則會沿對角線進(jìn)行反平行排列。當(dāng)兩者相互作用效果相近時(shí),則會產(chǎn)生更多豐富的物理現(xiàn)象。
J1-J2模型十分經(jīng)典,人們對其基態(tài)進(jìn)行了長期的研究。目前針對J1較強(qiáng),以及J2較強(qiáng)的情況研究已經(jīng)較為清晰的結(jié)論,但是對于J1-J2共同作用的中間區(qū)域,一直存在爭議。
對于該區(qū)域的基態(tài),人們有幾種不同的看法。比如,有人認(rèn)為格點(diǎn)可以形成Plaguette態(tài),Plaguette態(tài)是一個(gè)規(guī)則有序的態(tài);此外,也可能會形成Columnar態(tài);也有人提出,可能其中就是一種混亂無序的狀態(tài),即自旋液體態(tài)。自旋液體態(tài)十分復(fù)雜,有著非常復(fù)雜的量子糾纏和奇異量子行為。Philip Anderson認(rèn)為量子自旋液體是研究高溫超導(dǎo)的關(guān)鍵問題之一。
之前的玻爾茲曼機(jī)模型是無法很好地模擬該場景的。在該方法中,它將波函數(shù)視作所有可能自旋結(jié)構(gòu)的疊加,其中W(S)就是自旋構(gòu)型的權(quán)重,該權(quán)重在海森堡模型中都是>0的,但是在有競爭的模型中正負(fù)都有可能。因此在玻爾茲曼機(jī)模型中,就無法處理此類同時(shí)具有正負(fù)情況的波函數(shù)。
為此,我們提出使用深度卷積神經(jīng)網(wǎng)絡(luò)來描述波函數(shù)。我們的網(wǎng)絡(luò)包括了很多Building Block,每個(gè)Block又分為多種算子,包括卷積、Max pooling和反卷積等。
當(dāng)我們輸入一個(gè)自旋構(gòu)型,該網(wǎng)絡(luò)可以給出有正有負(fù)的構(gòu)型權(quán)重,此時(shí)的參數(shù)量是隨格點(diǎn)數(shù)量線性增長,而非災(zāi)難的指數(shù)形增長,這就意味著我們的神經(jīng)網(wǎng)絡(luò)可以使用有限擴(kuò)增的參數(shù)量來模擬出系統(tǒng)中指數(shù)增長的Hilbert空間。當(dāng)然這個(gè)空間也是僅在基態(tài)附近的部分。
當(dāng)我們確定了神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)來模擬波函數(shù)后,重要的是需要獲得系統(tǒng)的基態(tài),所謂基態(tài)是指系統(tǒng)的能量最低態(tài)。也就是我們需要通過神經(jīng)網(wǎng)絡(luò)求解系統(tǒng)能量最低態(tài)的參數(shù)。
這里的能量可以表示成所有自旋構(gòu)型加權(quán)求和的形式,因此可以使用馬爾可夫抽樣的方式進(jìn)行求解。這是一個(gè)典型的強(qiáng)化學(xué)習(xí)場景,我們可以通過優(yōu)化系統(tǒng)能量來得到網(wǎng)絡(luò)參數(shù)。
但是這個(gè)模型和一般的機(jī)器學(xué)習(xí)算法有所差異。第一,它需要極高的精度,我們需要比其他方法要求高至少2個(gè)量級的精度。其原因是量子態(tài)的求解精度需求極高,微小的誤差將對基態(tài)解產(chǎn)生巨大影響。此外,系統(tǒng)中可能存在多個(gè)局部最優(yōu)點(diǎn),若我們用普通方法進(jìn)行優(yōu)化,則可能陷入局域極值中。
為了解決這個(gè)問題,我們使用SR方法進(jìn)行解決。在機(jī)器學(xué)習(xí)中我們常稱之為自然梯度法。為了更新網(wǎng)絡(luò)參數(shù),我們需要求解能量對參數(shù)的多個(gè)梯度,為了計(jì)算梯度相,我們需要進(jìn)行求導(dǎo),并求解關(guān)聯(lián)矩陣的預(yù)處理,加速收斂。
這里的計(jì)算熱點(diǎn)包括馬爾可夫采樣。因?yàn)槲覀冃枰?jì)算關(guān)聯(lián)矩陣,需要50萬sweep的自旋樣本,每個(gè)sweep都需要對所有網(wǎng)格進(jìn)行翻轉(zhuǎn)。但是在sweep之間是不需要進(jìn)行求導(dǎo)和反向傳播的,我們只需要正向執(zhí)行,并在全部sweep做完后進(jìn)行反向傳播,以此降低通訊時(shí)間占比,以及計(jì)算量。
另一個(gè)計(jì)算熱點(diǎn)是SR優(yōu)化方法。在SR算法中一個(gè)重要步驟是計(jì)算大的關(guān)聯(lián)矩陣,然后求解線性方程組。具體哪部分的耗時(shí)是最嚴(yán)重的,其實(shí)是由模型參數(shù)大小所決定的。如果系統(tǒng)越大,采樣越耗時(shí),參數(shù)越多,SR方法的耗時(shí)越大。
我們分別在自己的機(jī)器以及新一代的神威機(jī)上進(jìn)行了驗(yàn)證和部署。神威機(jī)具有異構(gòu)的結(jié)構(gòu),其NPI處于核組之間,因此有64個(gè)組合。在核組級別上的并行本質(zhì)是線程并行。神威機(jī)的異構(gòu)結(jié)構(gòu)很適合此類應(yīng)用,因此為了最大化利用神威機(jī)的能力,我們針對神威機(jī)的特點(diǎn)和應(yīng)用特點(diǎn)設(shè)計(jì)了雙層并行方案。首先在核組之間的并行被用作自旋采樣,即每個(gè)自旋部署在不同的核組之上進(jìn)行獨(dú)立采樣。在求解線性方程組的時(shí)候,會使用ScaLAPACK進(jìn)行計(jì)算劃分。在并行內(nèi)部,我們使用卷積算子從核加速,并利用網(wǎng)絡(luò)輸出時(shí)采用批次>1的計(jì)算,將從核的計(jì)算性能妥善利用。
這是我們的程序在新的神威機(jī)上的移植和優(yōu)化的示意圖全覽??梢钥吹皆诓煌暮私M之間我們進(jìn)行了單獨(dú)獨(dú)立的采樣;采樣后將其收集并計(jì)算關(guān)聯(lián)矩陣,并求導(dǎo)更新參數(shù)。這項(xiàng)工作最大利用了10萬核組測試。
在性能表現(xiàn)方面,我們對比各個(gè)主機(jī)的用時(shí)結(jié)果。從上圖中我們可以看到,我們分別比較了16000個(gè)參數(shù),和10萬個(gè)參數(shù)的場景。不論參數(shù)量如何,其主要的計(jì)算時(shí)間還是集中在前向計(jì)算部分,SR優(yōu)化的占比只有1/4左右。
本工作的另一個(gè)優(yōu)點(diǎn)在于其可遷移性極高。我們首先可以在較小的神經(jīng)網(wǎng)絡(luò)中進(jìn)行學(xué)習(xí),而后將其擴(kuò)展到體積大的網(wǎng)絡(luò)中。在實(shí)踐中,遷移后通常只需要幾百步便可以使大網(wǎng)絡(luò)收斂,這無疑加速了模型的訓(xùn)練和應(yīng)用。
這里我們對比了性能。綠色和棕色線都是直接學(xué)習(xí)的結(jié)果,藍(lán)色和紅色是遷移的結(jié)果。通過圖中結(jié)果我們知道,如果使用直接學(xué)習(xí),則網(wǎng)絡(luò)很難收斂到最佳結(jié)果,而遷移則極大加快了這個(gè)最優(yōu)化的過程。
我們也分析了基態(tài)能量部分的外推結(jié)果,經(jīng)過計(jì)算發(fā)現(xiàn),能量在網(wǎng)格達(dá)到24×24后便逐漸收斂,我們也對多種磁序進(jìn)行外推,比如Dimer序和反鐵磁序。結(jié)果發(fā)現(xiàn),系統(tǒng)在中間區(qū)域的基態(tài)是自旋液體相。
與之前的最佳結(jié)果對比,我們的優(yōu)勢在于,網(wǎng)絡(luò)的擴(kuò)展性更高,也就是可以處理的系統(tǒng)尺寸更大,具有極好的遷移學(xué)習(xí)特征。
在下一步工作中,我們將繼續(xù)進(jìn)行相關(guān)研究,主要優(yōu)化卷積算子的性能,提高神經(jīng)網(wǎng)絡(luò)的計(jì)算速度;優(yōu)化ScaLAPACK庫,提升優(yōu)化算法的速度;增加網(wǎng)絡(luò)參數(shù),得到精度更高的基態(tài)。
該模型可以進(jìn)一步拓展到其他種類模型上,比如三角格子、六角格子和kagome格子等場景。我們還可以在近鄰、次近鄰作用的基礎(chǔ)上添加次次近鄰的相互作用。這些物理模型都有其特殊物理現(xiàn)象。
該模型還能用在費(fèi)米子(電子)模型比如t-J模型上,我們初步的測試目前來看效果很好。
但是當(dāng)前我們的研究還是限于系統(tǒng)的基態(tài),即T=0K的場景。而真正有限溫度下的系統(tǒng),可能存在更豐富的物理系統(tǒng)屬性,可以計(jì)算更多的物理量和實(shí)驗(yàn)進(jìn)行對比。
有限溫度的研究是個(gè)極大挑戰(zhàn)。因?yàn)榻^對零度場景下系統(tǒng)處于基態(tài),因此可以使用波函數(shù)進(jìn)行描述。但是當(dāng)溫度不等于零時(shí),系統(tǒng)處于混態(tài),就必須使用密度矩陣進(jìn)行描述。此時(shí)樣本空間將會成倍的增加,因此需要更多的網(wǎng)絡(luò)參數(shù),甚至到達(dá)100萬左右的級別。
雷峰網(wǎng)雷峰網(wǎng)(公眾號:雷峰網(wǎng))
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。