0
本文作者: 任然 | 2019-03-19 19:28 |
雷鋒網(wǎng)消息,Intel今天宣布,它將和Cray公司一起為美國能源部的阿貢國家實(shí)驗(yàn)室建造第一臺性能為1 ExaFlops的超級計(jì)算機(jī),即每秒可執(zhí)行百億億次浮點(diǎn)運(yùn)算,比目前的最強(qiáng)超級計(jì)算機(jī)Summit快5倍以上,預(yù)計(jì)2021年交付。
Intel表示,這臺價(jià)值5億美元的超級計(jì)算機(jī)名為Aurora,專門為傳統(tǒng)的高性能計(jì)算和人工智能設(shè)計(jì),它的研制和使用將顯著推進(jìn)科學(xué)研究和發(fā)現(xiàn)。
實(shí)際上,這臺Aurora已經(jīng)是升級過的第二版方案,此前Intel原計(jì)劃于2018年在阿貢國家實(shí)驗(yàn)室部署一臺基于第三代Knights Hill Xeon Phi協(xié)處理器的超級計(jì)算機(jī),峰值性能約180 PetaFlops(每秒18億億次),但在中國宣布計(jì)劃2020年前建立百億億次級超級計(jì)算機(jī)后,感受到來自東方神秘力量的Intel放棄了這一計(jì)劃,將設(shè)計(jì)目標(biāo)也提升至對位的百億億次級。
Aurora是能源部百億億級計(jì)算項(xiàng)目的產(chǎn)物,該項(xiàng)目是PathForward長期計(jì)劃中的一項(xiàng)撥款計(jì)劃,旨在加速在美國開發(fā)百億億次級超級計(jì)算機(jī)的研究。從2017年開始,該項(xiàng)目在三年的合同期內(nèi)分配了近2.58億美元的資金,除Intel之外,AMD、Cray、HPE,IBM和NVIDIA等公司均被要求提供至少40%項(xiàng)目總成本的補(bǔ)充融資。
據(jù)雷鋒網(wǎng)了解,自NVIDIA DGX2公布后,高性能計(jì)算界開始從純粹追求高性能,轉(zhuǎn)變?yōu)榕cAI尋求更好的結(jié)合,美國的Summit超級計(jì)算機(jī)也不例外。隨著Summit重新奪回了中國占據(jù)多年的TOP500第一名,讓采用CPU+GPU這種異構(gòu)體系結(jié)構(gòu)的超級計(jì)算機(jī)成為了絕對主流。
中科院計(jì)算機(jī)網(wǎng)絡(luò)信息中心副主任研究員遲學(xué)斌曾提到,Summit這臺機(jī)器讓人印象特別深刻的一點(diǎn)是它的實(shí)測效率高達(dá)70%以上,這在已有的異構(gòu)系統(tǒng)里應(yīng)該是最高的一臺。要發(fā)展更高的百億億次級超級計(jì)算機(jī)的話,其他途徑很難實(shí)現(xiàn),只能使用異構(gòu)體系結(jié)構(gòu)。
Aurora的設(shè)計(jì)計(jì)劃自然將繼續(xù)發(fā)揚(yáng)這一體系,其核心是Intel下一代至強(qiáng)處理器、下一代Xe GPU以及下一代傲騰存儲器的搭配,將采用Cray公司的Shasta超級計(jì)算系統(tǒng)及其Slingshot高性能互連,并完全支持Intel的One API開發(fā)工具,可將計(jì)算引擎映射到各種CPU、GPU、FPGA以及其他加速器。
阿貢國家實(shí)驗(yàn)室主任Paul Kearns表示,能源部、阿貢國家實(shí)驗(yàn)室、Intel和Cray公司等行業(yè)合作伙伴的合作,對國家具有巨大的科學(xué)效益。Aurora專為下一代人工智能而設(shè)計(jì),通過結(jié)合高性能計(jì)算和人工智能,來解決諸如預(yù)測極端天氣、大腦仿真、開發(fā)新材料等實(shí)際問題,從而加速科學(xué)發(fā)現(xiàn),進(jìn)一步了解宇宙。
雷鋒網(wǎng)同時(shí)了解到,美國最近的大手筆不止Aurora一個(gè)。此前,美國能源部向IBM、NVIDIA等公司提供了4.25億美元的聯(lián)邦資金,用于建造兩臺超級計(jì)算機(jī):一臺位于能源部的橡樹嶺,另一臺位于勞倫斯利弗莫爾國家實(shí)驗(yàn)室。根據(jù)TOP500超級計(jì)算機(jī)性能排名,位于橡樹嶺的超級計(jì)算機(jī)可實(shí)現(xiàn)143~200 PetaFlops 的峰值性能,而位于勞倫斯利弗莫爾的紅杉超級計(jì)算機(jī)峰值性能約為20 PetaFlops。
然而,即便Intel和Cray實(shí)現(xiàn)自己的承諾,將Aurora打造成為美國超級計(jì)算機(jī)皇冠頂上的寶石,但它很可能仍然不是下一代超級計(jì)算機(jī)中最強(qiáng)大的一臺。據(jù)悉,位于北京的中科院計(jì)算所(曙光超級計(jì)算機(jī))、天津的國防科大超級計(jì)算機(jī)中心(天河超級計(jì)算機(jī)),以及濟(jì)南的超級計(jì)算機(jī)濟(jì)南中心(神威超級計(jì)算機(jī))三個(gè)研發(fā)團(tuán)隊(duì)目前正在積極競爭,要在未來7個(gè)月內(nèi)建造百億億次級超級計(jì)算機(jī)。
此外,日本的百億億次級超級計(jì)算機(jī)“后京”也計(jì)劃于2020年完成部署,雖晚于中國但也要早于Aurora。多方圍剿之下,預(yù)計(jì)2021年完成部署的Aurora很有可能面臨的是后發(fā)后至的局面。(要不然你再回爐一次?)
如今的超級計(jì)算機(jī)領(lǐng)域已經(jīng)成為中國和美國之間的競爭舞臺。目前世界上最快的10臺超級計(jì)算機(jī)中有五臺在美國,其中Summit和Sierra均基于IBM最新的Power9處理器和NVIDIA Volta GV100加速卡打造,峰值性能分別為200 PetaFlops和126 PetaFlops,將占據(jù)HPC TOP500榜首多年的中國超級計(jì)算機(jī)神威太湖之光擠到了第三位。除此之外,其他三臺還包括第六名的Trinity、第九名的Titan和第十名的Sequoia。
TOP500榜單目前的前十名
位于中國無錫國家超級計(jì)算中心的神威太湖之光是目前我國最強(qiáng)的超級計(jì)算機(jī),基于自主研發(fā)的申威SW26010處理器,峰值性能125 PetaFlops,曾在2015~2017年蟬聯(lián)TOP500冠軍。緊隨神威太湖之光之后的是排名第四的天河2A,峰值性能100 PetaFlops。
在兩年前的TOP500排名中,中國以202臺的超級計(jì)算機(jī)數(shù)量首次超過美國的143臺,且這一趨勢在隨后的一年里還有所加速。至2018年秋季 TOP500出爐時(shí),中國上榜的超級計(jì)算機(jī)總數(shù)再次攀升到229臺,而美國則進(jìn)一步下降到108臺。
不過,中國雖然在高性能計(jì)算領(lǐng)域的硬件上已經(jīng)實(shí)現(xiàn)了超車,但在軟件和應(yīng)用層面上一直與國外有不小的差距,且這種差距并非依靠資金投入便能實(shí)現(xiàn)追趕,而是要持續(xù)不斷的慢慢積淀。
以目前的最強(qiáng)超算Summit為例,剛剛投入使用后不久,在去年的全球超級計(jì)算大會上便已有一些非常完美的應(yīng)用展示了出來,例如由美國加州理工大學(xué)和國家實(shí)驗(yàn)室設(shè)計(jì)的項(xiàng)目,使用傳統(tǒng)科學(xué)計(jì)算和AI計(jì)算相結(jié)合來預(yù)測地震的應(yīng)用,整體計(jì)算使用了傳統(tǒng)科學(xué)計(jì)算中的有限元,而在單點(diǎn)破壞嚴(yán)重的地方則使用了測量數(shù)據(jù)加AI推理,兩者結(jié)合之下將Summit這臺機(jī)器應(yīng)用到了完美,并據(jù)此得到了戈登·貝爾獎。
中科曙光副總裁何鐵寧在參觀了這些展示后表示,這些應(yīng)用最值得學(xué)習(xí)的地方是如何讓傳統(tǒng)科學(xué)計(jì)算和AI計(jì)算這兩者有機(jī)的結(jié)合起來,實(shí)現(xiàn)比較完美的負(fù)載均衡完全匹配。
據(jù)悉,國內(nèi)幾大超級計(jì)算中心現(xiàn)在也正向這一模式靠攏,在軟件上的投入逐漸增加,努力完善生態(tài)體系。今年將會有更多的投入在生態(tài)建設(shè)上,讓即將到來的三大百億億次級超算發(fā)揮出更強(qiáng)大的威力。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。