丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
人工智能 正文
發(fā)私信給陳彩嫻
發(fā)送

0

成立十年,這家由中科院孵化的超算中心如何榮登中國高性能計算機Top100榜單第三名?

本文作者: 陳彩嫻 2021-10-31 14:02
導(dǎo)語:計算的商業(yè)化,何以搭上了「碳中和」的列車?

在2020年中國高性能計算機性能Top100的排行榜中,部署在國家超算中心(無錫)的「神威·太湖之光」依然穩(wěn)居第一,國家超算中心(廣州)的「天河二號升級系統(tǒng)」位列第二,而榮登榜眼的,卻是此前名不見經(jīng)傳的北京超級云計算中心A分區(qū)。

這一排名,讓許多此前并不知道北京超級云計算中心的朋友大吃一驚:「超級云計算」是什么?北京超級云計算中心的「A分區(qū)」究竟實力何在?

盡管大家對A分區(qū)的研制廠商戴爾(DELL)多有耳聞,但對A分區(qū)所部屬的北京超級云計算中心卻幾乎一無所知,顧名思義,更容易將其與國家超算中心混淆。

這座超算中心成立于2011年,雖由中國科學(xué)院計算機網(wǎng)絡(luò)信息中心孵化、北京懷柔區(qū)政府支持成立,但卻不在國家的8個超算中心之列。

眾所周知,我國第一個國家超算中心成立于2009年,由天津濱海新區(qū)與國防科技大學(xué)合作共建,斥資6億。此后,國家又陸續(xù)在多個東部城市建立了超算中心:濟南、深圳、廣州、長沙、無錫、鄭州、昆山……

其「政府+高?!沟暮献髂J诫m與國家超算相似,但自創(chuàng)立之初,北京超級云計算中心的核心理念便注定了它的不同。

從2011年到2020年,北京超級云計算中心何以從一個籍籍無名的超算中心,成為躋身于中國高性能計算機Top100榜單一員、并僅次于兩個國家超算中心的明星超算呢?

在中國高性能計算盛會CCF HPC China 2021中,我們有幸見到了北京超級云計算中心的CTO郭宇,與他一同探究該中心的「成名之路」。

從建設(shè)的模式來看,北京超級云計算中心與國家超算中心有許多不同之處,其中,最大的不同便是:國家超算中心注重科研支持,而北京超級云計算中心的核心理念是超算商業(yè)化。

按照郭宇的話說,是「像設(shè)計產(chǎn)品一樣設(shè)計超算?!?/p>

被譽為「國之重器」的超級計算機,向來是大國之間的必爭之地。長久以來,這也形成了國家超算獨當(dāng)一面、民間超算不為人知的局勢。然而,任一行業(yè)的發(fā)展,必然是多方勢力的融合與交匯,百花齊放,從而共同推進領(lǐng)域的前進。

那么,在中國的超算領(lǐng)域內(nèi),北京超級云計算中心的位置在哪里?優(yōu)勢是什么?


1、超算市場的形成

回顧2011年北京超級云計算中心的成立節(jié)點,除了兩個國家超算中心(天津與濟南)的成立所帶來的信號,超算市場的爆發(fā)早在過去的五年便有了行業(yè)的鋪墊與基礎(chǔ):

2005年以前,CPU處理器處于「單核時代」,一個CPU只有一個核心。如果一臺服務(wù)器上有兩個CPU,那么,搭建一個1024核的CPU則需要512個節(jié)點,12個機柜,因為一個機柜最多只能裝滿42U。而每個機柜的寬度為60公分,12個機柜則是7.2米,相當(dāng)于一個普通教室的寬度。更重要的是,僅依靠提高主頻來提高計算效率的方法,

但從2006年開始,CPU處理器開始進入了「雙核」、并逐步拓展到「多核」時代。雙核處理器的出現(xiàn),也奠定了基于x86的計算架構(gòu),英特爾與AMD在CPU帝國中的主導(dǎo)地位也就此形成:

2006年年中,AMD率先推出AM2平臺。兩個月后,英特爾發(fā)布Conroe,性能直接提高40%,與此同時,功耗也降低了40%。但英特爾并不「就此罷休」,同年11月又直接推出全新的四核處理器Kentsfield,直接把CPU推進了「多核時代」。

與單核的CPU相比,多核CPU的并行處理能力更強、計算密度也更高,并大大減少了散熱與功耗。后來,CPU出現(xiàn)了8核、12核、16核……目前一個CPU最高已能達到64核。對于許多關(guān)注高性能計算的行業(yè)從事人員來說,他們認為,多核CPU必然會帶來計算與任務(wù)的并行化,也就是說,超算市場在未來會迎來爆發(fā)。

因此,回顧超算市場的發(fā)展歷史,在CPU進入「多核時代」后,北京超級云計算中心的成立,是卡在了爆發(fā)的起點。但當(dāng)時,北京超級云計算中心還未正式開始商業(yè)化的探索,前期工作也主要以維護中科院計算機網(wǎng)絡(luò)信息中心的超算集群,支持科研項目為主。

除了技術(shù)的加持,國家超算中心的陸續(xù)成立,也逐漸在國內(nèi)孵化了一個算力的市場。

據(jù)北京超級云計算中心CTO郭宇介紹,國家超算中心的建設(shè)模式是:科技部與地方政府各出一部分資金建設(shè)好國家超算中心后,在運營階段,超算中心的部分運營費用由地方政府的財政補貼,同時,向部分高??蒲腥藛T開放課題申請,由高??蒲腥藛T從課題經(jīng)費中支出部分資金、到國家超算中心去采購計算資源。

在這樣的模式下,國內(nèi)逐漸形成了一個商業(yè)循環(huán)的算力市場。隨著國家超算中心的出現(xiàn),科研院所與高校逐漸縮減自建超算的規(guī)模,增加對外部超算資源的采購。如此一來,超算市場的用戶越來越多,對超算的需求也不斷增加。當(dāng)市場擴大到一定的程度,必然會出現(xiàn)分化,分為高端市場、中端市場與低端市場。

對于國家超算中心來說,服務(wù)如此分化明顯的市場并不是一件易事,且國家超算中心存在的目的主要是支持國家大課題(如航空、宇宙、氣象等)、推進科研進步。這就造成了超算市場的服務(wù)縫隙:部分需要超算資源的小課題用戶在提出需求時,并不能得到滿足。

正是看到超算市場的這一縫隙,2018年,北京超級云計算中心開始了計算商業(yè)化的探索,希望能夠提供「隨需擴容」的計算服務(wù),滿足尖端超算以外的大規(guī)模通用超算市場。


2、探索計算的商業(yè)化

中國高性能計算機Top100的榜單排名由計算機的計算能力決定,而計算能力主要由計算機的單節(jié)點性能與集群規(guī)模構(gòu)成。

北京超級云計算A分區(qū)的Linpack測試性能達3.743PFlops,計算峰值性能達7.035PFlops,CPU核數(shù)達到192000,幾乎是第四名往后的計算機的三倍及以上。

據(jù)郭宇介紹,A分區(qū)從2019年年底開始建設(shè),原先只有200個節(jié)點,而后在2020年年中擴容到3000個節(jié)點,背后的原因并不是為了爭奪Top3,而是為了滿足客戶的需求。

在郭宇看來,國內(nèi)的超算市場可以大致分為三類:尖端超算、通用超算與行業(yè)超算。其中,國家超算中心所服務(wù)的需求,便主要是尖端超算,以難度高、設(shè)計性能平衡為主,要兼顧計算、訪存、通信與I/O等,服務(wù)對象是國家級的科研項目,重點是出成果,而不是盈利。

而北京超級云計算中心的目標(biāo)市場是通用超算,主要面向萬核以下(尤其是千核以下)的應(yīng)用規(guī)模,為需求不一的海量用戶提供租賃式超算服務(wù)。對于北京超級云計算中心來說,他們的目標(biāo)是超算的商業(yè)化運營,實現(xiàn)超算業(yè)務(wù)的盈利,反哺到中心建設(shè)的投入中,實現(xiàn)自給自足、靈活外延的正循環(huán)。

「讓計算不排隊」,是北京超級云計算中心的核心理念。

從2011年成立至今,北京超級云計算中心經(jīng)歷了兩個主要的階段:

剛成立的幾年,北京超級云計算中心以運營中科院體系內(nèi)的超算為主,包括中科院計算機網(wǎng)絡(luò)信息中心在2014年推出的超級計算機「元」、2015年的「元」二期等等。在這一階段,北京超級云計算中心的建設(shè)模式、運營模式與國家超算中心的體系有許多相同之處。

到了2017年,他們逐漸發(fā)現(xiàn)了上述所說的國家超算中心無法滿足的外溢市場需求。隨著國內(nèi)科研發(fā)展的深入推進,高校教師對計算的需求越來越大,超算的用戶類型也越來越多,應(yīng)用越來越復(fù)雜,用戶對計算機的服務(wù)要求也越來越高。

比方說,有些用戶做計算,并不是簡單地將一個程序放到超級計算機上就可以直接運行,而是需要在Linux命令行窗口下將源代碼進行編譯、調(diào)優(yōu)、集成甚至更復(fù)雜的適配移植,這對廣大只熟悉Windows操作系統(tǒng)的用戶來說過于復(fù)雜。

國家超算中心的主要任務(wù)是支持重量級的科研項目,取得出色的學(xué)術(shù)成果(比如獲戈登貝爾獎),如此以來,國家超算中心的計算資源自然會優(yōu)先分配給重要的科研團隊,這就導(dǎo)致了許多中小用戶享受不到好的服務(wù),出現(xiàn)「排隊計算」的情況。

基于這一行業(yè)需求,北京超級云計算中心便思考從商業(yè)運營的角度去解決國家超算中心的這部分外溢需求,通過靈活的方式將計算資源提供給超算市場的中小微「散戶」。

于是,2018年,北京超級云計算中心發(fā)布了「中國科技云·超算云」,開始了計算商業(yè)化的探索征程。

他們以云服務(wù)的方式輸出超算,注重商業(yè)化運營,遵循「隨需供應(yīng)」、「按需擴容」的理念,在兩年間占領(lǐng)了一定的超算市場,贏取了客戶的信任,在吸引更多中小用戶的過程中對A分區(qū)進行了擴容與提升,最終在2020年贏得了中國高性能計算機Top100排行榜的第三名。

郭宇表示:「贏得Top3是結(jié)果,不是目的。我們打造超算,本心是為了服務(wù)客戶,獲得該榮譽是錦上添花?!?/p>

相對于聚焦Top3的排名,郭宇更希望大家看到A分區(qū)背后的北京超級云計算中心及其獨特的建設(shè)模式。


3、關(guān)于「計算」模式的新思考

郭宇提出了一個有意思的觀點:作為一種「產(chǎn)品」,計算的獨特之處在于,在用戶購買計算資源時,用戶需要的并不是計算資源,而是想要解決問題。就像人們在購買電鉆時,他們想要的并不是電鉆,而是電鉆在墻上鉆出的洞。

所以,在市場上推廣計算資源時,北京超級云計算中心往往是強調(diào)「客戶服務(wù)」,而不是中心的資源情況。

從A分區(qū)來看,我們不難發(fā)現(xiàn),北京超級云計算中心與國家超算中心的模式多有不同:

首先是建設(shè)周期。國家超算中心由科技部或地方政府出資,超級計算機的項目申報需要經(jīng)過層層審批,建設(shè)周期一般為3-5年,而A分區(qū)由北京超級云計算中心內(nèi)部「拍板決定」。此外,A分區(qū)的建設(shè)主要基于市場上已有的技術(shù)設(shè)備,減少了技術(shù)攻關(guān)的時間成本。

比如,A分區(qū)從2019年年底開始建設(shè),從一個試驗性的小集群到面向用戶開放,2020年年中擴容,只用了3周便從200個節(jié)點擴容到3000個節(jié)點。

其次是分布位置。從地圖上看,我們不難發(fā)現(xiàn),國家超算中心基本分布在東部城市,而北京超級云計算中心的超算系則主要分布在中西部,尤其是西部。A分區(qū)便是分布在寧夏。計算中心是「耗電大戶」,從商業(yè)運營的角度看,西部的電價明顯更低。以北京為例,北京的電價每度為9毛錢,而西部城市只有不到3毛。

在建設(shè)A分區(qū)的時候,國家還沒有發(fā)布十四五計劃,「碳達峰」與「碳中和」的概念還未興起。郭宇談道,從北京超級云計算中心的角度來看,他們在建設(shè)A分區(qū)時,主要是遵循商業(yè)運營的邏輯,而今年「雙碳」熱點出現(xiàn)后,他們意外地發(fā)現(xiàn),自己的路線竟契合了國家的「雙碳」戰(zhàn)略。

「西部有風(fēng)力發(fā)電、光伏發(fā)電,能源豐富,而且年平均氣溫比較低,十分適合計算中心的生存,所以我們將西部作為主要的據(jù)點。而且超算業(yè)務(wù)對實時通訊的需求不高,用戶更關(guān)心的是產(chǎn)品的價格,至于機器是在Ta的本地城市、還是在幾千公里以外的西部,他們并不關(guān)心。」郭宇解釋。

北京超級云計算中心面向通用超算,用戶數(shù)量大,符合長尾效應(yīng)。郭宇談道:「有這些特點的市場,是比較適合用互聯(lián)網(wǎng)的方式去服務(wù)的。一是降低單用戶的成本,二是貼身服務(wù)?!?/p>

所以,無論是計算選址的確定,還是「超算+云服務(wù)」的互聯(lián)網(wǎng)運營模式,都體現(xiàn)了北京超級云計算中心在計算供應(yīng)中注重靈活與性價比的特點。

從A分區(qū)所搭配的CPU來看,也可窺見北京超級云計算中心的商業(yè)運營理念:

A分區(qū)采用的是AMD在2019年推出的第二代EPYC(霄龍)服務(wù)級處理器,代號羅馬(Rome),基于7nm工藝,搭載64核心128線程,每一個核心的內(nèi)存為4GB,在提升核心的同時也提升了時鐘速度,加速頻率可達3.4GHz。

從計算機的角度來看,計算總共可以分為4種類型:計算密集型、訪存密集型、存儲密集型(I/O密集型)與網(wǎng)絡(luò)通信密集型。北京超級云計算中心的主要客戶是訪存密集型的應(yīng)用,這決定了A分區(qū)的特點是:計算規(guī)模不大,成本低。而羅馬處理器主頻適中,計算性能適中,能耗低,性價比高,顯然更有利于商業(yè)運營。

郭宇坦言,北京超級云計算中心的目標(biāo)從來不是打造出像「神威·太湖之光」或「天河二號升級系統(tǒng)」這樣各方面性能均衡又出色的超級計算機,而是找到自己的市場定位,為目標(biāo)用戶提供適合他們的超算方案。

根據(jù)處理器的類別,北京超級云計算中心的超算分區(qū)可以劃分為四大系列:

? 基于AMD芯片的A分區(qū)與M分區(qū),以及A分區(qū)的加強版「A6分區(qū)」

? 基于英特爾芯片的T分區(qū)與L分區(qū)

? 基于國產(chǎn)芯片(如海光x86 CPU)的先導(dǎo)一號

? 基于英偉達芯片的AI智算云,比如N17、N19區(qū)

根據(jù)不同用戶的需求,北京超級云計算中心設(shè)立了不同的分區(qū)去滿足這些需求。比如,榮登2020年中國高性能計算機Top100榜單的A分區(qū)便是專門針對計算密集型與訪存密集型的用戶,存儲性能加強的I/O分區(qū)專門面向I/O密集型,等等。

「中國科技云·超算云」匯聚了國家超算中心、互聯(lián)網(wǎng)云計算中心等資源,可以為用戶提供定制化的計算服務(wù)。同時,他們揭掉了高性能計算的「神秘面紗」,為用戶提供運行問題解答、參數(shù)配置優(yōu)化、定制化腳本編寫等一系列服務(wù),更有一對一專屬微信群、7×24小時人工值守與5分鐘快速響應(yīng)等機制。


4、自主研發(fā)離不開計算

近年來,越來越多企業(yè)高舉「自主研發(fā)」的旗幟。與此同時,產(chǎn)品的迭代周期加快。為了快速滿足市場的需求,研發(fā)人員會越來越多地利用數(shù)字化技術(shù)進行模擬仿真,其間產(chǎn)生大量數(shù)據(jù),對計算的需求也會越來越多。

事實上,從2010年以來,許多企業(yè)也陸續(xù)建立了計算中心,但他們同樣面臨建設(shè)周期長、內(nèi)部計算資源協(xié)調(diào)難、計算排長隊的現(xiàn)象。企業(yè)一般是基于項目的優(yōu)先級進行計算資源的分配,但人工協(xié)調(diào)的效率較低,限制了研發(fā)項目的進展。

郭宇認為,隨著人們對云計算優(yōu)勢的認識加深,云計算的市場也在不斷擴大。在新基建中,「數(shù)據(jù)中心」對應(yīng)的便是云計算,云計算是數(shù)字化轉(zhuǎn)型的基礎(chǔ)。同時,隨著「雙碳」規(guī)劃的推進,碳排放指標(biāo)也將成為自建超算中心發(fā)展的限制因素之一。而北京超級云計算中心在分布位置上的先見之明,無疑將在未來的逐鹿上優(yōu)勢漸顯。

作為國內(nèi)第一家成規(guī)模的、市場化運營的超算中心,北京超級云計算中心的建設(shè)模式,啟示了中國超算市場的發(fā)展現(xiàn)狀:除了國家超算中心,越來越多由地方政府支持、民間創(chuàng)辦的超算中心展示了其在推進中國超算發(fā)展上的獨特優(yōu)勢。

比如,在2020年中國高性能計算機Top100的榜單排名上,除了北京超級云計算中心A分區(qū)獲得佳績,內(nèi)蒙古和林格爾新區(qū)的內(nèi)蒙古高性能計算公共服務(wù)平臺(青城之光)位居第四。

除了尖端超算與通用超算,中國的超算市場還有一股重要的力:公有云廠商,比如阿里云、華為云與亞馬遜云(AWS)。北京超級云計算中心的另一塊重要業(yè)務(wù)——行業(yè)超算,便與這股力量有所交織與重疊。

行業(yè)超算更注重實際業(yè)務(wù),應(yīng)用規(guī)模為單核到幾千核不等,超算只是業(yè)務(wù)中的一環(huán)。比方說,在基因測序的過程中,基因測序儀產(chǎn)生大量數(shù)據(jù),這時候,如果數(shù)據(jù)存儲在云上,使用云的存儲、網(wǎng)絡(luò)與計算資源等等服務(wù)進行基因的測序與分析,那么整個業(yè)務(wù)流程就會十分順利。

對于這類業(yè)務(wù)流程,郭宇自認為,單靠通用超算是很難滿足的。從北京超級云計算中心的角度來看,他們會考慮將通用超算與云廠商的云服務(wù)資源相結(jié)合。除了核心的計算業(yè)務(wù),公有云廠商還提供豐富的云服務(wù)組件,能更好地解決用戶的問題。

「對用戶來說,解決問題最重要。至于計算資源來自哪里,他們并不在乎。我們就是要把各種優(yōu)勢的資源組合在一起,滿足客戶的需求?!构钫劦?。

從2018年至今,北京超級云計算中心已服務(wù)超過15萬用戶,2019年便開始實現(xiàn)了盈利。

比如,北京超級云計算中心曾支持中科院力學(xué)所研究中速磁浮列車的空氣動力學(xué)外形優(yōu)化設(shè)計。中速磁浮列車氣動外形優(yōu)化研究需要針對一系列優(yōu)化外形進行數(shù)值模擬研究,對計算資源的要求較高,單工況網(wǎng)格量約6000萬左右,流場特性研究及外形優(yōu)化研究中產(chǎn)生的計算工況上百計,單工況并行計算核數(shù)約200個。

在這個項目中,北京超級云計算中心提供了可靈活拓展的大量計算節(jié)點,保證了多任務(wù)的提交計算。最終,他們確定的最優(yōu)化流線外形,相對于原始外形,頭車氣動升力系數(shù)增加了33.25%,尾車氣動升力系數(shù)減少了1.78%,整車氣動阻力系數(shù)減小了4.44%,大幅提升了中速磁浮列車的氣動性能。

「從用戶的角度看,建設(shè)幾千核的計算資源,先不說時間,就投資成本來講,現(xiàn)在的主流服務(wù)器,一個節(jié)點大概是40核心,如果他用的是5000核的計算資源,那么就需要125個節(jié)點,125個節(jié)點大概需要投資1000來萬,但他們的項目時長只有兩個月?!构罱榻B。

因此,從投入產(chǎn)出比來看,對一些短期的項目來說,直接采購計算資源顯然更劃算。


5、計算緊跟時代

在郭宇看來,目前國內(nèi)的超算市場展示了以下三個趨勢:

趨勢一:國內(nèi)的企業(yè)越發(fā)重視自主研發(fā),計算需求增加,同時也越來越愿意接受云計算的模式。

趨勢二:國產(chǎn)化的推進加深。在超算體系中,芯片、操作系統(tǒng)、應(yīng)用等等方面的國產(chǎn)化趨勢將越來越明顯。

趨勢三:計算體系架構(gòu)正在革新。隨著人工智能、加速計算的興起,以異構(gòu)計算、加速卡為引導(dǎo)的GPU力量正在崛起。

郭宇談起,他在2019年去美國參加全球超級計算大會(SC)時,席間與美國高校的老師聊天,得到的訊息便是:「在現(xiàn)在的環(huán)境下,如果你沒有搞點GPU的加速計算,文章都難發(fā)。從學(xué)術(shù)的角度看,CPU體系已經(jīng)研究地差不多,下一個重點就是GPU?!?/p>

2021年正好是北京超級云計算中心成立的十周年。作為一家商業(yè)運營的超算中心,郭宇介紹:「我們肯定會堅定不移地走計算商業(yè)化的道路。與此同時,他們也會與時俱進,根據(jù)國內(nèi)超算市場的發(fā)展趨勢,制定新的發(fā)展方針。雷鋒網(wǎng)

緊跟學(xué)術(shù)界的研究趨勢,北京超級云計算中心也加大了在GPU計算領(lǐng)域的投入,建設(shè)基于GPU加速卡的計算分區(qū)。隨著人工智能計算的興起,以及異構(gòu)計算模式的變化,他們也順勢建立了「AI云·智算云」,以滿足部分從事人工智能研究的學(xué)者需求。雷鋒網(wǎng)

相應(yīng)地,針對企業(yè)的自主研發(fā)需求,北京超級云計算中心也逐步推出了一系列面向企業(yè)的計算資源,比如針對CAD三維設(shè)計和中小規(guī)模CAE仿真計算的設(shè)計仿真云,支持海量中小企業(yè)實現(xiàn)“云上研發(fā)”,可以極低成本起步,推動中小企業(yè)高速發(fā)展,為國家中小企業(yè)發(fā)展打造堅實云上研發(fā)平臺。針對超算體系國產(chǎn)化的趨勢,他們也建立了基于國產(chǎn)芯片的集群(先導(dǎo)一號),與國產(chǎn)軟件廠商合作,通過云化的方式,幫助國產(chǎn)應(yīng)用更好地觸及用戶。雷鋒網(wǎng)

在郭宇看來,「讓計算不排隊」不僅是一句口號,更是切實、堅定的實踐。

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知

成立十年,這家由中科院孵化的超算中心如何榮登中國高性能計算機Top100榜單第三名?

分享:
相關(guān)文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說