0
2023年,大模型的出現(xiàn)帶火了整個算力行業(yè)。
從行業(yè)發(fā)展的角度,算力已然成為全行業(yè)競爭的高地,似乎誰能擁有更多的算力,誰就能掌握更多的主動權(quán),無論是大型企業(yè)還是中小企業(yè)都希冀于通過獲取高質(zhì)量的算力,謀求新的業(yè)務(wù)創(chuàng)新,創(chuàng)造新的增長點;從數(shù)字經(jīng)濟發(fā)展的角度,算力作為一種新型生產(chǎn)力,已成為推動數(shù)字經(jīng)濟發(fā)展的核心力量,正強有力地支撐數(shù)字中國建設(shè)。
基于此,國內(nèi)企業(yè)也開始進行算力產(chǎn)業(yè)的布局,《2023胡潤中國數(shù)字技術(shù)算法算力百強榜》顯示,企業(yè)價值在1000億以上的企業(yè)共29家,其中騰訊控股、阿里巴巴、中國移動、抖音、華為、美團、螞蟻科技、比亞迪、拼多多、京東進入榜單前十。
從多方的支持下,較以往幾年,近兩年我國算力產(chǎn)業(yè)的發(fā)展明顯提速,據(jù)工信部數(shù)據(jù)顯示,截至2022年底,我國基礎(chǔ)設(shè)施算力規(guī)模達到180EFLOPS(每秒18000京次浮點運算),算力核心產(chǎn)業(yè)規(guī)模達1.8萬億元。另外,隨著數(shù)據(jù)中心、智能中心、超算中心等新型基礎(chǔ)設(shè)施加快部署,預計2023年中國基礎(chǔ)設(shè)施算力規(guī)模將增長至231EFLOPS。
但隨著AI、大數(shù)據(jù)等新型技術(shù)的迭代,企業(yè)對算力的需求不僅僅局限在基礎(chǔ)算力層面,還對智算、超算有了很大的需求。從目前的算力市場結(jié)構(gòu)看,受益于AI服務(wù)器需求的爆發(fā),智能算力超過基礎(chǔ)算力成為我國算力規(guī)模增長的主要驅(qū)動力。
而近兩年的算力需求的變化也是最好的例證,據(jù)中國信息通信研究院數(shù)據(jù),2021年中國智能算力規(guī)模、基礎(chǔ)算力規(guī)模、超算算力規(guī)模分別為104EFlops、95EFlops、3EFlops,分別占比51%、47%、1%。隨著生成式AI的發(fā)展以及人工智能大模型的應用落地,預計未來智能算力規(guī)模占比將進一步擴大。
基于此,我國在算力基礎(chǔ)設(shè)施扶持政策方面也在不斷調(diào)整。早在2013年到2016年,國家出臺的數(shù)據(jù)中心指導意見明確將全國劃分為四個區(qū)域,引導算力向更綠色,更集約的地區(qū)布局,2017年到2022年,在數(shù)據(jù)中心不斷優(yōu)化布局的基礎(chǔ)上,提出了綠色數(shù)據(jù)中心的發(fā)展要求。
2023年,《算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展行動計劃》則提出了很多關(guān)于完善綜合布局,提升算力高效運載的指導意見。
也就是說,通過十年的跨越,在政策和需求雙輪驅(qū)動的作用下,算力基礎(chǔ)設(shè)施即將進入高質(zhì)量發(fā)展階段。
何為高質(zhì)量發(fā)展?這個階段又會出現(xiàn)哪些明顯的特征?
中國信通院產(chǎn)業(yè)與規(guī)劃研究所副總工程師王青拆解道,其一,多元泛在。隨著人工智能、大數(shù)據(jù)等等技術(shù)的發(fā)展,我們的通用算力、智能算力等協(xié)同發(fā)展供給體系越來越顯現(xiàn)。怎么樣實現(xiàn)多元異構(gòu)泛在的算力,是未來高質(zhì)量發(fā)展的重要特征。
其二,智能敏捷。無論是東數(shù)西算、一體化大數(shù)據(jù)還是國家數(shù)據(jù)局的成立,都是為了推動算力成為像水和電一樣的基礎(chǔ)資源。在這種情況下,算力必須擁有像水電一樣彈性調(diào)度的優(yōu)勢,能根據(jù)用戶需求滿足多層次算力調(diào)度的體系,讓算力更泛在化,算力資源和需求能夠精準對接。
其三,普惠賦能,算力最終是要和千行百業(yè)、實體經(jīng)濟相融合,在融合的過程中,幫助企業(yè)創(chuàng)造價值。
其四,綠色安全,隨著算力需求的持續(xù)攀升,綠色化、低碳化對于算力的發(fā)展越來越重要,怎樣提高算力基礎(chǔ)設(shè)施的能源效率和低碳水平已然成為了重要課題。
與前三者相比,算力的綠色發(fā)展正在成為企業(yè)和社會關(guān)注的焦點話題,因為算力的持續(xù)攀升往往會帶來高能耗問題。
通用算力方面,以CPU為例,CPU能耗已經(jīng)從2019年的205瓦,演進到2022年的400到500瓦的規(guī)模,但是以傳統(tǒng)風冷的散熱方式,400瓦以上就會遇到一個巨大的挑戰(zhàn)。
智算方面,尤其是異構(gòu)計算,用于AI 的GPU芯片的功耗已經(jīng)從2017年的300瓦左右的規(guī)模,演變到2022年的700到800瓦的規(guī)模。而且單機芯片密度更高的GPU,在散熱方面會遇到更大的挑戰(zhàn)。
王青介紹道,根據(jù)測算,如果芯片的尺寸演進到10納米,整個芯片的性能提升一倍,它的功耗至少要提高30%到40%,也就是說,散熱能力決定了芯片的性能發(fā)揮,所以散熱能力對芯片性能的發(fā)揮至關(guān)重要。
由此可見,高能耗已然成為當前算力帶來高價值驅(qū)動力背后不可忽視的問題。所以綠色算力就成了算力高質(zhì)量發(fā)展的重要目標,是算力的綠色低碳追求。
那如何實現(xiàn)算力的綠色、可持續(xù)發(fā)展,一下成了迫在眉睫的事情。
其實反觀近幾年國家對算力的綠色發(fā)展,一直處于高度重視的程度,無論是政府還是各行業(yè)企業(yè)都做了大量的工作。
政府側(cè),工信部出臺的《新型數(shù)據(jù)中心發(fā)展三年行動計劃(2021—2023年)》提出,要加快提升算力算效水平,加快高性能、智能計算中心部署,推動CPU、GPU等異構(gòu)算力提升,逐步提高自主研發(fā)算力的部署比例,推進新型數(shù)據(jù)中心算力供應多元化,支撐各類智能應用...
2022年8月,工信部等七部委聯(lián)合印發(fā)《信息通信行業(yè)綠色低碳發(fā)展行動計劃(2022—2025年)》,提出到2025年,全國新建大型、超大型數(shù)據(jù)中心電能利用率(PUE)降到1.3以下。
2023年《數(shù)字中國建設(shè)整體布局規(guī)劃》提出,要系統(tǒng)優(yōu)化算力基礎(chǔ)設(shè)施布局,促進東西部算力高效互補和協(xié)同聯(lián)動,到2025年基本形成橫向打通、縱向貫通、協(xié)調(diào)有力的一體化推進格局。
企業(yè)端,諸如中國聯(lián)通GPU資源編排調(diào)度賦能綠色AI智算,通過打造AI算力綠色節(jié)能調(diào)度系統(tǒng),對AI算力的IT系統(tǒng)能耗進行全生命周期的細顆粒度管控,對AI算力進行能耗壓降。
中國電信選擇與能源企業(yè)合作,打造數(shù)字青海綠色大數(shù)據(jù)中心,自建分布式光伏+電化學儲能的綠電供應系統(tǒng),是全國首個100%清潔能源可溯源綠色大數(shù)據(jù)中心。
中國移動呼和浩特數(shù)據(jù)中心結(jié)合政策指引、內(nèi)部偏差控制、準確掌握電力市場動態(tài)及時交易和調(diào)整等舉措,避免核減綠電使用量,最大限度提高綠電使用比例。
浪潮信息則圍繞了綠色計算多維度的標準和整個全生命周期,構(gòu)建了豐富多元的評價體系和標準建設(shè),以推動綠色計算的產(chǎn)業(yè)化發(fā)展。標準建設(shè)方面,出臺了相應的技術(shù)標準指引和白皮書,評價體系方面,研發(fā)了大量綠色測評的工具、規(guī)范以及報告;綠色計算技術(shù)方面,貫穿綠色采購、綠色設(shè)計、清潔生產(chǎn),到綠色包裝運輸、綠色運營、回收處理等整個全生命周期做了技術(shù)方面創(chuàng)新,來推動綠色計算的發(fā)展。
但是最值得一提的是,近段時間,浪潮信息還與英特爾聯(lián)合發(fā)布了全球首個全液冷冷板服務(wù)器參考設(shè)計,并面向業(yè)界開放,為全球液冷產(chǎn)業(yè)鏈上下游提供極具價值的參考樣板,推動先進全液冷冷板解決方案在全球數(shù)據(jù)中心的大規(guī)模部署應用,實現(xiàn)數(shù)據(jù)中心更加綠色低碳可持續(xù)發(fā)展。基于該參考設(shè)計,浪潮信息推出全液冷冷板服務(wù)器,實現(xiàn)服務(wù)器部件接近100%液冷散熱,達到PUE值接近于1的極致水平。
究其原因,IDC數(shù)據(jù)顯示,冷板式液冷已經(jīng)成為液冷數(shù)據(jù)中心的主流,在中國液冷服務(wù)器市場中的占比達到90%。
隨著AIGC時代的到來,對CPU、AIPU、內(nèi)存、存儲等各類IT資源的部署密度提出更高的需求,傳統(tǒng)風冷制冷模式在換熱性能及能耗優(yōu)化方面逐步受限,全液冷冷板技術(shù)將成為大規(guī)模、高密度數(shù)據(jù)中心特別是智算中心的必然選擇。
然而,目前由于液冷產(chǎn)業(yè)標準不完善,產(chǎn)業(yè)鏈上各個企業(yè)技術(shù)路徑多種多樣、產(chǎn)品規(guī)格千差萬別,產(chǎn)品質(zhì)量良莠不齊,各液冷模塊無法兼容,讓用戶難以選擇,獲取成本和使用門檻高,液冷產(chǎn)業(yè)發(fā)展面臨阻礙。
而此次浪潮信息與英特爾聯(lián)合開放的全液冷冷板服務(wù)器參考設(shè)計,主要做了兩方面的革新:
一方面,基于雙方在液冷技術(shù)領(lǐng)域的創(chuàng)新能力,從系統(tǒng)級解決方案出發(fā),以模塊化解耦設(shè)計思維,兼容不同廠商和型號的計算設(shè)備,探索高能效、易于運維、使用更安全,兼容性更出色的全液冷冷板服務(wù)器設(shè)計;另一方面,通過設(shè)計開放,對產(chǎn)業(yè)探索全液冷冷板解決方案,提供新思路,加速全液冷冷板技術(shù)的普及和規(guī)模化應用,推動產(chǎn)業(yè)化進程。
可以說,在這個過程中,雙方均發(fā)揮了自身的優(yōu)勢,浪潮信息和英特爾憑借著在綠色低碳方面的實戰(zhàn)經(jīng)驗和積累的技術(shù)經(jīng)驗,實現(xiàn)了1+1大于2的效果。
在全液冷冷板技術(shù)方面,雙方共同探索,實現(xiàn)了液冷模塊解耦、冷板結(jié)構(gòu)全局設(shè)計等創(chuàng)新突破,并面向全產(chǎn)業(yè)進行開放,為蓬勃發(fā)展的液冷產(chǎn)業(yè)生態(tài)注入新的創(chuàng)新活力,打通了液冷規(guī)?;瘧玫淖詈笠还?。
雷峰網(wǎng)了解到,此次浪潮信息推出的全液冷冷板服務(wù)器,實現(xiàn)了對CPU、高功耗內(nèi)存、NVMe 硬盤、OCP 網(wǎng)卡、電源、PCIe 轉(zhuǎn)接卡和光模塊等服務(wù)器主要發(fā)熱部件的冷板全液冷覆蓋,PUE降至1.05以下,并通過“去空調(diào)化”節(jié)省30%以上的數(shù)據(jù)中心空間,充分滿足數(shù)據(jù)中心的高密度部署需求。
同時,該產(chǎn)品針對不同部件的結(jié)構(gòu)、材質(zhì)、工作溫度等差異化需求,創(chuàng)新設(shè)計了諸多系統(tǒng)部件級液冷解決方案,包含PSU、內(nèi)存、硬盤、擴展模塊等,靈活性更高,用戶可以按需選擇。
其中,首創(chuàng)的內(nèi)存枕木散熱器液冷方案結(jié)合了傳統(tǒng)風冷散熱和冷板散熱的優(yōu)勢,比現(xiàn)有的管路(Tubing)內(nèi)存液冷方案,更加易于組裝和維護,且通用性更強。憑借這些創(chuàng)新的液冷解決方案設(shè)計,浪潮信息全液冷冷板服務(wù)器將為客戶提供極致PUE的算力系統(tǒng),助力客戶在AIGC時代構(gòu)建更加綠色低碳的數(shù)字基礎(chǔ)設(shè)施,并推動液冷產(chǎn)業(yè)在全液冷冷板技術(shù)這一新興技術(shù)領(lǐng)域的實踐與探索。
(雷峰網(wǎng)(公眾號:雷峰網(wǎng))雷峰網(wǎng)雷峰網(wǎng))
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。