0
隨著以ChatGPT為代表的AIGC技術(shù)迅猛發(fā)展,以及云計(jì)算、大數(shù)據(jù)、人工智能等技術(shù)的不斷變革,傳統(tǒng)數(shù)據(jù)中心正在向高算力、高密度的智算中心演進(jìn),同時(shí)帶來(lái)巨大能耗和碳排放,傳統(tǒng)的風(fēng)冷已經(jīng)無(wú)法滿足數(shù)據(jù)中心散熱需求。
IT 設(shè)備采用液冷并不是一件新鮮事物。在市場(chǎng)上已存在了幾十年。但是以往這種解決方案往往出現(xiàn)在較為小眾的應(yīng)用,今年由于一些趨勢(shì)和因素,使液冷成為更多主流 IT 用戶越來(lái)越青睞的制冷解決方案。
近日雷峰網(wǎng)與一眾媒體,在寧暢召開(kāi)“無(wú)憂煥液 智惠升級(jí)”媒體溝通會(huì)上,與寧暢信息產(chǎn)業(yè)有限公司總裁秦曉寧就液冷替換風(fēng)冷面臨的困境、解決方案以及發(fā)展趨勢(shì)進(jìn)行了深入的交流。
一、大模型對(duì)算力提出新要求
今年年初大模型爆火,行業(yè)進(jìn)入百模大戰(zhàn)甚至千模大戰(zhàn),而算力是訓(xùn)練大模型的重要因素之一。但是大模型又特別吃算力,在人工智能計(jì)算中,涉及較多的矩陣或向量的乘法和加法,專用性較高,所以不適合利用CPU進(jìn)行計(jì)算,而GPU是目前AI算力的主力。
秦曉寧表示,行業(yè)越是火熱我們?cè)揭潇o思考,一個(gè)通用計(jì)算機(jī)柜功耗目前就已經(jīng)達(dá)到了10kW,如果使用高功率密度的GPU,機(jī)房必須改造,我們建議至少上到40kW以上,如果想支持新技術(shù),“液冷”這件事情就非做不可,而不是嘗試。
但是改造數(shù)據(jù)中心,面臨著重重困難。一方面如果要新建數(shù)據(jù)中心,國(guó)家相關(guān)政策要求在PUE1.3以內(nèi),老數(shù)據(jù)中心不能不用;另一方面據(jù)相關(guān)數(shù)據(jù)顯示PUE高于1.5的占87%,要想降低PUE,也必須改造。
在演講中,秦曉寧指出過(guò)去液冷升級(jí)存在的三道難關(guān)。第一技術(shù)難,風(fēng)轉(zhuǎn)液冷首先要考驗(yàn)包括復(fù)雜部件液冷適配、漏液可靠性等在內(nèi)的綜合技術(shù);第二建設(shè)久,液冷升級(jí)涉及樓體、空間改造等多個(gè)環(huán)節(jié),周期長(zhǎng),產(chǎn)業(yè)鏈協(xié)同性較弱;第三成本高,用戶傾向于關(guān)注初期建設(shè)成本,往往忽略了液冷釋放的性能帶來(lái)的業(yè)務(wù)效益與節(jié)能效果。
其實(shí)當(dāng)機(jī)架功率密度為 10kW時(shí),采用傳統(tǒng)風(fēng)冷與基于 IT 機(jī)箱的浸沒(méi)式液冷相比,初始投資大致相等。但是當(dāng)按每機(jī)架 20kW和每機(jī)架 40kW 的方式部署液冷時(shí),結(jié)果顯示,采用液冷比傳統(tǒng)風(fēng)冷分別節(jié)省了 10%和 14%的投資成本。
“以前液冷是‘陽(yáng)春白雪’,只有需要高性能、大規(guī)模部署,資金充足的情況下才會(huì)采用這種方案?,F(xiàn)在之所以能夠普遍被廣大業(yè)界客戶、廠商接受,是因?yàn)镃PU和GPU功耗增長(zhǎng),讓大家不得不去把液冷技術(shù)下移普適化,”秦曉寧如是說(shuō)。
據(jù)了解,目前在雙碳的背景下,很多用戶對(duì)于液冷已經(jīng)認(rèn)可,比如金融和做科研的數(shù)據(jù)中心,
單臺(tái)機(jī)柜30kW、50kW都有;同時(shí)也有一小部分用戶還沒(méi)有認(rèn)知,不過(guò)數(shù)量較少。
二、 “液冷”普惠還需要走過(guò)一段艱難的路程
液冷是今年全面爆發(fā)的,有服務(wù)器的不一定有基礎(chǔ)設(shè)施能力,有基礎(chǔ)設(shè)施的不一定可以做好服務(wù)器。
秦曉寧指出,幾年前寧暢就開(kāi)始把液冷作為未來(lái)主要的產(chǎn)品和技術(shù)布局在做了。雖然各個(gè)廠家也開(kāi)始布局宣傳,但是寧暢已經(jīng)做了各行各業(yè)的差異化的大型數(shù)據(jù)中心的部署。
據(jù)秦曉寧介紹,液冷技術(shù)寧暢是從上往下開(kāi)發(fā),最初研發(fā)的是相變式液冷,后來(lái)是浸沒(méi)式非相變式液冷,然后是冷板液冷。寧暢是先把最難的攻克了,只有這樣才具備做能力將更復(fù)雜的技術(shù)產(chǎn)品帶到更廣泛的通用市場(chǎng),讓用戶適應(yīng)它、使用它。
據(jù)了解,針對(duì)過(guò)去液冷升級(jí)存在的難題寧暢推出“無(wú)憂煥液計(jì)劃”,旨在讓液冷從“奢侈”走向“普惠”。其中主要包括三檔套餐。一種是嘗鮮版,在24小時(shí)內(nèi),寧暢團(tuán)隊(duì)可實(shí)現(xiàn)風(fēng)冷服務(wù)器節(jié)點(diǎn)內(nèi)的液冷改造以及液冷機(jī)柜升級(jí);一種是升級(jí)版,提供全棧液冷模塊化解決方案,讓有強(qiáng)需求的客戶按需搭配;最后是尊享版,浸沒(méi)液冷全系統(tǒng)方案,數(shù)據(jù)中心可實(shí)現(xiàn)20%極致性能提升,30%極致節(jié)能效果優(yōu)化。
寧暢是傳統(tǒng)的服務(wù)器廠商,今年卻頻頻推出液冷方案。秦曉寧表示,寧暢最寶貴的就是經(jīng)驗(yàn),就跟人的歲數(shù)一樣,走過(guò)的路、吃過(guò)的虧多了,就知道下一步怎么走,如何解決下一步面臨的問(wèn)題。
據(jù)了解,寧暢已經(jīng)積攢了18萬(wàn)臺(tái)液冷的出貨經(jīng)驗(yàn),擁有完善的液冷設(shè)計(jì)庫(kù),另一方面寧暢液冷解決方案現(xiàn)已兼?zhèn)涓咝?、高密部署、更低噪音,自?dòng)補(bǔ)液智能化管理等優(yōu)點(diǎn)。
會(huì)上,秦曉寧希望在液冷這一大考中獲得100分,并作出解釋:100分的1是風(fēng)液轉(zhuǎn)換“次日達(dá)”;0是機(jī)房改造“0漏液”;最后一個(gè)0是“0耗散”,年度耗散3%趨近于0,省液體省錢。100分的另一層含義是希望可以用百分之百的精力和心思的投入,為用戶更好地實(shí)現(xiàn)液冷解決方案的態(tài)度。
但值得注意的是,目前廠商和用戶都面臨同一個(gè)問(wèn)題,那就是國(guó)內(nèi)現(xiàn)在還沒(méi)有統(tǒng)一的標(biāo)準(zhǔn),各個(gè)廠家各干各的,競(jìng)爭(zhēng)激烈;而對(duì)于用戶來(lái)說(shuō),設(shè)備的通用性、售后的維護(hù)都不是一件好事。而這個(gè)標(biāo)準(zhǔn)落地的過(guò)程可能要經(jīng)歷三、五年的周期。
談及未來(lái)液冷技術(shù)會(huì)如何發(fā)展,秦曉寧表示,今年市場(chǎng)對(duì)于算力的需求忽然增長(zhǎng),越來(lái)越多的客戶接受了液冷方案,但是受各種因素影響,切換的比例還沒(méi)有那么快。但是目前可以看到,下半年新建的一些數(shù)據(jù)中心更多已經(jīng)開(kāi)始采用液冷的方案。
要實(shí)現(xiàn)液冷技術(shù)的普惠化還有很長(zhǎng)一段路要走,而這段路需要寧暢以及更多的廠家從0到1淌出來(lái)。
(雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))雷峰網(wǎng))
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。