0
本文作者: 劉伊倫 | 2025-09-28 14:38 |
“存儲(chǔ)是保證大模型正常運(yùn)行的基礎(chǔ)。”平頭哥半導(dǎo)體產(chǎn)品總監(jiān)周冠鋒向雷峰網(wǎng)說到。
在大模型時(shí)代,全球正掀起大規(guī)模算力基建潮?!八懔?、算力,還是算力”的口號(hào)成為行業(yè)對(duì)這一趨勢的直白概括,不少人將算力視為最核心的競爭資源。
但鮮少有人意識(shí)到,大模型從千億參數(shù)訓(xùn)練到實(shí)時(shí)場景推理,每一步都需要EB級(jí)海量數(shù)據(jù)的持續(xù)供給,而這些數(shù)據(jù)的安全留存、高效調(diào)取,全依賴存儲(chǔ)系統(tǒng)的穩(wěn)定運(yùn)行,若缺乏高質(zhì)量、高可靠的存儲(chǔ)支撐,再強(qiáng)大的算力也會(huì)因“數(shù)據(jù)斷供”陷入“無米之炊”的困境。
這也恰恰點(diǎn)破了大模型時(shí)代技術(shù)基建的核心邏輯:看似聚焦“算力突破”的技術(shù)革命,實(shí)則離不開“存儲(chǔ)支撐”的底層托舉。
中國信通院最新出具的《2025先進(jìn)存力研究報(bào)告》指出,我國數(shù)據(jù)生產(chǎn)量逐年增長,存力建設(shè)卻略顯滯后,數(shù)據(jù)“應(yīng)存未存”現(xiàn)象凸顯。
在數(shù)據(jù)產(chǎn)量與存儲(chǔ)容量的規(guī)模方面,2023至2024年數(shù)據(jù)年產(chǎn)量由32.85ZB增至41.06ZB,增速達(dá)到25%,而數(shù)據(jù)存儲(chǔ)總量僅由1.73ZB提升至2.09ZB,增速為20.81%,數(shù)據(jù)存儲(chǔ)增量明顯落后于數(shù)據(jù)生產(chǎn)速度,存力缺口已然出現(xiàn)。
“國內(nèi)對(duì)智算算力的消納主要是圍繞大模型的訓(xùn)練、推理、微調(diào)及開發(fā),所以這并不單純是對(duì)于計(jì)算能力的價(jià)值體現(xiàn),而是算力+存力+網(wǎng)絡(luò)運(yùn)力的綜合能力體現(xiàn)。”某智算云頭部廠商負(fù)責(zé)人對(duì)雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))表示,也正因如此,在智算中心組網(wǎng)方案的合理性以及如何合理消納算力等方面,一旦出現(xiàn)不合理之處,在運(yùn)營過程中就會(huì)面臨瓶頸和問題。
某算力集群就曾因設(shè)計(jì)的計(jì)算訪存比過小,導(dǎo)致工作負(fù)載僅維持在10%,通過優(yōu)化存儲(chǔ)的性能,該集群提高到了20%-30%的使用范圍,改造設(shè)計(jì)后客戶數(shù)量大幅上升。
當(dāng)存力缺口成為制約算力效能釋放的關(guān)鍵瓶頸,當(dāng)存儲(chǔ)優(yōu)化對(duì)算力集群的價(jià)值已被實(shí)踐驗(yàn)證,如何系統(tǒng)性彌補(bǔ)存力短板?如何優(yōu)化存儲(chǔ)技術(shù)以實(shí)現(xiàn)大規(guī)模算力集群高效運(yùn)轉(zhuǎn)?平頭哥鎮(zhèn)岳510,正在為這些問題提供關(guān)鍵解決方案。
鎮(zhèn)岳510補(bǔ)齊阿里AI基建,實(shí)現(xiàn)「算力-存力-運(yùn)力」業(yè)務(wù)閉環(huán)
從政策加碼到企業(yè)競逐,AI基建已成為各國科技競爭的核心籌碼。
正如阿里巴巴集團(tuán)CEO吳泳銘在2025云棲大會(huì)上所指,未來五年全球AI累計(jì)投入金額將超過4萬億美元,這是人類歷史上最大規(guī)模的算力與研發(fā)投入。
2025年2月,阿里率先宣布未來三年投入超3800億元建設(shè)云計(jì)算和AI硬件基礎(chǔ)設(shè)施,七個(gè)月后,吳泳銘在云棲大會(huì)上再次強(qiáng)調(diào)這一規(guī)劃,并明確表示將追加更多投入。
真金白銀的投入已落地為具體動(dòng)作:僅過去四個(gè)季度,阿里在AI基礎(chǔ)設(shè)施和產(chǎn)品研發(fā)上的累計(jì)投入已超1000億元,2025年資本支出預(yù)計(jì)達(dá)1100-1200億元,其中700-800億元直接用于服務(wù)器采購與數(shù)據(jù)中心建設(shè)。
從擴(kuò)建墨西哥、日本等地的數(shù)據(jù)中心,到首次在巴西、法國、荷蘭布局云計(jì)算地域節(jié)點(diǎn),阿里的算力網(wǎng)絡(luò)正加速織密全球版圖,而這背后,亟需解決“算力-存力-運(yùn)力”的協(xié)同瓶頸。
若僅僅關(guān)注算力芯片的性能,就很容易面臨“內(nèi)存墻”等存儲(chǔ)領(lǐng)域的限制,無法充分發(fā)揮集群的性能。
這種瓶頸在大模型訓(xùn)練與推理場景中尤為突出:訓(xùn)練階段需頻繁讀取PB級(jí)數(shù)據(jù)集、寫入TB級(jí)Checkpoint(檢查點(diǎn))文件,推理場景中長上下文對(duì)話導(dǎo)致的KV緩存爆炸,都可能讓GPU陷入“空等數(shù)據(jù)”的閑置狀態(tài)。
為此,國內(nèi)各大廠商紛紛發(fā)力破局,鎮(zhèn)岳510的存在,補(bǔ)全了阿里及合作廠商在對(duì)先進(jìn)存力的需求,使數(shù)據(jù)從“產(chǎn)生-存儲(chǔ)-調(diào)用”形成高效閉環(huán)。
作為平頭哥推出的鎮(zhèn)岳510高性能SSD主控,其4μs超低時(shí)延比業(yè)界主流水平低30%以上,搭配340萬IOPS的超高隨機(jī)讀性能與14GB/s順序讀帶寬,可直接為GPU提供“無間斷數(shù)據(jù)供給”。
更關(guān)鍵的是,它通過“雙向適配”覆蓋全場景需求:向上支持pSLC模式,降低隨機(jī)讀時(shí)延,適配數(shù)據(jù)準(zhǔn)備階段的高頻隨機(jī)讀寫;向下兼容ZNS+QLC方案,通過分區(qū)順序?qū)懭胂厥臻_銷,兼顧冷數(shù)據(jù)存儲(chǔ)的大容量與低成本。
躋身存儲(chǔ)主控芯片第一梯隊(duì),鎮(zhèn)岳510如何打造「高性能、低成本」的AI存儲(chǔ)方案?
在阿里云大規(guī)模算力基建的實(shí)踐中,存儲(chǔ)與計(jì)算的協(xié)同效率始終是決定集群效能的核心命題。
“算力集群的計(jì)算過程是把數(shù)據(jù)從存儲(chǔ)搬運(yùn)到計(jì)算單元,計(jì)算完成后其中間結(jié)果以及存力結(jié)果會(huì)返存回存力集群,存力是不是能以更大的帶寬、更低的時(shí)延將數(shù)據(jù)搬運(yùn)到算力單元中進(jìn)行計(jì)算,將影響算力的利用率?!敝芄阡h表示。
由于計(jì)算集群會(huì)不定時(shí)發(fā)生故障,計(jì)算過程中需要定期進(jìn)行Checkpoint保存,更是對(duì)存儲(chǔ)性能的“壓力測試”,保存耗時(shí)越短、整個(gè)計(jì)算過程被中斷的時(shí)間越少,因集群故障導(dǎo)致的訓(xùn)練中斷風(fēng)險(xiǎn)就越低,業(yè)務(wù)連續(xù)性與可靠性也隨之增強(qiáng),從而進(jìn)一步提升計(jì)算的效率。
這一邏輯在阿里云的實(shí)際運(yùn)營中得到了深刻印證。
為平衡存儲(chǔ)成本與容量需求,阿里云曾廣泛采用HDD(機(jī)械硬盤)作為底層存儲(chǔ)介質(zhì),但HDD有限的帶寬與IOPS(每秒輸入輸出操作數(shù)),在大模型訓(xùn)練前的數(shù)據(jù)準(zhǔn)備、高頻次Checkpoint寫入等場景中顯得力不從心。
為突破瓶頸,需要在HDD上加一層緩存,以提升整個(gè)存儲(chǔ)集群的帶寬和IOPS。阿里云此前選用傲騰(Optane)作為緩存層核心,但隨著傲騰的逐步停產(chǎn),急需替代品作為緩存進(jìn)行持續(xù)供應(yīng)。
平頭哥鎮(zhèn)岳510通過對(duì)pSLC NAND(偽SLC NAND)技術(shù)的深度適配,不僅解決了阿里云的存儲(chǔ)性能瓶頸,還規(guī)避了傲騰停產(chǎn)造成的供應(yīng)鏈風(fēng)險(xiǎn)。
在云棲大會(huì)的演講中,平頭哥披露,基于鎮(zhèn)岳510的pSLC方案實(shí)現(xiàn)了對(duì)傲騰的性能超越,隨機(jī)讀帶寬提升17%,隨機(jī)寫IOPS提升4%。
更關(guān)鍵的是,這一方案打破了“高性能必高成本”的行業(yè)困境:在性能升級(jí)的同時(shí),SSD整體成本大幅降低,完美適配了阿里云對(duì)“高效能+低成本”的核心訴求,高度適配大語言模型訓(xùn)練前的數(shù)據(jù)準(zhǔn)備階段。如今,這一方案已在阿里云OSS(對(duì)象存儲(chǔ)服務(wù))等場景中開展灰度測試,意味著其技術(shù)成熟度與場景適配性已通過初步驗(yàn)證,即將進(jìn)入規(guī)?;瘧?yīng)用階段。
為了進(jìn)一步提供高性能、低成本的AI存儲(chǔ)方案,平頭哥與阿里云的深度合作,開展ZNS+QLC存儲(chǔ)解決方案的探索。QLC NAND作為高密度存儲(chǔ)介質(zhì),雖憑借每GB更低的成本成為大規(guī)模存儲(chǔ)場景的理想選擇,但傳統(tǒng)SSD主控對(duì)QLC的適配始終存在短板,隨機(jī)寫入時(shí)的寫放大效應(yīng)顯著,不僅導(dǎo)致性能波動(dòng),更縮短了SSD的使用壽命,讓QLC的成本優(yōu)勢難以充分釋放。
而ZNS(分區(qū)命名空間)技術(shù)的出現(xiàn),為解決這一痛點(diǎn)提供了方向:它通過將閃存劃分為獨(dú)立分區(qū),讓數(shù)據(jù)按分區(qū)順序?qū)懭?,從根源上減少垃圾回收操作,但如何讓ZNS與QLC深度協(xié)同成了又一命題。
鎮(zhèn)岳510針對(duì)ZNS+QLC方案進(jìn)行了底層架構(gòu)優(yōu)化:
一方面,通過定制化的分區(qū)管理算法,讓數(shù)據(jù)寫入嚴(yán)格匹配ZNS分區(qū)的順序特性,改善了傳統(tǒng)方案中的空間浪費(fèi)問題;
另一方面,鎮(zhèn)岳510內(nèi)置的智能磨損均衡機(jī)制,能根據(jù)QLC的擦寫壽命特性,動(dòng)態(tài)調(diào)整各分區(qū)的數(shù)據(jù)分布,避免單一分區(qū)過度損耗,延長QLC SSD的使用壽命。
更關(guān)鍵的是,這些優(yōu)化并未以性能妥協(xié)為代價(jià),完全滿足AI冷數(shù)據(jù)存儲(chǔ)、訓(xùn)練數(shù)據(jù)集歸檔等場景的性能需求。
鎮(zhèn)岳510的價(jià)值不止于AI場景,其對(duì)分布式存儲(chǔ)的深度支持,在阿里云EBS(彈性塊存儲(chǔ))等核心產(chǎn)品中也展現(xiàn)出優(yōu)勢。
分布式存儲(chǔ)作為云計(jì)算的底層基石,需要應(yīng)對(duì)多租戶、多場景的混合讀寫需求,對(duì)QoS(服務(wù)質(zhì)量,衡量存儲(chǔ)系統(tǒng)性能穩(wěn)定性與可靠性的關(guān)鍵指標(biāo))的穩(wěn)定性要求極高。
鎮(zhèn)岳510從硬件層面重構(gòu)了QoS保障機(jī)制:通過獨(dú)立的讀寫通道設(shè)計(jì),將隨機(jī)讀、順序?qū)?、混合讀寫等不同任務(wù)的資源需求進(jìn)行隔離,避免任務(wù)間的相互干擾;同時(shí),內(nèi)置的智能優(yōu)先級(jí)調(diào)度算法,能根據(jù) EBS 的業(yè)務(wù)場景動(dòng)態(tài)分配帶寬與IO資源,確保核心業(yè)務(wù)的時(shí)延優(yōu)先。
平頭哥在云棲大會(huì)現(xiàn)場的對(duì)比數(shù)據(jù)顯示,在混合讀寫場景下,鎮(zhèn)岳510為阿里云EBS提供99%時(shí)延表現(xiàn),意為在統(tǒng)計(jì)周期內(nèi),存儲(chǔ)系統(tǒng)處理混合讀寫請(qǐng)求時(shí),99%的請(qǐng)求響應(yīng)時(shí)間都能控制在某一特定時(shí)延值以內(nèi)。基于鎮(zhèn)岳510的EBS混合讀寫QoS 99%時(shí)延僅為兩款國外主流競品時(shí)延的56%和84%,時(shí)延明顯更短。
鎮(zhèn)岳510規(guī)?;荷罡⒗镌艵BS,驅(qū)動(dòng)高性能SSD發(fā)展
在商業(yè)世界里,技術(shù)不是唯一,實(shí)現(xiàn)規(guī)模化落地才能真正釋放產(chǎn)品的價(jià)值。
得益于背靠阿里云的天然優(yōu)勢,鎮(zhèn)岳510以“內(nèi)部深度應(yīng)用+外部生態(tài)合作”的雙輪驅(qū)動(dòng),從阿里云存儲(chǔ)的“芯” 底座走向全產(chǎn)業(yè)的存儲(chǔ)解決方案
阿里云EBS作為支撐千萬級(jí)云服務(wù)器的底層存儲(chǔ)服務(wù),是鎮(zhèn)岳510規(guī)模化應(yīng)用的關(guān)鍵場景之一。
鎮(zhèn)岳510通過硬件架構(gòu)優(yōu)化與智能調(diào)度算法,為EBS帶來了全方位的性能躍升:不僅大幅提升系統(tǒng)的IOPS(每秒輸入輸出操作數(shù))與吞吐帶寬,更在讀寫混合場景下實(shí)現(xiàn)關(guān)鍵突破,時(shí)延較行業(yè)其他主控壓縮92%,同等資源條件下,有效提升承載用戶的并發(fā)訪問量。
在內(nèi)部場景驗(yàn)證技術(shù)成熟度后,鎮(zhèn)岳510以“核心主控芯片”的身份向外延伸,與憶恒創(chuàng)源、得瑞領(lǐng)新、佰維存儲(chǔ)等頭部存儲(chǔ)廠商達(dá)成深度合作。
憶恒創(chuàng)源基于鎮(zhèn)岳510打造的PBlaze7 7A40系列企業(yè)級(jí)SSD,成為業(yè)內(nèi)首款實(shí)現(xiàn)4K隨機(jī)寫入100萬IOPS的企業(yè)級(jí)存儲(chǔ)產(chǎn)品。該系列SSD推出后,迅速切入多個(gè)應(yīng)用場景,支持大規(guī)模模型訓(xùn)練和推理任務(wù),優(yōu)化在線交易處理(OLTP)和數(shù)據(jù)分析性能,滿足金融、電商等行業(yè)需求,并且助力云服務(wù)提供商提升存儲(chǔ)效率,降低運(yùn)營成本。
依托鎮(zhèn)岳510芯片,得瑞領(lǐng)新推出了首款支持PCIe5.0接口的高性能NVMe SSD,即D8000 系列,能夠穩(wěn)定滿足 AI 訓(xùn)練、實(shí)時(shí)數(shù)據(jù)分析等高性能計(jì)算場景的嚴(yán)苛需求。
行業(yè)內(nèi)的技術(shù)探索從未停歇,平頭哥作為專注該領(lǐng)域研發(fā)的重要力量,也有著清晰且長遠(yuǎn)的規(guī)劃。
“平頭哥的存儲(chǔ)產(chǎn)品線目前還是聚焦于SSD主控芯片的研發(fā),因此平頭哥存儲(chǔ)產(chǎn)品線會(huì)持續(xù)開發(fā)下一代性能更強(qiáng)、容量更大、糾錯(cuò)性能更高、訪問時(shí)延更低的SSD主控芯片,來解決未來AI算力增加、算力規(guī)模增大之后對(duì)存儲(chǔ)帶來的性能更高的要求。”周冠鋒說道。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。