0
本文作者: 劉伊倫 | 2025-03-19 18:44 |
前年看跌,去年看漲,現(xiàn)在AI的發(fā)展正在重塑存儲(chǔ)產(chǎn)業(yè)的價(jià)值。
“2023年大家關(guān)心價(jià)格還會(huì)跌多久,去年大家關(guān)心價(jià)格還會(huì)漲多久,我想在今天除了價(jià)格以外,大家可能會(huì)更關(guān)心存儲(chǔ)的價(jià)值還有多少。”深圳市閃存市場(chǎng)資訊有限公司總經(jīng)理邰煒在MemoryS 2025上表示,“而這也是今年大會(huì)的主題‘存儲(chǔ)格局,價(jià)值重塑’?!?/strong>
從ChatGPT到DeepSeek,多模態(tài)、大模型的發(fā)展讓AGI不再遙不可及,算力的爆發(fā)帶來了存力的增長。高帶寬、高容量及低功耗,市場(chǎng)對(duì)存儲(chǔ)提出了更多的要求,也讓存儲(chǔ)站上了更重要的位置,邰煒說:“我們必須承認(rèn)AI讓存儲(chǔ)變得更加基礎(chǔ)、更加關(guān)鍵。”
先進(jìn)的存力成為AI發(fā)展的關(guān)鍵要素。
HBM在全部DRAM產(chǎn)業(yè)中的占比已經(jīng)將近30%,由于其用量的增加,2025年DRAM市場(chǎng)將達(dá)到2880億GB的當(dāng)量。英偉達(dá)GPU架構(gòu)的再次升級(jí)將帶動(dòng)HBM正式進(jìn)入HBM3e時(shí)代,2026年HBM4的出現(xiàn)也將帶來更多定制化需求。
QLC時(shí)代也已經(jīng)提前到來。邰煒表示:“預(yù)計(jì)今年QLC將占接近20%的產(chǎn)能,32TB的企業(yè)級(jí)SSD將實(shí)現(xiàn)大規(guī)模量產(chǎn),QLC在手機(jī)端的應(yīng)用也將迎來突破,這讓存儲(chǔ)市場(chǎng)規(guī)模達(dá)到1670億美元,并且將繼續(xù)保持增長。”
當(dāng)然,PCIe5.0也成為了存儲(chǔ)廠商繞不開的話題,主流服務(wù)器平臺(tái)已經(jīng)全面支持DDR5和PCIe5.0,其在訓(xùn)練時(shí)間上相比上一代有明顯的縮短,今年部分廠商的PCIe5.0搭載率將達(dá)到30%。
AI正在點(diǎn)燃存儲(chǔ)市場(chǎng),邰煒直言:“對(duì)于很多企業(yè)而言,關(guān)鍵不在把控行情,緊跟需求、加大技術(shù)投入以及選擇正確的路線才是真正的難點(diǎn)?!?/strong>
在技術(shù)路線上,NAND將繼續(xù)朝更高堆疊發(fā)展,今年將步入300層以上的時(shí)代,同時(shí)混合鍵合技術(shù)也已成為NAND閃存重要的技術(shù)發(fā)展方向。在存儲(chǔ)產(chǎn)品上,DeepSeek帶來開源和更低成本的AI方案,這使得一體機(jī)熱銷。隨著行業(yè)大模型的應(yīng)用以及端側(cè)模型的加速落地,內(nèi)置DeepSeek的一體機(jī)已經(jīng)成為一個(gè)真正的賣點(diǎn)。
從技術(shù)、產(chǎn)品到解決方案,存儲(chǔ)行業(yè)正在適應(yīng)AI帶來的新變化。
高帶寬、大容量、低功耗,SSD主控芯片如何適應(yīng)AI需求?
平頭哥產(chǎn)品總監(jiān)周冠鋒在MemoryS上表示,團(tuán)隊(duì)梳理了AI數(shù)據(jù)從收集、清洗到訓(xùn)練的完整鏈條,發(fā)現(xiàn)AI對(duì)存力的需求在每個(gè)領(lǐng)域都有所提升,存儲(chǔ)產(chǎn)品要滿足這些需求,實(shí)現(xiàn)起來頗具挑戰(zhàn) 。
面對(duì)AI帶來的存力需求,如果單純從芯片堆料的角度出發(fā),很難制造出優(yōu)秀的芯片,技術(shù)的優(yōu)化和適配才是正解。周冠鋒表示:“對(duì)于一個(gè)SSD主控芯片來說,最核心有兩點(diǎn),一是芯片架構(gòu),二是核心算法。”
芯片架構(gòu)決定任務(wù)處理分配方式,如何通過架構(gòu)創(chuàng)新實(shí)現(xiàn)時(shí)延降低?
周冠鋒告訴雷峰網(wǎng):“我們打造了‘軟硬件深度融合’架構(gòu),將適配硬件的任務(wù)用可編程硬件模塊實(shí)現(xiàn),不確定性任務(wù)由固件處理?!?在此架構(gòu)下,表項(xiàng)、隊(duì)列、Buffer 管理均通過硬件完成,錯(cuò)誤處理與地址分配則由軟件負(fù)責(zé),讓主控芯片實(shí)現(xiàn)4微秒的時(shí)延。
算法創(chuàng)新決定產(chǎn)品性能的上限,SSD芯片的核心算法有兩個(gè),一是數(shù)據(jù)糾錯(cuò)算法,二是介質(zhì)應(yīng)用算法。
數(shù)據(jù)糾錯(cuò)算法要求同時(shí)具備高能效、強(qiáng)糾錯(cuò)能力以及易于硬件實(shí)現(xiàn),具有很高的技術(shù)挑戰(zhàn)。周冠鋒表示:“通過對(duì)BF+NMS算法進(jìn)行pipeline(流水線)整合,我們實(shí)現(xiàn)了高速率的同時(shí)保留了NMS的高糾錯(cuò)能力?!?/p>
而關(guān)于介質(zhì)應(yīng)用算法如何最快找到最佳電壓,使NAND原始誤碼率降到最低?
“我們獨(dú)創(chuàng)了拋物線擬合算法,實(shí)現(xiàn)最多只需要四次retry搜索就可以找到拋物線的極小值點(diǎn),帶來的效果是更低的時(shí)延、更低的SSD功耗以及更好的QOS?!?/strong>周冠鋒對(duì)雷峰網(wǎng)表示。
商業(yè)化是技術(shù)的目標(biāo)之一,產(chǎn)品力硬也要面臨如何落地的拷問。對(duì)于平頭哥鎮(zhèn)岳510的商業(yè)化進(jìn)程,周冠鋒稱:“鎮(zhèn)岳510已經(jīng)在阿里云的EBS業(yè)務(wù)大規(guī)模上線,并且與行業(yè)內(nèi)存儲(chǔ)廠商憶恒創(chuàng)源、得瑞領(lǐng)新及佰維存儲(chǔ)開展合作?!?/p>
端側(cè)模型加速落地,存儲(chǔ)如何適配本地化部署?
DeepSeek的出現(xiàn)讓終端側(cè)AI的表現(xiàn)超越了一年前僅能在云端運(yùn)行的模型,有判斷稱,AI推理和處理正在全面向終端側(cè)轉(zhuǎn)移。
芯片工程師哲宇告訴雷峰網(wǎng):“在資源受限的端側(cè),有了DeepSeek的蒸餾模型之后,原來只能部署7B模型的場(chǎng)景,現(xiàn)在能達(dá)到14B模型的效果,端側(cè)AI的能力上了一個(gè)臺(tái)階?!?/p>
技術(shù)路徑成為現(xiàn)實(shí),實(shí)際的使用場(chǎng)景則讓需求落地。AI軟件工程師楷杰告訴雷峰網(wǎng):“本地化部署大模型的核心優(yōu)勢(shì)在于數(shù)據(jù)安全,很多企業(yè)的數(shù)據(jù)涉及公司機(jī)密,不適合采用云端的解決方案?!?/p>
本地化部署的需求帶火了一體機(jī),一體機(jī)將計(jì)算、存儲(chǔ)及網(wǎng)絡(luò)等多種功能集成于單一設(shè)備中,為數(shù)據(jù)安全及隱私性提供了高度適配的解決方案,但性能瓶頸、存儲(chǔ)容量以及散熱等問題也亟待解決。
銓興科技董事長黃少娃告訴雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng)):“預(yù)訓(xùn)練后超大模型不是直接進(jìn)入推理,還需進(jìn)行后訓(xùn)練才能成為真正安全私有的AI模型。基于模型巨大的參數(shù)量,通常市面上的后訓(xùn)練解決方案需要大量的顯卡,造成后訓(xùn)練成本昂貴。我們通過利用超顯存融合技術(shù)開發(fā)添翼AI擴(kuò)容卡,將顯存空間擴(kuò)大了20倍,結(jié)合AI Link算法平臺(tái),銓興的訓(xùn)推一體解決方案實(shí)現(xiàn)降本90%,減少能耗和實(shí)現(xiàn)數(shù)據(jù)的安全。同時(shí)利用我們的算法平臺(tái),實(shí)現(xiàn)DeepSeek推理并發(fā)性能提高50%?!?/strong>
作為市面上第一家推出適配DeepSeek滿血版訓(xùn)推一體機(jī)產(chǎn)品的公司,黃少娃告訴雷峰網(wǎng):“671B的模型部署如果排列168張顯卡,算力大概只用到1/3,會(huì)出現(xiàn)顯存不夠,算力浪費(fèi)的現(xiàn)象?!?/p>
實(shí)現(xiàn)算力、存儲(chǔ)和功耗的平衡,產(chǎn)品設(shè)計(jì)是一個(gè)有效的解決方案。“我們把顯卡的數(shù)量從168張高階顯卡減少到16張中低階的顯卡,顯卡數(shù)量可以降本90%,再搭載銓興添翼AI擴(kuò)容卡以及銓興AI Link算法平臺(tái),2臺(tái)服務(wù)器就可以實(shí)現(xiàn)DeepSeek滿血版模型的訓(xùn)推一體部署?!?/p>
銓興科技訓(xùn)推一體方案可以助力垂域模型和部署本地端AI訓(xùn)練,黃少娃稱:“現(xiàn)在的客戶主要集中在政府、教育、金融、法律和中小企業(yè)等領(lǐng)域?!?/strong>
面對(duì)產(chǎn)業(yè)AI化,存儲(chǔ)廠商如何提供全套解決方案?
云端大模型和端側(cè)小模型之外,傳統(tǒng)產(chǎn)業(yè)智能化帶來的存儲(chǔ)需求被較少的關(guān)注,產(chǎn)業(yè)側(cè)要的不是單獨(dú)的技術(shù)或者產(chǎn)品,而是一個(gè)整體的解決方案。
“面對(duì)產(chǎn)業(yè)AI化,我們推出涵蓋傳感器、SSD、加速卡、系統(tǒng)整合軟件及AI管理軟件的整套解決方案?!币硕H全球嵌入式閃存事業(yè)部總經(jīng)理吳錫熙說,“我們的邊緣側(cè)AI布局策略是用堆積木的方式將產(chǎn)品線進(jìn)行整合,讓客戶使用一站式的端側(cè)AI落地方案?!?/strong>
產(chǎn)業(yè)側(cè)AI的應(yīng)用,擴(kuò)容是趨勢(shì)所在。而擴(kuò)容勢(shì)必帶來功耗的上升,如何提供一個(gè)更具性價(jià)比的解決方案?
“不管有沒有AI,擴(kuò)容都是一條沒有異議的道路?!?/strong>吳錫熙告訴雷峰網(wǎng),“現(xiàn)在市場(chǎng)都在談QLC就是為了突破容量極限,傳輸速度越來越快不一定意味著功耗變大,用更先進(jìn)制程去做主控芯片也可以降低功耗?!?/p> 宜鼎國際中國分公司總經(jīng)理游禮印補(bǔ)充道:“實(shí)現(xiàn)極致的能耗比很重要,但對(duì)很多客戶而言,成本是更重要的一個(gè)考慮因素,現(xiàn)在能做的是提供給客戶一個(gè)相對(duì)兼容的解決方案,如果不計(jì)成本的話,能耗比肯定可以做得更好?!?/p> 落地產(chǎn)業(yè)的全套解決方案,意味著其專業(yè)化程度相比一體機(jī)更上一個(gè)層級(jí)。游禮印認(rèn)為,一體機(jī)偏消費(fèi)性質(zhì),真正做B端的產(chǎn)品要高穩(wěn)定性、高定制化,一體機(jī)通用性高,產(chǎn)品出問題可能直接給客戶換貨即可。但B端客戶更關(guān)注能否切實(shí)解決其面臨的問題,而非以舊換新。 AI帶火的不只一體機(jī),整個(gè)存儲(chǔ)市場(chǎng)都處于上升期。 “國內(nèi)存儲(chǔ)市場(chǎng)其實(shí)還在逐步去庫存的階段,下半年的需求會(huì)更好,宜鼎對(duì)市場(chǎng)價(jià)格的反應(yīng)采取比較符合行業(yè)的做法,不會(huì)急漲急跌,會(huì)根據(jù)客戶的需求去調(diào)整?!庇味Y印告訴雷峰網(wǎng),“各個(gè)行業(yè)對(duì)智能應(yīng)用的落地需求和探索越來越多,華南和華東這兩個(gè)市場(chǎng)的跡象尤為明顯?!?/strong> 雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。