0
前年看跌,去年看漲,現(xiàn)在AI的發(fā)展正在重塑存儲產(chǎn)業(yè)的價值。
“2023年大家關心價格還會跌多久,去年大家關心價格還會漲多久,我想在今天除了價格以外,大家可能會更關心存儲的價值還有多少。”深圳市閃存市場資訊有限公司總經(jīng)理邰煒在MemoryS 2025上表示,“而這也是今年大會的主題‘存儲格局,價值重塑’?!?/strong>
從ChatGPT到DeepSeek,多模態(tài)、大模型的發(fā)展讓AGI不再遙不可及,算力的爆發(fā)帶來了存力的增長。高帶寬、高容量及低功耗,市場對存儲提出了更多的要求,也讓存儲站上了更重要的位置,邰煒說:“我們必須承認AI讓存儲變得更加基礎、更加關鍵。”
先進的存力成為AI發(fā)展的關鍵要素。
HBM在全部DRAM產(chǎn)業(yè)中的占比已經(jīng)將近30%,由于其用量的增加,2025年DRAM市場將達到2880億GB的當量。英偉達GPU架構的再次升級將帶動HBM正式進入HBM3e時代,2026年HBM4的出現(xiàn)也將帶來更多定制化需求。
QLC時代也已經(jīng)提前到來。邰煒表示:“預計今年QLC將占接近20%的產(chǎn)能,32TB的企業(yè)級SSD將實現(xiàn)大規(guī)模量產(chǎn),QLC在手機端的應用也將迎來突破,這讓存儲市場規(guī)模達到1670億美元,并且將繼續(xù)保持增長。”
當然,PCIe5.0也成為了存儲廠商繞不開的話題,主流服務器平臺已經(jīng)全面支持DDR5和PCIe5.0,其在訓練時間上相比上一代有明顯的縮短,今年部分廠商的PCIe5.0搭載率將達到30%。
AI正在點燃存儲市場,邰煒直言:“對于很多企業(yè)而言,關鍵不在把控行情,緊跟需求、加大技術投入以及選擇正確的路線才是真正的難點?!?/strong>
在技術路線上,NAND將繼續(xù)朝更高堆疊發(fā)展,今年將步入300層以上的時代,同時混合鍵合技術也已成為NAND閃存重要的技術發(fā)展方向。在存儲產(chǎn)品上,DeepSeek帶來開源和更低成本的AI方案,這使得一體機熱銷。隨著行業(yè)大模型的應用以及端側模型的加速落地,內(nèi)置DeepSeek的一體機已經(jīng)成為一個真正的賣點。
從技術、產(chǎn)品到解決方案,存儲行業(yè)正在適應AI帶來的新變化。
高帶寬、大容量、低功耗,SSD主控芯片如何適應AI需求?
平頭哥產(chǎn)品總監(jiān)周冠鋒在MemoryS上表示,團隊梳理了AI數(shù)據(jù)從收集、清洗到訓練的完整鏈條,發(fā)現(xiàn)AI對存力的需求在每個領域都有所提升,存儲產(chǎn)品要滿足這些需求,實現(xiàn)起來頗具挑戰(zhàn) 。
面對AI帶來的存力需求,如果單純從芯片堆料的角度出發(fā),很難制造出優(yōu)秀的芯片,技術的優(yōu)化和適配才是正解。周冠鋒表示:“對于一個SSD主控芯片來說,最核心有兩點,一是芯片架構,二是核心算法?!?/strong>
芯片架構決定任務處理分配方式,如何通過架構創(chuàng)新實現(xiàn)時延降低?
周冠鋒告訴雷峰網(wǎng):“我們打造了‘軟硬件深度融合’架構,將適配硬件的任務用可編程硬件模塊實現(xiàn),不確定性任務由固件處理?!?在此架構下,表項、隊列、Buffer 管理均通過硬件完成,錯誤處理與地址分配則由軟件負責,讓主控芯片實現(xiàn)4微秒的時延。
算法創(chuàng)新決定產(chǎn)品性能的上限,SSD芯片的核心算法有兩個,一是數(shù)據(jù)糾錯算法,二是介質應用算法。
數(shù)據(jù)糾錯算法要求同時具備高能效、強糾錯能力以及易于硬件實現(xiàn),具有很高的技術挑戰(zhàn)。周冠鋒表示:“通過對BF+NMS算法進行pipeline(流水線)整合,我們實現(xiàn)了高速率的同時保留了NMS的高糾錯能力?!?/p>
而關于介質應用算法如何最快找到最佳電壓,使NAND原始誤碼率降到最低?
“我們獨創(chuàng)了拋物線擬合算法,實現(xiàn)最多只需要四次retry搜索就可以找到拋物線的極小值點,帶來的效果是更低的時延、更低的SSD功耗以及更好的QOS?!?/strong>周冠鋒對雷峰網(wǎng)表示。
商業(yè)化是技術的目標之一,產(chǎn)品力硬也要面臨如何落地的拷問。對于平頭哥鎮(zhèn)岳510的商業(yè)化進程,周冠鋒稱:“鎮(zhèn)岳510已經(jīng)在阿里云的EBS業(yè)務大規(guī)模上線,并且與行業(yè)內(nèi)存儲廠商憶恒創(chuàng)源、得瑞領新及佰維存儲開展合作?!?/p>
端側模型加速落地,存儲如何適配本地化部署?
DeepSeek的出現(xiàn)讓終端側AI的表現(xiàn)超越了一年前僅能在云端運行的模型,有判斷稱,AI推理和處理正在全面向終端側轉移。
芯片工程師哲宇告訴雷峰網(wǎng)(公眾號:雷峰網(wǎng)):“在資源受限的端側,有了DeepSeek的蒸餾模型之后,原來只能部署7B模型的場景,現(xiàn)在能達到14B模型的效果,端側AI的能力上了一個臺階。”
技術路徑成為現(xiàn)實,實際的使用場景則讓需求落地。AI軟件工程師楷杰告訴雷峰網(wǎng):“本地化部署大模型的核心優(yōu)勢在于數(shù)據(jù)安全,很多企業(yè)的數(shù)據(jù)涉及公司機密,不適合采用云端的解決方案?!?/p>
本地化部署的需求帶火了一體機,一體機將計算、存儲及網(wǎng)絡等多種功能集成于單一設備中,為數(shù)據(jù)安全及隱私性提供了高度適配的解決方案,但性能瓶頸、存儲容量以及散熱等問題也亟待解決。
銓興科技董事長黃少娃告訴雷峰網(wǎng):“預訓練后超大模型不是直接進入推理,還需進行后訓練才能成為真正安全私有的AI模型?;谀P途薮蟮膮?shù)量,通常市面上的后訓練解決方案需要大量的顯卡,造成后訓練成本昂貴。我們通過利用超顯存融合技術開發(fā)添翼AI擴容卡,將顯存空間擴大了20倍,結合AI Link算法平臺,銓興的訓推一體解決方案實現(xiàn)降本90%,減少能耗和實現(xiàn)數(shù)據(jù)的安全。同時利用我們的算法平臺,實現(xiàn)DeepSeek推理并發(fā)性能提高50%?!?/strong>
作為市面上第一家推出適配DeepSeek滿血版訓推一體機產(chǎn)品的公司,黃少娃告訴雷峰網(wǎng):“671B的模型部署如果排列168張顯卡,算力大概只用到1/3,會出現(xiàn)顯存不夠,算力浪費的現(xiàn)象?!?/p>
實現(xiàn)算力、存儲和功耗的平衡,產(chǎn)品設計是一個有效的解決方案。“我們把顯卡的數(shù)量從168張高階顯卡減少到16張中低階的顯卡,顯卡數(shù)量可以降本90%,再搭載銓興添翼AI擴容卡以及銓興AI Link算法平臺,2臺服務器就可以實現(xiàn)DeepSeek滿血版模型的訓推一體部署?!?/p>
銓興科技訓推一體方案可以助力垂域模型和部署本地端AI訓練,黃少娃稱:“現(xiàn)在的客戶主要集中在政府、教育、金融、法律和中小企業(yè)等領域?!?/strong>
面對產(chǎn)業(yè)AI化,存儲廠商如何提供全套解決方案?
云端大模型和端側小模型之外,傳統(tǒng)產(chǎn)業(yè)智能化帶來的存儲需求被較少的關注,產(chǎn)業(yè)側要的不是單獨的技術或者產(chǎn)品,而是一個整體的解決方案。
“面對產(chǎn)業(yè)AI化,我們推出涵蓋傳感器、SSD、加速卡、系統(tǒng)整合軟件及AI管理軟件的整套解決方案?!币硕H全球嵌入式閃存事業(yè)部總經(jīng)理吳錫熙說,“我們的邊緣側AI布局策略是用堆積木的方式將產(chǎn)品線進行整合,讓客戶使用一站式的端側AI落地方案?!?/strong>
產(chǎn)業(yè)側AI的應用,擴容是趨勢所在。而擴容勢必帶來功耗的上升,如何提供一個更具性價比的解決方案?
“不管有沒有AI,擴容都是一條沒有異議的道路?!?/strong>吳錫熙告訴雷峰網(wǎng),“現(xiàn)在市場都在談QLC就是為了突破容量極限,傳輸速度越來越快不一定意味著功耗變大,用更先進制程去做主控芯片也可以降低功耗?!?/p> 宜鼎國際中國分公司總經(jīng)理游禮印補充道:“實現(xiàn)極致的能耗比很重要,但對很多客戶而言,成本是更重要的一個考慮因素,現(xiàn)在能做的是提供給客戶一個相對兼容的解決方案,如果不計成本的話,能耗比肯定可以做得更好?!?/p> 落地產(chǎn)業(yè)的全套解決方案,意味著其專業(yè)化程度相比一體機更上一個層級。游禮印認為,一體機偏消費性質,真正做B端的產(chǎn)品要高穩(wěn)定性、高定制化,一體機通用性高,產(chǎn)品出問題可能直接給客戶換貨即可。但B端客戶更關注能否切實解決其面臨的問題,而非以舊換新。 AI帶火的不只一體機,整個存儲市場都處于上升期。 “國內(nèi)存儲市場其實還在逐步去庫存的階段,下半年的需求會更好,宜鼎對市場價格的反應采取比較符合行業(yè)的做法,不會急漲急跌,會根據(jù)客戶的需求去調(diào)整?!庇味Y印告訴雷峰網(wǎng),“各個行業(yè)對智能應用的落地需求和探索越來越多,華南和華東這兩個市場的跡象尤為明顯?!?/strong> 雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉載。詳情見轉載須知。