0
2023年初,大模型呼嘯而來,給人的震撼前所未有。
而在大模型時代浸潤一年后的今天,業(yè)內(nèi)基本達(dá)成共識:大模型就是一趟加速狂奔列車,如果趕上,能享受時代帶來的一大波紅利,必須搶先入局,拿到這趟車的車票。
做大模型的人紛至沓來,大模型的產(chǎn)業(yè)鏈上下游也迎來前所未有大爆發(fā),其中,讓人感知最深就是算力?!澳募以茝S囤卡比較多”、“A100、A800根本沒貨”..... 算力緊俏的話語經(jīng)常聽到。
得算力得天下,國內(nèi)這一輪大模型都在圍繞算力奔忙,許多投資者遵循這一邏輯,購買相關(guān)資產(chǎn)配置,算力公司的市值也由此大漲,而許多做算力相關(guān)的渠道商,也因?yàn)檫@一波大模型賺得盆滿缽滿。
聯(lián)想凌拓首席執(zhí)行官 陸大昕
實(shí)際上,大模型帶來的機(jī)會遠(yuǎn)不止在算力,隨著大模型深入發(fā)展,大模型下一個需求大爆發(fā)在于存儲。近期,雷峰網(wǎng)(公眾號:雷峰網(wǎng))近期參加聯(lián)想凌拓2024技術(shù)大會。聯(lián)想凌拓首席執(zhí)行官陸大昕在演講中表示:“數(shù)據(jù)怎么存儲、怎么管理、怎么保證數(shù)據(jù)安全……這些都是后續(xù)大模型建設(shè)中的剛需。”
如果將大模型比作孩子,那么數(shù)據(jù)就是營養(yǎng)豐富的菜肴。只有提供足夠和高質(zhì)量的數(shù)據(jù),這個“孩子”才能健康成長,變得更加強(qiáng)壯和聰明。數(shù)據(jù)存儲則像是烹飪這些菜肴的大廚,需要精心準(zhǔn)備和烹制,以確保數(shù)據(jù)的質(zhì)量和豐富性。
大模型對數(shù)據(jù)管理的要求,總結(jié)下來就幾點(diǎn),第一是,數(shù)據(jù)存儲容量要更大。
相比于傳統(tǒng)AI的需求,大模型的場景具有數(shù)據(jù)量大、參數(shù)規(guī)模大、訓(xùn)練周期長等特點(diǎn)。相對應(yīng)的,它對存力提出了更高的要求,更加強(qiáng)調(diào)高吞吐、高IOPS、高帶寬、低延時等極致性能。
近期,很多數(shù)據(jù)存儲商動作不斷,接連推出了大模型時代AI存儲新品,為基礎(chǔ)模型訓(xùn)練、行業(yè)模型訓(xùn)練、細(xì)分場景模型訓(xùn)練推理提供數(shù)據(jù)管理支持。
此次大會上,聯(lián)想凌拓推出了NetApp AFF C系列、 NetApp ASA A系列、 NetApp ASA C系列、Lenovo ThinkSystem DG系列及Lenovo ThinkSystem DM3010H企業(yè)級存儲陣列,并優(yōu)化升級MagnaScale數(shù)據(jù)管理平臺V4.0。
聯(lián)想凌拓產(chǎn)品管理與營銷高級總監(jiān) 林佑聲
其中新推出的NetApp AFF C系列在適應(yīng)大模型的存儲容量上有了很大的改進(jìn)。“新一代的SSD最小容量是15TB,未來還會推出30TB的SSD?!甭?lián)想凌拓產(chǎn)品管理與營銷高級總監(jiān)林佑聲稱。“在2U的空間可以提供1.5PB的全閃容量,它能夠提極高的高性能以及大容量,能耗可以降低85%,占地面積可以大幅下降95%?!?/p>
與此同時,大模型的訓(xùn)練還需要存大量的圖片、語音等非結(jié)構(gòu)化數(shù)據(jù)。NetApp AFF C系列秉承了ONTAP完全統(tǒng)一的數(shù)據(jù)管理概念,統(tǒng)一了文件、對象、數(shù)據(jù)塊等多項(xiàng)數(shù)據(jù)類型,實(shí)現(xiàn)在AI復(fù)雜數(shù)據(jù)環(huán)境中幫助客戶去做簡化。
第二是數(shù)據(jù)處理速度要快。海量數(shù)據(jù)的處理涉及多個環(huán)節(jié),包括數(shù)據(jù)的收集與整理、訓(xùn)練與計算,以及應(yīng)用的部署與相關(guān)服務(wù)的提供。這其中,數(shù)據(jù)從邊緣到數(shù)據(jù)中心,再到云端的流動,以及各種不同類型的數(shù)據(jù)管理,都構(gòu)成了復(fù)雜的數(shù)據(jù)環(huán)境。而大模型訓(xùn)練場景卻要求在幾個小時內(nèi)就要完成任務(wù)。在這樣的背景下,簡化數(shù)據(jù)管理顯得尤為重要。
在聯(lián)想凌拓技術(shù)大會上,雷峰網(wǎng)了解到,升級后的聯(lián)想凌拓MagnaScale 4.0秉承了Data Fabric的戰(zhàn)略思想,讓數(shù)據(jù)流動更加便捷,在存儲平臺的內(nèi)部,實(shí)現(xiàn)了數(shù)據(jù)熱度的智能分層,支持一鍵上云和一鍵下云,釋放了數(shù)據(jù)的流動性。目前MagnaScale已廣泛服務(wù)于在醫(yī)療的PACS、制造業(yè)的自動檢測、生命科學(xué)等領(lǐng)域中應(yīng)用。
僅僅強(qiáng)調(diào)數(shù)據(jù)容量和處理速度還并不夠,對于企業(yè)而言,還需要考慮落地與成本問題。在這次大會上,雷峰網(wǎng)注意到,聯(lián)想凌拓展示了在智能制造、智慧醫(yī)療、智能交通系統(tǒng)以及智慧金融行業(yè)的解決方案。
聯(lián)想凌拓智能制造展區(qū)
其中,在智能制造行業(yè),聯(lián)想凌拓采用工業(yè)智能質(zhì)檢系統(tǒng),通過采用高性能、高可靠的 NetApp ONTAP NAS,自研的 Lenovo ThinkSystem DXN 分布式存儲一體機(jī),提供卓越性價比的歸檔存儲空間。
聯(lián)想凌拓智慧醫(yī)院展區(qū)
在智慧醫(yī)療領(lǐng)域,聯(lián)想凌拓帶來了“救急1110”解決方案。通過采用該解決方案,醫(yī)療行業(yè)用戶可以獲得1分鐘數(shù)據(jù)全備份、1分鐘數(shù)據(jù)全恢復(fù)、10分鐘單項(xiàng)應(yīng)用容災(zāi)的業(yè)務(wù)連續(xù)性保障和數(shù)據(jù)安全性保障,滿足法規(guī)要求。
智算時代,隨著千億級參數(shù)大模型的不斷涌現(xiàn),多樣性算力需求進(jìn)一步增長,數(shù)據(jù)作為推動AI發(fā)展的核心生產(chǎn)要素,其所釋放出的價值日益凸顯。而數(shù)據(jù)規(guī)模及質(zhì)量決定了AI智能的高度。兼顧二者,構(gòu)建大容量、高性能的存力底座,儼然成為了AI大模型時代致勝的關(guān)鍵。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。