一年發(fā)兩代至強服務(wù)器CPU，英特爾在「卷」什么？

本文作者：包永剛

2024-01-02 14:41

導(dǎo)語：無論是不再傳統(tǒng)的至強CPU，還是架構(gòu)有重大變化的酷睿Ultra，目標都是無處不在的AI。

2023年初，代號“Sapphire Rapids”的第四代英特爾至強可拓展處理器發(fā)布。

2023年底，代號Emerald Rapids的第五代英特爾至強可擴展處理器（以下簡稱第五代至強）也正式推出。

最新發(fā)布的第五代至強可在相同熱設(shè)計功耗（TDP）范圍內(nèi)，平均性能提升21%，并在一系列工作負載中將每瓦性能提升高達36%。

一年發(fā)兩代至強服務(wù)器CPU，英特爾在「卷」什么？

一年發(fā)布兩代至強處理器，是前所未見的情況，英特爾為什么這么做？

“2023年1月發(fā)布第四代至強，12月發(fā)布第五代至強，預(yù)計2024年將發(fā)布下一代至強?！?strong>英特爾數(shù)據(jù)中心與人工智能集團副總裁兼中國區(qū)總經(jīng)理陳葆立說，“我們的速度越來越快，其實也是響應(yīng)客戶和市場對于更新更快算力的需求。我們所做的努力，是為了能夠更快跟得上市場。”

一年發(fā)兩代至強服務(wù)器CPU，英特爾在「卷」什么？

英特爾數(shù)據(jù)中心與人工智能集團副總裁兼中國區(qū)總經(jīng)理陳葆立

對于至強這樣高性能和非常復(fù)雜的CPU，一年更新兩代的挑戰(zhàn)非常大，做到這一點，表明了英特爾在四年五個節(jié)點戰(zhàn)略的帶動下，執(zhí)行力的提升。

英特爾一年卷出兩代產(chǎn)品的關(guān)鍵到底是什么？

生成式AI需要什么樣的處理器？

“以前模型都比較小，現(xiàn)在模型變大后，單芯片的能力，甚至是單服務(wù)器的能力都未必能夠滿足生成式AI的訴求，所以互聯(lián)互通的能力非常重要，這是芯片需要具備的非常重要的能力。”火山引擎IAAS產(chǎn)品負責(zé)人李越淵對雷峰網(wǎng)(公眾號：雷峰網(wǎng))表示。

這正是第五代至強升級的一個重點，第五代至強具備8條DDR5通道，支持5,600 MT/s的傳輸速率，且采用英特爾超級通道互聯(lián)（英特爾UPI）2.0以增加跨插槽內(nèi)帶寬，提供高達 20 GT/s的傳輸。領(lǐng)先的云服務(wù)供應(yīng)商（CSP）采用基于第五代至強的實例，將能夠使用CXL Type 3內(nèi)存設(shè)備來擴展內(nèi)存容量。

“大模型是顯存帶寬密集型和顯存容量密集型，有時候它對于算力的‘饑渴度’并不是非常高。對于處理器來說，未來還是要適當關(guān)注內(nèi)存帶寬的提升。”阿里云服務(wù)器研發(fā)事業(yè)部高級總監(jiān)王偉說，“我們看到第五代至強確實是增加了內(nèi)存帶寬，增加了Cache，某種意義上有利于未來通過CPU來做生成式AI應(yīng)用場景的運用。”

一年發(fā)兩代至強服務(wù)器CPU，英特爾在「卷」什么？

實際上，第五代至強擁有多達64核，三級緩存是上一代產(chǎn)品的近3倍。

王偉透露，阿里在自研的第八代服務(wù)器上做了各種AI嘗試，發(fā)現(xiàn)生成式AI對于CPU已經(jīng)不算挑戰(zhàn)。使用CPU進行通義千問7B/14B/72B這樣較大規(guī)模模型的推理，已經(jīng)可以在單個阿里云第八代ECS實例上運行。

這得益于第五代至強每個內(nèi)核均具備AI加速功能，不用添加獨立的加速器，就可以處理端到端的工作負載。英特爾采用內(nèi)部模型的測試結(jié)果顯示，參數(shù)量多達200億的大語言模型的推理性能提高42%，延遲低于100毫秒。

“AI模型是每個公司最重要的資產(chǎn)，所以會非常關(guān)注自身數(shù)據(jù)的安全和模型安全?！崩钤綔Y指出，“英特爾在這上面做了很多努力和嘗試，包括英特爾TDX可以更加透明、低門檻的讓客戶實現(xiàn)端到端的安全，我們云廠商也非常關(guān)注芯片的安全性能?！?/p>

年初發(fā)布的第四代英特爾至強可擴展處理器就已經(jīng)集成了英特爾可信域拓展（英特爾TDX），能夠提供虛擬機（VM）層面的隔離和保密性，增強隱私性和對數(shù)據(jù)的管理，隨著新產(chǎn)品的推出，所有OEM和CSP解決方案提供商均可啟用該功能。

顯然，英特爾一年推出兩代產(chǎn)品，主要還是為了滿足客戶的需求。

“客戶能否依賴我們的產(chǎn)品進行演進，我們也是非常緊密的跟像阿里或者是字節(jié)溝通?！标愝崃⒄f，“我們不管什么產(chǎn)品，在早期的溝通得到反饋后，我們會做相應(yīng)的改進。我們也希望我們承諾的東西能夠滿足客戶最終的需求，以客戶為優(yōu)先擁抱市場?！?/p>

至強CPU有什么優(yōu)勢？

AI訓(xùn)練并不是CPU的強項，GPU有架構(gòu)優(yōu)勢。

“在推理任務(wù)中，CPU的容忍度更高一些，更有可能很好的完成任務(wù)。”李越淵表示。

不過，在每個核加入AI加速單元后，至強CPU已經(jīng)不是傳統(tǒng)意義的CPU。

王偉認為，“嘗試在通用CPU中加一些向量計算單元，有利于面向AI場景，隨著AI的應(yīng)用發(fā)展，CPU和GPU這兩種體系架構(gòu)的融合芯片會走向必然。”

不可忽視的是，無論是CPU、GPU、NPU還是各種AI加速器，在生成式AI快速發(fā)展的時刻，都有巨大的機會，特別是在推理市場。埃文斯數(shù)據(jù)公司的調(diào)查數(shù)據(jù)顯示，邊緣和客戶端設(shè)備對推理的需求相比數(shù)據(jù)中心超過了1.4倍。

此時能夠更好滿足客戶推理需求的產(chǎn)品更容易獲得青睞。

“長期來看，我們也會更多關(guān)注大模型AI推理側(cè)，如何通過降低對算力的訴求，更好的孵化大模型在推理側(cè)的應(yīng)用和發(fā)展?！?strong>王偉認為，“未來大模型AI推理的算力需求一定會持續(xù)下降，降低到端云結(jié)合的方式可以進行大模型AI推理，甚至在部分AI大模型推理應(yīng)用中，算力需求量應(yīng)該要降到端側(cè)的單顆芯片即可完成，比如一部手機。”

這是英特爾至強的機會所在。英特爾也在努力降低客戶的總體擁有成本（TCO），對于遵循典型的五年更新周期并從更前一代處理器進行升級的客戶，總體擁有成本最多可降低77%。

陳葆立強調(diào)，“我們保持平臺延伸性，不管是軟件廠商或者是一體機提供商，升級到第五代英特爾至強可擴展處理將非?？斓?/strong>，因為整個平臺驗證和軟件驗證都做完了?！?/p>

從整個英特爾的產(chǎn)品線看，英特爾除了云端的至強可擴展處理器之外，還有邊緣端的酷睿Ultra處理器。

英特爾酷睿Ultra處理器采用了英特爾首個用于客戶端的片上AI加速器“神經(jīng)網(wǎng)絡(luò)處理單元（NPU），代表著英特爾40年來最重大的架構(gòu)變革。

可以非常清晰的看到，英特爾正在努力與合作伙伴和廣泛的生態(tài)系統(tǒng)一起，讓AI無處不在。

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

0人收藏

分享：

相關(guān)文章

intel第五代至強阿里云服務(wù)器火山引擎IAAS

阿里云神龍架構(gòu)入選世界互聯(lián)網(wǎng)領(lǐng)先科技成果

SaaS的安全之痛給了他們什么啟發(fā)

阿里核心技術(shù)成員解讀自研數(shù)據(jù)庫 OceanBase

比特大陸被偷幣，企業(yè)“捉鬼”有多難

包永剛

編輯

發(fā)私信

當月熱門文章

兩款全球最快移動CPU齊發(fā)，高通「升維」加速邊緣AI

創(chuàng)紀錄的288核至強服務(wù)器CPU，為什么離不開Intel 18A？

最新文章

高性能+高能效，英特爾Panther Lake「均衡設(shè)計」的絕招

創(chuàng)紀錄的288核至強服務(wù)器CPU，為什么離不開Intel 18A？

從“產(chǎn)能擴張”到“架構(gòu)升級”，AI存儲打響「升維戰(zhàn)」

股價暴漲、股東套現(xiàn)，中際旭創(chuàng)的高增長邏輯還能走多遠？

存力競爭開啟，平頭哥鎮(zhèn)岳510正在成為阿里AI Infra的新基石

天璣 9500 的雙 NPU 架構(gòu)設(shè)計，如何讓手機 AI 功能從 “嘗鮮” 變成 “剛需”？

熱門搜索

小米 Android iOS 新能源汽車開發(fā)者央行虛擬貨幣大眾 Win10 共享單車 iPhone 7

一年發(fā)兩代至強服務(wù)器CPU，英特爾在「卷」什么？

一年發(fā)兩代至強服務(wù)器CPU，英特爾在「卷」什么？