丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
芯片 正文
發(fā)私信給包永剛
發(fā)送

0

Arm定了個超1000億臺設(shè)備運行AI的目標(biāo)

本文作者: 包永剛   2024-11-22 16:27
導(dǎo)語:與生態(tài)合作伙伴一起能夠達成這個目標(biāo)。

所有人的目光聚焦在生成式AI時,Arm同樣如此,還提出了非常具體的目標(biāo)。

一年一度的 Arm Tech Symposia 年度技術(shù)大會深圳站,Arm 終端事業(yè)部產(chǎn)品管理副總裁 James McNiven表示,“預(yù)計到2025年底,全球?qū)⒂谐^1000億臺Arm設(shè)備具備 AI 能力。

Arm定了個超1000億臺設(shè)備運行AI的目標(biāo)

對于Arm架構(gòu)芯片出貨量已經(jīng)超過3000億顆的Arm來說,這是一個可以輕松達成的目標(biāo)嗎?

“我不會說這是一個非常輕松就能達成的目標(biāo)?!?/strong>James McNiven對雷峰網(wǎng)表示,“我們與生態(tài)合作伙伴一起能夠達成這個目標(biāo)。”

為了達成這個目標(biāo),Arm有一些列動作,包括為生成式AI計算進行的持續(xù)的架構(gòu)演進,提供易于使用的軟件工具,以及特定面向行業(yè)的整體解決方案,還有更廣泛的合作。

為生成式AI演進的架構(gòu)

Arm一直在根據(jù)市場需求持續(xù)演進其架構(gòu)保持其領(lǐng)導(dǎo)地位。

Arm定了個超1000億臺設(shè)備運行AI的目標(biāo)

比如2011年Armv7-A中引入了Neon,Neon是高級單指令多數(shù)據(jù)(SIMD)指令的一種實現(xiàn)方案。

2016年Armv8-A 中引入了 SVE,2021 年 Armv9-A 中引入了 SVE2,它們提供可變長度寄存器。

2021年Armv9-A中引入了SME和SME2。SME引入了兩個關(guān)鍵的新架構(gòu)特性:Streaming SVE模式和ZA存儲,新特性使SME 和 SME2 能夠高效地處理矩陣和基于向量的工作負(fù)載。

Arm定了個超1000億臺設(shè)備運行AI的目標(biāo)

SVE2和SEM的架構(gòu)擴展也是Arm未來十年架構(gòu)演進的重要方向。

Armv9 CPU中的SVE2對于加速視頻解碼和圖像處理有顯著作用。

聯(lián)發(fā)科最新的旗艦芯片天璣9400,就是借助SVE2讓聯(lián)發(fā)科的芯片協(xié)助開發(fā)者和終端提升視頻和圖像處理,提供更好的照片質(zhì)量,并為用戶在觀看流媒體視頻和瀏覽社交媒體應(yīng)用程序時提供了更好的續(xù)航能力。

SME建立在SVE2的基礎(chǔ)之上,新增了高效處理矩陣的能力,是一個增強矩陣操作的架構(gòu)擴展。

Arm SME能夠顯著提升Arm CPU上處理現(xiàn)有AI和ML應(yīng)用的能力,加速很多利用矩陣運算的應(yīng)用,例如 AR、VR 和圖像處理。

Arm定了個超1000億臺設(shè)備運行AI的目標(biāo)

這也意味著,從2015年使用Armv8(NEON)架構(gòu)的Cortex-A73 CPU開始,Arm在AI領(lǐng)域的投入就已經(jīng)轉(zhuǎn)化為產(chǎn)品。Arm將實現(xiàn)的1000億臺設(shè)備具備AI能力的目標(biāo),也覆蓋從Armv8(NEON)到Armv9(SVE2/SME)的所有產(chǎn)品。

可擴展的計算平臺只是Arm滿足生成式AI時代需求的技術(shù)底層。對于芯片設(shè)計公司來說,關(guān)注可擴展能力的同時,也關(guān)注性能和產(chǎn)品上市時間。

面向不同行業(yè)推出計算子系統(tǒng),加速產(chǎn)品上市

芯片行業(yè)不變的追求就是以更小芯片面積和更低功耗實現(xiàn)更高性能,性能總是會成為首先被關(guān)注的焦點。

基于Armv9.2架構(gòu)的Arm Cortex-X925在Geekbench 6.2基準(zhǔn)測試中創(chuàng)下新高,實現(xiàn)了15% 的每時鐘周期指令數(shù) (IPC) 提升。

Arm Cortex-X925顯著的性能提升得益于L2緩存從2MB增加到3MB,增強了整體性能和能效。再結(jié)合Cortex-X925 在更快速、更高效預(yù)取數(shù)據(jù)和復(fù)雜指令的能力后,效果更佳明顯。

除此之外,Cortex-X925也充分利用3納米工藝的優(yōu)勢,在需要時以更高的頻率運行 CPU,從而提高響應(yīng)速度、應(yīng)用啟動速度和瀏覽器性能并且保持能效優(yōu)勢。

Cortex-X925中矢量管線50%的Integer8 TOPS 提升,可加快智能手機上的AI應(yīng)用響應(yīng)速度。

即便Arm的設(shè)計足夠優(yōu)秀,想要加速產(chǎn)品上市進程,還需要整體解決方案。為此,Arm推出了Arm 終端計算子系統(tǒng) (CSS),CSS具備最新的 Armv9 CPU、Arm Immortalis GPU、基于3納米工藝生產(chǎn)就緒的CPU和GPU物理實現(xiàn),以及最新的 CoreLink系統(tǒng)互連和系統(tǒng)內(nèi)存管理單元 (SMMU)。

Arm終端CSS提升了30% 以上的計算和圖形性能,AI推理速度也提高了59%,以應(yīng)對各種嚴(yán)苛的工作負(fù)載,適用于廣泛的AI應(yīng)用。

“Arm終端CSS的關(guān)鍵在于Arm目前性能最強、效率最高、功能最廣泛的CPU集群,帶來最佳的性能和能效?!盝ames表示。

不止是CSS,面向更高性能的云端Neoverse CPU,Arm也已經(jīng)推出了Arm Neoverse CSS。雷峰網(wǎng)(公眾號:雷峰網(wǎng))了解到,Arm接下來還將推出面向汽車市場的Arm CSS for Auto。

Arm定了個超1000億臺設(shè)備運行AI的目標(biāo)

加速實現(xiàn)AI目標(biāo),Arm Kleidi 軟件庫是關(guān)鍵

Arm的計算子系統(tǒng)性能要被充分發(fā)揮,軟件非常關(guān)鍵。

“開發(fā)者需要統(tǒng)一的開發(fā)平臺,換言之,我們要讓開發(fā)者不需要關(guān)心底層硬件,讓他們完成一次代碼編寫后就可以部署到不同的解決方案中。”James 同時表示,“基于Arm平臺超過2000萬的開發(fā)者對于軟件平臺也有易于使用的要求?!?/p>

Arm定了個超1000億臺設(shè)備運行AI的目標(biāo)

面向生成式AI的時代,Arm推出面向熱門AI框架的Arm Kleidi軟件庫。

KleidiAI的命名來自于希臘語“kleidi”,意為“鑰匙”,象征其在提升Arm CPU上AI性能方面發(fā)揮著關(guān)鍵作用。

Kleidi 軟件庫包含面向AI工作負(fù)載的KleidiAI,和面向計算機視覺工作負(fù)載的 KleidiCV。

KleidiAI的明顯優(yōu)勢在于,Arm直接與領(lǐng)先的AI框架合作,Kleidi軟件庫直接嵌入在包括 MediaPipe、LLAMA.cpp、PyTorch和 TensorFlow Lite的 AI 框架中,開發(fā)者無需進行任何操作,不會增加額外工作量。

Arm近日也宣布成功將Arm KleidiAI軟件庫集成到騰訊混元自研的Angel機器學(xué)習(xí)框架,能夠持續(xù)為跨操作系統(tǒng)的不同基于 Arm 的設(shè)備帶來顯著的性能提升。

與不包含優(yōu)化的實現(xiàn)方案相比,在Arm Cortex-X925 CPU 上,使用集成了KleidiAI的llama.cpp的Meta Llama 3和微軟 Phi-3 大語言模型 (LLM) 的詞元 (Token) 首次響應(yīng)時間加快了190%。

Arm定了個超1000億臺設(shè)備運行AI的目標(biāo)

Arm的工程團隊只用不到24小時就測出了Llama 3的優(yōu)化性能,充分體現(xiàn)了KleidiAI易于集成的特性。

軟件庫中的KleidiCV,能夠加速許多攝像頭用例中的計算機視覺管線?;贙leidiCV集成,全球最的的計算機視覺庫OpenCV發(fā)現(xiàn)各種圖像處理任務(wù)的典型性能提升高達75%。

值得注意的是,Arm Kleidi 軟件庫適用于從終端到云端的各種應(yīng)用場景。

更廣泛的生態(tài)合作

“AI比歷史上其他計算技術(shù)都更耗電和內(nèi)存?!?/strong>James表示,“先進封裝作為解決AI計算挑戰(zhàn)的新方法,我們要驅(qū)動基于Arm的小芯片生態(tài)的繁榮?!?/p>

這就離不開Arm全面設(shè)計 (Arm Total Design)生態(tài)的壯大,這個生態(tài)中除了Arm的軟件和固件,還有先進的代工廠、芯片設(shè)計公司、EDA、內(nèi)存、第三方IP等公司。

Arm定了個超1000億臺設(shè)備運行AI的目標(biāo)

對于Arm,只有不斷拓展自己的邊界,成為平臺公司,更有利于加速實現(xiàn)明年底1000億臺Arm設(shè)備具備運行AI能力目標(biāo)的實現(xiàn),這也將幫助Arm在生成式AI時代保持領(lǐng)先優(yōu)勢。

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

分享:
相關(guān)文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄