丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
芯片設(shè)計(jì) 正文
發(fā)私信給包永剛
發(fā)送

0

Arm全面計(jì)算戰(zhàn)略重磅升級(jí)!Armv9架構(gòu)CPU一鍵三連

本文作者: 包永剛 2021-05-26 18:24
導(dǎo)語(yǔ):全面計(jì)算的時(shí)代PPA的重要性越來(lái)越低,提高系統(tǒng)性能將變得更加重要。

雷鋒網(wǎng)消息,今年三月,Arm推出了面向未來(lái)十年的新一代架構(gòu)Armv9。今天,Arm發(fā)布新一代CPU、GPU產(chǎn)品和互聯(lián)技術(shù),Arm要用全新的全面計(jì)算產(chǎn)品組合,應(yīng)對(duì)智能手機(jī)、高性能PC、可穿戴等眾多應(yīng)用的計(jì)算需求和設(shè)計(jì)挑戰(zhàn)。

Arm全面計(jì)算戰(zhàn)略重磅升級(jí)!Armv9架構(gòu)CPU一鍵三連

全新的CPU內(nèi)核包括高性能核心Cortex-X1的升級(jí)版Cortex-X2,Cortex-A78的繼任者Cortex-A710,時(shí)隔四年后升級(jí)Cortex-A55的全新小核心Cortex-A510。

三款全新的CPU核心都基于今年三月份推出的Armv9架構(gòu),可謂一鍵三連,因此在改進(jìn)性能和效率的同時(shí),也將擁有擴(kuò)展的SVE(可伸縮矢量擴(kuò)展)、機(jī)密計(jì)算架構(gòu)、內(nèi)存標(biāo)簽擴(kuò)展特性。

Arm全面計(jì)算戰(zhàn)略重磅升級(jí)!Armv9架構(gòu)CPU一鍵三連

Arm新一代Mali GPU產(chǎn)品包括高端系列Mali-G78的繼任者M(jìn)ali-G710,中端系列Mail-G57的后繼產(chǎn)品Mali-G510,以及高能效產(chǎn)品Mali-G310。

全新的GPU系列依舊采用2019年發(fā)布的Valhall架構(gòu),這一架構(gòu)2019年被Mali-G77首次使用,去年發(fā)布的Mali-G78進(jìn)行了小幅升級(jí),麒麟9000、Exynos 2100以及MediaTek天璣都使用了Mali-G78。

Arm高級(jí)副總裁兼終端設(shè)備事業(yè)部總經(jīng)理 Paul Williamson告訴雷鋒網(wǎng),“之所以引入新的產(chǎn)品命名規(guī)則,主要是因?yàn)橐肓薃rmv9架構(gòu),希望用新的命名表示這個(gè)新架構(gòu)將會(huì)給市場(chǎng)帶來(lái)的變化。”

除了全新CPU和GPU,Arm還發(fā)布了CoreLink CI-700 一致性互連技術(shù)和 CoreLink NI-700片上網(wǎng)絡(luò)互連技術(shù)與Arm CPU、GPU和NPU IP搭配,可跨SoC解決方案增強(qiáng)系統(tǒng)性能。

Armv9架構(gòu)三款全新CPU,性能平均提升超30%

2023年完成向64位應(yīng)用程序過(guò)渡

雷鋒網(wǎng)此前文章指出,Armv9架構(gòu)有三個(gè)系列,分別是針對(duì)通用計(jì)算的A系列,實(shí)時(shí)處理器的R系列,微控制器的M系列,預(yù)計(jì)未來(lái)兩代移動(dòng)基礎(chǔ)設(shè)施CPU的性能提升將超過(guò)30%。首款基于Armv9架構(gòu)CPU的移動(dòng)處理器最快將在今年底問(wèn)世,可能來(lái)自MediaTek。

全新Cortex核心首先需要關(guān)注的是兼容性問(wèn)題。自谷歌2019年宣布Google Play商店要求開發(fā)者上傳64位應(yīng)用程序之后,業(yè)界就開始向64位應(yīng)用程序過(guò)渡,并且,谷歌表示將在今年夏天晚些時(shí)候停止64位設(shè)備對(duì)32位應(yīng)用程序的兼容。

Arm則表示,為了支持生態(tài)系統(tǒng)對(duì)于性能的需求, 2023 年將僅提供 64 位的移動(dòng)應(yīng)用大核和小核。因?yàn)樵贏rmv9架構(gòu)的全新三款CPU中,Cortex-X2和Cortex-A510只支持AArch64微體系結(jié)構(gòu),它們不再能夠執(zhí)行AArch32代碼,而Cortex-A710仍將支持AArch32。

Arm全面計(jì)算戰(zhàn)略重磅升級(jí)!Armv9架構(gòu)CPU一鍵三連

Arm解釋稱這主要是為了滿足中國(guó)市場(chǎng)需求,由于中國(guó)移動(dòng)應(yīng)用市場(chǎng)缺乏像Google Play商店的同類生態(tài)系統(tǒng),中國(guó)的供應(yīng)商以及應(yīng)用程序需要更多時(shí)間過(guò)渡到64位應(yīng)用程序。

這意味著,在采用Arm全新Cortex內(nèi)核的SoC上如果要運(yùn)行32位的應(yīng)用程序,只能運(yùn)行在Cortex-A710核心。

仍要看到的是,全新的Armv9架構(gòu)的產(chǎn)品X2和A710總體保持著X1和A78的目標(biāo),X系列愿意在合理的范圍內(nèi)折衷功率,通過(guò)微體系結(jié)構(gòu)提高性能。A710則更著重于PPA(性能、功耗、面積)的平衡,通過(guò)更智能的設(shè)計(jì)提高性能和效率。小核A510是四年來(lái)的首次更新,是一種全新的小巧設(shè)計(jì)。

Arm全面計(jì)算戰(zhàn)略重磅升級(jí)!Armv9架構(gòu)CPU一鍵三連

Cortex-X2性能優(yōu)勢(shì)進(jìn)一步擴(kuò)大

Cortex-X2進(jìn)一步擴(kuò)大了與Cortex-A710的性能和功耗的差距,Arm稱X2除了可以用于智能手機(jī)SoC,也可以用于大屏幕計(jì)算設(shè)備和筆記本電腦等對(duì)性能要求更高的終端。基于Armv9架構(gòu),X2核心從前端分支預(yù)測(cè)改進(jìn)、調(diào)度優(yōu)化到后端的管道等都進(jìn)行了諸多改進(jìn)。

Arm全面計(jì)算戰(zhàn)略重磅升級(jí)!Armv9架構(gòu)CPU一鍵三連

就單核性能而言,在SPECint2006測(cè)試中,在相同工藝制程和頻率下,X2相比X1的集成性能提升了16%,機(jī)器學(xué)習(xí)性能提升高達(dá)2倍。但由于Arm是將8MB L3緩存設(shè)計(jì)與4MB L3設(shè)計(jì)進(jìn)行比較,6%的性能提升到底是較大緩存還是核心性能提升暫不清楚。

Arm全面計(jì)算戰(zhàn)略重磅升級(jí)!Armv9架構(gòu)CPU一鍵三連

性能和功耗曲線來(lái)看,想要實(shí)現(xiàn)16%的性能提升需要付出更高的功耗,這將給三星和高通等手機(jī)SoC設(shè)計(jì)公司帶來(lái)更大挑戰(zhàn)。

Arm全面計(jì)算戰(zhàn)略重磅升級(jí)!Armv9架構(gòu)CPU一鍵三連

Cortex-A710能效提升30%

由于同樣采用了最新的Armv9架構(gòu),因此Cortex-A710同樣從核心的前端到后端也進(jìn)行了改進(jìn),不同的是A710還支持AArch32。

經(jīng)過(guò)優(yōu)化的結(jié)果是,Cortex-A710相比Cortex-A78實(shí)現(xiàn)了最多10%的性能提升和30%的能效提升。同樣,10%的性能提升也是在8MB L3緩存設(shè)計(jì)與4MB L3緩存設(shè)計(jì)的比較。由于Cortex-A710可用于中端或低端SoC,這就意味著會(huì)使用較小緩存,10%的性能提升可能不容易實(shí)現(xiàn)。

Arm全面計(jì)算戰(zhàn)略重磅升級(jí)!Armv9架構(gòu)CPU一鍵三連

相比性能提升,稍微降低頻率可以帶來(lái)很大的功耗降低。Arm稱,在性能相同的情況下,A710的功耗比Cortex-A78少30%。這將有利于適中頻率的Cortex-A710 “中間”核心實(shí)現(xiàn)持續(xù)的性能和電源效率。

總體看來(lái),X2和A710的性能和功率指標(biāo)都很適中,提升也是近幾年來(lái)最少的。Arm解釋稱,由于向Armv9的遷移而進(jìn)行了較大的體系結(jié)構(gòu)更改,因此對(duì)通常的效率和性能改進(jìn)產(chǎn)生了影響。

X2和A710都是該奧斯汀微體系結(jié)構(gòu)家族的第四代產(chǎn)品,因此我們正面臨著不斷減少的收益和成熟的設(shè)計(jì)壁壘。

四年來(lái)首次更新Cortex小核

小核心是時(shí)隔四年終于迎來(lái)更新,因?yàn)樯弦淮『诵腃ortex-A55早在2017年就發(fā)布。全新的Cortex-A510來(lái)自Arm劍橋團(tuán)隊(duì),使用了很多已經(jīng)在較大核中使用的技術(shù)。Arm稱Cortex-A510新內(nèi)核與此前的旗艦內(nèi)核Cortex-A73的單核性能和頻率非常相似,但功耗卻低很多。

Arm全面計(jì)算戰(zhàn)略重磅升級(jí)!Armv9架構(gòu)CPU一鍵三連

據(jù)悉,Arm采用了一個(gè)被稱為“合并內(nèi)核”的設(shè)計(jì)方法,這是一種非常復(fù)雜的方法,最多兩個(gè)核心對(duì),它們共享L2緩存系統(tǒng)以及它們之間的FP / NEON / SVE管道。

Arm指出,共享管道對(duì)硬件是完全透明的,并且還使用了細(xì)粒度的硬件調(diào)度。在同時(shí)使用兩個(gè)內(nèi)核的實(shí)際多線程工作負(fù)載中,與為每個(gè)內(nèi)核專用的管道相比,性能影響和不足僅占百分之幾。

乍一看,Arm的做法與AMD十年前在其Bulldozer內(nèi)核中對(duì)CMT(集群多線程)所做的改進(jìn)有一些非常相似,但是在某些重要方面卻有很大不同。

從性能指標(biāo)看,將Cortex-A55與32KB L1、128KB L2和4MB L3與具有32KB L1、256KB L2和8MB L3的Cortex-A510比較。在核心頻率相同的情況下,SPECint2006性能提升35%,SPECfp2006性能提升50%,提升非常顯著,但從年均復(fù)合增長(zhǎng)率的角度看,提升并不那么令人印象深刻。

比較IOS功率和性能,Cortex-A510性能提升10%,功耗可以降低20%。

值得注意的是,A510與A55的曲線在較低工作點(diǎn)幾乎重疊。盡管A510總體上具有更好的性能,但這似乎主要是將效率曲線擴(kuò)展到更高的功率水平的結(jié)果。實(shí)際上要在任何結(jié)構(gòu)化的基準(zhǔn)測(cè)試中重現(xiàn)這些更真實(shí)的工作負(fù)載是極其困難的。

需要注意,Armv9-A CPU群集(cluster)的支柱是新款的動(dòng)態(tài)共享單元( DynamIQ Shared Unit)DSU-110,DSU-110 具備可擴(kuò)展性、可支持最多八Cortex-X2 內(nèi)核配置,同時(shí)確保效率表現(xiàn)。

Arm全面計(jì)算戰(zhàn)略重磅升級(jí)!Armv9架構(gòu)CPU一鍵三連

Paul Williamson稱:“通過(guò)共享系統(tǒng)級(jí)緩存最多可以降低15%的能耗?!?/p>

旗艦Mali-G710 GPU是關(guān)注重點(diǎn),中低端GPU性能大躍升

新的GPU系列延續(xù)采用Valhall 架構(gòu),旗艦產(chǎn)品Mali-G710是Mali-G78的繼承者,目標(biāo)是相對(duì)簡(jiǎn)單的代際演進(jìn),這是Arm的架構(gòu)師在Mali GPU中實(shí)現(xiàn)的最高性能。

Arm全面計(jì)算戰(zhàn)略重磅升級(jí)!Armv9架構(gòu)CPU一鍵三連

Mali-G610對(duì)于Mali GPU的品牌有積極意義,G610繼承了 Mali-G710 的所有功能,微體系結(jié)構(gòu)相同,但價(jià)格更低。G610配置低于7個(gè)內(nèi)核,可以幫助合作伙伴更好地區(qū)分旗艦產(chǎn)品與“高端”產(chǎn)品。

AnandTech指出,新的G710微體系結(jié)構(gòu)看起來(lái)非常有趣,尤其是要解決與Arm的Mali GPU的API開銷相關(guān)的一些弱點(diǎn)。如何發(fā)揮作用還有待觀察,但從性能和功耗的提升來(lái)看,這似乎是一個(gè)穩(wěn)健的進(jìn)步,即便這不足以改變移動(dòng)市場(chǎng)的競(jìng)爭(zhēng)格局。

總的來(lái)說(shuō),對(duì)于大部分消費(fèi)者而言,此次Arm升級(jí)的三款GPU關(guān)注的重點(diǎn)仍然是旗艦GPU Mali-G710。作為Valhall GPU架構(gòu)的延續(xù),新款G710執(zhí)行引擎的與上一代Mali-G77和Mali-G78大致相同。與前一代Mali-G78 GPU相比,Arm承諾的改進(jìn)是性能提高約20%,功耗有望降低20%,機(jī)器學(xué)習(xí)性能提升35%。

Mali-G510和Mali-G310是在前代G57和G31產(chǎn)品的基礎(chǔ)上迭代升級(jí)。Mali-G510是Arm中端產(chǎn)品組合的重大升級(jí),G510可從2核擴(kuò)展到6核,可以在端智能手機(jī)、旗艦智能電視和機(jī)頂盒上實(shí)現(xiàn) 100%的性能提升以及22%的節(jié)能優(yōu)化,延長(zhǎng)了電池續(xù)航。

新的Mali-G310是基于Valhall的新低端產(chǎn)品,瞄準(zhǔn)的是以低面積效率為重點(diǎn)的市場(chǎng),包括數(shù)千億的低成本設(shè)備和其他嵌入式市場(chǎng),例如入門級(jí)智能手機(jī)、AR 設(shè)備和可穿戴設(shè)備。G310一個(gè)關(guān)鍵的價(jià)值是代表了Mali GPU架構(gòu)從Bifrost架構(gòu)到新的Valhall設(shè)計(jì)的重大轉(zhuǎn)變。

這些新設(shè)計(jì)代表了微體系結(jié)構(gòu)中新的重大突破,讓Arm的中端和低端產(chǎn)品實(shí)現(xiàn)了顯著的性能提升。G510相比G54性能提升了1倍,能效提升22%,機(jī)器學(xué)習(xí)性能提升了1倍。G310相比G31圖形變形性能提升4.5倍,Vulkan性能提升4.5倍,Android UI性能提升2倍。

有意思的是,Anandtech認(rèn)為由于缺少更大的幅度變化或步進(jìn)功能升級(jí),Arm的高端GPU前景看起來(lái)并不十分理想,三星已經(jīng)確認(rèn)在下一代Exynos GPU中采用AMD RDNA GPU,海思麒麟SoC被按下了暫停鍵。聯(lián)發(fā)科成為最后一個(gè)會(huì)采用Mali高端GPU的公司,但他們至今還未推出真正的旗艦級(jí)SoC,所以有可能看不到高端Mali-G710產(chǎn)品。

Arm Mali GPU設(shè)計(jì)哲學(xué)一直是一把雙刃劍,特別是它們正試圖通過(guò)非常相似的微體系結(jié)構(gòu)來(lái)滿足如此廣闊的市場(chǎng)。高端市場(chǎng)看起來(lái)有些暗淡,但中端和低端產(chǎn)品看起來(lái)非常有前途。

Arm表示,到2020年,他們已經(jīng)出貨了超過(guò)10億個(gè)Mali GPU, DTV市場(chǎng)份額為80%,智能手機(jī)市場(chǎng)份額超過(guò)50%。

全面計(jì)算時(shí)代系統(tǒng)性能更加重要

Arm在2019年首次提出全面計(jì)算戰(zhàn)略,隨著全新架構(gòu)產(chǎn)品的發(fā)布,Arm的全面計(jì)算戰(zhàn)略也進(jìn)一步升級(jí)。Arm認(rèn)為全面計(jì)算設(shè)計(jì)戰(zhàn)略的三大關(guān)鍵原則是——計(jì)算性能、開發(fā)者可及性和安全性。要同時(shí)滿足這三大關(guān)鍵原則,需要提供出色的性能、安全性、可擴(kuò)展性和效率。

Arm全面計(jì)算戰(zhàn)略重磅升級(jí)!Armv9架構(gòu)CPU一鍵三連

“我們正致力于將 Armv9 技術(shù)引入到各個(gè)領(lǐng)域,以系統(tǒng)級(jí)設(shè)計(jì)最大程度地提高性能?;?Arm 架構(gòu)的計(jì)算技術(shù)正在構(gòu)建超越智能手機(jī)市場(chǎng)以外的領(lǐng)導(dǎo)地位,借助移動(dòng)生態(tài)系統(tǒng)帶來(lái)的巨大規(guī)模優(yōu)勢(shì),在筆記本電腦、臺(tái)式機(jī)、云等應(yīng)用領(lǐng)域打造領(lǐng)先的解決方案。這些靈活的解決方案將被應(yīng)用于Arm 合作伙伴的各種應(yīng)用中,開啟新一代沉浸式的交互體驗(yàn)?!盤aul Williamson表示。

全面計(jì)算對(duì)于移動(dòng)設(shè)備、有豐富功能的AI產(chǎn)品都非常重要。因此,既需要Arm的Cortex CPU和Mali GPU,還需要全新的互聯(lián)技術(shù),這對(duì)于提高系統(tǒng)性能至關(guān)重要。

Arm今天推出的CoreLink CI-700 和 CoreLink NI-700 對(duì)新的 Armv9-A 功能提供硬件級(jí)支持,如內(nèi)存標(biāo)簽擴(kuò)展(Memory Tagging Extension),并支持更高的安全性、改進(jìn)的帶寬和延遲。

Arm全面計(jì)算戰(zhàn)略重磅升級(jí)!Armv9架構(gòu)CPU一鍵三連

Paul Williamson指出,“以往算力用基準(zhǔn)測(cè)試來(lái)衡量,但全面計(jì)算的時(shí)代PPA的重要性越來(lái)越低,交付更好的用戶體驗(yàn)和更高的系統(tǒng)性能將變得更加重要。Arm 全新的全面計(jì)算解決方案采用系統(tǒng)范圍的整體優(yōu)化方法,橫跨硬件 IP、物理 IP、軟件、工具和標(biāo)準(zhǔn),滿足所有終端細(xì)分市場(chǎng)的應(yīng)用場(chǎng)景和成本區(qū)間。”

對(duì)算力需求越來(lái)越高以及應(yīng)用越來(lái)越豐富是可以看到的趨勢(shì),在變化越來(lái)越快的5G、AI和數(shù)字化時(shí)代,芯片巨頭都已經(jīng)轉(zhuǎn)向多芯片組合競(jìng)爭(zhēng)的時(shí)代,更加靈活的產(chǎn)品組合能夠滿足不同應(yīng)用的性能需求。當(dāng)然,與之相對(duì)應(yīng)的還有制程、異構(gòu)集成、封裝等一系列的問(wèn)題,需要整個(gè)產(chǎn)業(yè)鏈共同面對(duì)。

Arm的全面計(jì)算策略能獲得多大的成功?

注,文中配圖來(lái)自Arm

相關(guān)文章:

Arm進(jìn)攻服務(wù)器市場(chǎng)心切

Arm新十年,能否實(shí)現(xiàn)CPU計(jì)算“統(tǒng)治”?

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

分享:
相關(guān)文章
最新文章
請(qǐng)?zhí)顚懮暾?qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說(shuō)