0
雷鋒網(wǎng)在去年9月的《單線程性能提升超50%!Arm新款服務(wù)器CPU要靠單核打天下?》文章中介紹了其最新的Neoverse N2和Neoverse V1平臺(tái),不過當(dāng)時(shí)Arm并未公布兩款新品更多的產(chǎn)品細(xì)節(jié),只是表示對(duì)比Neoverse N1,Neoverse N2在保持相同水平的功率和面積效率之余單線程性能提升了40%,Neoverse V1的單線程性能可提升超過50%。
本月初發(fā)布最新一代架構(gòu)Armv9后,Arm本周公布了更多關(guān)于Neoverse N2和Neoverse V1的技術(shù)細(xì)節(jié),還發(fā)布了Mesh互聯(lián)技術(shù)Neoverse CMN-700。同時(shí),Arm介紹了更多生態(tài)建設(shè)方面的進(jìn)展,包括與騰訊、阿里云、甲骨文等公司合作的進(jìn)展。
生態(tài)建設(shè)是Arm向服務(wù)器以及基礎(chǔ)設(shè)施市場拓展的關(guān)鍵,在智能手機(jī)市場增速放緩背景下,Arm拓展新市場的節(jié)奏似乎也加速了。
Neoverse V1和N2各有絕招
Neoverse V系列的定位是提供最佳性能,整體而言,相比N1,Neoverse V1帶來了 50% 的性能提升、1.8倍的矢量工作負(fù)載優(yōu)化、以及4倍的機(jī)器學(xué)習(xí)工作負(fù)載優(yōu)化。這背后,是Arm迄今為止設(shè)計(jì)過的最寬微架構(gòu),讓Neoverse V1能夠容納更多運(yùn)行中的指令,支持高性能和百萬兆級(jí)計(jì)算等市場應(yīng)用。
與此同時(shí),Neoverse V1也率先支持了可伸縮矢量擴(kuò)展(SVE,Scalable Vector Extensions),SVE可基于未知寬度向量單元的軟件編程模型,執(zhí)行單指令流多數(shù)據(jù)流(SIMD)整數(shù)、bfloat16、浮點(diǎn)指令。
Arm基礎(chǔ)設(shè)施事業(yè)部高級(jí)副總裁兼總經(jīng)理Chris Bergey說:“Neoverse V1寬而深的架構(gòu),加上 SVE功能將使其在單核性能和通過SVE延長代碼存活期等方面占據(jù)領(lǐng)先優(yōu)勢(shì),為芯片設(shè)計(jì)人員提供可實(shí)現(xiàn)的靈活性。”
Neoverse V1率先支持了SVE,Neoverse N2則是第一個(gè)具備SEV2功能的平臺(tái),因?yàn)镹eoverse N2平臺(tái)是第一個(gè)基于Armv9架構(gòu)的平臺(tái)。
Chris Bergey介紹,在諸如機(jī)器學(xué)習(xí)、數(shù)字信號(hào)處理、多媒體和5G等廣泛應(yīng)用場景中,SVE2除了帶來大幅性能提升外,還帶來 了SVE 具備的編程簡易性及可移植性等優(yōu)勢(shì)。
Neoverse N定位就是同時(shí)考慮性能、功率、面積(PPA),擅長可擴(kuò)展,可以應(yīng)用于從高吞吐量計(jì)算到功率與尺寸受限的邊緣和5G應(yīng)用場景。其單線程的性能提升略低于Neoverse V1,相比N1有40%的提升,能為用戶減少TCO的每瓦性能表現(xiàn)。
計(jì)算加互聯(lián),提供平臺(tái)級(jí)解決方案
Neoverse V1和N2能夠提供相比x86架構(gòu)CPU更高的單核性能,但數(shù)據(jù)中心的建設(shè)者發(fā)現(xiàn)計(jì)算性能越來越高的同時(shí),系統(tǒng)間互聯(lián)的挑戰(zhàn)越來越大。因此,Arm也在CMN-600的基礎(chǔ)上,發(fā)布了升級(jí)的Mesh互聯(lián)技術(shù)CMN-700。
據(jù)悉,CMN-700在每個(gè)矢量上進(jìn)一步提升了性能——從內(nèi)核的數(shù)量、緩存的大小,到附加內(nèi)存及 IO 設(shè)備的數(shù)量和類型。
Arm的技術(shù)專家介紹,“Neoverse產(chǎn)品支持 MPAM(Memory Partitioning and Monitoring)和 C-busy(Completer busy)特性,能夠讓大量的內(nèi)核可以均衡利用那些DRAM以及系統(tǒng)緩存等共享資源。同時(shí),在支持可擴(kuò)展性方面我們有CMN-700互連技術(shù),它能實(shí)現(xiàn)多達(dá)256個(gè)內(nèi)核的可擴(kuò)展性支持,還能連接到加速器以及合作伙伴的IP等?!?/p>
“我們認(rèn)為和多樣化的加速器進(jìn)行互聯(lián),比如和AI加速器,對(duì)于未來市場非常關(guān)鍵,與此同時(shí),互聯(lián)技術(shù)的靈活性尤為重要?!?Chris Bergey表示。
Arm的目標(biāo)是通過對(duì)CCIX和CXL持續(xù)不斷的投入,讓合作伙伴可以實(shí)現(xiàn)更多的定制方案,具備總線和高核數(shù)的可擴(kuò)展性特色,突破傳統(tǒng)硅限制。
也因此,Arm更強(qiáng)調(diào)Neoverse的平臺(tái)屬性。Chris Bergey說:“我們發(fā)現(xiàn)越來越多的客戶需要完整的解決方案,即一個(gè)平臺(tái)承載他們的系統(tǒng),可以在上面添加他們的加速器或其他設(shè)備,并且可以對(duì)其進(jìn)行定制。我們要做的就是為客戶提供構(gòu)建科技大廈所需要的‘磚瓦’,而不只是單個(gè)給客戶某一個(gè)單獨(dú)的IP,單獨(dú)的CPU或互聯(lián)IP。”
完善軟件生態(tài),抓住四大市場機(jī)遇
Arm能夠提供有競爭力的平臺(tái)級(jí)解決方案,但要真正實(shí)現(xiàn)在云計(jì)算、高性能計(jì)算、5G以及邊緣基礎(chǔ)設(shè)施四大市場的基于,軟件的完善程度以及生態(tài)合作伙伴的支持非常重要。在EDA工具、數(shù)據(jù)庫、DevOps以及安全等方面,Arm Neoverse獲得了越來越多的軟件支持,AWS Gravition2在這樣的支持下不斷完善。
另外,甲骨文(Oracle)已宣布計(jì)劃在Oracle云基礎(chǔ)設(shè)施上采用Ampere Altra CPU。
在國內(nèi),Neoverse也吸引了騰訊和阿里云。騰訊專項(xiàng)測試技術(shù)中心總監(jiān)黃聞欣介紹,“去年,我們和Arm正式簽署了一份合作協(xié)議,希望通過合作加速Arm Neoverse技術(shù)的測評(píng)和適配。通過TencentBench測試框架發(fā)現(xiàn),得益于更多可擴(kuò)展的CPU核心數(shù),Arm服務(wù)器比傳統(tǒng)的服務(wù)器性能表現(xiàn)更強(qiáng)勁,在AI推理和圖片處理領(lǐng)域優(yōu)勢(shì)非常明顯?!?/p>
Arm與阿里在Java方面的合作也有進(jìn)展。阿里巴巴首席工程師周經(jīng)森說:“Arm的CPU資源在我們現(xiàn)有的軟件里有兩個(gè)考慮的點(diǎn),一些軟件需要重新編譯,另一些只需要把Java applications在JVM(Java Virtual Machine)運(yùn)行好。過去一年里,我們與Arm合作提高JVM性能,從JDK8到JDK11,通過阿里巴巴 Dragonwell(OpenJDK的一個(gè)發(fā)行版),把現(xiàn)有一些Java應(yīng)用的性能提高了50%?!?/p>
對(duì)于云原生市場的機(jī)遇,Arm基礎(chǔ)設(shè)施事業(yè)部全球高級(jí)總監(jiān)鄒挺表示:“云原生技術(shù)我們看到了很大的機(jī)遇,也不斷進(jìn)行投入,包括與公有云以及其他細(xì)分市場的合作伙伴緊密合作。在開源社區(qū)方面,我們投入大量工程資源,積極與合作伙伴們進(jìn)行了諸多云原生方面的協(xié)作。同時(shí),在下一代基礎(chǔ)設(shè)施方面,我們也展開了大規(guī)模的合作,比如說在OSS以及與ISV方面的合作?!?/p>
Arm在5G領(lǐng)域的合作伙伴也有所進(jìn)展,Marvell發(fā)布了基于Neoverse N2 的OCTEON系列網(wǎng)絡(luò)解決方案,預(yù)計(jì)2021年底前試產(chǎn)。據(jù)悉,相較于前一代的OCTEON解決方案,其性能提升3倍。
在高性能計(jì)算市場,印度電子信息技術(shù)部(MeitY)已宣布將加入法國芯片公司 SiPearl 和韓國電子通信研究所( ETRI)的行列,采用Neoverse V1驅(qū)動(dòng)國家級(jí)百萬兆級(jí)高性能計(jì)算項(xiàng)目。
小結(jié)
相同的產(chǎn)品,Arm在半年內(nèi)分兩次介紹,這表明了Arm看好新一代基礎(chǔ)設(shè)施市場的機(jī)遇,是重視,當(dāng)然也心切。畢竟,智能手機(jī)市場的增長正越來越慢,向新的市場拓展對(duì)于Am的重要性越來越高。
就像本月GTC 21上黃仁勛發(fā)布基于Arm架構(gòu)AI專用CPU GRACE時(shí)所說,英偉達(dá)能夠幫助Arm的優(yōu)勢(shì)拓展到移動(dòng)市場之外。
生態(tài)的建設(shè)沒有捷徑可走,搶食x86的蛋糕,也困難重重。Neoverse的靈活性和可擴(kuò)展性帶來的可定制性,以及TCO的優(yōu)勢(shì),能夠取得多大的勝利?
注,文中配圖來自Arm雷鋒網(wǎng)雷鋒網(wǎng)
相關(guān)文章:
Arm新十年,能否實(shí)現(xiàn)CPU計(jì)算“統(tǒng)治”?
單線程性能提升超50%!Arm新款服務(wù)器CPU要靠單核打天下?
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。