0
本文作者: 嘉嘉 | 2022-10-27 14:26 |
“我們總是高估未來(lái)2年會(huì)發(fā)生的改變,低估了未來(lái)10年將發(fā)生的變化?!北葼柹w茨這句名言用到如今的高性能計(jì)算(HPC)領(lǐng)域再貼切不過(guò).
十年前,誰(shuí)能想到高性能計(jì)算能夠讓普通人在智能手機(jī)上就能點(diǎn)外賣,電影大片的特效渲染也需要高性能計(jì)算的加持。
十年前,幾乎沒有人能料想到英偉達(dá)和高通在2022年發(fā)布的智能汽車芯片AI算力能高達(dá)2000T,未來(lái)的智能汽車將是“裝了四個(gè)輪子的超級(jí)計(jì)算機(jī)”。
高性能計(jì)算的應(yīng)用早已不再局限于天氣預(yù)測(cè)、藥物研發(fā)、油田分析等少數(shù)應(yīng)用,如今的高性能計(jì)算正在進(jìn)入次世代,應(yīng)用的領(lǐng)域不僅更加廣泛,與普通人的生活聯(lián)系的也更加緊密。
新思科技研究團(tuán)隊(duì)早在幾年前就預(yù)測(cè),高性能計(jì)算和云將會(huì)被用于多種不同類型的應(yīng)用中,無(wú)論大小。
在AI、元宇宙、智能汽車等諸多技術(shù)和應(yīng)用的推動(dòng)下,面對(duì)越來(lái)越大的芯片和越來(lái)越復(fù)雜系統(tǒng),高性能計(jì)算的計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)挑戰(zhàn)應(yīng)該如何解決?
最近幾年,高性能計(jì)算受到越來(lái)越多的關(guān)注。新冠疫情下,高性能計(jì)算對(duì)于疫苗和藥物的研發(fā)發(fā)揮了重要的作用。越來(lái)越智能的汽車也依賴算力的大幅度提升。還有近兩年備受關(guān)注的元宇宙,也需要高性能計(jì)算作為支撐。
而這些大大小小的應(yīng)用,也正是推動(dòng)高性能計(jì)算進(jìn)入下一個(gè)時(shí)代的動(dòng)力。知名市場(chǎng)分析機(jī)構(gòu)Mordor Intelligence在2021年的一份報(bào)告中指出,高性能計(jì)算市場(chǎng)在2020年到2025年預(yù)計(jì)將以每年6%以上的速度增長(zhǎng)。
高性能計(jì)算的主要作用其實(shí)就是為數(shù)據(jù)中心的運(yùn)行提供所需的計(jì)算能力。
過(guò)去,數(shù)據(jù)中心處理的數(shù)據(jù)只是某個(gè)特定組織業(yè)務(wù)運(yùn)營(yíng)的輸出,通過(guò)對(duì)由人機(jī)交互生成的大量數(shù)據(jù)進(jìn)行測(cè)量、推理或分析實(shí)現(xiàn)更高商業(yè)價(jià)值,比如藥物研發(fā)和油田分析。
如今,數(shù)據(jù)不再由人類實(shí)踐所生成,比如,一輛自動(dòng)駕駛汽車每行駛1小時(shí)可以生成5TB的數(shù)據(jù),隨著自動(dòng)駕駛汽車數(shù)量的增多,產(chǎn)生的數(shù)據(jù)量也將十分驚人。研究型數(shù)據(jù)統(tǒng)計(jì)公司Statista預(yù)計(jì),2010年全球的數(shù)據(jù)量為2ZB,這一數(shù)據(jù)在2025年將增長(zhǎng)至181ZB,數(shù)據(jù)正在以超乎想象的速度增長(zhǎng)。
數(shù)據(jù)生成方式發(fā)生根本性轉(zhuǎn)變的同時(shí),數(shù)據(jù)處理和存儲(chǔ)技術(shù)近十年間也發(fā)正了變革。這進(jìn)一步引發(fā)了數(shù)據(jù)中心架構(gòu)的重大變化,分布式網(wǎng)絡(luò)應(yīng)運(yùn)而生。
CPU已經(jīng)不能滿足數(shù)據(jù)爆炸式增長(zhǎng)帶來(lái)的計(jì)算需求,需要性能更強(qiáng)的專用處理器。同時(shí),新的數(shù)據(jù)中心架構(gòu)對(duì)于通信性能的要求也大幅提升,獨(dú)立網(wǎng)卡(NIC)和服務(wù)器機(jī)架上的架頂式交換機(jī)的性能和延遲,對(duì)于在數(shù)據(jù)中心內(nèi)部高效移動(dòng)數(shù)據(jù)而言也不再適用。
數(shù)據(jù)爆發(fā)對(duì)于存儲(chǔ)技術(shù)和容量帶來(lái)的挑戰(zhàn),也需要?jiǎng)?chuàng)新性技術(shù)滿足云計(jì)算和高性能計(jì)算的需求。IDC預(yù)測(cè),從2020年到2025年,全球存儲(chǔ)容量將以每年19.2%的速度增長(zhǎng)。
新的應(yīng)用確實(shí)在推動(dòng)高性能計(jì)算進(jìn)入次世代,但在摩爾定律放緩的背景下,高性能計(jì)算無(wú)論是提升計(jì)算性能,還是降低通信延遲和實(shí)現(xiàn)存儲(chǔ)技術(shù)創(chuàng)新,都面臨著諸多挑戰(zhàn)。
過(guò)去幾十年間,得益于摩爾定律,芯片的性能持續(xù)快速提升。然而,先進(jìn)的制程正在接近物理極限,這一方面讓依靠先進(jìn)制程提升單芯片性能的難度和復(fù)雜度越來(lái)越高。另一方面,想要將小芯片集成到單個(gè)系統(tǒng)中也帶來(lái)了復(fù)雜性和設(shè)計(jì)的挑戰(zhàn)。
這就意味著,無(wú)論采用何種方式提升計(jì)算性能,都同樣面臨著更高復(fù)雜度的設(shè)計(jì)挑戰(zhàn)。
先看提升單芯片性能面臨的挑戰(zhàn),單芯片性能的提升正在將裸片尺寸推向制造工藝的極限,這就不僅要克服單芯片設(shè)計(jì)規(guī)模的挑戰(zhàn),還面臨整體成本增加的問題。
3DIC Complier是一個(gè)不錯(cuò)的解決方案,它可以將設(shè)計(jì)分解為多個(gè)集成芯片設(shè)計(jì)。要使用3DIC Complier設(shè)計(jì)性能強(qiáng)大的芯片,從一開始,開發(fā)者就需要使用新思科技的3DIC Compiler 等工具進(jìn)行更多的早期版圖規(guī)劃和基于封裝的信號(hào)完整性分析。
3DIC Compiler是統(tǒng)一的多裸晶芯片設(shè)計(jì)實(shí)現(xiàn)平臺(tái),不僅效率高,還能擴(kuò)展容量和性能,為各種異構(gòu)工藝和堆疊裸片提供無(wú)縫支持。
新思科技已經(jīng)與臺(tái)積電緊密合作,無(wú)縫集成了基于臺(tái)積公司3DFabric技術(shù)的設(shè)計(jì)方法, 為客戶提供完整的“初步規(guī)劃到簽核”的設(shè)計(jì)平臺(tái),能夠滿足芯片開發(fā)者對(duì)性能、功耗和晶體管數(shù)量密度的要求。
為應(yīng)對(duì)不斷增長(zhǎng)的單芯片設(shè)計(jì)規(guī)模的挑戰(zhàn),開發(fā)者則需要使用像新思科技的Fusion Design Platform,這一平臺(tái)能讓芯片開發(fā)者在不斷增加的計(jì)算內(nèi)核上進(jìn)行操作,并且這些工具能在云環(huán)境中使用。在云環(huán)境中,開發(fā)者可以訪問成千上萬(wàn)的計(jì)算資源,這對(duì)提升芯片的整體性能以及加快上市時(shí)間有重要意義。
今年,新思科技也和三星達(dá)成合作,通過(guò)Fusion Design Platform提供經(jīng)認(rèn)證的數(shù)字實(shí)現(xiàn)、時(shí)序和物理簽核參考流程,開發(fā)者可以利用新思科技平臺(tái)的自動(dòng)化功能和集成優(yōu)勢(shì)來(lái)提高工作效率,并在三星的先進(jìn)工藝節(jié)點(diǎn)上最大限度地提高PPA,還能加速高性能計(jì)算芯片的設(shè)計(jì)。
Arm也已利用新思科技的Fusion Design Platform和Verification Continuum Platform,實(shí)現(xiàn)了Neoverse V1和N2云端到邊緣基礎(chǔ)設(shè)施內(nèi)核的快速開發(fā)和理想PPA指標(biāo),加快了高性能計(jì)算和AI應(yīng)用領(lǐng)域中基于Arm的產(chǎn)品上市時(shí)間。
提升單芯片性能的設(shè)計(jì)難度,以及先進(jìn)制程帶來(lái)的高成本都是大部分芯片設(shè)計(jì)公司難以承受的。從系統(tǒng)的角度看,下一代高性能計(jì)算架構(gòu)將出現(xiàn)分解架構(gòu)和異構(gòu)系統(tǒng)的爆炸式增長(zhǎng),不同的專用處理架構(gòu)將集成在單個(gè)節(jié)點(diǎn)中,在模塊之間實(shí)現(xiàn)精密、靈活的切換。
于是,將不同性能和功能的芯片封裝在一起的小芯片技術(shù)受到歡迎,Die-to-Die接口對(duì)于不受封裝成本和裝配限制的高性能計(jì)算應(yīng)用SoC非常有吸引力。
小芯片的設(shè)計(jì)可以根據(jù)應(yīng)用需求集成各種小芯片和IP資源,但即使是較大的公司也負(fù)擔(dān)不起所有IP的開發(fā)費(fèi)用,采購(gòu)第三方IP可以節(jié)省時(shí)間和金錢,是更理想的選擇。
作為全球頂級(jí)的IP提供商,新思科技提供一系列Die-to-Die IP,包括UCIe和基于SerDes的PHY和控制器。
一邊提升單芯片的性能,一邊通過(guò)小芯片的設(shè)計(jì)不斷提升性能,高性能計(jì)算在解決計(jì)算挑戰(zhàn)的同時(shí),還需解決網(wǎng)絡(luò)和存儲(chǔ)的挑戰(zhàn)。
用于大數(shù)據(jù)處理、模擬和預(yù)測(cè)的模型越來(lái)越復(fù)雜,推動(dòng)了對(duì)更高計(jì)算能力和更大存儲(chǔ)容量,以及更低網(wǎng)絡(luò)延遲的需求,這是一個(gè)全面硬實(shí)力的考驗(yàn)。
據(jù)估算,數(shù)據(jù)中心的運(yùn)行和冷卻服務(wù)器的用電各占約40%,20%的用電用于存儲(chǔ)和網(wǎng)絡(luò)。只有同時(shí)解決新型數(shù)據(jù)中心計(jì)算、存儲(chǔ)和網(wǎng)絡(luò)的挑戰(zhàn),才能邁入高性能計(jì)算的新時(shí)代,實(shí)現(xiàn)數(shù)據(jù)中心的碳中和。
高性能計(jì)算要實(shí)現(xiàn)性能提升,就要求數(shù)據(jù)網(wǎng)絡(luò)和設(shè)備接口需要增加帶寬滿足計(jì)算和存儲(chǔ)節(jié)點(diǎn)間的數(shù)據(jù)傳輸需求。這給高性能計(jì)算的存儲(chǔ)系統(tǒng)帶來(lái)了包括帶寬、容量、延遲、安全性、訪問管理、功率等諸多挑戰(zhàn)。
十年前,人們對(duì)于帶寬需求的估計(jì)很低,大概是現(xiàn)在的一半甚至三分之一。但如今,全球?qū)挼男枨笠郧八从械乃俣仍鲩L(zhǎng),以太網(wǎng)正在成為數(shù)據(jù)中心高性能計(jì)算的選擇。以太網(wǎng)、PCIe和其它接口技術(shù)都在逐漸增加帶寬以滿足需求,以太網(wǎng)正在從100Gbps過(guò)渡到800Gbps。
雖然訪問支持10Gbps到800Gbps以太網(wǎng)的各種配置的IP很重要,但SoC開發(fā)者也在尋找能夠提供更多差異化的解決方案,比如可根據(jù)特定設(shè)計(jì)需求進(jìn)行配置的最低延遲以太網(wǎng)IP;能夠縮短上市時(shí)間的集成MAC、PCS和PHY的解決方案等。
作為業(yè)界為數(shù)不多能夠提供高性能計(jì)算端到端解決方案的公司,新思科技也有高質(zhì)量的IP解決方案幫助開發(fā)者應(yīng)對(duì)網(wǎng)絡(luò)挑戰(zhàn)。
新思科技全面的112G以太網(wǎng)PHY解決方案結(jié)合了自身的布線可行性研究、封裝基板指南、信號(hào)和電源完整性模型以及深入的串?dāng)_分析,可實(shí)現(xiàn)快速可靠的SoC集成。112G以太網(wǎng)PHY是新思科技面向高性能計(jì)算應(yīng)用的綜合IP產(chǎn)品組合的一部分,除此之外還包括廣泛使用的協(xié)議如PCI Express 、DDR、HBM、Die-to-Die、CXL和 CCIX。
網(wǎng)絡(luò)性能的提升的同時(shí),存儲(chǔ)設(shè)備上的數(shù)據(jù)接口速度也在提高,NVMe SSD采用PCIe 5.0和6.0,傳輸速率可以達(dá)到32Gbps和64Gbps。
與提升產(chǎn)品性能一樣重要的,是對(duì)芯片全生命周期的追蹤,特別是高性能計(jì)算這樣對(duì)芯片品質(zhì)、安全性和可靠性要求極高的應(yīng)用。生命周期管理(SLM)的出現(xiàn),讓設(shè)備運(yùn)作的一整個(gè)生命周期都可持續(xù)提供資料反饋和優(yōu)化,幫助開發(fā)者設(shè)計(jì)出更優(yōu)秀芯片。
SLM很可能會(huì)改變整個(gè)先進(jìn)工藝設(shè)計(jì)領(lǐng)域的游戲規(guī)則,新思科技也將發(fā)揮重要作用。得益于在TEST和DFT領(lǐng)域豐富的經(jīng)驗(yàn)和強(qiáng)大的實(shí)力,新思科技建立了SLM平臺(tái),并且,新思科技還將SLM平臺(tái)與領(lǐng)先的EDA和IP技術(shù)相整合,建構(gòu)了完整的一體化平臺(tái),幫助芯片設(shè)計(jì)團(tuán)隊(duì)最大化芯片的PPA,加速產(chǎn)品上市。
另外,一些額外的存儲(chǔ)技術(shù)也能滿足次世代高性能計(jì)算的需求。比如持久內(nèi)存技術(shù)、遠(yuǎn)程直接內(nèi)存訪問(RDMA)和RoCE、NVMe-oF、計(jì)算存儲(chǔ)。
新思科技與業(yè)界一起解決高性能計(jì)算的存儲(chǔ)挑戰(zhàn),提供廣泛的高性能IP產(chǎn)品組合,例如DDR、HBM、以太網(wǎng)和PCIe PHY和控制器、ARC處理器以及設(shè)計(jì)工具。
一個(gè)很好的例子是,Socionext采用了新思科技的HBM2E IP,運(yùn)行速度為3.6Gbps的HBM2E IP,滿足了Socionext創(chuàng)新AI引擎和加速器片上系統(tǒng)(SoC)對(duì)于容量、功耗和計(jì)算性能的嚴(yán)苛要求,成功將5nm工藝HBM2E IP部署于AI和高性能計(jì)算SoC。
人們常說(shuō),科技改變生活。芯片作為技術(shù)革命底層的支撐,一直在影響著科技未來(lái)的走向。隨著高性能計(jì)算的持續(xù)發(fā)展,以及高性能計(jì)算更加廣泛的應(yīng)用,我們將迎來(lái)更加智能的生活,體驗(yàn)到云計(jì)算帶來(lái)的數(shù)字化普及帶來(lái)的便利,智能汽車帶來(lái)的全新體驗(yàn),以及元宇宙的全新世界。這一切的背后,新思科技高性能計(jì)算端到端的全面解決方案,以及高效、安全的IP和工具,更是支撐高性能計(jì)算進(jìn)入新時(shí)代的關(guān)鍵。
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。