0
本文作者: 包永剛 | 2020-08-13 21:48 |
雷鋒網(wǎng)消息,英特爾首席架構師Raja Koduri和多位英特爾院士、架構師在英特爾2020年架構日上詳細介紹了英特爾在六大技術支柱方面的最新進展。首次展示了英特爾全新的10nm SuperFin技術,并首次介紹了可實現(xiàn)全擴展的Xe圖形架構,還有Willow Cove微架構和用于移動客戶端的Tiger Lake SoC架構細節(jié),先進封裝技術、混合架構等。
英特爾在架構日上展示的制程&封裝、XPU架構、內(nèi)存&存儲、互聯(lián)、安全、軟件的進展,是否表明了英特爾開啟了計算架構創(chuàng)新的黃金十年?
全新10nm SuperFin技術可媲美節(jié)點轉(zhuǎn)換
智能化時代快速增長的算力需求與先進制程提升的速度之間的差距越來越大,晶體管的微縮也面臨著越來越多的物理極限挑戰(zhàn),業(yè)界正通過技術創(chuàng)新去解決挑戰(zhàn)。Raja Koduri表示,經(jīng)過多年對FinFET晶體管技術的改進,英特爾正在重新定義該技術,以實現(xiàn)其歷史上最強大的單節(jié)點內(nèi)性能增強,帶來的性能提升可與完全節(jié)點轉(zhuǎn)換相媲美。
英特爾推出的全新晶體管技術10nm SuperFin技術實現(xiàn)了英特爾增強型FinFET晶體管與Super MIM(Metal-Insulator-Metal)電容器的結合。
SuperFin技術能夠提供增強的外延源極/漏極、改進的柵極工藝和額外的柵極間距,并通過以下方式實現(xiàn)更高的性能:
增強源極和漏極上晶體結構的外延長度,從而增加應變并減小電阻,以允許更多電流通過通道。
改進柵極工藝以實現(xiàn)更高的通道遷移率,從而使電荷載流子更快地移動。
提供額外的柵極間距選項可為需要最高性能的芯片功能提供更高的驅(qū)動電流。
使用新型薄壁阻隔將過孔電阻降低了30%,從而提升了互連性能表現(xiàn)。
與行業(yè)標準相比,在同等的占位面積內(nèi)電容增加了5倍,從而減少了電壓下降,顯著提高了產(chǎn)品性能。該技術由一類新型的“高K”( Hi-K)電介質(zhì)材料實現(xiàn),該材料可以堆疊在厚度僅為幾埃厚的超薄層中,從而形成重復的“超晶格”結構。
Raja說:“這是一項行業(yè)內(nèi)領先的技術,領先于其他芯片制造商的現(xiàn)有能力。”
據(jù)悉,10nm SuperFin技術將運用于代號為“ Tiger Lake”的英特爾下一代移動處理器中。搭載Tiger Lake移動處理器的產(chǎn)品將在今年假日季上市。
晶體管技術創(chuàng)新的同時,更為重要的可能是架構創(chuàng)新。去年2017 年圖靈獎的兩位得主 John L. Hennessy 和 David A. Patterson發(fā)表了一篇長報告《A New Golden Age for Computer Architecture》,詳細描述了引發(fā)計算機架構新時代到來的種種變化,并且展望未來的十年將是計算機體系架構領域的“新的黃金十年”。
英特爾在2020年架構日上展示了從CPU到GPU的多個架構的最新進展。
Tiger Lake與最新Willow Cove CPU及Xe GPU微架構
Tiger Lake是英特爾第一個在SoC架構中采用全新 Xe-LP圖形微架構。Tiger Lake基于全新的Willow Cove CPU核,有顯著的頻率。GPU采用全新的Xe圖形架構,每瓦性能效率有顯著提升。加上電源管理、結構和內(nèi)存、I/O、顯示燈方面的提升,Tiger Lake的性能超越上一代CPU,并實現(xiàn)大規(guī)模的AI性能和圖形性能的飛躍。
Tiger Lake SoC架構提升具體如下:
全新Willow Cove CPU核心——基于10nm SuperFin技術進步,顯著提升頻率。
新Xe圖形架構 – 具有高達96個執(zhí)行單元(EUs),每瓦性能效率顯著提高。
電源管理——一致性結構中的自主動態(tài)電壓頻率調(diào)整(DVFS),提高了全集成電壓穩(wěn)壓器(FIVR)效率。
結構和內(nèi)存——一致性結構帶寬增加2倍,約86GB/s內(nèi)存帶寬,經(jīng)驗證的LP4x-4267、DDR4-3200;LP5-5400架構功能?。
高斯網(wǎng)絡加速器GNA 2.0專用IP,用于低功耗神經(jīng)推理計算,減輕CPU處理。運行音頻噪音抑制工作負載情況下,采用GNA推理計算的CPU利用率比不采用GNA的CPU低20%。
IO——集成TB4/USB4,CPU上集成PCIe Gen 4,用于低延遲、高帶寬設備對內(nèi)存的訪問。
顯示——高達 64GB/s的同步傳輸帶寬用于支持多個高分辨率顯示器。到內(nèi)存的專用結構路徑,以保持服務質(zhì)量。
IPU6 ——多達6個傳感器,具有4K 30幀視頻、27MP像素圖像;最高4K90幀和42MP像素圖像架構功能。
Willow Cove
Willow Cove基于最新的處理器技術和10nm的SuperFin技術的英特爾最新一代CPU微架構。Willow Cove在Sunny Cove架構的基礎上,極大地提升了頻率以及功率效率,實現(xiàn)超越代間CPU的性能提高。
另外,Willow Cove還將重新設計的緩存架構引入到更大的非相容1.25MB MLC中,并通過英特爾控制流強制技術(Control Flow Enforcement Technology)增強了安全性。
Xe 圖形架構
關注英特爾的人對Xe架構并不陌生,英特爾在CES上也透露了首款針對PC的獨立圖形顯卡DG1。在今天的架構日上,英特爾首次詳細介紹了可實現(xiàn)全擴展的Xe圖形架構。Xe圖形架構有Xe-LP、Xe-HP、Xe-HPC三個系列,加上今天新推出的Xe微架構變體Xe-HPG,目前已有四個系列Xe微架構。
Xe-LP是針對PC和移動計算平臺的最高效架構。最高配置EU單元多達96組,并具有新架構設計,包括異步計算、視圖實例化 (view instancing)、采樣器反饋(sampler feedback)、帶有AV1的更新版媒體引擎以及更新版顯示引擎等。
Xe-LP將使新的終端用戶功能具備即時游戲調(diào)整(Instant Game Tuning)、捕捉與流媒體及圖像銳化。軟件優(yōu)化方面,Xe-LP將通過新的DX11路徑和優(yōu)化的編譯器對驅(qū)動進行改進。
Xe-HP是業(yè)界首個多區(qū)塊(multi-tiled)、高度可擴展的高性能架構,可提供數(shù)據(jù)中心級、機架級媒體性能,具有可擴展性和AI優(yōu)化。Xe-HP涵蓋了從一個區(qū)塊(tile)到兩個和四個區(qū)塊的動態(tài)范圍的計算,其功能類似于多核GPU。
架構日上,英特爾展示了Xe-HP在單個區(qū)塊上以60 FPS的速率對10個完整的高質(zhì)量4K視頻流進行轉(zhuǎn)碼。還展示了Xe-HP在多個區(qū)塊上的計算可擴展性。
雷鋒網(wǎng)了解到,首款Xe-HP芯片已于實驗室完成啟動測試。目前,英特爾現(xiàn)在正在與關鍵客戶一起測試Xe-HP,并計劃通過Intel DevCloud使開發(fā)者可以使用Xe HP。Xe-HP產(chǎn)品將于明年推出。
Xe-HPG是英特爾推出的最新Xe微架構變體,是為游戲優(yōu)化的微架構。這個全新的微架構結合了Xe-LP的良好的效能功耗比的構建模塊,利用Xe-HP的可擴展性對Xe-HPC進行更強的配置和計算頻率的優(yōu)化。
同時,Xe-HPG添加了基于GDDR6的新內(nèi)存子系統(tǒng)以提高性價比,且將具有加速的光線跟蹤支持。據(jù)悉,Xe-HPG預計將于2021年開始發(fā)貨。
Xe架構的產(chǎn)品將于今明兩年陸續(xù)推出。英特爾表示,首款Xe架構產(chǎn)品DG1已投產(chǎn),并有望按計劃于2020年開始交付。DG1現(xiàn)在可在英特爾DevCloud上供早期訪問用戶使用。
除了DG1,將很快投產(chǎn),并于今年晚些時候發(fā)貨的Xe產(chǎn)品還有針對數(shù)據(jù)中心的Server GPU(SG1)獨立圖形顯卡。SG1將4個DG1聚合,可以很小的尺寸將性能提升至數(shù)據(jù)中心級別,實現(xiàn)低延遲、高密度的安卓云游戲和視頻流。
數(shù)據(jù)中心架構
Ice Lake
英特爾還有一款預期將于今年底推出的產(chǎn)品Ice Lake。Ice Lake是首款基于10nm的英特爾至強可擴展處理器,它將帶來一系列技術,包括全內(nèi)存加密、PCIe Gen 4、8個內(nèi)存通道等,以及可加快密碼運算速度的增強指令集,在跨工作負載的吞吐量和響應能力方面提供強勁性能。
英特爾透露,Ice Lak系列中也會推出針對網(wǎng)絡存儲和物聯(lián)網(wǎng)的變體。
Sapphire Rapids
當然,英特爾也會基于增強型SuperFin技術推出下一代至強可擴展處理器Sapphire Rapids,它將是美國阿貢國家實驗室“極光”超級計算機系統(tǒng)(Aurora Exascale)中使用的CPU。
Sapphire Rapids提供領先的行業(yè)標準技術,包括DDR5、PCIe Gen 5、Compute Express Link 1.1等。另外,它也將延續(xù)英特爾的內(nèi)置人工智能加速策略,使用一種名為先進的矩陣擴展(AMX)的新加速器。
英特爾預計Sapphire Rapids將于2021年下半年開始首批生產(chǎn)發(fā)貨。
除了CPU和GPU,英特爾的FPGA也在持續(xù)演進。
混合架構
特別值得一提的是,架構日上英特爾還介紹了下一代采用混合架構可客戶端產(chǎn)品Alder Lake。
Alder Lake將結合英特爾即將推出的兩種架構——Golden Cove和Gracemont,并將進行優(yōu)化,以提供出色的效能功耗比。
要開啟計算架構的黃金新十年,除了需要晶體管技術以及架構創(chuàng)新,也需要更先進的封裝技術和統(tǒng)一的軟件平臺與之匹配。
封裝與軟件等進展
封裝技術方面,英特爾使用“混合結合(Hybrid bonding)”技術的測試芯片已在2020年第二季度流片。
當今,大多數(shù)封裝技術中使用的是傳統(tǒng)的“熱壓結合(thermocompression bonding)”技術,混合結合是這一技術的替代品?;旌辖Y合這項新技術能夠加速實現(xiàn)10微米及以下的凸點間距,提供更高的互連密度、帶寬和更低的功率。
存儲技術方面,英特爾也有全面的產(chǎn)品能夠滿足不同的需求。
傳輸產(chǎn)品,英特爾有世界上第一臺下一代224G-PAM4 TX收發(fā)器。
軟件方面,今年7月,英特爾發(fā)布了其第八版的oneAPI Beta,為分布式數(shù)據(jù)分析帶來了新的功能和提升,包括渲染性能、性能分析以及視頻和線程文庫。
架構日上,英特爾宣布oneAPI Gold版本將于今年晚些時候推出。oneAPI Gold版是為開發(fā)人員提供在標量、矢量、距陣和空間體系結構上保證產(chǎn)品級別的質(zhì)量和性能的解決方案。
雷鋒網(wǎng)小結
近來,關于英特爾的消息引發(fā)擔憂,包括7nm工藝延期,市值被英偉達超越等。作為一家以技術為核心競爭力的公司,英特爾在2020年架構日上公布的晶體管到架構,再到軟件和安全等的最新技術進展和詳細解讀。不僅是英特爾讓外界看到其技術實力的一個好機會,更是回應外界質(zhì)疑最好的方式。
Raja去年接受雷鋒網(wǎng)采訪時說:“我百分之百認同未來十年是計算架構的新黃金十年的觀點。在未來10年,我們將看到比過去50年多得多的架構優(yōu)化和提升。通過軟件和硬件的結合,我們可以讓摩爾定律的提升變成十倍?!?/p>
芯片行業(yè)的競爭已經(jīng)升級,英特爾能否繼續(xù)引領?
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。