0
本文作者: 王強 | 2015-04-22 11:56 | 專題:成為世界最快,中國超算經(jīng)歷了什么? |
該來的總是要來的,這句話今天在高科技領域又一次得到了驗證。中國制造的超級計算機連續(xù)數(shù)年登頂全球性能冠軍后,為其提供核心處理器的美國企業(yè)終于被美國政府勒令停止與中方的合作。依賴進口芯片十余年后,國產超算不得不開始在國內尋求替代品。
超級計算機本質上就是一大堆小主機的集合體。過去二十年來,大部分超算使用的處理器和家用PC并無太大區(qū)別。由于運算芯片很容易在市面上買得到,業(yè)界一直公認超級計算機的核心技術主要是大規(guī)模網(wǎng)絡互聯(lián)和軟件系統(tǒng)。這兩項技術決定了那一大堆和PC沒有多少區(qū)別的主機能否高效率地聯(lián)合在一起發(fā)揮集體的最大力量。如今,中國制造的超算已經(jīng)在這兩大指標上取得世界領先地位,天河2號數(shù)度連冠的驕人成績就是最好的證明。
然而技術的發(fā)展讓形勢發(fā)生了變化。自從GPGPU和眾核芯片開始進入高性能計算領域,頂級超算越來越依賴這一類可以大幅提升性能的專用浮點處理器。Nvidia的Tesla和Intel的Xeon Phi是兩種主流的超算專用芯片,它們和我們的PC使用的CPU有較多不同,在市面上也不是隨處可見。
與此同時,Nvidia和Intel為了爭奪市場,開始向超算制造商提前供應尚未正式發(fā)布的超算芯片。天河2號就曾提前半年獲得Intel的Xeon Phi處理器,保證其能在年度性能排行榜上獲得冠軍殊榮。另一方面,這類芯片的軟件優(yōu)化也需要芯片廠商配合,這也讓Intel、Nvidia與各家超算研制單位的合作不斷加深。
在這樣的背景下,美國的禁運政策就對中國的超算發(fā)展有了很大影響。與Intel、Nvidia等企業(yè)的合作被切斷后國產超算就難以提前拿到新一代超算處理器,也難以獲得軟件開發(fā)的支持,研制進度就會被拖后半年到一年之久,登頂性能冠軍寶座就會變得非常艱難。
無法再依賴進口芯片,改用國產處理器怎么樣呢?現(xiàn)實并不樂觀。國產超算用浮點處理器雖然已經(jīng)研發(fā)多年,但如今卻要面臨兩大技術障礙:
第一大問題是高帶寬內存技術。超算芯片與我們普通PC使用的CPU的最大區(qū)別就是前者特別加強了浮點計算性能。今年新一代的Xeon Phi和明年的下一代Tesla都會有3T Flops的雙精度浮點運算速度,大約是主流i7 4770 CPU的12倍之多。國內研制的申威眾核計算芯片可以達到1T Flops的性能,但繼續(xù)提高指標就要面臨內存帶寬的瓶頸。
超算運行的程序大都比較依賴內存帶寬,如果帶寬不足,浮點性能指標再高也沒什么價值。新一代Xeon Phi和Tesla的內存帶寬高達600G/s以上,是家用主流CPU的20多倍。為了實現(xiàn)如此之高的帶寬,Intel和Nvidia使用了內存3D封裝技術,將內存芯片和運算芯片疊在一起緊密相連。這一技術需要處理器研發(fā)企業(yè)和內存企業(yè)的深度合作,實現(xiàn)難度遠超傳統(tǒng)的內存方案。
國內的申威處理器與飛騰處理器幾年前就開始進行3D封裝內存技術的研究,但由于缺乏經(jīng)驗和內存企業(yè)的配合,時至今日仍然與Intel等差距巨大。事實上國產處理器過去一直使用第三方出售的內存控制器模塊,即使是傳統(tǒng)的內存系統(tǒng)的研制上都沒什么經(jīng)驗,更不用說新一代3D封裝內存了。掌握3D內存技術的Intel、Nvidia、AMD等企業(yè)也不可能向國內企業(yè)出售相應技術的授權,三星等內存制造商又很難給國內企業(yè)提供強有力的支持。內存問題不解決,申威、飛騰等超算芯片就難以做到媲美同期Xeon Phi、Tesla的高運算指標,這樣國產超算面對裝備Intel、Nvidia芯片的美國對手時就會力不從心。
制約超算芯片發(fā)展的另一大關鍵技術是高帶寬互聯(lián)總線。我們PC中常見的PCIe總線對于高浮點性能的超算處理器的互聯(lián)來說太過緩慢,區(qū)區(qū)32G/s的帶寬如同狹窄的雙車道馬路。下一代Xeon Phi和Tesla將升級到帶寬超過100G/s的專用總線,大大緩解系統(tǒng)中大量處理器數(shù)據(jù)交換的擁堵現(xiàn)象。Intel甚至會首次應用硅光子技術,以光路取代電路在芯片間高速交換信息,降低總線的復雜度、功耗并提供更強的性能。
國產處理器在這一方面仍然處于明顯落后的局面。新一代申威、飛騰等浮點處理器使用的互聯(lián)方案依舊是PCIe的水平,兩三年內都難以追上美國企業(yè)。而硅光子傳輸這樣的先進技術領域,國內企業(yè)仍處于中期研究階段,離實際部署有著很長的距離。總線帶寬不足意味著國產超算難以通過部署更多數(shù)量的芯片通過數(shù)量優(yōu)勢占據(jù)主動,也就無法抹除單個芯片性能不足帶來的劣勢。
進口芯片沒法提前買到,國產處理器又面臨兩大技術難題的困擾無法匹敵美國產品,未來幾年全球超算排行榜上中國登頂?shù)臋C會就會十分渺茫。不過排行榜只是個榮譽,單純追求排名并沒有太大意義。如果中國在美國禁運后加大對自主芯片的投入,為更長遠的未來做好準備,那么在幾年的頹勢過后,搭載國產處理器的中國超級計算機還是可以與美國的頂尖系統(tǒng)一決高下的。而且借此機會國產處理器還可以在其他領域獲得長足進步,甚至在一些關鍵行業(yè)取代進口處理器,這不能不說是一個大好機會。塞翁失馬焉知非福,或許中國自主研制的處理器就將因美國禁運政策而從此崛起,中國科技產業(yè)多年的一大夢想如今有希望實現(xiàn)了。
雷峰網(wǎng)特約稿件,未經(jīng)授權禁止轉載。詳情見轉載須知。