美國禁運，國產(chǎn)超算面臨怎樣的挑戰(zhàn)？

本文作者：王強

2015-04-22 11:56

導(dǎo)語：美國對華禁運超算關(guān)鍵技術(shù)后，國產(chǎn)超級計算機要再登頂性能冠軍就需要依賴自主芯片。那么，中國自主研發(fā)的超算處理器要追上進(jìn)口產(chǎn)品的水平需要跨越哪些障礙呢？

該來的總是要來的，這句話今天在高科技領(lǐng)域又一次得到了驗證。中國制造的超級計算機連續(xù)數(shù)年登頂全球性能冠軍后，為其提供核心處理器的美國企業(yè)終于被美國政府勒令停止與中方的合作。依賴進(jìn)口芯片十余年后，國產(chǎn)超算不得不開始在國內(nèi)尋求替代品。

超級計算機本質(zhì)上就是一大堆小主機的集合體。過去二十年來，大部分超算使用的處理器和家用PC并無太大區(qū)別。由于運算芯片很容易在市面上買得到，業(yè)界一直公認(rèn)超級計算機的核心技術(shù)主要是大規(guī)模網(wǎng)絡(luò)互聯(lián)和軟件系統(tǒng)。這兩項技術(shù)決定了那一大堆和PC沒有多少區(qū)別的主機能否高效率地聯(lián)合在一起發(fā)揮集體的最大力量。如今，中國制造的超算已經(jīng)在這兩大指標(biāo)上取得世界領(lǐng)先地位，天河2號數(shù)度連冠的驕人成績就是最好的證明。

然而技術(shù)的發(fā)展讓形勢發(fā)生了變化。自從GPGPU和眾核芯片開始進(jìn)入高性能計算領(lǐng)域，頂級超算越來越依賴這一類可以大幅提升性能的專用浮點處理器。Nvidia的Tesla和Intel的Xeon Phi是兩種主流的超算專用芯片，它們和我們的PC使用的CPU有較多不同，在市面上也不是隨處可見。

與此同時，Nvidia和Intel為了爭奪市場，開始向超算制造商提前供應(yīng)尚未正式發(fā)布的超算芯片。天河2號就曾提前半年獲得Intel的Xeon Phi處理器，保證其能在年度性能排行榜上獲得冠軍殊榮。另一方面，這類芯片的軟件優(yōu)化也需要芯片廠商配合，這也讓Intel、Nvidia與各家超算研制單位的合作不斷加深。

在這樣的背景下，美國的禁運政策就對中國的超算發(fā)展有了很大影響。與Intel、Nvidia等企業(yè)的合作被切斷后國產(chǎn)超算就難以提前拿到新一代超算處理器，也難以獲得軟件開發(fā)的支持，研制進(jìn)度就會被拖后半年到一年之久，登頂性能冠軍寶座就會變得非常艱難。

無法再依賴進(jìn)口芯片，改用國產(chǎn)處理器怎么樣呢？現(xiàn)實并不樂觀。國產(chǎn)超算用浮點處理器雖然已經(jīng)研發(fā)多年，但如今卻要面臨兩大技術(shù)障礙：

第一大問題是高帶寬內(nèi)存技術(shù)。超算芯片與我們普通PC使用的CPU的最大區(qū)別就是前者特別加強了浮點計算性能。今年新一代的Xeon Phi和明年的下一代Tesla都會有3T Flops的雙精度浮點運算速度，大約是主流i7 4770 CPU的12倍之多。國內(nèi)研制的申威眾核計算芯片可以達(dá)到1T Flops的性能，但繼續(xù)提高指標(biāo)就要面臨內(nèi)存帶寬的瓶頸。

超算運行的程序大都比較依賴內(nèi)存帶寬，如果帶寬不足，浮點性能指標(biāo)再高也沒什么價值。新一代Xeon Phi和Tesla的內(nèi)存帶寬高達(dá)600G/s以上，是家用主流CPU的20多倍。為了實現(xiàn)如此之高的帶寬，Intel和Nvidia使用了內(nèi)存3D封裝技術(shù)，將內(nèi)存芯片和運算芯片疊在一起緊密相連。這一技術(shù)需要處理器研發(fā)企業(yè)和內(nèi)存企業(yè)的深度合作，實現(xiàn)難度遠(yuǎn)超傳統(tǒng)的內(nèi)存方案。

國內(nèi)的申威處理器與飛騰處理器幾年前就開始進(jìn)行3D封裝內(nèi)存技術(shù)的研究，但由于缺乏經(jīng)驗和內(nèi)存企業(yè)的配合，時至今日仍然與Intel等差距巨大。事實上國產(chǎn)處理器過去一直使用第三方出售的內(nèi)存控制器模塊，即使是傳統(tǒng)的內(nèi)存系統(tǒng)的研制上都沒什么經(jīng)驗，更不用說新一代3D封裝內(nèi)存了。掌握3D內(nèi)存技術(shù)的Intel、Nvidia、AMD等企業(yè)也不可能向國內(nèi)企業(yè)出售相應(yīng)技術(shù)的授權(quán)，三星等內(nèi)存制造商又很難給國內(nèi)企業(yè)提供強有力的支持。內(nèi)存問題不解決，申威、飛騰等超算芯片就難以做到媲美同期Xeon Phi、Tesla的高運算指標(biāo)，這樣國產(chǎn)超算面對裝備Intel、Nvidia芯片的美國對手時就會力不從心。

制約超算芯片發(fā)展的另一大關(guān)鍵技術(shù)是高帶寬互聯(lián)總線。我們PC中常見的PCIe總線對于高浮點性能的超算處理器的互聯(lián)來說太過緩慢，區(qū)區(qū)32G/s的帶寬如同狹窄的雙車道馬路。下一代Xeon Phi和Tesla將升級到帶寬超過100G/s的專用總線，大大緩解系統(tǒng)中大量處理器數(shù)據(jù)交換的擁堵現(xiàn)象。Intel甚至?xí)状螒?yīng)用硅光子技術(shù)，以光路取代電路在芯片間高速交換信息，降低總線的復(fù)雜度、功耗并提供更強的性能。

國產(chǎn)處理器在這一方面仍然處于明顯落后的局面。新一代申威、飛騰等浮點處理器使用的互聯(lián)方案依舊是PCIe的水平，兩三年內(nèi)都難以追上美國企業(yè)。而硅光子傳輸這樣的先進(jìn)技術(shù)領(lǐng)域，國內(nèi)企業(yè)仍處于中期研究階段，離實際部署有著很長的距離?？偩€帶寬不足意味著國產(chǎn)超算難以通過部署更多數(shù)量的芯片通過數(shù)量優(yōu)勢占據(jù)主動，也就無法抹除單個芯片性能不足帶來的劣勢。

進(jìn)口芯片沒法提前買到，國產(chǎn)處理器又面臨兩大技術(shù)難題的困擾無法匹敵美國產(chǎn)品，未來幾年全球超算排行榜上中國登頂?shù)臋C會就會十分渺茫。不過排行榜只是個榮譽，單純追求排名并沒有太大意義。如果中國在美國禁運后加大對自主芯片的投入，為更長遠(yuǎn)的未來做好準(zhǔn)備，那么在幾年的頹勢過后，搭載國產(chǎn)處理器的中國超級計算機還是可以與美國的頂尖系統(tǒng)一決高下的。而且借此機會國產(chǎn)處理器還可以在其他領(lǐng)域獲得長足進(jìn)步，甚至在一些關(guān)鍵行業(yè)取代進(jìn)口處理器，這不能不說是一個大好機會。塞翁失馬焉知非福，或許中國自主研制的處理器就將因美國禁運政策而從此崛起，中國科技產(chǎn)業(yè)多年的一大夢想如今有希望實現(xiàn)了。

雷峰網(wǎng)特約稿件，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。