0
本文作者: 王強(qiáng) | 2015-04-22 11:56 | 專題:成為世界最快,中國超算經(jīng)歷了什么? |
該來的總是要來的,這句話今天在高科技領(lǐng)域又一次得到了驗(yàn)證。中國制造的超級(jí)計(jì)算機(jī)連續(xù)數(shù)年登頂全球性能冠軍后,為其提供核心處理器的美國企業(yè)終于被美國政府勒令停止與中方的合作。依賴進(jìn)口芯片十余年后,國產(chǎn)超算不得不開始在國內(nèi)尋求替代品。
超級(jí)計(jì)算機(jī)本質(zhì)上就是一大堆小主機(jī)的集合體。過去二十年來,大部分超算使用的處理器和家用PC并無太大區(qū)別。由于運(yùn)算芯片很容易在市面上買得到,業(yè)界一直公認(rèn)超級(jí)計(jì)算機(jī)的核心技術(shù)主要是大規(guī)模網(wǎng)絡(luò)互聯(lián)和軟件系統(tǒng)。這兩項(xiàng)技術(shù)決定了那一大堆和PC沒有多少區(qū)別的主機(jī)能否高效率地聯(lián)合在一起發(fā)揮集體的最大力量。如今,中國制造的超算已經(jīng)在這兩大指標(biāo)上取得世界領(lǐng)先地位,天河2號(hào)數(shù)度連冠的驕人成績就是最好的證明。
然而技術(shù)的發(fā)展讓形勢發(fā)生了變化。自從GPGPU和眾核芯片開始進(jìn)入高性能計(jì)算領(lǐng)域,頂級(jí)超算越來越依賴這一類可以大幅提升性能的專用浮點(diǎn)處理器。Nvidia的Tesla和Intel的Xeon Phi是兩種主流的超算專用芯片,它們和我們的PC使用的CPU有較多不同,在市面上也不是隨處可見。
與此同時(shí),Nvidia和Intel為了爭奪市場,開始向超算制造商提前供應(yīng)尚未正式發(fā)布的超算芯片。天河2號(hào)就曾提前半年獲得Intel的Xeon Phi處理器,保證其能在年度性能排行榜上獲得冠軍殊榮。另一方面,這類芯片的軟件優(yōu)化也需要芯片廠商配合,這也讓Intel、Nvidia與各家超算研制單位的合作不斷加深。
在這樣的背景下,美國的禁運(yùn)政策就對(duì)中國的超算發(fā)展有了很大影響。與Intel、Nvidia等企業(yè)的合作被切斷后國產(chǎn)超算就難以提前拿到新一代超算處理器,也難以獲得軟件開發(fā)的支持,研制進(jìn)度就會(huì)被拖后半年到一年之久,登頂性能冠軍寶座就會(huì)變得非常艱難。
無法再依賴進(jìn)口芯片,改用國產(chǎn)處理器怎么樣呢?現(xiàn)實(shí)并不樂觀。國產(chǎn)超算用浮點(diǎn)處理器雖然已經(jīng)研發(fā)多年,但如今卻要面臨兩大技術(shù)障礙:
第一大問題是高帶寬內(nèi)存技術(shù)。超算芯片與我們普通PC使用的CPU的最大區(qū)別就是前者特別加強(qiáng)了浮點(diǎn)計(jì)算性能。今年新一代的Xeon Phi和明年的下一代Tesla都會(huì)有3T Flops的雙精度浮點(diǎn)運(yùn)算速度,大約是主流i7 4770 CPU的12倍之多。國內(nèi)研制的申威眾核計(jì)算芯片可以達(dá)到1T Flops的性能,但繼續(xù)提高指標(biāo)就要面臨內(nèi)存帶寬的瓶頸。
超算運(yùn)行的程序大都比較依賴內(nèi)存帶寬,如果帶寬不足,浮點(diǎn)性能指標(biāo)再高也沒什么價(jià)值。新一代Xeon Phi和Tesla的內(nèi)存帶寬高達(dá)600G/s以上,是家用主流CPU的20多倍。為了實(shí)現(xiàn)如此之高的帶寬,Intel和Nvidia使用了內(nèi)存3D封裝技術(shù),將內(nèi)存芯片和運(yùn)算芯片疊在一起緊密相連。這一技術(shù)需要處理器研發(fā)企業(yè)和內(nèi)存企業(yè)的深度合作,實(shí)現(xiàn)難度遠(yuǎn)超傳統(tǒng)的內(nèi)存方案。
國內(nèi)的申威處理器與飛騰處理器幾年前就開始進(jìn)行3D封裝內(nèi)存技術(shù)的研究,但由于缺乏經(jīng)驗(yàn)和內(nèi)存企業(yè)的配合,時(shí)至今日仍然與Intel等差距巨大。事實(shí)上國產(chǎn)處理器過去一直使用第三方出售的內(nèi)存控制器模塊,即使是傳統(tǒng)的內(nèi)存系統(tǒng)的研制上都沒什么經(jīng)驗(yàn),更不用說新一代3D封裝內(nèi)存了。掌握3D內(nèi)存技術(shù)的Intel、Nvidia、AMD等企業(yè)也不可能向國內(nèi)企業(yè)出售相應(yīng)技術(shù)的授權(quán),三星等內(nèi)存制造商又很難給國內(nèi)企業(yè)提供強(qiáng)有力的支持。內(nèi)存問題不解決,申威、飛騰等超算芯片就難以做到媲美同期Xeon Phi、Tesla的高運(yùn)算指標(biāo),這樣國產(chǎn)超算面對(duì)裝備Intel、Nvidia芯片的美國對(duì)手時(shí)就會(huì)力不從心。
制約超算芯片發(fā)展的另一大關(guān)鍵技術(shù)是高帶寬互聯(lián)總線。我們PC中常見的PCIe總線對(duì)于高浮點(diǎn)性能的超算處理器的互聯(lián)來說太過緩慢,區(qū)區(qū)32G/s的帶寬如同狹窄的雙車道馬路。下一代Xeon Phi和Tesla將升級(jí)到帶寬超過100G/s的專用總線,大大緩解系統(tǒng)中大量處理器數(shù)據(jù)交換的擁堵現(xiàn)象。Intel甚至?xí)状螒?yīng)用硅光子技術(shù),以光路取代電路在芯片間高速交換信息,降低總線的復(fù)雜度、功耗并提供更強(qiáng)的性能。
國產(chǎn)處理器在這一方面仍然處于明顯落后的局面。新一代申威、飛騰等浮點(diǎn)處理器使用的互聯(lián)方案依舊是PCIe的水平,兩三年內(nèi)都難以追上美國企業(yè)。而硅光子傳輸這樣的先進(jìn)技術(shù)領(lǐng)域,國內(nèi)企業(yè)仍處于中期研究階段,離實(shí)際部署有著很長的距離??偩€帶寬不足意味著國產(chǎn)超算難以通過部署更多數(shù)量的芯片通過數(shù)量優(yōu)勢占據(jù)主動(dòng),也就無法抹除單個(gè)芯片性能不足帶來的劣勢。
進(jìn)口芯片沒法提前買到,國產(chǎn)處理器又面臨兩大技術(shù)難題的困擾無法匹敵美國產(chǎn)品,未來幾年全球超算排行榜上中國登頂?shù)臋C(jī)會(huì)就會(huì)十分渺茫。不過排行榜只是個(gè)榮譽(yù),單純追求排名并沒有太大意義。如果中國在美國禁運(yùn)后加大對(duì)自主芯片的投入,為更長遠(yuǎn)的未來做好準(zhǔn)備,那么在幾年的頹勢過后,搭載國產(chǎn)處理器的中國超級(jí)計(jì)算機(jī)還是可以與美國的頂尖系統(tǒng)一決高下的。而且借此機(jī)會(huì)國產(chǎn)處理器還可以在其他領(lǐng)域獲得長足進(jìn)步,甚至在一些關(guān)鍵行業(yè)取代進(jìn)口處理器,這不能不說是一個(gè)大好機(jī)會(huì)。塞翁失馬焉知非福,或許中國自主研制的處理器就將因美國禁運(yùn)政策而從此崛起,中國科技產(chǎn)業(yè)多年的一大夢想如今有希望實(shí)現(xiàn)了。
雷峰網(wǎng)特約稿件,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。