丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
專(zhuān)欄 正文
發(fā)私信給Shavvn
發(fā)送

1

解讀世界最強(qiáng)超算——太湖之光

本文作者: Shavvn 2016-06-27 09:53
導(dǎo)語(yǔ):本文依據(jù)現(xiàn)有公開(kāi)資料對(duì)太湖之光進(jìn)行深入分析。

雷鋒網(wǎng)注:本文作者計(jì)算機(jī)體系結(jié)構(gòu)博士生,原文發(fā)表于知乎,經(jīng)作者再次編輯后授權(quán)發(fā)布在雷鋒網(wǎng)。ISC2016 公布了中國(guó)新一代超級(jí)計(jì)算機(jī)“太湖之光”,取代了天河二號(hào)成為T(mén)op 500 (超算排行榜)頭名。本文依據(jù)現(xiàn)有公開(kāi)資料對(duì)太湖之光進(jìn)行深入分析。

解讀世界最強(qiáng)超算——太湖之光

(圖片來(lái)自新華網(wǎng))

前幾天,我在辦公室看到太湖之光的消息,非常振奮,當(dāng)即就去找導(dǎo)師匯報(bào)(因?yàn)楹凸P者研究方向相關(guān))

我:“中國(guó)造了一臺(tái)新超算,100PFlops!”

導(dǎo)師的第一反應(yīng)是:“功耗多少?”

我:“15MW”

導(dǎo)師:“Holy sh*t!”(臥槽?。?/p>

我:“他們沒(méi)用 Intel 的芯片?!?/p>

導(dǎo)師:“oh that makes sense”(怪不得)

我不是黑 Intel,但實(shí)在是x86架構(gòu)的歷史包袱太重了,想要實(shí)現(xiàn) 性能/功耗比的重大提升,這是一個(gè)邁不過(guò)去的坎。 我在 如何看待 19 歲少年想做出在目前 Intel 同等計(jì)算性能下降低 80% 功耗的全新電路系統(tǒng)芯片?這個(gè)回答中就提到過(guò),Rex Computing 的人在做的事之一就是砍掉Cache (緩存),用 Scratch Pad Memory (相當(dāng)于是手動(dòng)管理的快速片上內(nèi)存) 取而代之。而在太湖之光的眾核架構(gòu)中的大量 slave core里面,采用了同樣的思路,只保留了instruction cache。

data cache用Scratch Pad Memory代替,避免了眾核情況下的cache coherence帶來(lái)的大量性能和功耗浪費(fèi)。(Master core 里面有正常的Cache),我覺(jué)得這是太湖之光實(shí)現(xiàn)高性能/功耗比的一個(gè)重要原因。 并且Slave core只支持user mode,于是我猜測(cè)它在TLB上面應(yīng)該也有精簡(jiǎn)。但目前 SW26010 芯片還沒(méi)有詳細(xì)的文檔資料,所以這點(diǎn)我也只能猜測(cè)。

至于采用眾核架構(gòu),可以說(shuō)是大勢(shì)所趨。所謂眾核架構(gòu),就是在同一個(gè)芯片上集成幾十甚至上百個(gè)核心,這些核心協(xié)同或者獨(dú)立工作,大大提高系統(tǒng)可執(zhí)行的線(xiàn)程數(shù),提高并行性,進(jìn)而提高性能。神威SW26010 每個(gè)芯片上有多達(dá)260個(gè)核心。相似地,美國(guó)一些新的超算系統(tǒng)采用了Intel的眾核Knights Landing芯片,據(jù)說(shuō)性能也很不錯(cuò)。

解讀世界最強(qiáng)超算——太湖之光

圖1:SW26010 的眾核架構(gòu)

至于指令集,Jack Dongarra在他的報(bào)告里特意強(qiáng)調(diào)SW26010 芯片的指令集和 Alpha (美國(guó)一家曾經(jīng)的高性能芯片廠商)的指令集沒(méi)有關(guān)系,所以哪怕神威前幾代芯片和Alpha 有淵源,但這次應(yīng)該真沒(méi)有。

然后更令我驚喜的是不光系統(tǒng)搭起來(lái)跑了Linpack,而且還有三項(xiàng)應(yīng)用入圍了Gordon Bell獎(jiǎng)的最終名單 (這個(gè)可以說(shuō)是超算界最厲害的獎(jiǎng)了)。充分說(shuō)明太湖之光已經(jīng)形成戰(zhàn)斗力,可以投入真正的科研應(yīng)用。

最后我們冷靜下來(lái)談一談不足之處: HPCG的跑分。

為什么HPCG跑分重要?因?yàn)樗萀inpack更接近真實(shí)應(yīng)用的場(chǎng)景,更能體現(xiàn)出內(nèi)存系統(tǒng)的瓶頸。Linpack測(cè)試的重點(diǎn)是系統(tǒng)的浮點(diǎn)運(yùn)算能力,也就是我們前面提到的FLOPS(floating operations per second)這個(gè)指標(biāo)。然而實(shí)際的應(yīng)用中,浮點(diǎn)運(yùn)算快并不代表系統(tǒng)有很好的性能,因?yàn)槿绻胍↑c(diǎn)運(yùn)算能力得到發(fā)揮,首先需要能在短時(shí)間內(nèi)把大量的數(shù)據(jù)送給需要處理的單元,這對(duì)系統(tǒng)的內(nèi)存和互連網(wǎng)絡(luò)的性能要求更高。而HPCG的跑分則是一個(gè)更接近綜合性能的指標(biāo)。用一個(gè)汽車(chē)的比喻來(lái)講,Linpack的跑分更像是汽車(chē)的百米加速指標(biāo),而HPCG更像是到真實(shí)的賽道上去跑——這時(shí)候就不光是加大馬力就能行的了,操控性等其他因素也很重要。

解讀世界最強(qiáng)超算——太湖之光

表1:太湖之光,天河二號(hào),以及泰坦(美國(guó))性能對(duì)比

由上表可以看出,太湖之光在HPCG的測(cè)試下只達(dá)到了它0.3%的峰值性能,總的算下來(lái)還不如天河二號(hào)。說(shuō)明其在內(nèi)存和互連網(wǎng)絡(luò)的性能上存在很大的瓶頸。

結(jié)語(yǔ)

雖然太湖之光取得了很好的成績(jī),可以說(shuō)是中國(guó)超算人的驕傲,但我們還是不能掉以輕心。美國(guó)正在大力發(fā)展 exa-scale計(jì)劃 (1000 Pflops,大約是太湖之光的10倍性能) ,計(jì)劃在2023年拿出性能達(dá)到exa-scale,功耗小于20MW 的超算。并且還有3臺(tái)超過(guò)100Pflops的超算正在建設(shè)當(dāng)中 。而我們眼前就有GPU帶來(lái)的超算變革,DARPA(美國(guó)國(guó)防前沿研究計(jì)劃) 也為exa-scale計(jì)劃投資了不少黑科技的項(xiàng)目, 而且這個(gè)太湖之光一出,他們估計(jì)跟國(guó)會(huì)要錢(qián)更加容易…… 革命尚未成功,同志仍需努力?。?/p>

注:文中資料圖均來(lái)自Jack Dongarra 的報(bào)告 Report on the Sunway TaihuLight System

雷鋒網(wǎng)注:本文為雷鋒網(wǎng)作者授權(quán)發(fā)布文章,轉(zhuǎn)載請(qǐng)聯(lián)系授權(quán),不得刪減內(nèi)容。

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

解讀世界最強(qiáng)超算——太湖之光

分享:
相關(guān)文章

計(jì)算機(jī)民科

計(jì)算機(jī)體系結(jié)構(gòu)博士生
當(dāng)月熱門(mén)文章
最新文章
請(qǐng)?zhí)顚?xiě)申請(qǐng)人資料
姓名
電話(huà)
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶(hù)安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說(shuō)