0
本文作者: 鐵流 | 2017-09-22 15:21 |
雷鋒網(wǎng)按:今年6月,核高基總師魏少軍接受科技日報采訪時表示,"國產(chǎn)兆芯x86通用處理器的成功自主研發(fā)和量產(chǎn),令國產(chǎn)桌面處理器在性能方面完成了一次跨越式的提升,從“十二五”初期的不足國際整體水準的7%提升到了目前的50%,綜合性能體驗達到80%。"
實際上,國產(chǎn)X86芯片的性能和英特爾對比究竟怎么樣?在技術引進吸收創(chuàng)新的過程中又取得了怎樣的進步呢?
幾個月前,上海兆芯最新的產(chǎn)品ZXD在2017年北京國際互聯(lián)網(wǎng)科技博覽會暨世界網(wǎng)絡安全大會上亮相。ZXD雖然相對于Intel和AMD的CPU還有不小差距,但相對應兆芯第一款CPU ZXA而言,確實有著很大的進步——自上海兆芯自2013年成立以來,從第一款產(chǎn)品ZXA,到如今最新的產(chǎn)品ZXD,上海兆芯用了數(shù)年時間實現(xiàn)以VIA的技術為基礎,將產(chǎn)品的裸CPU性能提升了80%以上。
ZX-A 是兆芯的第一款CPU,技術源自VIA,擁有2個核心,主頻1.6G,采用臺積電40nm制造工藝。就其性能來說,根據(jù)相關單位的SPEC2006測試,主頻1.6G的ZXC在采用Ubuntu 14.04操作系統(tǒng),ICC編譯器的情況下,成績?yōu)椋?/p>
SPECint2006 : 11.3
SPECint_rate2006: 20.5
SPECfp2006 : 12.4
SPECfp_rate2006: 18.7
STREAM測試的單線程成績?yōu)椋?/p>
Copy 5502.8MB/s;
Scale 5042.9MB/s;
Add 5321.6MB/s
Triad 5252.7MB/s
STREAM測試的多線程成績?yōu)椋?/p>
Copy 5191.1MB/s;
Scale 5104MB/s;
Add 5383.8MB/s
Triad 5461.9MB/s
這里介紹下,SPEC2006是在行業(yè)內(nèi)相對比較權威的測試軟件,通過26個程序對CPU進行測試,然后計算結果,分數(shù)越高性能越好。不過SPEC2006測試也并非無懈可擊——可以通過不說明編譯器等條件作弊,是否打開auto parallelization也有有成績差異,還有base分值和peak分值會有一定的差別等等。
即便如此,相當于一些黑箱測試而言,SPEC依舊是相對比較公正的測試,能夠比較客觀的反映CPU的實際性能,畢竟絕對客觀的測試是不存在的,就如同高考,即便存在這樣或那樣的問題,但目前來看,依舊是最具可操作性,相對公平合理的考評方式(北京、上海除外)。
ZX-C是對VIA技術的引進消化吸收,相對于ZXA的2個CPU核,ZXC改為4個CPU核,而且CPU核之間核心通過 L2 Cache 交互,相比較ZXA而言,ZXC的多核性能有所提升。針對從VIA引進的內(nèi)核存在資源冗余和不均衡的問題做了重新設計,并采用了臺積電28nm制造工藝,降低了功耗,提高了穩(wěn)定性,減少了量產(chǎn)成本,將CPU的主頻從ZXA的1.6G,提升到ZXC的2G。
另外,兆芯還重新設計 FSB 接口,F(xiàn)SB 頻率從 1066MHz 提高到 1333MHz。對訪存單元進行了重新設計,設計了全新的 L1/L2 訪存控制單元,優(yōu)化訪存性能等工作。
而這些修改最直接的體體現(xiàn)就是在性能上,根據(jù)相關單位的SPEC2006測試,主頻2.16G(睿頻)的ZXC在采用Ubuntu 14.04操作系統(tǒng),ICC編譯器的情況下,成績?yōu)椋?/p>
Specint 2006: 17
Specint rate2006: 50
Specfp 2006: 18.2
Specfp rate2006: 36.3
ZXC相對于ZXA,在單線程定點成績上提升了約54%,多線程提升了約147%;就浮點性能而言,ZXC相對于ZXA單線程性能提升了約50%,多線程性能提升了約50%。
雖然在Ubuntu 14.04操作系統(tǒng),ICC編譯器的情況下,Specint 2006:17;Specfp 2006:18.2 的成績相對應Intel有較大的差距,但相對于ZXA而言,ZXC的進步著實不小。
之前介紹了,ZXC相對于ZXA,在單線程定點成績上提升了約54%,多線程提升了約147%;就浮點性能而言,ZXC相對于ZXA單線程性能提升了約50%,多線程性能提升了約50%。
但ZXC也有自己的短板,那就是前端總線——對于圖像、音頻、視頻、游戲、FPGA綜合以及科學應用等應用,通常是對于大工作集的少部分數(shù)據(jù)進行操作,前端總線就成為一個主要的性能瓶頸。
ZXC延續(xù)了VIA原本的前端總線(VIA V4 bus)的設計——前端總線(front-side bus,F(xiàn)SB)是早期Intel芯片的計算機通信的接口,和AMD公司的EV6類似,其連接CPU和北橋芯片,內(nèi)存控制器通常集成在北橋中——ZXC沒有將內(nèi)存控制器集成到處理器上,而是在橋片里。這樣一來,導致STREAM測試的成績就不太好看了。
根據(jù)STREAM 5.10測試的成績,單線程的成績?yōu)椋?/p>
Copy: 7685.0 MB/s
Scale: 7446.4 MB/s
Add: 8129.5 MB/s
Triad: 7981.7 MB/s
4 線程測試成績?yōu)椋?/p>
Copy: 7426.3 MB/s
Scale: 7504.0 MB/s
Add: 7656.8MB/s
Triad: 7787.7 MB/s
從中可以看出,ZXC的STREAM 測試成績是比較一般的,而且相對于ZXA而言提升也比較有限。
ZXD的最明顯改進之處就在于更換了更好的DDR4內(nèi)存控制器,是國內(nèi)首款集成了DDR4內(nèi)存控制器的國產(chǎn)桌面CPU,而且ZXD還把內(nèi)存控制器集成到芯片里——相對于ZXC的DDR3內(nèi)存控制器,ZXD采用了DDR4內(nèi)存控制器,并把內(nèi)存控制器集成到芯片里,而非像ZXC那樣把內(nèi)存控制器集成在橋片里,而這個改變一定程度上提升了CPU的綜合性能。
此外,ZXD很有可能將FSB總線換了類似于Intel的dmi這樣的接口。兩者因素相加,使ZXC存在的短板不復存在。最典型的證明就是STREAM測試成績大幅提升。根據(jù)相關單位的測試,STREAM 5.10測試單線程成績?yōu)椋?/p>
Copy: 10942.4 MB/s
Scale: 10371.4 MB/s
Add: 10603.1 MB/s
Triad: 9850.1MB/s
多線程成績?yōu)椋?/p>
Copy: 12666.1 MB/s
Scale: 13060.3 MB/s
Add: 11270.2MB/s
Triad: 11302.6MB/s
從測試成績可以看出,ZXD的SRTEAM測試成績相對于ZXC有了顯著提升,彌補了過去的短板。并且通過更新了ddr4內(nèi)存控制器,在商業(yè)上還能有效應對各家內(nèi)存大廠的DDR3內(nèi)存條停產(chǎn)的問題。
除了內(nèi)存控制器上的改進之外,ZXD增加 X86 指令緩沖器,提供了更精確的循環(huán)緩沖功能,并通過整體流水線前后端各級優(yōu)化,大幅減少流水線級數(shù),有效降低了分支預測失敗的性能損失......經(jīng)過一系列的改進,直接體現(xiàn)在ZXD相對于ZXC的性能提升,根據(jù)相關單位的數(shù)據(jù),在采用Ubuntu 14.04操作系統(tǒng),內(nèi)存為 32GB DDR4內(nèi)存,硬盤為Intel 530 系列120GB 的SSD硬盤,編譯器為ICC,ZXD睿頻到2.2G的情況下,SPEC2006測試成績?yōu)椋?/p>
Specint 2006: 20.4
Specint rate2006: 63.3
Specfp 2006: 23
Specfp rate2006: 47.6
ZXD這個成績雖然相對于Intel和AMD依舊有不小的差距,就裸CPU性能而言,ZXD大約是Intel主流四核CPU的30%—40%。而且必須說明的是,兆芯對CPU架構的修改還是相對有限的,目前所做的修改并非脫胎換骨的大換血,比如沒有實現(xiàn)類似于AMD從“打樁機”到Zen的提升和飛躍。
配圖來自兆芯官網(wǎng)
雷峰網(wǎng)特約稿件,未經(jīng)授權禁止轉載。詳情見轉載須知。