丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
芯片 正文
發(fā)私信給包永剛
發(fā)送

1

打破16項AI性能記錄!英偉達A100 GPU要無人能敵?

本文作者: 包永剛 2020-07-30 01:05
導語:DGX SuperPOD系統(tǒng)在MLPerf Training v0.7基準測試中開創(chuàng)了八個全新里程碑,共打破16項紀錄。

雷鋒網(wǎng)消息,2020年7月30日,MLPerf組織發(fā)布第三個版本MLPerf Training v0.7基準測試(Benchmark)結果。結果顯示,英偉達基于今年5月最新發(fā)布的Ampere架構A100 Tensor Core GPU,和HDR InfiniBand實現(xiàn)多個DGX A100 系統(tǒng)互聯(lián)的龐大集群——DGX SuperPOD系統(tǒng)在性能上開創(chuàng)了八個全新里程碑,共打破16項紀錄。

打破16項AI性能記錄!英偉達A100 GPU要無人能敵? 

打破MLPerf Training最新基準測試16項記錄

MLPerf是2018年5月成立的行業(yè)基準測試組織,在AI備受關注的當下,獲得了芯片巨頭和AI芯片公司以及AI業(yè)界的廣泛關注。為了能夠讓機器學習處理器的基準測試也像CPU那樣,MLPerf組織囊括了該行業(yè)中的所有知名企業(yè)和機構,比如英特爾、英偉達、Google、亞馬遜、阿里巴巴和百度、微軟、斯坦福大學等。

巨頭公司們樂于通過MLPerf的成績證明其AI實力,平頭哥在去年11月MLPerf首個版本基準測試成績公布之后就強調(diào)其自主研發(fā)的AI芯片含光800在Resnet50基準測試中獲得單芯片性能第一。

作為AI的領軍者,英偉達自然也不會錯過MLPerf的基準測試。2018年12月,英偉達首次在MLPerf訓練基準測試中創(chuàng)下了六項紀錄,次年7月英偉達再次創(chuàng)下八項紀錄。在最新MLPerf Training v0.7基準測試中,有兩項新的測試和一項經(jīng)大幅修訂的測試。 

打破16項AI性能記錄!英偉達A100 GPU要無人能敵?

打破16項AI性能記錄!英偉達A100 GPU要無人能敵?

其中一項基準測試對推薦系統(tǒng)的性能進行了排名,推薦系統(tǒng)是日益普及的一項AI任務。另一項基準測試對使用BERT的對話式AI進行了測試,BERT是現(xiàn)有最復雜的神經(jīng)網(wǎng)絡模型之一。還有,強化學習測試中使用了Mini-go和全尺寸19x19 圍棋棋盤,該測試是本輪最復雜的測試,內(nèi)容涵蓋從游戲到訓練的多項操作。

特別值得一提的是,英偉達是唯一一家在MLPerf Training v0.7測試中均采用市售商用產(chǎn)品的公司。其他大多數(shù)提交使用的要么是預覽類別(preview category),其所用的產(chǎn)品預計需要幾個月后才會面市,使用研究類別的產(chǎn)品,更是較長一段時間內(nèi)都不會面市。

另外,在此次提交結果的九家公司中,除英偉達外,還有六家公司多家生態(tài)系統(tǒng)合作伙伴也提交了基于英偉達GPU的MLPerf測試結果。包括三家云服務提供商(阿里云、谷歌云和騰訊云)和三家服務器制造商(戴爾、富士通和浪潮)。 

18個月內(nèi)實現(xiàn)AI性能4倍提升 

創(chuàng)造紀錄的英偉達DGX SuperPOD系統(tǒng)是基于Ampere架構以及Volta架構。雷鋒網(wǎng)此前報道,5月份發(fā)布的最近Ampere架構GPU A100基于臺積電7nm工藝,面積高達826平方毫米,集成了540億個晶體管。相比Volta架構實現(xiàn)了高達20倍的性能提升,并且可以同時滿足AI訓練和推理的需求。

打破16項AI性能記錄!英偉達A100 GPU要無人能敵?

打破16項AI性能記錄!英偉達A100 GPU要無人能敵?

A100對比V100

由8個安培A100 GPU打造的NVIDIA DGX A100 AI系統(tǒng)單節(jié)點性能達到了創(chuàng)紀錄的5 petaflops。

此次,英偉達在Selene上運行了系統(tǒng)的MLPerf測試,Selene是基于DGX SuperPOD的內(nèi)部集群。DGX SuperPOD是針對大規(guī)模GPU集群的公共參考架構,可在數(shù)周內(nèi)完成部署。

根據(jù)測試結果,相較于首輪MLPerf訓練測試中使用的基于V100 GPU的系統(tǒng),如今的DGX A100系統(tǒng)能夠以相同的吞吐率,在18個月內(nèi)實現(xiàn)了4倍的性能提升。

能夠取得里程碑的成就除了強大的硬件,還有兩大關鍵——軟件和網(wǎng)絡連接。

打破16項AI性能記錄!英偉達A100 GPU要無人能敵?

A100 GPU搭配CUDA-X庫的軟件更新,為通過Mellanox HDR 200Gb/s InfiniBand網(wǎng)絡構建的擴展集群提供支持。HDR InfiniBand可實現(xiàn)極低的延遲和高數(shù)據(jù)吞吐量,同時通過可擴展分層聚合和縮減協(xié)議(SHARP)技術,提供智能深度學習計算加速引擎。 

英偉達A100能否無人能敵?

英偉達A100發(fā)布之后,就有業(yè)內(nèi)人士表示GPU的性能又上了一個臺階,AI芯片初創(chuàng)公司想要超越英偉達的難度有增加了。

但相比硬件的超越,雷鋒網(wǎng)認為軟硬件生態(tài)才是巨頭公司更大的優(yōu)勢所在。據(jù)悉,通過最新的軟件優(yōu)化,基于NVIDIA V100的DGX-1 系統(tǒng)也可實現(xiàn)2倍的性能提升。

就此次最新基準測試而言,提交了基于英偉達GPU的MLPerf測試結果的公司大多采用了英偉達的軟件中心NGC容易,以及用于參賽的公開框架。另外,包括這些MLPerf合作伙伴在內(nèi)的近二十家云服務提供商和OEM組成的生態(tài)系統(tǒng),已采用或計劃采用A100 GPU來打造在線實例、服務器和PCIe卡。 

打破16項AI性能記錄!英偉達A100 GPU要無人能敵?

英偉達表示,A100進入市場的速度也比以往英偉達的GPU更快,發(fā)布之初用于英偉達的第三代DGX系統(tǒng),正式發(fā)布僅六周后,A100就正式登陸了Google Cloud 。

當然,英偉達也在通過更多行業(yè)軟件吸引用戶。比如今年5月,英偉達發(fā)布了兩個應用框架——用于對話式AI的Jarvis和用于推薦系統(tǒng)的Merlin。還有面向汽車行業(yè)市場的NVIDIA DRIVE,面向醫(yī)療健康市場的Clara,面向機器人技術市場的Isaac,以及面向零售/智能城市市場的Metropolis。

性能和生態(tài)都足夠好的A100,能讓英偉達在AI市場無人能敵嗎?價格會是阻礙嗎?

相關文章:

為什么平頭哥和英偉達在MLPerf基準測試中都獲得了第一?

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉載。詳情見轉載須知。

分享:
相關文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設置密碼以方便用郵箱登錄
立即設置 以后再說