丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
芯片 正文
發(fā)私信給包永剛
發(fā)送

0

為什么平頭哥和英偉達在MLPerf基準測試中都獲得了第一?

本文作者: 包永剛 2019-11-09 07:57
導語:總的來說,幾乎每個芯片公司都可以在某個類別中取得勝利。

語音播放文章內容

由深聲科技提供技術支持

雷鋒網(wǎng)按,本周,MLPerf組織發(fā)布了第一個MLPerf Inference v0.5的結果,雖然這個基準測試還不成熟,但依舊獲得了巨頭公司的廣泛關注。并且平頭哥、英偉在成績公布后紛紛發(fā)布消息表示自己成績都獲得了第一? 

為什么平頭哥和英偉達在MLPerf基準測試中都獲得了第一?

自去年初成立之后, MLPerf組織一直在穩(wěn)步建立其機器學習到的Benchmarks。為了能夠讓機器學習處理器的基準測試也像CPU那樣,該組織囊括了該行業(yè)中的所有知名企業(yè),比如英特爾、NVIDIA、Google和百度。從技術上講,MLPerf基準測試還處于初期階段,它們甚至還沒有完成,但是該組織的成果引起發(fā)了巨大關注。

早在6月份,該組織就發(fā)布了第二個基準測試集MLPerf Inference v0.5。顧名思義,這是MLPerf組織的機器學習推理基準測試,旨在衡量各種加速器和系統(tǒng)執(zhí)行訓練后的神經(jīng)網(wǎng)絡的程度和速度。MLPerf Inference是測試推理性能的通用方法,它最終將成為衡量從低功耗SoC中的NPU到數(shù)據(jù)中心高性能加速器的標準。在基準測試首次發(fā)布的四個多月之后,MLPerf組織發(fā)布推理基準測試的首個官方結果。

基準測試的初始版本v0.5仍然非常不完整,它目前僅涵蓋5個網(wǎng)絡/基準,并且還沒有功耗測試指標,這是衡量整體能源效率是必不可少的。盡管如此,基準測試的初始版本吸引了主要芯片公司的關注,這些公司都渴望展示其硬件在基準測試中的成績,并向客戶(和投資者)說明為什么他們的解決方案更好。實際上,第一輪官方基準測試提交了近600份結果,遠超出了該組織非正式預期的全新基準測(通常需要一段時間才能建立新的行業(yè)基準),這更能說明了行業(yè)對MLPerf的期待,推理芯片數(shù)十億美元的市場將繼續(xù)快速增長。

為什么平頭哥和英偉達在MLPerf基準測試中都獲得了第一?

隨著第一輪申請工作的完成,MLPerf組織現(xiàn)在發(fā)布其Inference v0.5的官方結果,不過只是大多數(shù)(如果不是全部)主要芯片公司都在發(fā)布與結果相關的公告,聲明或新聞稿。說實在的,600份提交的成果分布在40種不同的測試中,芯片公司還有很多事情可以做??s小標準范圍,每個人都可以找到成功的方案,例如總吞吐量、延遲,每個加速器的吞吐量等。這并不是基準測試本身,甚至也不是芯片公司所為,但這給我們提醒,即使初始版本足夠廣泛,也可以涵蓋很多用例,尤其是在專用加速器的情況下,它們通常針對特定用例進行了優(yōu)化。

為什么平頭哥和英偉達在MLPerf基準測試中都獲得了第一?

作為更新,MLPerf v0.5分為5個基準,其中兩個基準實質上是其各自主基準的移動衍生產品。當前這個套件的桌面/服務器版本涵蓋了圖像分類(ResNet50),對象檢測(ResNet34)和機器翻譯任務(GNMT)。所有基準測試都提供了四種方案:單路(一個終端運行一個任務),多路(一個終端同時運行多個任務),服務器(服務器的實時性能)和離線(不在線的服務器)。這些實質上將方案分解為終端和服務器方案,并從分解為相應平臺的兩個最常見方案。

為什么平頭哥和英偉達在MLPerf基準測試中都獲得了第一?

更進一步,MLPerf提供了兩個測試“分區(qū)”:封閉分區(qū)和開放分區(qū)。封閉分區(qū)是“蘋果對蘋果(apples-to-apples)”測試,芯片將獲得預先訓練的網(wǎng)絡和預先訓練的權重。在選擇要使用的精度等級(只要滿足精度要求)方面,芯片公司在量化方面仍具有一定的靈活性,但是在封閉的分區(qū),他們的解決方案仍必須達到數(shù)學上的等效性,并且禁止重新訓練網(wǎng)絡。這個目的在于,測試平臺能否很好地執(zhí)行預訓練好的網(wǎng)絡。

為什么平頭哥和英偉達在MLPerf基準測試中都獲得了第一?

相比之下,開放式分區(qū)顯然更加開放。芯片公司被允許重新訓練網(wǎng)絡以及進行更廣泛的量化工作。絕對不是封閉測試區(qū)那樣的蘋果對蘋果,開放分區(qū)本質上是一種結構較少的結構化格式,可以讓芯片公司以最佳的方式展示其解決方案和團隊的獨創(chuàng)性。

深入研究結果,MLPerf最終收到了從CPU和GPU到FPGA,DSP和專用ASIC等各領域的官方意見。 正如一位MLPerf代表指出的那樣,該組織實質上收到了除神經(jīng)形態(tài)和模擬系統(tǒng)以外的每種類型處理器的成果。 當然會有大公司的代表,包括NVIDIA的GPU、谷歌的TPU、英特爾的CPU和加速器以及Habana Labs的Goya加速器。即使在封閉分區(qū),也有一些預期外的結果,包括Raspberry Pi 4和阿里巴巴的含光800加速器。

為什么平頭哥和英偉達在MLPerf基準測試中都獲得了第一?

為什么平頭哥和英偉達在MLPerf基準測試中都獲得了第一?

總的來說,我不會在這里對結果進行過多的剖析,因為大量的測試意味著非常多的對比。更重要的是,缺少功耗測試意味著目前無法測量能效。但總的來說,幾乎每個芯片公司都可以在某個類別中取得勝利。在離線測試中,看到了Google從1 TPUv3到32的幾乎完美的拓展性,NVIDIA的Tesla加速器在一些測試中名列前茅,英特爾在CPU中位居榜首,高通的驍龍855在官方結果中也遠遠超過其它SoC。

關于MLPerf推理的第一組結果不會成為推理性能的最終成績。在開發(fā)方面,MLPerf組織仍在努力完善基準,以添加其他網(wǎng)絡類型,著眼于語音識別等任務。 同樣,該組織將進行功耗測試,以便每個人都能看到他們的設計效率,因為電源效率通常是大規(guī)模部署規(guī)劃的最重要考慮因素。

盡管這些早期版本的MLPerf在添加和優(yōu)化測試時和目標還有不同,但對于芯片公司來說,他們現(xiàn)在知道自己和競爭對手所處的位置。比參數(shù)更重要的是,機器學習優(yōu)化的開放性性質意味著芯片公司還有大量空間來優(yōu)化其系統(tǒng)以進行將來的測試,以及設計更好的新硬件。客戶(其中許多人在MLPerf委員會中)希望加快工作進展。因此,既然第一個結果已經(jīng)出爐,芯片公司就可以專注于其產品,并了解如何才能進行下一輪正式測試。

最后,從更長遠來看,MLPerf Inference基準測試在未來幾年內將趨于成熟(該組織目前尚未估計1.0何時準備就緒),這也意味著該基準測試將穩(wěn)定下來,并且在芯片公司的性能實驗室之外更容易使用。MLPerf組織已經(jīng)發(fā)表評論說,他們將開發(fā)移動應用程序以加快對智能手機和其他智能設備的測試,并且我們期望桌面基準測試的情況也將日趨成熟。如果運氣好的話,在不久的將來,我們將能夠把MLPerf推理應用到我們自己的測試中,并將這些測試轉換為有意義的結果,以比較消費類硬件。激動人心的時刻到來了!

雷鋒網(wǎng)編譯,via anandtech 雷鋒網(wǎng)

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉載。詳情見轉載須知。

分享:
相關文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設置密碼以方便用郵箱登錄
立即設置 以后再說