丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
智能駕駛 正文
發(fā)私信給Dude
發(fā)送

0

算力即權(quán)力?黃仁勛與他的 2000 TOPS自動駕駛運算怪獸 | GTC 2020

本文作者: Dude 2020-05-16 13:23
導語:新的核彈來了。

雷鋒網(wǎng)新智駕按:本文作者系知名電動汽車博主王宇波,新智駕在不變原意的基礎(chǔ)上略經(jīng)編輯。

核彈教父黃仁勛的核彈又來了,只不過這次除了GPU,還有秒殺全場算力達到2000 TOPS的自動駕駛運算平臺。

因為疫情的關(guān)系,NVDIA GTC2020大會推遲2個月舉行,形式也從線下變成了線上。5月14日,教主一身皮衣在自家廚房侃侃而談,甚至還從自家的烤爐里拿出了新的核彈。

先來劃重點:

  • 基于臺積電7nm工藝的全新一代GPU架構(gòu) Ampere

  • 新架構(gòu)產(chǎn)品將覆蓋從民用顯卡GeForce、專業(yè)圖形Quadro到科學運算Tesla的所有產(chǎn)品支線

  • 基于Ampere的第一款GPU產(chǎn)品NVDIA A100和使用A100 GPU的Tesla A100加速卡

  • 面向自動駕駛領(lǐng)域的Orin 系統(tǒng)級芯片(SoC)

  • 在Orin SoC和Ampere GPU的加入下,DRIVE AGE平臺得到擴展。

信息繁雜密集,但一系列的集中展示中,都在傳達——自動駕駛時代,算力即權(quán)力的核心信息。

2000 TOPS的自動計算平臺基于新架構(gòu)

黃仁勛此次線上主題演講的核心是英偉達的下一代圖形處理器(GPU)架構(gòu) Ampere。

真要談這次新架構(gòu)的升級,作為顯卡用途的性能提升可能并不明顯,得益于7nm工藝和按部就班的升級節(jié)奏,相比上一代產(chǎn)品,這部分的提升大約在20-30%。

基于Ampere架構(gòu)的第一款GPU A100的技術(shù)參數(shù)讓人眼花繚亂:7nm工藝,540億個晶體管,3D堆疊技術(shù)面積高達826mm^2,同時支持TF32和BF16,擁有108個SMs的GA100,438個第三代Tensor Core,支持劃分成為多達7個GPU來執(zhí)行不同任務(wù)。

現(xiàn)在的英偉達 Drive AGX Orin 系列正是基于新的2000 TOPS的自動駕駛運算平臺。

。Ampere 是當前 Turing 架構(gòu)的繼承者,而包括 Xavier 在內(nèi)的英偉達 Drive 平臺都基于 Turing 的前身——Volta。

值得一提的是,雖然已發(fā)布多年,但 Xavier 首次出現(xiàn)在量產(chǎn)車上還是最近的小鵬 P7(Xpilot 3.0 系統(tǒng))。不過,其他自動駕駛開發(fā)者用上 Drive Pegasus 系統(tǒng)(整合了兩顆 Xavier 與兩顆 Volta GPU)已經(jīng)快 2 年時間。

性能與功耗方面只有 30TOPS+30W 的 Xavier 設(shè)計之初面向的就是 Level 2+ ADAS 系統(tǒng)(類似通用 Super Cruise 和特斯拉 Autopilot)。到了 Orin 時代,英偉達則轉(zhuǎn)換了戰(zhàn)略,它們準備借助基于 Orin 的 Drive AGX 系統(tǒng)通吃高中低端市場。

英偉達汽車高級總監(jiān) Danny Shapiro 就表示:“除了 Level 2,我們的客戶還要求英偉達提供 Robotaxi 等更加高級的解決方案。對客戶來說,專門為不同等級的自動駕駛開發(fā)獨立架構(gòu)成本太高了,而我們可以幫它們實現(xiàn),從 ADAS 直接打通到 Robotaxi?!?/p>

2000TOPS的自動駕駛運算怪獸

去年12月,Nvida推出了面向ADAS和自動駕駛領(lǐng)域的新一代SOC Orin,當時發(fā)布的時候是這么說的:

「Orin SOC擁有170億個晶體管,搭載NVDIA下一代GPU(即基于Ampere架構(gòu)的GPU)和Arm Hercules CPU核心,可以提供200TOPS是運算能力,是上一代Xavier SOC的7倍,功耗45W,2022年交付,面向L2+級自動駕駛場景。」

算力即權(quán)力?黃仁勛與他的 2000 TOPS自動駕駛運算怪獸 | GTC 2020

雷鋒網(wǎng)新智駕:圖片來自網(wǎng)絡(luò)

為了進一步推動自動駕駛平臺算力前進,NVDIA這次選擇將2顆Orin Soc和2塊Ampere架構(gòu)的GPU集成到一個平臺上,算力堆砌到恐怖的2000TOPS,功耗800W,一舉拿下自動駕駛計算平臺算力的桂冠。 

實際上相同的玩法在上一代Drive AGX Pegasus平臺已經(jīng)用過,兩顆 Xavier SoC和兩顆基于圖靈架構(gòu)的GPU,算力320TOPS,功耗500W。

只不過這次在功耗提升1.6倍的情況下,英偉達交出了6.25倍的算力答卷。老黃的口氣也很大,“Drive AGX Robotaxi是應(yīng)用到全自動駕駛研發(fā)和測試場景的最佳方案?!?/p>

200TOPS暴打特斯拉HW3.0?

談到自動駕駛芯片,就難免要提到紅到發(fā)紫的特斯拉HW3.0硬件。HW3.0整個計算模塊可以提供144TOPS的算力,功耗需求200W,基于單個Orin SOC的運算平臺提供200TOPS的算力,功耗只要45W。

算力即權(quán)力?黃仁勛與他的 2000 TOPS自動駕駛運算怪獸 | GTC 2020

雷鋒網(wǎng)新智駕:圖片來自網(wǎng)絡(luò)

如果僅僅從數(shù)據(jù)上來看,2年后交付的Orin SoC確實秒殺已經(jīng)量產(chǎn)裝車半年有余的HW3.0。

但是只看算力合適么?

答案是不合適,AI算法不是通用計算,算力不等于全部,算法效率更重要。

 讓我們先回到第一章節(jié)提到的Tensor Core,在NVDIA給它起的硬核名字背后其實就一種通用矩陣硬件。Orin SoC的核心部分實際上就是昨天發(fā)布的Ampere GPU內(nèi)嵌,那AI能力同樣是Tensor Core賦予的。 

HW3.0呢?核心是NPU。

Tensor Core所代表的通用矩陣計算和HW3.0中NPU的直接卷積計算分別是整個行業(yè)兩種截然不同的方向 —— 二者的差別優(yōu)劣,在這里難以展開,需要專門的文章進行闡釋 。

事實上,NVDIA通過大量運算單元的堆砌所提供的高算力支持是一個硬件廠商的本分,然而軟硬研發(fā)分離的結(jié)果往往可能導致算法效率得不到最好的落實,這也是為什么特斯拉用NPU搭配自家AI算法的做法雖然缺乏通用性,但效率更高。

如何去理解這個事情?

筆者咨詢了一位負責NPU算法的資深工程師,得到如下回答:

“單純看TOPS沒有意義,要看實際計算結(jié)果。打個比方:你的算法好,網(wǎng)絡(luò)加速快,你只需要1/5的算力,就能得出結(jié)果。要是你的芯片算得快,但是無法得出結(jié)果,那就是在浪費能量?,F(xiàn)在神經(jīng)網(wǎng)絡(luò)芯片,沒有統(tǒng)一標準,沒有統(tǒng)一架構(gòu),所以不能用統(tǒng)一Tops值去衡量算力?!?/p>

當然,作為一個NPU算法工程師,他是認為直接進行硬件計算的NPU搭配極致優(yōu)化的AI算法是最有效率的做法。

所以在領(lǐng)略了NVDIA新硬件的血脈噴張之后,筆者發(fā)現(xiàn)自動駕駛發(fā)展核心要素其實還是算法,或者說是軟硬結(jié)合的效率。

這也是為什么NVDIA在提供Ampere架構(gòu)產(chǎn)品的時候,重點提到了與前一代產(chǎn)品的通用性,比如Pony Ai 基于Drive AGX Pegasus平臺研發(fā)的自動駕駛算法在NVIDA新硬件交付之后可以直接無縫遷移到新平臺上,繼續(xù)累計此前所獲得的算法效率經(jīng)驗。

在車載芯片領(lǐng)域,英偉達的主要對手是英特爾旗下的 Mobileye,這家以色列公司幾乎統(tǒng)治了整個 ADAS 市場。至于自動駕駛的研發(fā),也少不了 Mobileye 的身影,許多廠商甚至選擇大雜燴戰(zhàn)略,在開發(fā) L4 系統(tǒng)時用英特爾的 CPU 搭配英偉達的 GPU 或 SoC。顯然,這種架構(gòu)上的混亂狀態(tài)嚴重阻礙了代碼的重復(fù)利用,也加重了整個行業(yè)的工作量。 

英偉達的賣點之一就是開發(fā)人員可以使用的通用架構(gòu),從最初的基準開發(fā)到仿真再到路測。 更重要的是,雖然新款芯片接連問世,它們依然保留著兼容性,因此在 Xavier 或更老平臺上運行的代碼可以直接移至 Orin 或后續(xù)產(chǎn)品。

展望未來的產(chǎn)品線,英偉達將推出 Orin ADAS SoC,可與攝像頭和雷達一起安裝在擋風玻璃外殼中。這款入門級芯片功耗只有 5W,但卻能提供 10 TOPS 的性能,驅(qū)動現(xiàn)有的 ADAS 功能綽綽有余。 

此外,馬斯克此前在推特上提到的下一代自動駕駛硬件則需要2-3年的時間,自動駕駛領(lǐng)域的頭部廠商們的血戰(zhàn),即將拉開序幕……你,期待嗎?

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

分享:
相關(guān)文章

編輯

雷鋒網(wǎng)新智駕主編,關(guān)注智能駕駛,添加微信:Hiumanlun0608,請注明公司--職位--事由
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說