0
本文作者: 包永剛 | 2024-09-20 15:57 |
汽車行業(yè)正快速朝著智能化的方向發(fā)展。汽車的智能化將驅(qū)動(dòng)汽車架構(gòu)轉(zhuǎn)向中央計(jì)算架構(gòu)。
中央計(jì)算能在降低成本的同時(shí)提高通信效率,還可以實(shí)現(xiàn)遠(yuǎn)程升級(jí)(OTA),讓智能汽車也能像智能手機(jī)一樣持續(xù)升級(jí),擁有更好的智能化體驗(yàn)。既然是中央計(jì)算,芯片的安全性和性能都尤為重要。
“隨著自動(dòng)駕駛接管車輛的時(shí)間越來越長(zhǎng),汽車芯片的功能安全將無法忽視?!?/strong>Imagination Technologies車載GPU產(chǎn)品線的產(chǎn)品總監(jiān)章政指出,“在車上用消費(fèi)級(jí)芯片只是短期過渡?!?/p> 目前大量的智能汽車雖符合國(guó)家的法規(guī)要求,但考慮成本等多方面的因素,滿足的是系統(tǒng)級(jí)安全,整車符合汽車安全要求,但使用了一些消費(fèi)級(jí)芯片,而非高等級(jí)的功能安全芯片,這是為什么? 最核心的原因還是因?yàn)槌杀荆?strong>傳統(tǒng)方式要實(shí)現(xiàn)功能安全,會(huì)帶來成倍的成本增加,阻礙了高功能安全等級(jí)的汽車芯片普及。
近期Imagination發(fā)布了業(yè)界高等級(jí)功能安全和最高性能的汽車GPU IP DXS。
通過創(chuàng)新的分布式安全機(jī)制,Imagination DXS GPU對(duì)性能的影響幾乎為零,芯片面積的代價(jià)估計(jì)僅為10%,實(shí)現(xiàn)了ASIL-B功能安全等級(jí)。
并且Imagination DXS GPU IP,峰值性能比Imagination上一代汽車GPU提高了50%,可擴(kuò)展至192 GPixel/s、6 TFLOPS和 24 TOPS,AI性能更是有高達(dá)10倍的提升。
Imagination的全新產(chǎn)品無疑將推動(dòng)高功能安全等級(jí)車載芯片在智能汽車中的普及。
用10%的芯片面積代價(jià),實(shí)現(xiàn)高等級(jí)功能安全
所謂功能安全,指的是確保芯片按照設(shè)計(jì)的功能運(yùn)行。如果芯片不能按照汽車設(shè)計(jì)的功能執(zhí)行,可能會(huì)威脅到駕駛員、乘客、路人的安全。
要達(dá)到功能安全,就要付出一定的成本,比如招聘有經(jīng)驗(yàn)的設(shè)計(jì)人員,執(zhí)行嚴(yán)格的功能安全研發(fā)流程,進(jìn)行安全認(rèn)證等。
對(duì)于芯片來說,實(shí)現(xiàn)功能安全最重要的成本來自增加的芯片面積,因?yàn)樗行鹿δ艿膶?shí)現(xiàn),都需要增加芯片面積。
實(shí)現(xiàn)汽車芯片功能安全有兩種常見的方式,一種雙核鎖步法,另一種是工作負(fù)載重復(fù)法。
雙核鎖步法用兩個(gè)相同的邏輯單元實(shí)現(xiàn)同一個(gè)功能,同時(shí)執(zhí)行任務(wù)比較結(jié)果是否一致,如果一致說明邏輯運(yùn)行正確。通過雙核鎖步法實(shí)現(xiàn)功能安全的代價(jià)是多一倍的芯片面積。
工作負(fù)載重復(fù)法,就是把同一個(gè)工作執(zhí)行兩次,對(duì)比兩次的結(jié)果是否一致,這種方法可以避免隨機(jī)錯(cuò)誤,但難以避免長(zhǎng)期錯(cuò)誤,并且因?yàn)橐M(jìn)行兩次重復(fù)的工作,相當(dāng)于性能降低為二分之一。
無論是雙核鎖步法增加一倍的芯片面積,還是工作負(fù)載重復(fù)法相同的芯片面積性能降低一半,實(shí)現(xiàn)功能安全的代價(jià)都是十分高昂,自然難以普及。
自動(dòng)駕駛逐步普及之后,汽車芯片的功能安全就難以被忽略。如何才能用最小成本實(shí)現(xiàn)高等級(jí)功能安全?
Imagination DXS開創(chuàng)性地實(shí)現(xiàn)了僅增加10%的芯片面積,對(duì)GPU的性能幾乎零影響,通過分布式安全機(jī)制實(shí)現(xiàn)了ASIL-B功能安全。
根據(jù)ISO 26262汽車安全完整性等級(jí)(ASIL)體系,ASIL-A等級(jí)的要求最低,ASIL-D等級(jí)的要求最全面。
“今天我們可以輕松達(dá)到ASIL-B,這個(gè)等級(jí)基本可以滿足L2級(jí)自動(dòng)駕駛的需求。如果需要更高功能安全等級(jí),可以通過2個(gè)ASIL-B系統(tǒng)交叉確認(rèn)實(shí)現(xiàn)。未來我們會(huì)進(jìn)一步提高安全等級(jí)?!闭抡嬖V雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))。
Imagination DXS能夠以足夠小的代價(jià),實(shí)現(xiàn)足夠高的功能安全等級(jí)的核心是利用了處理器固有的并行性,以及任何線程都不會(huì)被完全利用的事實(shí)。
也就是說,DXS會(huì)利用一個(gè)GPU線程等待的時(shí)間,插入安全測(cè)試,使用相同的安全測(cè)試在另一個(gè)線程等待時(shí)插入,執(zhí)行完成后對(duì)比結(jié)果是否一致。
這是DXS實(shí)現(xiàn)高等級(jí)功能安全邏輯模塊的功能安全,也是實(shí)現(xiàn)整個(gè)功能安全的難點(diǎn)所在,需要能夠迅速在模塊中定位錯(cuò)誤,這只是實(shí)現(xiàn)功能安全的其中一半。
DXS另一半的功能安全是內(nèi)存,包括Cache或SRAM。章政介紹Imagination會(huì)通過ECC、parity或者CRC校驗(yàn),保證內(nèi)存的功能正確。
Imagination通過獨(dú)特的分布式安全機(jī)制(DMS),利用空閑時(shí)不停發(fā)送很小的測(cè)試向量,在ASIL標(biāo)準(zhǔn)設(shè)定的時(shí)間范圍內(nèi)識(shí)別故障,實(shí)現(xiàn)高等級(jí)功能安全。
DXS在執(zhí)行安全相關(guān)的任務(wù)時(shí),效率是同級(jí)別競(jìng)品的2倍,再借助分布式功能安全機(jī)制,DXS的優(yōu)勢(shì)還能翻倍。
Imagination已經(jīng)為這個(gè)機(jī)制申請(qǐng)了專利。章政說,“DSM機(jī)制不僅可以用于車載電子,對(duì)于功能安全要求高的其它的領(lǐng)域,比如航空、醫(yī)療和工業(yè),也都適用?!?nbsp;
AI性能的數(shù)量級(jí)提升
對(duì)于自動(dòng)駕駛汽車芯片,與功能安全同樣重要的是高性能。因?yàn)樽詣?dòng)駕駛?cè)栽诓粩喟l(fā)展,智能化功能在不斷擴(kuò)展,高性能和可擴(kuò)展性都非常重要。
得益于增加了一個(gè)新的SPU單元,使用5nm節(jié)點(diǎn),算力可從單核0.25 TFLOPS的配置,擴(kuò)展到1.5 TFLOPS的處理能力,DXS的性能相比上一代XS整體提升了50%。
Imagination為SPU做了很多優(yōu)化工作,比如增加了2D雙速紋理處理(2D dual-rate texturing),更新了固件處理器(firmware processor),新增了可變分辨率渲染(fragment shading rate)。
整體而言,對(duì)于渲染類任務(wù),DXS單位面積的性能高出競(jìng)品2倍。對(duì)于以計(jì)算為中心的圖形處理任務(wù),DXS單位面積性能高出競(jìng)品28%左右。
自動(dòng)駕駛芯片的AI性能也值得單獨(dú)關(guān)注,這是實(shí)現(xiàn)更高級(jí)別自動(dòng)駕駛的關(guān)鍵所在。
4核配置的DXS,用于FP16半精度浮點(diǎn)計(jì)算時(shí),DXS能提供12 TFLOPS的性能;用于int8計(jì)算時(shí),DXS能提供254TOPS。
“這是運(yùn)行在1GHz主頻上的數(shù)據(jù),如果芯片設(shè)計(jì)公司后端能力夠強(qiáng),DXS可以運(yùn)行在1.2GHz甚至1.5GHz的主頻,其性能將更高?!闭抡硎荆?strong>我們研究發(fā)現(xiàn),大部分AI負(fù)載FP16的精度就足夠滿足要求,FP32確實(shí)有更高精度,但帶寬會(huì)增加一倍,系統(tǒng)可能沒辦法提供這么高的帶寬。當(dāng)然我們的DXS也支持FP32。”
帶寬也是限制汽車ADAS實(shí)現(xiàn)的重要原因, Imagination DXS增加了片上存儲(chǔ),盡量把所有計(jì)算都控制在一個(gè)GPU內(nèi),大幅降低系統(tǒng)的帶寬需求。
不過對(duì)于發(fā)揮芯片的AI性能,上層的軟件同樣關(guān)鍵。
由于GPU的人才相對(duì)匱乏,為了讓開發(fā)者充分利用GPU的性能,Imagination開發(fā)了一系列庫,比如幾何庫、BLAS庫(imgBLAS),專門的CNN 庫(imgNN),還有專門處理車載工作的庫,如處理雷達(dá)數(shù)據(jù)需要的FFT庫(imgFFT)。
Imagination的目標(biāo)是幫助軟件開發(fā)人員實(shí)現(xiàn)高達(dá)80%的GPU利用率。
這些庫與新的參考工具包oneAPI和TVM相結(jié)合,構(gòu)成了一個(gè)基于開放標(biāo)準(zhǔn)的實(shí)用軟件棧,軟件開發(fā)人員可以利用該軟件棧輕松地將其計(jì)算應(yīng)用移植到基于Imagination IP的硬件上,并最大限度地提高其性能。
DXS AI性能的提升相比上一代高達(dá)近10倍。其中,硬件性能大概提升了50%,所以更大的的提升來自軟件的支持和協(xié)同。
“計(jì)算庫提升了2-4倍的性能,采用雙速率FP16帶來了3倍提升,所以DXS在典型工作負(fù)載上帶來了6-12倍的性能提升。”章政表示,“DXS大模型、路況視覺觀察、駕駛員行為監(jiān)測(cè)、激光雷達(dá)系統(tǒng)數(shù)據(jù)處理等方面已經(jīng)具備了商用能力。DXS覆蓋從座艙到L2/L3自動(dòng)駕駛的需求,DXS 8-256 MC1主要用于低成本的HMI應(yīng)用,最高端的IMG DXS-48-1536 MC4滿足ADAS的這個(gè)需求?!?/p>
不同的公司可以根據(jù)產(chǎn)品定位,靈活選擇合適的配置,甚至可以在下一代產(chǎn)品更新時(shí)增加一個(gè)新的GPU模塊。
這就離不開DXS硬件和軟件的靈活性。
為了應(yīng)對(duì)高端制程大芯片良率越來越低的挑戰(zhàn),DXS原生支持小芯片(Chiplet)封裝,這得益于Imagination內(nèi)核之間的低帶寬總線和對(duì)隔離的支持。
軟件層面,基于硬件的虛擬化技術(shù)使Imagination GPU能夠同時(shí)運(yùn)行8個(gè)操作系統(tǒng),并通過完全的內(nèi)存隔離,實(shí)現(xiàn)完全安全的GPU多任務(wù)處理。
目前Imagination的汽車GPU支持OpenGL ES、Vulkan、OpenGL和OpenCL。它們可運(yùn)行流行的汽車操作系統(tǒng),如QNX和Green Hills軟件公司的INTEGRITY RTOS,以及Linux和Android。
隨著高安全等級(jí)且高性能DXS的發(fā)布,高功能安全的汽車芯片的普及將掃清障礙。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。