0
本文作者: 于勝越 | 2018-11-01 05:54 | 專題:2018 全球智能駕駛峰會 |
*地平線(上海)芯片研發(fā)總經(jīng)理吳征
雷鋒網(wǎng)新智駕按:10 月 26 日至 27 日,2018 全球智能駕駛峰會在蘇州召開,本次峰會由蘇州市相城區(qū)人民政府主辦,蘇州高鐵新城管理委員會、雷鋒網(wǎng)新智駕和數(shù)域承辦,邀請到來自主機(jī)廠、科技公司、資本機(jī)構(gòu)和產(chǎn)業(yè)研究機(jī)構(gòu)等領(lǐng)域的多位專家,共同打造了一場智能汽車和自動駕駛領(lǐng)域的頂級峰會。
本次峰會上,地平線(上海)芯片研發(fā)總經(jīng)理吳征發(fā)表了題為《車規(guī)級AI處理器—打造自動駕駛計(jì)算中樞》的主題演講。吳征博士曾在三星半導(dǎo)體、矽瑪特、飛思卡爾和摩托羅拉等多家跨國公司擔(dān)任中國區(qū)高管職位。吳征博士從事芯片/半導(dǎo)體行業(yè)超過二十年,近期加入地平線,負(fù)責(zé)研發(fā)自動駕駛的AI車規(guī)級處理器。這也是吳征博士加入地平線以來的第一次公開演講。以下為吳征演講全文,雷鋒網(wǎng)(公眾號:雷鋒網(wǎng))新智駕進(jìn)行了不改變原意的編輯(略有刪減):
如今我們已進(jìn)入一個大數(shù)據(jù)時代,無論是人們在淘寶、京東網(wǎng)上購物,或使用手機(jī)上網(wǎng)、拍照,或在市區(qū)里開車“一不小心”被拍......生活中無時無刻不在產(chǎn)生大量的數(shù)據(jù)。日積月累的數(shù)據(jù)量非常龐大,但多數(shù)情況下,眾多貌似是重復(fù)性的、無用的數(shù)據(jù)被擱置在旁,真正使用時又非常困難。
如何將大量的無用數(shù)據(jù)轉(zhuǎn)化成有用數(shù)據(jù),挖掘其背后的價值?這是一個很大的挑戰(zhàn)。這涉及到如何有效地進(jìn)行數(shù)據(jù)處理,本質(zhì)上看,這是一大計(jì)算問題。
AI作為一種的關(guān)鍵技術(shù),它基于大數(shù)據(jù)進(jìn)行訓(xùn)練和推理,可將無用數(shù)據(jù)進(jìn)行“識別”, 把非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化成結(jié)構(gòu)化數(shù)據(jù),提取有用的信息。首先,我們來回顧一下近幾年AI計(jì)算芯片的發(fā)展:
英特爾的CPU傳統(tǒng)架構(gòu),在處理大量數(shù)據(jù)方面顯得效率不高,算力不足;
后來,英偉達(dá)的GPU被應(yīng)用,其計(jì)算能力強(qiáng),性能強(qiáng)大,但也有局限性,比如功耗高,成本貴;
最近幾年,F(xiàn)PGA盛行,其架構(gòu)適合CNN計(jì)算,能耗比高,現(xiàn)場可編程適合各種場景,但對一般開發(fā)者來說,其開發(fā)較難;當(dāng)大規(guī)模量產(chǎn)時,成本、功耗也比較高。
最近幾年,一些平臺公司,例如Google,本質(zhì)上是一家軟件互聯(lián)網(wǎng)公司,亦開始擁抱硬件,甚至進(jìn)軍芯片。很重要的一點(diǎn)是,龐大的數(shù)據(jù)量需要有效處理。目前越來越多的公司開始考慮軟硬件融合,打造生態(tài)圈。
作為一家技術(shù)驅(qū)動型的公司,有著強(qiáng)大人工智能算法的地平線,自成立即定位于一家軟硬件結(jié)合的公司, 其核心是要打造自己的BPU (Brain Processing Unit)芯片,類似于 Google 的TPU。地平線瞄準(zhǔn)的是嵌入式AI 芯片,應(yīng)用在物聯(lián)網(wǎng)方面的終端產(chǎn)品,節(jié)點(diǎn)和控制設(shè)備, 專注于邊緣計(jì)算。這與研發(fā)服務(wù)器,云端AI芯片不同, 前者計(jì)算性能更強(qiáng)大,同時功耗和成本也是需要考慮的問題。
AI計(jì)算技術(shù)與應(yīng)用場景高度相關(guān)。以人臉識別和自動駕駛環(huán)境識別為例,其訓(xùn)練、推理及算法不同。 在一定程度上可以理解為:場景決定算法,算法決定芯片。反之,芯片又要求有算法,只有軟硬件接合,提供解決方案應(yīng)用到場景才能最終解決問題,這是一個閉環(huán)系統(tǒng)。
2015年成立之初,地平線確定專攻AI嵌入式芯片,當(dāng)年9月開始研發(fā)BPU;這期間地平線也在發(fā)力FPGA,同英特爾合作開發(fā)ADAS系統(tǒng);去年6月,地平第一代AI芯片(BPU)流片,并在去年年底發(fā)布了第一代AI芯片“征程”和“旭日”。地平線BPU架構(gòu)正在不斷完善,性能更強(qiáng),于今年初發(fā)布基于BPU第二代架構(gòu)的Matrix視覺感知方案,并在CES上進(jìn)行公開實(shí)車Road Show。今年地平線兩款芯片已經(jīng)開始量產(chǎn)。
今年底,地平線將完成新一輪融資,金額為5-10億美元,投資方包括一家和英特爾規(guī)模相當(dāng)?shù)男酒?,以及一家知名汽車廠商。
以BPU為核心,地平線提供的是一整套軟硬件綜合解決方案,包括芯片,算法,編譯器和運(yùn)行時庫,以及訓(xùn)練仿真的綜合平臺。業(yè)務(wù)覆蓋三大領(lǐng)域:智能駕駛、智慧城市、智慧零售。
算力是智能駕駛芯片的核心問題,地平線專注于視覺感知領(lǐng)域。
車規(guī)級AI處理器的研發(fā)目前面臨幾大挑戰(zhàn):強(qiáng)大的計(jì)算能力,可靠性,功能安全,和質(zhì)量管理與長周期的支持體系。
目前一輛汽車大多裝載多個攝像頭,每個攝像頭或720P,或1080P,每秒30幀。未來車身上會有越來越多的攝像頭,6個、8個甚至12個,逐漸升級的分辨率,為自動駕駛帶來的是巨大的數(shù)據(jù)處理量。另外一方面,基于神經(jīng)元網(wǎng)路的AI計(jì)算量也是巨大的。
就目前看來,面向L2、L3級自動駕駛處理器的算力要求達(dá)到數(shù)十個TOPS,L4到L5級將達(dá)到數(shù)百,甚至千TOPS級的要求。
不同于用在一般消費(fèi)產(chǎn)品方面的芯片,用于汽車方面的半導(dǎo)體面臨的環(huán)境更嚴(yán)苛,對可靠性要求高。感知決策關(guān)系著汽車與人身安全,所以對功能安全要求更高。
一款芯片從芯片定義,設(shè)計(jì),流片,測試和驗(yàn)證,到獲得車規(guī)級認(rèn)證需要花費(fèi)很長的時間。另一方面,汽車芯片進(jìn)入供應(yīng)商或主機(jī)廠,從導(dǎo)入設(shè)計(jì)到設(shè)計(jì)采納,一輪輪測試與驗(yàn)證,一款芯片與OEM磨合成功,并實(shí)現(xiàn)真正量產(chǎn)至少需要3-5年。這是一筆很大的投入。而且,汽車上的MCU、信息娛樂等芯片目前并沒有中國品牌的身影,可見應(yīng)用到汽車方面的半導(dǎo)體芯片的門檻非常高。
應(yīng)用于汽車方面的芯片或車規(guī)級芯片與消費(fèi)級芯片不同,可從以下幾個維度進(jìn)行對比:
溫度方面:消費(fèi)級芯片使用溫度一般在0°—70°;工業(yè)級半導(dǎo)體使用溫度更寬一點(diǎn);在汽車上,溫度需要低至-40°,高溫要到105度到125°;
從使用周期來看:消費(fèi)型半導(dǎo)體為1—3年,而一輛汽車的壽命至少為10—15年;
從現(xiàn)場失效率來說,消費(fèi)等級的是小于10%, 而汽車芯片的目標(biāo)要求為零失效率。
值得一提的是,汽車半導(dǎo)體需要通過AEC-Q100認(rèn)證。在質(zhì)量認(rèn)證方面,除零失效率,汽車半導(dǎo)體產(chǎn)商還需經(jīng)過TS16949質(zhì)量管理認(rèn)證和10年以上的支撐體系。
另外,和安全相關(guān)的芯片應(yīng)用到汽車上,需經(jīng)過功能安全認(rèn)證,來保證安全護(hù)航。這是值得重視的一點(diǎn)。
為什么功能安全認(rèn)證如此關(guān)鍵?
和手機(jī)相同,電子信息化比重越來越大的汽車可以看作為是一個復(fù)雜的嵌入系統(tǒng),無法做到盡善盡美,失效是不可避免的,一般分為兩種情況:
系統(tǒng)失效,或因產(chǎn)品的系統(tǒng)規(guī)格不完善,或因硬件芯片設(shè)計(jì)或軟件開發(fā)中的“錯誤”;
隨機(jī)失效,這或是個永久性錯誤,例如汽車的老化效應(yīng)造成電路某處連接出現(xiàn)問題,或者是瞬態(tài)錯誤,例如某一瞬間的電干擾。所以參局者需要遵從業(yè)界最好規(guī)范來減少這些系統(tǒng)失效的風(fēng)險,實(shí)施安全機(jī)制來減少隨機(jī)失效的風(fēng)險。
功能安全對應(yīng)汽車方面即ISO26262標(biāo)準(zhǔn)。這是一整套流程,即從需求,開發(fā),驗(yàn)證到認(rèn)證,從IP,EDA工具到芯片設(shè)計(jì),從硬件到軟件,系統(tǒng)均有規(guī)范,形成一套完整的功能安全體系。面向量產(chǎn)的芯片需經(jīng)過認(rèn)證達(dá)到一定ASIL等級,例如和ABS,EPS相關(guān)的芯片必須達(dá)到ASIL-D等級。
接下來,再看面向自動駕駛的AI處理器如何滿足強(qiáng)大算力的需求。
傳統(tǒng)的馮諾依曼架構(gòu)已無法滿足深度學(xué)習(xí)的計(jì)算要求,地平線自主創(chuàng)新的BPU,是一種多指令多數(shù)據(jù)MIMD架構(gòu),其能夠滿足數(shù)據(jù)流的計(jì)算要求,實(shí)現(xiàn)靈活的數(shù)據(jù)分發(fā)和計(jì)算的并發(fā)異步處理,并對CNN計(jì)算中關(guān)鍵的乘加運(yùn)算(MAC)單元達(dá)到很高的利用率,所以地平線BUP的每瓦TOPS性能相當(dāng)突出。
地平線BPU于去年發(fā)布的第一代高斯架構(gòu),到目前的第二代基于伯努利架構(gòu),均采用新型稀疏二值化神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),可支持更多路視頻輸入,支持多傳感器融合,目前主要集中在感知領(lǐng)域,后期將進(jìn)行定位,建模,預(yù)測,路徑規(guī)劃到最終決策。
地平線面向智能駕駛的BPU和Matrix視覺感知系統(tǒng),已經(jīng)向歐美汽車廠商交付。BPU 2.0可以實(shí)現(xiàn)多路攝像頭、多場景融合,能效更佳, 可在30W的功耗下實(shí)現(xiàn)基于像素級的圖像識別分割,可識別人、牌照、車型、交通紅綠燈、路標(biāo)、障礙物等等。
地平線目前的第二代車規(guī)級AI芯片,已進(jìn)入最后的開發(fā)階段。與第一代不同,前者從方框級的識別精確到像素級的語義識別。
總體來看,基于自動駕駛,地平線打造的是車規(guī)級AI處理器或SoC,提供相關(guān)的軟件算法,核心編譯器、運(yùn)行時庫,訓(xùn)練,工具鏈一整套的平臺和整體解決方案。
最后,以地平線量產(chǎn)的兩款芯片名字來結(jié)尾,用于智能IPC的旭日(Sunrise)和用于智能駕駛的征程(Journey)。在地平線看來,自動駕駛目前正在蓬勃發(fā)展階段,但未來的發(fā)展依舊面臨挑戰(zhàn),無論是商業(yè)大規(guī)模落地還是技術(shù)實(shí)現(xiàn)方面。但這是一段美好的征程,我們將像AI的深度學(xué)習(xí)一樣,不斷的學(xué)習(xí),不斷的進(jìn)步,攀登一座又一座的高峰,最終達(dá)到幸福的彼岸。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。
本專題其他文章