1
本文作者: 張偉 | 2016-09-14 09:00 | 專題:GPU引爆中國新興企業(yè)——GTC CHINA2016大會專題 |
前英特爾中國研究院院長、馭勢科技CEO吳甘沙在Nvidia GTC大會上演講
當(dāng)吳甘沙的身份變成馭勢科技CEO之后,他也成為各類自動駕駛論壇的常客,此次Nvidia在京舉辦的GPU技術(shù)大會,便有他的主題演講。從現(xiàn)場的幻燈片來看,大致內(nèi)容與以往相比無太大變化,有一些小更新,我們來回顧一下。
與業(yè)界多數(shù)人觀點一致,吳甘沙認為人工智能是未來大趨勢,2016年的人工智能相當(dāng)于1996年的互聯(lián)網(wǎng)和1976年的PC,后兩者分別引領(lǐng)了20年的數(shù)字化和網(wǎng)絡(luò)化,接下來的20年將是人工智能波瀾壯闊的20年。
篤定智能駕駛的未來
在吳甘沙看來,未來5到10年,智能駕駛的市場輻射規(guī)模將是最大的,而且社會效應(yīng)也會最卓著。因為在2020這個重要的時間節(jié)點,多數(shù)車廠都會推出新的車型,帶動激光雷達的訂單增長,從而將單價從75000美元壓縮到500美元以內(nèi),推動自動駕駛汽車的量產(chǎn)。
在過往的多次演講中,吳甘沙已經(jīng)闡述了其對智能駕駛發(fā)展階段的界定:
吳甘沙眼中的智能駕駛發(fā)展階段,這一次他沒提203X年(制表:雷鋒網(wǎng))
目前我們還只經(jīng)歷了前兩個階段:從駕駛輔助到輔助駕駛。二者的技術(shù)要求也有很大不同。
1、駕駛輔助重要的是誤報率要低,而漏報率則并沒有那么重要。
2、輔助駕駛漏報率必須是0,同時其誤報率也必須非常低。
因為一次漏報就可能車毀人亡,而莫名其妙緊急剎車則非常影響體驗,同時很危險。
1、駕駛輔助只需要視覺傳感器來做感知。
2、輔助駕駛需要視覺、毫米波/超聲波雷達等多傳感器融合來做感知、規(guī)劃、決策及控制等一系列動作。
▼
如今,多數(shù)廠商都想在輔助駕駛上做得更好。
吳甘沙照例以特斯拉在5月份的首起自動駕駛撞車事故為例闡述了目前解決方案的一些弊端:因為攝像頭和激光雷達存在不可避免的缺陷(比如不能清晰辨別出前方是車身還是橋梁)而釀成悲劇。目前特斯拉也正在不斷升級其輔助駕駛系統(tǒng)。
針對此,吳甘沙給出的方案是:
1、通過深度學(xué)習(xí)算法,進行車輛識別、行人識別、標(biāo)識牌識別以及車道線識別,無論遠近、類型、角度還是有無遮擋都能識別,感知環(huán)境能力更強。但是當(dāng)其他車輛從本車的側(cè)后方出現(xiàn)時,很難識別出來,這個時候,深度學(xué)習(xí)算法也是有缺陷的。
2、基于立體視覺的算法,通過立體攝像頭進行車輛捕捉和識別,深度學(xué)習(xí)算法的缺陷就被彌補了。并且還能識別出不平整的道路表面。
三目立體攝像頭(左中右三個攝像頭)
3、建立一個多任務(wù)的識別網(wǎng)絡(luò),將深度學(xué)習(xí)算法和立體視覺算法組合在一起,系統(tǒng)性對行人、車輛、標(biāo)示、車道線等進行識別。
而且,他正在建立一個全面的世界模型,可以識別不同國家、地區(qū)道路上的突發(fā)狀況(例如澳大利亞袋鼠跳到路上、中東地區(qū)的駱駝闖入道路等),同時將深度學(xué)習(xí)算法融合進去,令輔助駕駛表現(xiàn)得更好。
全面世界模型
除去以上路面檢測部分,還有可行駛區(qū)域(道路的可行駛范圍)以及非結(jié)構(gòu)化道路(雪天的道路邊界被掩埋)的檢測,這個時候也需要深度學(xué)習(xí)算法來讓檢測更加精確。
▼
識別與檢測方案給出后,接下來要解決定位與地圖的問題:達到分米甚至厘米的精度。
定位方案
目前很多廠商使用慣性導(dǎo)航系統(tǒng)與GPS RTK(高精度GPS)作為解決方案,可以給出準確的定位信息。但是目前慣導(dǎo)系統(tǒng)基本上價格非常昂貴,并不是最優(yōu)解。
吳甘沙認為,使用視覺里程計代替慣性導(dǎo)航系統(tǒng),也能實現(xiàn)不錯的效果,準確率很高。目前他的團隊正在做這件事。
地圖方案
區(qū)別于Google和其他地圖廠商的高精度地圖,目前吳甘沙給出的地圖方案是:
1、基于Landmark(即道路標(biāo)識:道路兩旁的標(biāo)牌);
2、基于Lanemark(上帝視角鳥瞰“Bird View”道路表面的標(biāo)線),精度達到10cm的級別。
這種方案的地圖采集設(shè)備價格較低、定位設(shè)備價格較低且實時更新,是為自動駕駛專門制作的地圖。
▼
吳甘沙還提到,目前攝像頭還有很多創(chuàng)新的機會,可以借鑒自然界一些鬼斧神工的創(chuàng)造比如:蒼蠅的腹眼、老鷹的超遠距離眼、變色龍的360度環(huán)視眼、哈士奇的夜視眼。
未來,一輛車身上將有6-8個高精度攝像頭,分辨率超過750萬像素,與毫米波/激光雷達更好地進行融合,在異構(gòu)視覺融合方面做得更出色,服務(wù)于自動駕駛甚至無人駕駛。
最后,他認為,并不是最好的深度學(xué)習(xí)算法就是最適合解決問題的(方案),軟件和硬件要針對問題進行適配。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。