0
本文作者: 易建成 | 2016-11-22 17:00 | 專(zhuān)題:雷峰網(wǎng)公開(kāi)課 |
編者按:本文內(nèi)容來(lái)自清華大學(xué)計(jì)算機(jī)系教授、博士生導(dǎo)師鄧志東在雷鋒網(wǎng)硬創(chuàng)公開(kāi)課的分享,由雷鋒網(wǎng)旗下欄目“新智駕”整理。
今年 11 月 15 號(hào),18 輛百度無(wú)人車(chē)——「云驍」亮相烏鎮(zhèn)子夜路,并在 3.16 公里的開(kāi)放城區(qū)道路上自主行駛。它們可以完成交通信號(hào)燈的識(shí)別、加減速、變道超車(chē)、自動(dòng)泊車(chē)、倒車(chē)等。這是 NHTSA L4 級(jí)別的完全自動(dòng)駕駛汽車(chē)。
2016 年 8 月 25 日,nuTonomy 在新加坡推出首個(gè)無(wú)人駕駛出租車(chē)免費(fèi)載客服務(wù),已先期測(cè)試兩年,限定在 2.5 平方英里的商業(yè)住宅區(qū)內(nèi)。
2016 年 9 月 14 日,Uber 在美國(guó)匹茲堡市區(qū)推出無(wú)人駕駛出租車(chē)載客服務(wù)并試運(yùn)行,在整個(gè)城區(qū)進(jìn)行測(cè)試,有上下坡、有隧道、有狹窄道路,這應(yīng)該是無(wú)人駕駛發(fā)展史上里程碑性質(zhì)的事件。
特斯拉更激進(jìn),所有新車(chē)將裝配「具有完全自動(dòng)駕駛功能」的硬件系統(tǒng) Autopilot 2.0,軟件升級(jí)適合于已有的車(chē)型;并宣稱(chēng) 2017 年年底之前以完全自動(dòng)駕駛模式從洛杉磯開(kāi)往紐約。Autopilot 2.0使用低成本方案,配置 8 個(gè)攝像頭,12 個(gè)增強(qiáng)型超聲波傳感器,1個(gè)毫米波雷達(dá)。
目前無(wú)人駕駛汽車(chē)產(chǎn)業(yè)步伐加速,Google、沃爾沃、福特、寶馬、百度、英特爾等全球近 20 家企業(yè)均已宣稱(chēng),5 年后即 2021 年將會(huì)是無(wú)人駕駛汽車(chē)元年,部分企業(yè)宣稱(chēng) SAE L4 水平的自動(dòng)駕駛汽車(chē)將在 2021 年左右實(shí)現(xiàn)量產(chǎn)。
看起來(lái)大家都說(shuō)自己的無(wú)人駕駛汽車(chē)是SAE L4 水平的。但 L4 真的就指日可待了?我們必須把無(wú)人駕駛與自動(dòng)駕駛的概念弄清楚。
2016 年 9 月 20 日,美國(guó)交通運(yùn)輸部最新發(fā)布了自動(dòng)駕駛的聯(lián)邦新規(guī),明確了無(wú)人駕駛汽車(chē)以 SAE 的 6 級(jí)作為分級(jí)標(biāo)準(zhǔn)(L0 –L5)。
SAE 與 NHTSA 的分級(jí)標(biāo)準(zhǔn),0 級(jí)、 1 級(jí)和 2 級(jí)的分類(lèi)都是相同的。兩者的不同之處在于——原來(lái)的第四級(jí),現(xiàn)在被 SAE 細(xì)分為:第四級(jí)和第五級(jí)。
SAE L0:是完全的人為駕駛,增加開(kāi)環(huán)告警式的ADAS功能,如 LDW,F(xiàn)CW,BSD 等;
SAE L1:增加單項(xiàng)的閉環(huán)ADAS功能,如 ACC,AEB,LKS,IPAS 等。
SAE L2 和 SAE L3 是過(guò)渡期的無(wú)人駕駛階段,分別屬于部分和有條件的自動(dòng)駕駛。
SAE L2 涉及到安全駕駛員和監(jiān)控駕駛員,安全駕駛員進(jìn)行行車(chē)環(huán)境感知,手不離方向盤(pán),遇到緊急情況可直接進(jìn)行接管,這種無(wú)人駕駛通常采用「厘米級(jí)柵格/拓?fù)涞貓D+RTK導(dǎo)航+目標(biāo)識(shí)別」的解決方案;SAE L3僅有車(chē)上或車(chē)下的監(jiān)控駕駛員,需要在緊急情況下,通過(guò)車(chē)載計(jì)算機(jī)進(jìn)行認(rèn)知干預(yù)。
真正的無(wú)人駕駛階段在 SAE L4 和 SAE L5。
SAE L4 階段沒(méi)有任何人類(lèi)駕駛員,可以無(wú)方向盤(pán)和油門(mén)、剎車(chē)踏板,但限定區(qū)域和功能。
SAE L5 是真正的無(wú)人駕駛階段,與人類(lèi)駕駛無(wú)異,司機(jī)位置無(wú)人,也沒(méi)有人的車(chē)上/車(chē)下認(rèn)知判別干預(yù);無(wú)方向盤(pán)和油門(mén)、剎車(chē)踏板;全區(qū)域、全功能。
現(xiàn)在許多企業(yè)都宣稱(chēng)自己的無(wú)人駕駛汽車(chē)達(dá)到了 SAE L4 的級(jí)別。那么 SAE L4 級(jí)別的無(wú)人駕駛汽車(chē)就一定比 L2 先進(jìn)?我覺(jué)得這一定要看它自主行駛的區(qū)域和功能。
試想一輛從景區(qū)東門(mén)沿固定線路自主行駛到西門(mén)的無(wú)人車(chē),即使它無(wú)需任何人類(lèi)駕駛員,達(dá)到了所謂 SAE L4,但它真的就比在整個(gè)匹茲堡城區(qū)自主行駛的 L2 水平的無(wú)人車(chē)先進(jìn)嗎?答案顯然是否定的??傊谡?wù)?SAE L4 無(wú)人駕駛是否比 L2 先進(jìn)時(shí),一定要具體指明自主行駛的區(qū)域(封閉、開(kāi)放;區(qū)域大小、復(fù)雜程度)以及功能和環(huán)境條件(氣候、時(shí)間段)。
二、從事自動(dòng)駕駛的三股力量
目前從事自動(dòng)駕駛主要有三股力量:傳統(tǒng)車(chē)企、新車(chē)企和跨界科技企業(yè)。
這些跨界科技企業(yè)主張「跳過(guò)中間階段、一步到位」,比如谷歌、優(yōu)步、百度、蘋(píng)果、Lyft、樂(lè)視等。
絕大多數(shù)國(guó)際巨頭,包括新車(chē)企(如特斯拉)和老車(chē)企(如福特、沃爾沃、奧迪、寶馬、豐田、日產(chǎn)、通用、梅塞德斯-奔馳、大眾等),都在測(cè)試自己研發(fā)的自動(dòng)駕駛汽車(chē)。他們主張?jiān)谙薅ǔ杀镜那疤嵯卵驖u進(jìn),逐步升級(jí)無(wú)人駕駛功能。
無(wú)人駕駛汽車(chē)研發(fā)中,科技企業(yè)占據(jù)主動(dòng)。因?yàn)槠?chē)對(duì)安全性、可靠性要求極高,汽車(chē)作為特殊產(chǎn)品存在生產(chǎn)許可、安全認(rèn)證、產(chǎn)品準(zhǔn)入、品牌、供應(yīng)鏈等門(mén)檻,因此科技企業(yè)研發(fā)初期必須要與車(chē)企合作,并得到其全力支持。
另一方面,無(wú)人駕駛必須以汽車(chē)這么一個(gè)工業(yè)級(jí)的移動(dòng)載具產(chǎn)品做為基礎(chǔ)或平臺(tái) ,但它包括的遠(yuǎn)不止這些。更重要的關(guān)鍵技術(shù)還包括:環(huán)境感知、環(huán)境建模、自主決策、規(guī)劃與導(dǎo)航、控制等,這些均超出傳統(tǒng)汽車(chē)行業(yè)的強(qiáng)項(xiàng),大多屬于信息技術(shù)領(lǐng)域。
從長(zhǎng)遠(yuǎn)來(lái)看,未來(lái)在無(wú)人駕駛汽車(chē)行業(yè),傳統(tǒng)車(chē)企能做的事情或許不多。
事實(shí)上,汽車(chē)時(shí)代有四大公害,包括交通事故、交通擁堵、環(huán)境污染、石油危機(jī),已經(jīng)發(fā)展成為嚴(yán)重的社會(huì)問(wèn)題。
考慮到全球每天有三千多人,每年有 125 萬(wàn)人因車(chē)禍死亡,而且其中絕大多數(shù)交通意外都涉及到人為責(zé)任,比如由于疏忽,酒后駕駛,疲勞駕駛等等。
另外,目前汽車(chē)使用效率很低,比如每天上下班高峰期才使用汽車(chē)。用完了就把它放在停車(chē)位,所以就使用了全天時(shí)間 1% 到 10% 左右。而且 5 座、兩噸重的乘用車(chē),大多僅搭載一位乘客,是極大的能源浪費(fèi)。
無(wú)人駕駛可以使安全、共享、綠色、節(jié)能發(fā)揮到最大化。而共享電動(dòng)無(wú)人駕駛出租車(chē)可以使城市機(jī)動(dòng)車(chē)保有量降低至少三分之一,車(chē)輛的擁有量大幅度降低,能從根本上解決汽車(chē)帶來(lái)的污染、交通擁堵和安全問(wèn)題。
在共享無(wú)人駕駛汽車(chē)時(shí)代,智能增值服務(wù)更為重要。無(wú)人駕駛汽車(chē)可能就是一個(gè)智能移動(dòng)終端或者網(wǎng)絡(luò)的一個(gè)節(jié)點(diǎn)。與現(xiàn)在手機(jī)的通話功能類(lèi)似,代步出行將變成基本功能,更重要的是移動(dòng)智能服務(wù)。
如此便可以理解為什么 Uber 會(huì)把無(wú)人駕駛汽車(chē)研發(fā)當(dāng)做對(duì)企業(yè)生存至關(guān)重要的事情來(lái)做。百度也有共享汽車(chē)的戰(zhàn)略。谷歌、蘋(píng)果、滴滴、樂(lè)視等是否也有同樣的考量,將叫車(chē)出行服務(wù)和無(wú)人駕駛結(jié)合,做出前瞻性的戰(zhàn)略布局?
四、人工智能加速共享無(wú)人駕駛產(chǎn)業(yè)的發(fā)展
我們認(rèn)為,人工智能可以推動(dòng)無(wú)人駕駛汽車(chē)最短在 2 到 4 年獲得初步的商業(yè)模式。
利用大數(shù)據(jù)驅(qū)動(dòng)下的人工智能(特別是深度卷積神經(jīng)網(wǎng)絡(luò)、深度強(qiáng)化學(xué)習(xí)與交互式認(rèn)知智能),開(kāi)展面向無(wú)人駕駛汽車(chē)的環(huán)境感知/理解、信息融合、HD 地圖、低成本多模態(tài)導(dǎo)航和自主決策等前沿技術(shù)的研究,可望有力地推動(dòng)無(wú)人駕駛汽車(chē)核心技術(shù)與產(chǎn)業(yè)的發(fā)展。
自動(dòng)駕駛或者無(wú)人駕駛汽車(chē)發(fā)展面對(duì)的主要困難和挑戰(zhàn)是什么?可以認(rèn)為是在如下兩方面:
1)L2 到 L3如何跨越?機(jī)器如何代替人進(jìn)行可靠的周邊行車(chē)環(huán)境感知?如何自動(dòng)判斷自己的“感知失效”,并通過(guò)計(jì)算機(jī)向人發(fā)出干預(yù)請(qǐng)求?
2)L3 到 L4如何跨越?可能更難。取消“人在回路(HIL)” ,需要認(rèn)知智能的實(shí)質(zhì)性進(jìn)步。
要從 L2 跨越到 L3,就是要用機(jī)器去替代人進(jìn)行周邊行車(chē)環(huán)境的感知,對(duì)各種復(fù)雜道路交通場(chǎng)景,要做到非??煽亢茈y。近期人工智能的革命性進(jìn)展,再加之高清地圖的支撐,讓這個(gè)有可能成為現(xiàn)實(shí)。
如果我們單一傳感器通道完成不了,那么就要使用高性?xún)r(jià)比、低成本、多模態(tài)的傳感器組合,這就需要信息融合技術(shù)的突破。
特別地,在交通流稠密的復(fù)雜城區(qū),如何安全、快捷地檢測(cè)到行人等小目標(biāo)障礙物,以確保行車(chē)的安全?這是尤其重要的。
另外一個(gè)困難是,在保證絕對(duì)安全的前提下,如何降低無(wú)人駕駛汽車(chē)的成本,走通商業(yè)模式?目前無(wú)人駕駛降低成本的方案有四個(gè)方面:
1)人工智能算法;
2)降低激光雷達(dá)成本(這個(gè)趨勢(shì)比較明顯);
3)基于 5G 與云計(jì)算的智能網(wǎng)聯(lián);
4)基于智慧交通設(shè)施和智慧城市的發(fā)展。
人工智能在無(wú)人駕駛汽車(chē)中的應(yīng)用與其他垂直細(xì)分領(lǐng)域的應(yīng)用是一樣的,涉及算法(深度學(xué)習(xí)),數(shù)據(jù)(視覺(jué)大數(shù)據(jù),點(diǎn)云大數(shù)據(jù),駕駛行為大數(shù)據(jù)等),計(jì)算(移動(dòng)端、云端芯片/加速器),通信(基于 5G的 移動(dòng)端到云端的通信)和垂直整合等 5 個(gè)維度,幾乎是下一代信息技術(shù)的全部。
我們將從上述 5 個(gè)維度談?wù)勅斯ぶ悄苋绾渭铀俟蚕頍o(wú)人駕駛產(chǎn)業(yè)的發(fā)展。
環(huán)境理解特別重要。人開(kāi)車(chē)什么地方都能去,什么氣候條件下都可以駕駛,原因就是我們對(duì)周邊的行車(chē)環(huán)境有理解能力。
信息融合是因?yàn)槲覀儽仨氂枚鄠鞲衅鱽?lái)保證自主行駛的絕對(duì)可靠性、絕對(duì)安全性。如果單一通道傳感器解決不了,就采用多種傳感器組合,但組合就存在信息融合的問(wèn)題。
具體來(lái)說(shuō)包括,
a、基于深度監(jiān)督學(xué)習(xí)的障礙物檢測(cè)與識(shí)別技術(shù)
障礙物包括機(jī)動(dòng)車(chē)、非機(jī)動(dòng)車(chē)以及行人小目標(biāo),其可靠的檢測(cè)與識(shí)別,是一大困難。
b、基于深度監(jiān)督學(xué)習(xí)的高精地圖創(chuàng)建技術(shù)
現(xiàn)在高精地圖采用柵格方法,建立一個(gè)省、全中國(guó)甚至全球的高精地圖,數(shù)據(jù)量太大。如何解決傳輸、存儲(chǔ)與使用的問(wèn)題?所以我們需要利用深度學(xué)習(xí)和人工智能的方法,研究基于目標(biāo)理解的高精地圖的創(chuàng)建技術(shù)。
c、基于深度監(jiān)督學(xué)習(xí)的多模態(tài)導(dǎo)航融合技術(shù)
高精度定位定姿導(dǎo)航也需要大大降低成本,商業(yè)模式必須把這部分費(fèi)用降下來(lái)。
d、基于深度強(qiáng)化學(xué)習(xí)的自主決策技術(shù)
這個(gè)問(wèn)題更復(fù)雜,這是從 L3 跨越到 L4面臨的主要挑戰(zhàn)。
在與高精地圖的結(jié)合或在其支持下,利用現(xiàn)在人工智能算法的進(jìn)步進(jìn)行環(huán)境感知,是有可能解決這個(gè)問(wèn)題的,即有可能實(shí)現(xiàn)從 L2 到 L3的跨越,用機(jī)器代替人進(jìn)行周邊行駛環(huán)境的可靠感知。
比如基于深度學(xué)習(xí)解決極端環(huán)境下的道路感知問(wèn)題,比如車(chē)道線的檢測(cè)與跟蹤問(wèn)題,可行駛路面的檢測(cè)問(wèn)題。如果在正常環(huán)境下,現(xiàn)在傳統(tǒng)的計(jì)算機(jī)視覺(jué)方法都基本可以解決了。
還有一個(gè)更加重要的問(wèn)題:目標(biāo)的檢測(cè)與識(shí)別。這個(gè)問(wèn)題非常重要,因?yàn)樗玛P(guān)自動(dòng)駕駛汽車(chē)與無(wú)人駕駛汽車(chē)的安全性。我們可以在高精度地圖的支撐下,利用人工智能方法,利用大數(shù)據(jù)和深度學(xué)習(xí)算法進(jìn)行各種障礙物及其運(yùn)動(dòng)行為意圖的識(shí)別與預(yù)測(cè)。
不能單純用人工智能的方法,還要與高精地圖進(jìn)行結(jié)合,因?yàn)榈缆方煌ㄔO(shè)施相對(duì)來(lái)說(shuō)是不變的。已知高精地圖先驗(yàn)知識(shí),利用人工智能,解決道路理解、障礙物理解、障礙物運(yùn)動(dòng)行為預(yù)測(cè)以及低成本導(dǎo)航問(wèn)題,保證厘米水平的定位和精準(zhǔn)定姿。在使用多模態(tài)低成本導(dǎo)航設(shè)備時(shí),用深度學(xué)習(xí)方法去完成信息融合。
所謂多模態(tài)比如使用激光雷達(dá)SLAM技術(shù)、單目視覺(jué)SLAM技術(shù)、基于內(nèi)容理解的地圖匹配導(dǎo)航和基于柵格的地圖匹配導(dǎo)航等,這些都是降成本的方案,也都最終需要進(jìn)行信息融合。
從某種意義上來(lái)說(shuō),大數(shù)據(jù)更為重要,就是“數(shù)據(jù)為王”。因?yàn)樯疃葘W(xué)習(xí)的代碼已經(jīng)開(kāi)源了,算法上也沒(méi)有太大的區(qū)別,對(duì)特定的應(yīng)用場(chǎng)景或問(wèn)題來(lái)說(shuō),是否能達(dá)到人類(lèi)水平的識(shí)別精度,就主要靠大數(shù)據(jù)的應(yīng)用了。
大數(shù)據(jù)或稱(chēng)巨量資料,指的是數(shù)據(jù)規(guī)模巨大到不能通過(guò)目前的獨(dú)立同分布(i.i.d)假設(shè)下的平穩(wěn)隨機(jī)分析方法進(jìn)行處理了。
大數(shù)據(jù)有四個(gè)基本特征:
數(shù)據(jù)體量巨大,從 TB 級(jí)別到 PB 級(jí)別;數(shù)據(jù)種類(lèi)很多,比如網(wǎng)絡(luò)日志,圖像,視頻,高清柵格地圖,激光雷達(dá)點(diǎn)云數(shù)據(jù),導(dǎo)航數(shù)據(jù)等等;價(jià)值密度很低,但是商業(yè)價(jià)值很高;要求處理速度快。
大數(shù)據(jù),尤其是專(zhuān)有大數(shù)據(jù),已經(jīng)成為人工智能產(chǎn)業(yè)或自動(dòng)駕駛/無(wú)人駕駛產(chǎn)業(yè)制勝的基礎(chǔ)和關(guān)鍵。面對(duì)自動(dòng)駕駛中的某些特定問(wèn)題,比如說(shuō)目標(biāo)檢測(cè)與識(shí)別,我們有可能得到大數(shù)據(jù),并對(duì)它進(jìn)行清洗、標(biāo)簽與利用。
所以,從某種角度講,誰(shuí)擁有與利用大數(shù)據(jù)越多,誰(shuí)離產(chǎn)品的成熟度就越高,或者商業(yè)模式就越近。這是可以判斷一個(gè)企業(yè)它的產(chǎn)品的成熟度,或者能不能走出商業(yè)模式,離商業(yè)模式是不是很近的主要指標(biāo)之一。
總之,大數(shù)據(jù)對(duì)無(wú)人駕駛汽車(chē)或者自動(dòng)駕駛汽車(chē)研發(fā)非常重要,而且專(zhuān)有的大數(shù)據(jù),是支撐產(chǎn)業(yè)發(fā)展的一種戰(zhàn)略資源。
在大數(shù)據(jù)的采集和應(yīng)用中,我們需要解決大數(shù)據(jù)的完備性問(wèn)題。這個(gè)完備性同樣非常重要,但要做到完備性是非常困難的,需要付出極大的資源。比如說(shuō)識(shí)別率從 99.999% 提高到 99.99999%,需要的是指數(shù)級(jí)增長(zhǎng)的大數(shù)據(jù),而非僅是線性增長(zhǎng)的大數(shù)據(jù)。
計(jì)算引擎主要有三個(gè)方面的應(yīng)用:
基于超級(jí)GPU、TPU 集群,進(jìn)行深度學(xué)習(xí)算法的離線訓(xùn)練;
基于云平臺(tái)的在線應(yīng)用;
移動(dòng)端應(yīng)用。
對(duì)深度學(xué)習(xí)算法的離線訓(xùn)練來(lái)說(shuō),一般就采用 GPU,TPU 這樣的超級(jí)集群服務(wù)器。對(duì)于云端的在線應(yīng)用或者移動(dòng)端設(shè)備的應(yīng)用,我們推薦采用 FPGA 深度學(xué)習(xí)處理器,因?yàn)樗幸恍┨攸c(diǎn),比如說(shuō)低功耗、低成本、高靈活、高性能,它尤其適合于深度學(xué)習(xí)的推斷。它的好處之一就是,相對(duì)于 GPU 來(lái)說(shuō),能耗比可以提升至少 1000 倍,而且成本更低。
計(jì)算引擎的前沿發(fā)展,以后或會(huì)使用類(lèi)腦芯片,因?yàn)樗墓母汀?/p>
高清地圖對(duì)于支撐基于人工智能的環(huán)境感知,還有低成本多模態(tài)導(dǎo)航,具有極其重要的現(xiàn)實(shí)意義。高精度地圖可望發(fā)展成為一個(gè)上游的巨大產(chǎn)業(yè),也許未來(lái)的交通基礎(chǔ)設(shè)施就變成了硬道路和數(shù)字化道路與交通設(shè)施。
基于人工智能去做高清地圖,潛力很大,市場(chǎng)也很大。無(wú)人駕駛汽車(chē)產(chǎn)業(yè)的發(fā)展,還有其他一些基礎(chǔ)支撐條件,包括智慧城市,智能交通系統(tǒng)(ITS),還可以利用 5G 通訊,以及基于5G的智能網(wǎng)聯(lián)技術(shù)。5G通信的作用是巨大的,因?yàn)樗挥幸粋€(gè)毫秒的端到端時(shí)間延遲,具有足夠的實(shí)時(shí)性。
總之,人工智能的發(fā)展會(huì)加速共享無(wú)人駕駛汽車(chē)產(chǎn)業(yè)。人工智能近期的革命性進(jìn)展,再加上高精地圖、5G 通訊、智能網(wǎng)聯(lián)以及智能交通系統(tǒng)和智慧城市的支撐,形成合力,就一定能使無(wú)人駕駛產(chǎn)業(yè)早日商業(yè)化落地。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。