丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
智能駕駛 正文
發(fā)私信給新智駕
發(fā)送

0

Momenta創(chuàng)始人曹旭東:無(wú)人駕駛最大的難點(diǎn)是什么?

本文作者: 新智駕 2017-05-19 12:26
導(dǎo)語(yǔ):如何解決無(wú)人駕駛的難點(diǎn)?視覺(jué)高精度地圖如何實(shí)現(xiàn)?無(wú)人駕駛端到端學(xué)習(xí)靠譜么?Momenta創(chuàng)始人兼CEO曹旭東一一解答了這些問(wèn)題。

Momenta創(chuàng)始人曹旭東:無(wú)人駕駛最大的難點(diǎn)是什么?

雷鋒網(wǎng)新智駕按:本文來(lái)自Momenta創(chuàng)始人兼CEO曹旭東的技術(shù)解讀。Momenta是一家新生的自動(dòng)駕駛技術(shù)公司,公司基于深度學(xué)習(xí)的環(huán)境感知、高精度地圖和駕駛決策技術(shù),助力自動(dòng)駕駛的實(shí)現(xiàn)。創(chuàng)始人兼CEO曹旭東,畢業(yè)于清華大學(xué),曾任微軟亞洲研究院研究員、商湯科技執(zhí)行研發(fā)總監(jiān)。

無(wú)人駕駛最大的難點(diǎn)是什么?

無(wú)人駕駛最大的難點(diǎn),也是最重要的要素,就是安全。

高安全性意味著低事故率。一個(gè)系統(tǒng)做到很低的事故率,通常要做兩件事情,一個(gè)是發(fā)現(xiàn)問(wèn)題,一個(gè)是解決問(wèn)題。

開(kāi)始時(shí),由于系統(tǒng)的問(wèn)題非常多,主要精力在解決問(wèn)題,但是隨著事故率逐漸降低,發(fā)現(xiàn)問(wèn)題變得越來(lái)越難。據(jù)統(tǒng)計(jì),全球來(lái)看,對(duì)于人類司機(jī),一億公里發(fā)生致命事故1~3起。對(duì)于無(wú)人駕駛,我們希望比人更安全,最好致命事故率低一個(gè)量級(jí),做到十億公里一起致命性事故。統(tǒng)計(jì)上,要達(dá)到足夠置信度,需要多次重復(fù)實(shí)驗(yàn),最好一百次以上。這意味著一套比人更加安全的無(wú)人駕駛的系統(tǒng)需要測(cè)試的總里程達(dá)到1000億公里。按照一輛車一年10萬(wàn)公里總里程計(jì)算。我們需要100萬(wàn)輛車,一整年的時(shí)間,收集無(wú)人駕駛數(shù)據(jù)和測(cè)試,才能夠保證無(wú)人駕駛所需的安全性?,F(xiàn)在Google和百度的無(wú)人車成本都在百萬(wàn)人民幣量級(jí),乘以100萬(wàn)輛車這個(gè)巨大的基數(shù),對(duì)于任何一家公司而言,都是一個(gè)天文數(shù)字。

如何克服?

無(wú)人車大規(guī)模數(shù)據(jù)收集和測(cè)試的巨大成本主要來(lái)源于兩方面:一方面是需要海量的測(cè)試車輛,另一方面是高昂的單車成本。

針對(duì)這兩方面的成本,我們有兩種互補(bǔ)的解決方案:第一種解決方案是無(wú)人駕駛模擬;第二種解決方案是眾包數(shù)據(jù)收集和測(cè)試。

無(wú)人駕駛模擬可以通過(guò)算法生成感知和決策數(shù)據(jù),減少數(shù)據(jù)收集和測(cè)試車輛數(shù)量,降低研發(fā)成本。當(dāng)然,無(wú)人駕駛模擬也存在不足:

  • 第一,模擬生成的感知數(shù)據(jù)和真實(shí)的數(shù)據(jù)存在差異,實(shí)際中,還是以真實(shí)數(shù)據(jù)為主,生成數(shù)據(jù)為輔。

  • 第二,模擬的規(guī)則是人制定的。很多失敗的場(chǎng)景恰恰是人思考的盲點(diǎn),單純通過(guò)模擬并不能發(fā)現(xiàn)。

總結(jié)來(lái)說(shuō),雖然模擬可以降低數(shù)據(jù)收集和測(cè)試車輛的數(shù)量,但是我們?nèi)匀恍枰占鎸?shí)數(shù)據(jù),用大量的車做真實(shí)測(cè)試。

單車成本主要由三部分構(gòu)成:設(shè)備成本,造車成本,運(yùn)營(yíng)成本。運(yùn)營(yíng)成本就是駕駛員開(kāi)著車采數(shù)據(jù)和做測(cè)試的成本。設(shè)備成本方面,我們可以發(fā)揮算法優(yōu)勢(shì),通過(guò)多攝像頭等廉價(jià)設(shè)備實(shí)現(xiàn)無(wú)人駕駛。攝像頭是所有感知設(shè)備中信息量最大的,需要人腦水平的強(qiáng)人工智能,才能從間接視頻數(shù)據(jù)中提取出無(wú)人駕駛所需要的直接數(shù)據(jù)。激光雷達(dá)、高精GPS和IMU長(zhǎng)期看都有降價(jià)空間,我們的技術(shù)方案不排除任何感知設(shè)備,價(jià)格合理,就會(huì)融合進(jìn)來(lái)。

造車成本和運(yùn)營(yíng)成本已經(jīng)優(yōu)化了上百年,很難降低。一個(gè)聰明的想法是讓其他人承擔(dān)這部分成本——這個(gè)想法叫做眾包,代表性的公司有特斯拉和Mobileye。然而,遺憾的是,他們的眾包方案存在兩個(gè)問(wèn)題:

  • 第一,需要造車。特斯拉自己造車,Mobileye則通過(guò)合作伙伴造車。

  • 第二,需要讀取和控制車輛駕駛行為。造車周期三到五年,顯著慢于算法研發(fā)節(jié)奏,成為時(shí)間瓶頸。如果為了加快迭代,在算法沒(méi)成熟的情況下強(qiáng)行上車,是拿人的生命做冒險(xiǎn),也顯然不可取。特斯拉的幾起致命事故就是血的教訓(xùn)。

因此,我們?cè)O(shè)想直接利用現(xiàn)有道路上已有的運(yùn)營(yíng)車輛,不需要造車、改車、控制車,以一種零負(fù)擔(dān)、零危險(xiǎn)的方式實(shí)現(xiàn)眾包測(cè)試和數(shù)據(jù)收集,這是個(gè)非常困難的問(wèn)題,需要非常深厚的算法積淀和原創(chuàng)能力。

Momenta創(chuàng)始人曹旭東:無(wú)人駕駛最大的難點(diǎn)是什么?

無(wú)人駕駛的向?qū)А呔鹊貓D

高精度地圖是一個(gè)寬泛的概念,需要達(dá)到兩方面的高精度,分別是地標(biāo)位置的高精度和本車定位的高精度。

  • 地標(biāo)位置的高精度。高精地圖由很多類地標(biāo)構(gòu)成,比如地面各種道路標(biāo)線,地上各種交通標(biāo)志等,地標(biāo)的定義現(xiàn)在還沒(méi)有明確的標(biāo)準(zhǔn),不同廠商從自己產(chǎn)品和技術(shù)需求出發(fā),有不同的定義方式。

  • 本車定位的高精度。高精定位有三種方式:第一種是衛(wèi)星定位。多基站+差分GPS在開(kāi)闊區(qū)域可以做到厘米級(jí)精度,但是城市中因?yàn)槎嗦窂叫?yīng),精度只有米;第二種是匹配定位,這種方式和人很像,觀察周圍環(huán)境或者地標(biāo),在記憶地圖中搜索,匹配定位。結(jié)合GPS限定搜索范圍,可以做到快速準(zhǔn)確匹配。第三種是積分定位。IMU或者視覺(jué)里程計(jì)。短時(shí)間內(nèi)精確,長(zhǎng)時(shí)間有累積誤差。這三種方式各有優(yōu)缺點(diǎn),結(jié)合起來(lái)可以做到低成本、高精度、高可靠性。

高精度地圖是視覺(jué)的延伸和增強(qiáng),之于無(wú)人駕駛是必須的。舉個(gè)例子,多車道彎道行車時(shí),因?yàn)槁放哉系K物的遮擋,車載傳感器感知不到拐彎之后的道路情況,導(dǎo)致拐彎之后的某一車道上發(fā)生車禍。一旦有了高精地圖的車道級(jí)定位和實(shí)時(shí)路況更新,就能提前減速并變換到到非車禍車道,杜絕事故的發(fā)生 。 再舉一個(gè)例子:通過(guò)視覺(jué),我們可以識(shí)別當(dāng)前在第幾車道,通過(guò)高精度地圖定位,我們也可以知道當(dāng)前在第幾車道,兩種不同方式互相校驗(yàn),可以達(dá)到更高的安全性??偨Y(jié)來(lái)說(shuō),高精地圖可以使無(wú)人車看得更遠(yuǎn),看得更準(zhǔn)。

高精地圖對(duì)于自動(dòng)駕駛整體解決方案研發(fā)的價(jià)值非常高,這一點(diǎn)卻被很多人忽視。分為三個(gè)方面:決策,測(cè)試,V2E。

第一方面,無(wú)人駕駛決策。本質(zhì)上,駕駛決策學(xué)習(xí)的是道路環(huán)境到駕駛行為的映射,也就是這種情況應(yīng)該怎么開(kāi),那種情況應(yīng)該怎么開(kāi)。如果獲得環(huán)境和行為的海量數(shù)據(jù),就可以通過(guò)數(shù)據(jù)驅(qū)動(dòng)的方式學(xué)習(xí)無(wú)人駕駛決策。道路環(huán)境可以通過(guò)視覺(jué)感知獲得,而司機(jī)的駕駛行為如何獲得?很多人認(rèn)為,司機(jī)的駕駛行為就是剎車油門方向盤,想要獲得,一定要有CAN總線權(quán)限,要改車。其實(shí)不需要。首先,更新一個(gè)概念,司機(jī)的駕駛行為還可以用車輛在高精地圖中的軌跡表示。通過(guò)精確定位,我們可以獲得每輛車的駕駛軌跡,以及軌跡上每一點(diǎn)的速度,加速度。駕駛軌跡是駕駛行為更通用的表示,與車型無(wú)關(guān)。剎車油門方向盤,雖然直觀,但不通用。人類司機(jī),換輛車,要調(diào)整駕駛習(xí)慣,重新適應(yīng),是同一道理。依賴高精地圖,我們可以獲得駕駛軌跡這一駕駛行為數(shù)據(jù)。通過(guò)眾包,就可以獲得海量環(huán)境和行為數(shù)據(jù),通過(guò)數(shù)據(jù)驅(qū)動(dòng)的方式學(xué)習(xí)無(wú)人駕駛決策。

第二方面,無(wú)人駕駛測(cè)試。測(cè)試,找出問(wèn)題,非常重要,也極具挑戰(zhàn)。當(dāng)無(wú)人駕駛算法接近人類駕駛的安全性時(shí),需要一千輛車測(cè)試一年的時(shí)間才有可能發(fā)現(xiàn)問(wèn)題。如果團(tuán)隊(duì)像Google和百度一樣靠自己運(yùn)營(yíng)測(cè)試車輛,顯然是不現(xiàn)實(shí)的。眾包是唯一實(shí)現(xiàn)海量測(cè)試的方法,但是我們不希望像特斯拉一樣,以消費(fèi)者的生命為代價(jià),測(cè)試自己未成熟的算法方案。通過(guò)高精度地圖,我們不控制車、不帶來(lái)危險(xiǎn),就可以實(shí)現(xiàn)眾包測(cè)試。具體原理是,我們可以預(yù)測(cè)駕駛軌跡,也記錄了真實(shí)駕駛軌跡。預(yù)測(cè)軌跡和真實(shí)軌跡比對(duì),如果一致,說(shuō)明測(cè)試通過(guò),如果不一致,說(shuō)明測(cè)試失敗。找到問(wèn)題,就可以有的放矢,高效解決問(wèn)題。我們的方法是為無(wú)人車大腦測(cè)試設(shè)計(jì)的。無(wú)人駕駛整體測(cè)試還包括無(wú)人車身體測(cè)試,以及身體和大腦結(jié)合的測(cè)試,也就是車輛測(cè)試和軌跡跟蹤測(cè)試。相比于無(wú)人車大腦,這兩部分成熟很多。

第三方面,V2E。V2E是指通過(guò)車輛和道路通信實(shí)現(xiàn)無(wú)人駕駛。概念上,V2E可以大大降低無(wú)人駕駛的難度,提高安全性。非常有意思的是,這個(gè)概念在特定場(chǎng)景早已商業(yè)化,例如亞馬遜的倉(cāng)儲(chǔ)機(jī)器人Kiva。倉(cāng)庫(kù)地下鋪設(shè)有通信導(dǎo)軌,每個(gè)搬運(yùn)機(jī)器人實(shí)時(shí)和導(dǎo)軌通信,確定自己當(dāng)前的位置,接受中心計(jì)算機(jī)的調(diào)度。中心計(jì)算機(jī)知道所有機(jī)器人的當(dāng)前狀態(tài),根據(jù)取貨需求,整體規(guī)劃調(diào)度每個(gè)機(jī)器人取貨送貨。但是將V2E的概念真正落地到無(wú)人駕駛卻困難重重,其中主要有三方面的問(wèn)題。第一,道路通信設(shè)備要解決供電、應(yīng)對(duì)風(fēng)吹日曬雨淋等技術(shù)可靠性問(wèn)題,還要承擔(dān)基礎(chǔ)設(shè)施重建和復(fù)雜維護(hù)的高昂成本。二,環(huán)境和車輛通信,需要統(tǒng)一的通信標(biāo)準(zhǔn)。誰(shuí)來(lái)制定標(biāo)準(zhǔn)?眾多車企都以自己的利益為考慮,很難協(xié)調(diào)。三,通信安全的問(wèn)題。如果黑客或者恐怖分子利用通信協(xié)議漏洞,惡意操縱路面上的車輛,制造恐怖事件,又應(yīng)如何應(yīng)對(duì)?這些問(wèn)題都限制了V2E從概念短期內(nèi)走向現(xiàn)實(shí)。相對(duì)于電子通信的V2E,我們提出“漸進(jìn)式的V2E”。無(wú)人駕駛的很多問(wèn)題是因?yàn)榈缆窐?biāo)線、標(biāo)牌不足或者布置不合理造成的,通過(guò)高精地圖和基于高精地圖的測(cè)試,我們可以自動(dòng)發(fā)現(xiàn)哪些路段標(biāo)線和標(biāo)識(shí)需要改進(jìn),并給出改進(jìn)的具體實(shí)施方案。漸進(jìn)式V2E不需要電子通信設(shè)備,沒(méi)有通信標(biāo)準(zhǔn)和安全問(wèn)題。在現(xiàn)有道路標(biāo)線、標(biāo)牌體系下,就可以大幅改善無(wú)人駕駛的可靠性和安全性。

Momenta創(chuàng)始人曹旭東:無(wú)人駕駛最大的難點(diǎn)是什么?

視覺(jué)高精度地圖的實(shí)現(xiàn)

視覺(jué)高精度地圖的實(shí)現(xiàn)技術(shù),不是SLAM也不是SFM,這些方法都不適用。要建真正可用的視覺(jué)高精地圖,需要從第一原理出發(fā)重新設(shè)計(jì)整個(gè)算法。我們構(gòu)建高精地圖的第一原理是:多張圖像存在視差,利用點(diǎn)的對(duì)應(yīng)關(guān)系,可以從2D點(diǎn)恢復(fù)出3D點(diǎn)。人眼雙目視覺(jué)獲得深度也是這一原理。從基本原理出發(fā),建立高精地圖,需要?jiǎng)?chuàng)造性地解決三方面的問(wèn)題:

1. 圖像部分。檢測(cè)識(shí)別語(yǔ)義點(diǎn)。傳統(tǒng)的SLAM或者SFM算法都基于SIFT、ORB等人工設(shè)計(jì)的特征點(diǎn)。在光照、視角發(fā)生變化的情況下,無(wú)法準(zhǔn)確的檢測(cè)匹配原有特征點(diǎn)。換句話說(shuō),光照視角發(fā)生變化后,原來(lái)構(gòu)建的地圖就無(wú)法使用了。我們的方法是定義道路標(biāo)線、標(biāo)牌等地標(biāo)上的點(diǎn)作為語(yǔ)義點(diǎn),通過(guò)深度學(xué)習(xí)和數(shù)據(jù)驅(qū)動(dòng)的監(jiān)督訓(xùn)練得到模型,可以準(zhǔn)確檢測(cè)和識(shí)別語(yǔ)義點(diǎn),解決檢測(cè)不到、匹配錯(cuò)誤的問(wèn)題。

2. 幾何部分。通過(guò)眾包間接實(shí)現(xiàn)海量攝像頭測(cè)量效果。不同車輛,不同時(shí)間,經(jīng)過(guò)同一地標(biāo),即使光照視角不同,我們也可以通過(guò)語(yǔ)義點(diǎn)模型把所有車輛拍攝到的同一語(yǔ)義點(diǎn)關(guān)聯(lián)起來(lái),這相當(dāng)于間接實(shí)現(xiàn)了多攝像頭測(cè)距的效果。我們知道,視覺(jué)測(cè)量中,攝像頭越多、視差覆蓋越全,測(cè)量精度就越高。我們實(shí)驗(yàn)驗(yàn)證,隨著眾包車次的增加,真實(shí)3D點(diǎn)位置估計(jì)的準(zhǔn)確性有量級(jí)上的提升。

3. GPS部分。給每個(gè)語(yǔ)義點(diǎn)精確的GPS坐標(biāo)。我們有幾方面的考慮:(1)讓高精地圖通用。GPS坐標(biāo)是地圖的通用語(yǔ)言,給每個(gè)語(yǔ)義點(diǎn)賦予GPS坐標(biāo),便于他人使用;(2)消除累積誤差。單純使用幾何方法構(gòu)建局部地圖,會(huì)有累積誤差。結(jié)合GPS,可以解決這個(gè)問(wèn)題;(3)消除局部地圖歧義性。當(dāng)局部地圖有重合或者語(yǔ)義點(diǎn)缺失的時(shí)候,確定局部地圖坐標(biāo)系很麻煩,但全局GPS坐標(biāo)系沒(méi)有這個(gè)問(wèn)題。

Momenta創(chuàng)始人曹旭東:無(wú)人駕駛最大的難點(diǎn)是什么?

無(wú)人駕駛端到端的學(xué)習(xí)靠譜嗎?

端到端(end-to-end learning)是深度學(xué)習(xí)中的一個(gè)概念,具體指通過(guò)深度學(xué)習(xí)網(wǎng)絡(luò)直接學(xué)習(xí)從輸入到輸出的映射關(guān)系。無(wú)人駕駛端到端學(xué)習(xí)指的是輸入視頻序列、輸出剎車油門方向盤的操作序列。英偉達(dá)和comma.ai都使用端到端深度學(xué)習(xí),開(kāi)發(fā)出了無(wú)人駕駛的demo系統(tǒng)。

簡(jiǎn)單來(lái)說(shuō),對(duì)于無(wú)人駕駛,端到端不適合開(kāi)發(fā)實(shí)用無(wú)人駕駛系統(tǒng),可以做demo,然而大規(guī)模商用卻非常困難,其原因如下:

1. 不聰明。我們?cè)谧鲴{駛決策時(shí),只關(guān)心高精地圖環(huán)境、自己當(dāng)前位置和周圍物體的相對(duì)位置,并不關(guān)心車的顏色或者路邊的樹(shù)葉是綠的還是黃的。端到端學(xué)習(xí)沒(méi)有這些先驗(yàn)知識(shí),所以需要大量冗余數(shù)據(jù)和計(jì)算。如果把整個(gè)無(wú)人駕駛拆解成感知、地圖、決策三部分,分別獨(dú)立學(xué)習(xí)再融合,可以大大降低需要的數(shù)據(jù)和計(jì)算。

2. 不靈活。端到端學(xué)習(xí)的是攝像頭輸入到剎車油門方向盤輸出的直接映射。如果攝像頭設(shè)置變化或者增加其他感知設(shè)備,就需要重新收集數(shù)據(jù)學(xué)習(xí)。如果換輛車,執(zhí)行機(jī)構(gòu)變化,也需要重新收集數(shù)據(jù)學(xué)習(xí)。如果拆解成感知、地圖和決策三部分,就可以大大提高靈活性。比如模擬極端情況,我們只需要在高精地圖圖層中生成車輛3D框,不需要重新渲染真實(shí)道路環(huán)境和車輛視頻,簡(jiǎn)單很多。

3. 難理解。無(wú)人駕駛是一個(gè)系統(tǒng)工程。遇到問(wèn)題時(shí),深入系統(tǒng),診斷出問(wèn)題模塊,有針對(duì)性的改進(jìn),是解決問(wèn)題的行之有效的手段。但是,對(duì)于整體端到端學(xué)習(xí),一旦出現(xiàn)問(wèn)題,因?yàn)闊o(wú)法對(duì)癥下藥,解決問(wèn)題的難度會(huì)增大,需要投入更多的資源和時(shí)間。

我并不是完全否定端到端學(xué)習(xí),而是無(wú)人駕駛端到端學(xué)習(xí)目前存在以上問(wèn)題,或許在將來(lái)可以得到解決。

考驗(yàn)一個(gè)算法團(tuán)隊(duì)解決實(shí)際問(wèn)題能力的一個(gè)重要的方面就是拆解問(wèn)題——把一個(gè)復(fù)雜問(wèn)題拆解成一系列比較簡(jiǎn)單的問(wèn)題,再通過(guò)端到端深度學(xué)習(xí)解決。通常來(lái)說(shuō),在檢測(cè)、識(shí)別、分割等簡(jiǎn)單基礎(chǔ)的任務(wù)上,端到端學(xué)習(xí)可以獲得更好的效果。復(fù)雜問(wèn)題的拆解是一門藝術(shù)。

雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

分享:
相關(guān)文章
當(dāng)月熱門文章
最新文章
請(qǐng)?zhí)顚?xiě)申請(qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說(shuō)