0
本文作者: 新智駕 | 2017-07-17 12:00 |
雷鋒網(wǎng)按:智行者科技 CTO 王肖博士在汽車創(chuàng)新港微課堂的分享,已授權(quán)雷鋒網(wǎng)編輯與發(fā)布。
王肖,清華大學(xué)汽車工程系博士,北京智行者科技 CTO。他曾作為核心人員參與并獲得 2012、2014 及 2015 中國智能車未來挑戰(zhàn)賽冠軍,獲得汽車工業(yè)科學(xué)技術(shù)進(jìn)步一等獎(jiǎng)、軍隊(duì)科技進(jìn)步獎(jiǎng)等多項(xiàng)獎(jiǎng)勵(lì),參與起草中國智能網(wǎng)聯(lián)車輛技術(shù)路線圖。
本文內(nèi)容主要包含以下三點(diǎn):
為什么選擇無人物流作為首選落地場景;
蝸必達(dá)-無人物流車集成解決方案;
AVOS 設(shè)計(jì)思路及關(guān)鍵技術(shù)介紹。
智行者其實(shí)是一家非常年輕的公司,核心團(tuán)隊(duì)人員從事智能車的研究已經(jīng)非常長,主要是來自于清華大學(xué)汽車系李克強(qiáng)教授的實(shí)驗(yàn)室。
智行者成立于 2015 年 6 月,短短兩年的時(shí)間我們做了很多工作。
2016 年北京車展前夕,長安汽車從重慶到北京 2000 公里自動(dòng)駕駛的測試中,我們參與了部分城區(qū)自動(dòng)駕駛研究工作。在北汽推出的自動(dòng)駕駛試乘展示里,我們也做了很多相關(guān)工作。
這兩個(gè)項(xiàng)目當(dāng)時(shí)在北京車展取得了很大的反響。2016 年 10 月,我們?cè)诤贾輩⒓恿税⒗镌茥髸?huì),而且首次在國內(nèi)推出了低速自動(dòng)駕駛觀光車, 7 天之內(nèi)我們差不多接待了 2000 多名乘客,整個(gè)演示過程非常順利,外界給我們?cè)u(píng)價(jià)很高。
除了封閉區(qū)自動(dòng)駕駛外,2016 年底我們開始啟動(dòng)高速自動(dòng)駕駛季度的拉練,也就是我們每個(gè)季度會(huì)選擇一條路線作為長途拉練。
去年 11 月,我們從北京到北戴河進(jìn)行來回五天的拉練測試,主要是在國道上進(jìn)行我們的算法測試。車上有非常周密的安全措施,比如駕駛員可以隨時(shí)介入、有緊急按鈕等等。
進(jìn)入 2017 年后,我們通過一年多的團(tuán)隊(duì)鍛煉、技術(shù)積累以及我們對(duì)自動(dòng)駕駛市場的整體判斷,我們選擇了「低速物流」作為首選的落地場景。
*「四步走」戰(zhàn)略
我改寫了一句比較時(shí)髦的話:「自動(dòng)駕駛不僅有詩和遠(yuǎn)方,更有眼前的茍且」,但是這個(gè)「茍且」是打引號(hào)的。我想說的是智行者的基因?qū)嶋H上是一個(gè)自動(dòng)駕駛產(chǎn)品導(dǎo)向型的公司,而不是一個(gè)純技術(shù)導(dǎo)向型的公司。
具體說來,智行者會(huì)根據(jù)用戶需求來定義產(chǎn)品。用戶需求包括成本、功能等等,我們選擇當(dāng)前最成熟、最合理的技術(shù)方案進(jìn)行產(chǎn)品化,而不會(huì)去追求采用單個(gè)相機(jī)來解決所有問題的學(xué)術(shù)型流派思路。這也是我們與一些 AI 公司最大的區(qū)別,我們是做產(chǎn)品,而不是純粹做算法。
上圖是我們的「四步走」的戰(zhàn)略,需要說明一下:SCR、GCR 縮寫詞是智行者內(nèi)部的叫法,并不代表官方說法。
概括講,我們的戰(zhàn)略由簡單到復(fù)雜。說白了,先把我們自己的“肚子填飽”,基礎(chǔ)打好,這才有力量去迎接真正屬于自動(dòng)駕駛的詩和遠(yuǎn)方。否則當(dāng)前目標(biāo)如果過于遠(yuǎn)大,對(duì)于創(chuàng)業(yè)公司來說,可能根本熬不到詩和遠(yuǎn)方那一天。
2016 年,我們做了非常多主機(jī)廠的演示項(xiàng)目,如北汽、長安,我們都全身心參與,所以團(tuán)隊(duì)積累了很多經(jīng)驗(yàn)和資源。2017 年我們將重心就放在低速自動(dòng)駕駛,而且提升到一個(gè)產(chǎn)品的高度,并不是說只是演示。
我們堅(jiān)信,自動(dòng)駕駛與我們常規(guī)車輛一樣,并不是要用多么先進(jìn)的方法,更不是采用 Deep Learning (深度學(xué)習(xí))學(xué)習(xí)數(shù)據(jù)就能一蹴而就。它需要從業(yè)者以極大的耐心和無數(shù)的失敗,才能真正的做出一款可能看似比較簡單的產(chǎn)品。
我們的思想是,只有先把特定場地的自動(dòng)駕駛做好,不斷積累經(jīng)驗(yàn)和數(shù)據(jù),打好基本功,才有資格去嘗試城市和高速的自動(dòng)駕駛產(chǎn)品。否則,稍有不慎可能造成巨大的交通事故,這也就是我們?cè)燔嚺c做手機(jī)的人不同的思路。汽車是關(guān)乎乘客生命安全,并不是說手機(jī)死機(jī)就重啟這么簡單。
無人配送物流車:為什么是當(dāng)前最佳落地場景
我們首選低速場景作為一個(gè)入口,實(shí)際上低速也包含很多,比如低速掃地車、低速景區(qū)觀光車,還有園區(qū)通勤車輛,這都屬于低速車輛。
我們認(rèn)為當(dāng)前自動(dòng)駕駛要落地,有兩大關(guān)鍵指標(biāo),需要強(qiáng)調(diào)的是「當(dāng)前需要落地」,而不是 10 年、20 年要落地,這兩大指標(biāo)就是:現(xiàn)實(shí)剛需程度和可預(yù)期安全風(fēng)險(xiǎn)。
現(xiàn)實(shí)剛需程是指眼下的自動(dòng)駕駛是不是社會(huì)以及客戶所需要的。這里的產(chǎn)品是客戶掏錢買來,需要產(chǎn)生利潤,而不是說為了演示或參加比賽而使用的。我認(rèn)為,現(xiàn)實(shí)的剛需程度如果把控不了,那可能成了賠本賺吆喝。
比如我們參加了很多的比賽和演示,非常熱鬧,媒體評(píng)價(jià)非常高,但是實(shí)際上最終沒有人給你掏錢,那么最終實(shí)際上還是一個(gè)演示。
可預(yù)期的安全風(fēng)險(xiǎn)是指我們?cè)谝恍┓浅O端,功能失效的情況下會(huì)造成多么嚴(yán)重的安全事故。
比如,在新聞報(bào)道里,載貨大卡車由于制動(dòng)器失效導(dǎo)致車毀人亡的事故。同理,我們做算法或者做產(chǎn)品也要好好考慮:哪怕現(xiàn)在用最先進(jìn)的技術(shù)手段,如果說大規(guī)模上量一千臺(tái)、一萬臺(tái)的產(chǎn)品,我們會(huì)有多大的概率出現(xiàn)多大的交通事故?這是我們做產(chǎn)品要非常值得考慮的事情。
我們認(rèn)為,針對(duì)當(dāng)下的社會(huì)需求以及技術(shù)水平,低速載物最具落地優(yōu)勢。
載物自動(dòng)駕駛到底有沒有社會(huì)需求?我們從數(shù)據(jù)上分析,這兩幅圖集中反映目前中國電商的繁榮以及為消費(fèi)者所帶來的便利,其實(shí)很大程度上是建立在巨大的人力成本上。
2015 年,中國物流占 GDP 的 18%,但美國可能只有我們的一半甚至少一點(diǎn)。同樣,未來快遞行業(yè)并不是已經(jīng)發(fā)展到頂峰。
根據(jù)相關(guān)數(shù)據(jù)預(yù)測,在未來 3 到 4 年可能還會(huì)翻倍。試想一下,在未來 10 年、20 年人口下降的情況下,如此大規(guī)模的一個(gè)送貨方式還能繼續(xù)維持嗎?
隨著快遞員的工資越來越高,電商的核心競爭力到底在哪里?如果單純只是一個(gè)勞動(dòng)密集型產(chǎn)業(yè),我相信這不是長久之計(jì)。既然有這么大的產(chǎn)業(yè),那么我們應(yīng)該將成本降下來,來真正提高他們的核心競爭力。
上圖數(shù)據(jù)顯示,目前中國物流行業(yè)成本最高的環(huán)節(jié),并不是卡車司機(jī)、倉儲(chǔ)管理,而是最后一公里的一線快遞員。
從圖中可以看出,2016 年快遞相關(guān)的從業(yè)人中一線快遞員占了總體一半以上。從這個(gè)角度考慮,如果把一線快遞員無人化后,它的經(jīng)濟(jì)效益肯定會(huì)顯著上升。
同時(shí)從另外一個(gè)社會(huì)影響角度講,目前人力電動(dòng)三輪這種送貨方式,由于數(shù)量越來越多,三輪車本身行駛速度非???,好多時(shí)候不遵守交通規(guī)則,甚至出現(xiàn)逆行等問題。
所以我們綜合考慮,最后一公里的無人化綜合效益應(yīng)該非常顯著,而不僅僅是一個(gè)經(jīng)濟(jì)效益。
也許有人認(rèn)為,我們選擇低速載物就沒有什么技術(shù)門檻。上圖是我們?cè)谇迦A實(shí)地運(yùn)營期間,遇到的一些非常典型的問題。
第一個(gè)問題就是 RTK,也就是差分 GPS 基本失效。因?yàn)閮蛇叺臉浞浅6?,這對(duì)我們激光定位或者視覺定位要求非常高。
第二,在園區(qū)內(nèi),目標(biāo)交通行為非常復(fù)雜。比如有很多自行車、電動(dòng)車在路上行駛,而且它可能事先是毫無任何特征,也沒有什么手勢之類就直接切入。對(duì)于自動(dòng)駕駛小車來講,我們需要進(jìn)行非常準(zhǔn)確的目標(biāo)行為和軌跡預(yù)測,否則要么造成車輛猛剎車,要么造成撞人事故。
第三,園區(qū)內(nèi)基本上沒有交通秩序的約束。比如,逆行或是人在道路中間站著拍照這種場景應(yīng)該是常態(tài)。這種場景我們并沒有辦法通過法律法規(guī)約束,這也是團(tuán)隊(duì)面臨的非常嚴(yán)重的問題。
第四,行駛路徑會(huì)有很多突發(fā)和偶然性的事故,比如,無人物流車行駛在一半的時(shí)候突然被一輛亂停亂放的車輛堵住通道,這時(shí)候物流車不僅需要重新規(guī)劃路線,可能還涉及到調(diào)頭、倒車等非常復(fù)雜的操作。
以上場景算法的復(fù)雜程度,其實(shí)已經(jīng)遠(yuǎn)遠(yuǎn)高于高速自動(dòng)駕駛。需要強(qiáng)調(diào)的是,我并不是說高速自動(dòng)駕駛非常簡單,它可能注重點(diǎn)不同,高速自動(dòng)駕駛的算法可能非常簡單,但要求每一項(xiàng)功能非常可靠,比如感知算法。
不幸的是,在我們目前測試的幾個(gè)場景看,應(yīng)該是一個(gè)常態(tài),而且有一些場景遠(yuǎn)遠(yuǎn)比它還復(fù)雜。
作為最后一公里物流產(chǎn)品的方案,安全是我們的基本要求。
蝸必達(dá)產(chǎn)品在去年 11 月在內(nèi)部立項(xiàng),目前迭代到了 2.0 版本,1.0 的版本經(jīng)過半年左右的研究,積累了許多問題。2.0 版本目前在功能和定義上面基本上比較完善。
今年 7 月,我們計(jì)劃會(huì)有 10 臺(tái)左右小批量的樣車投入到實(shí)際運(yùn)營中。經(jīng)過下半年持續(xù)改進(jìn),而且在我們合作方強(qiáng)有力的推動(dòng)之下,我們希望在今年年底達(dá)到 100 臺(tái)的小批量運(yùn)營。
我們認(rèn)為 100 臺(tái)是產(chǎn)品穩(wěn)定成熟的標(biāo)志性數(shù)字,從現(xiàn)在 1 臺(tái)發(fā)展到 100 臺(tái)的難度,遠(yuǎn)遠(yuǎn)大于從 100 臺(tái)發(fā)展到 1 萬臺(tái)。
在底盤和執(zhí)行器的設(shè)計(jì)上,我們充分考慮到實(shí)用性及可靠性問題。
我們采用車規(guī)級(jí)的電控底盤執(zhí)行器、電池等提升性能,而不是采用現(xiàn)成玩具車的底盤改造。與國外某些送披薩的自動(dòng)駕駛小車相比,我們根本區(qū)別在于我們真正將它看做是車而不是玩具。
比如,我們要充分考慮它的實(shí)用性,在重慶,我們需要考慮爬坡等問題。如果想多送幾次貨,我們要用大容量電池來提高它的行駛里程。目前我們的車能夠跑 70 公里即完整運(yùn)行一天是沒有問題的。
在最關(guān)鍵的傳感器以及計(jì)算單元選擇上,我們充分考慮就是:如果量產(chǎn),要考慮成本、供貨周期以及銷售服務(wù)等等。
因此,我們從一開始就立足于國產(chǎn)方案來確保我們后續(xù)的順利量產(chǎn)。比如說這里最核心的激光雷達(dá)、GPS 和相機(jī)等等,我們都具有目前國內(nèi)最好的供應(yīng)商資源。
在計(jì)算單元里,我們也逐步從前期的英偉達(dá) TX 系列方案,逐步過渡到國產(chǎn) FPGA 方案。我們?cè)谟?jì)算單位里,通過 ARM+FPGA+MCU 的組合方式,能實(shí)現(xiàn)常規(guī) CPU 運(yùn)算,也能為后期深度學(xué)習(xí)等方式來進(jìn)行擴(kuò)展。
當(dāng)然,車輛和傳感器的硬件是蝸必達(dá)非常重要的基礎(chǔ),但它真正的靈魂,就是智行者的自動(dòng)駕駛開發(fā)體系軟件架構(gòu)。
我們從平臺(tái)、體系以及關(guān)鍵技術(shù)四個(gè)方面來歸納,實(shí)際上主要包括以下四個(gè)模塊:
AVDC ,數(shù)據(jù)、采集和標(biāo)注平臺(tái);
AVSIM ,仿真平臺(tái);
AVOS ,自動(dòng)駕駛的操作系統(tǒng);
AVTA ,自動(dòng)駕駛算法測試及評(píng)估體系。
AVOS 設(shè)計(jì)思路及關(guān)鍵技術(shù)介紹
由于時(shí)間關(guān)系,以下我就 AVOS 以及其中的關(guān)鍵技術(shù)進(jìn)行簡單的介紹。
AVOS 并不是憑空臆造的,也不是純粹去模仿寫出來的,它是我們從前期項(xiàng)目演示中摸索出來的。從功能上講,它主要解決的問題是我們算法與業(yè)務(wù)的功能:充分高內(nèi)聚、低耦合。
高內(nèi)聚、低耦合是一個(gè)軟件工程名詞,是指算法與業(yè)務(wù)在功能上高度依靠、環(huán)環(huán)相扣、非常嚴(yán)謹(jǐn)?shù)模⒉皇嵌嘁粋€(gè)少一個(gè)的問題,而是代碼上要充分的節(jié)耦,不能高度依賴。
基于 AVOS 框架,我們能夠充分應(yīng)付多種業(yè)務(wù)。
比如,我們要做高速自動(dòng)駕駛車輛、掃地車、物流車等,如果沒有考慮到這一點(diǎn),就會(huì)出現(xiàn)所謂掃地車版本、物流車版本、乘用車版本、大卡車版本。后期造成的最大問題是難以維護(hù),代碼管理非常零亂。
所以,在 AVOS 內(nèi)部架構(gòu),我們采用的是 ROS 作為框架,這主要是考慮到我們的用戶,如果他自己想做開發(fā),用 ROS 也會(huì)比較方便。
我們真正的核心層還是在 KERNEL 層——只負(fù)責(zé)一個(gè)非常純粹的自動(dòng)駕駛算法。在這個(gè)算法結(jié)構(gòu)體系里沒有任何的業(yè)務(wù)功能。
舉一個(gè)例子,比如 KERNEL 層沒有所謂的停車點(diǎn),在哪兒上車或者在哪兒送貨。我們認(rèn)為這屬于業(yè)務(wù)層,我們只做純粹的自動(dòng)駕駛算法研究。
AVOS 的設(shè)計(jì)有以下三個(gè)關(guān)鍵詞:平臺(tái)無關(guān)、功能抽象、認(rèn)知虛擬。
平臺(tái)無關(guān),這里的「平臺(tái)」不只是車輛硬件或者傳感器,還包括任務(wù),也就是我們要實(shí)現(xiàn)的兩點(diǎn):車輛層,傳感器和硬件自適應(yīng),不能說換一臺(tái)車后,我們的代碼還需要修改,我們需要自適應(yīng);任務(wù)層是指我們開發(fā)了一個(gè) AVOS Managenent 工具方便我們進(jìn)行非常傻瓜式的操作。
功能抽象,這里的功能包括交通功能和業(yè)務(wù)功能這兩塊。交通功能,具有交通屬性;業(yè)務(wù)功能就是車除了運(yùn)動(dòng)外,實(shí)際上還有工具屬性,比如掃地車會(huì)掃地,物流車除了運(yùn)動(dòng)之外它是送貨,它實(shí)際上是一個(gè)具有業(yè)務(wù)功能的交通工具。
AVOS 將交通及業(yè)務(wù)功能統(tǒng)一抽象為自動(dòng)駕駛的算法功能。例如,在 AVOS 里,沒有紅綠燈的概念。
我們的做法是將紅綠燈抽象為停車線前面有一個(gè)不可逾越的障礙物,通過這種方式來讓自動(dòng)駕駛算法實(shí)現(xiàn)在規(guī)定地點(diǎn)自動(dòng)停車。
同樣,在 AVOS 也沒有業(yè)務(wù)層,沒有送貨店、載客店的概念,都會(huì)進(jìn)行高度的抽象。
比如我要到 B 點(diǎn)停 5 秒鐘,讓所有乘客下去,這是一個(gè)業(yè)務(wù)層的描述。我們通過將這些業(yè)務(wù)層的描述轉(zhuǎn)換到 AVOSKERNEL 能夠理解的語言。
簡單解釋,比如通過用戶在載客層點(diǎn)設(shè)置一個(gè)虛擬障礙物,它是不可逾越的,車輛同時(shí)也要在這里停車。那么這個(gè)不可逾越的障礙物可能就是保持 5 秒,保持 5 秒之后它就自動(dòng)消失。
我描述得比較簡單,實(shí)際在模型里不簡單。通過這種業(yè)務(wù)的描述轉(zhuǎn)化為功能的描述來進(jìn)行抽象,我們?cè)?AVOSKERNEL 里相當(dāng)于沒有任何業(yè)務(wù)的功能描述。
最后是認(rèn)知虛擬,包括場景感知與情境認(rèn)知。
場景感知就是算法,例如計(jì)算障礙物的位置以及速度等等。但人類在理解周圍障礙物的行為以及它未來軌跡時(shí),我們肯定不是簡簡單單通過前后兩個(gè)這樣去比較。
我們實(shí)際上要做到情境認(rèn)知,要對(duì)一個(gè)連續(xù)時(shí)間、空間實(shí)體的交互影響來進(jìn)行描述。這里涉及到非常復(fù)雜的模型。
簡單介紹我們兩個(gè)非常細(xì)的關(guān)鍵技術(shù),第一項(xiàng)是高精度地圖構(gòu)建以及定位。
這是蝸必達(dá)原型車在園區(qū)實(shí)際運(yùn)行的狀態(tài),我們可以看到,這個(gè)園區(qū)還是蠻復(fù)雜的。
雖然路上沒有多少行人,但可以看到周圍有的花花草草,當(dāng)它走到一個(gè)靠墻特別近的地方時(shí),RTK 已經(jīng)完全失效,在這種情況下主要是通過激光雷達(dá)進(jìn)行精確定位。
這段視頻的后半段呈現(xiàn)的是我們算法的定位效果。這里不僅是激光雷達(dá)定位,還包括一個(gè)非常便宜的慣導(dǎo)、輪速計(jì)和 RTK 等進(jìn)行了融合定位。我們發(fā)現(xiàn)當(dāng) RTK 失效時(shí),車輛非常穩(wěn)定,沒有出現(xiàn)漂移或者抖動(dòng)。
第二項(xiàng)關(guān)鍵技術(shù)就是目標(biāo)行為以及運(yùn)動(dòng)軌跡的預(yù)測。
在學(xué)術(shù)研究里,有很多種行為預(yù)測方法,當(dāng)然通過深度學(xué)習(xí)也可以實(shí)現(xiàn)。但是實(shí)際上我們?cè)谧霎a(chǎn)品時(shí),一定要考慮到:我們要盡可能利用一切工程化方法、先驗(yàn)知識(shí)來輔助來進(jìn)行非常精確的定位。
這段視頻有高精度地圖,紅色車輛是我們的自動(dòng)駕駛車輛,綠色軌跡是目標(biāo)行為預(yù)測的車輛,在左下角有視頻來作參考。
在地圖上,深藍(lán)色的線是自動(dòng)駕駛車輛絕對(duì)的行駛參考軌跡,我們?cè)诠靖浇L制了一張面積四平方公里大小的高精度地圖,我們?cè)谏厦鏄?biāo)注了建筑物、柵欄等等。
回到切入車輛行為預(yù)測,其中四個(gè)點(diǎn)或者五個(gè)點(diǎn)代表的是,比如四個(gè)時(shí)刻、五個(gè)時(shí)刻一個(gè)車輛將要行駛到的一個(gè)全局的路徑位置。
在視頻中,我們可以看到這輛車一開始會(huì)有左轉(zhuǎn)的趨勢、有從右方切到左邊的趨勢,到這輛車又重置車道,最后又回歸到右車道的趨勢。
我們的行為預(yù)測都能夠比較準(zhǔn)確估計(jì)出來。有了這個(gè)行為預(yù)測后,我們?cè)贅?gòu)建其他模型時(shí)就可以做到非常精確。
在視頻后半段,汽車在十字路口右拐時(shí),前車也要右轉(zhuǎn)。我們從靜止出發(fā),因?yàn)殪o止的時(shí)候前車沒有速度,我們也無法預(yù)測。如果它一旦有了速度,我們也能夠精確預(yù)測出它右轉(zhuǎn)做出的運(yùn)動(dòng)軌跡,然后我們?cè)俑鶕?jù)這個(gè)運(yùn)動(dòng)軌跡進(jìn)行運(yùn)動(dòng)規(guī)劃。
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。