0
本文作者: 大壯旅 | 2019-06-21 16:32 | 專題:CVPR 2019 |
*Argoverse 數(shù)據(jù)集中的范例數(shù)據(jù)
雷鋒網(wǎng)按,一直以來,在測試中采集到的數(shù)據(jù)都是各家自動駕駛廠商不愿示人的秘密。不過,最近這一密不透風的“高墻”開始有崩塌的征兆,自動駕駛行業(yè)正在向開源邁進。
今年 3 月份,安波福(Aptiv)就先行一步,成為第一家公開傳感器數(shù)據(jù)集的主流自動駕駛系統(tǒng)開發(fā)商。本周的 CVPR 大會上,Waymo 和 Argo.AI 也站上了開放數(shù)據(jù)集的潮頭。
一般來說,一臺自動駕駛測試車每天能采集到至少 4TB 原始數(shù)據(jù),雖然這些實時數(shù)據(jù)都能起到幫助車輛理解周邊環(huán)境的作用,但在系統(tǒng)開發(fā)上,各家廠商的選擇非常局限。
在日常測試中,測試車上的工程師和技術(shù)人員會記下最有意義的場景。一天的測試結(jié)束后,車上所有的數(shù)據(jù)都會被匯集到數(shù)據(jù)中心,那些真正的精華會被打上標簽留作后續(xù)分析。至于其他的海量原始數(shù)據(jù),對訓練機器學習系統(tǒng)來說并沒有什么價值。
詳細來說,工程師們最關(guān)心的其實就是數(shù)據(jù)中的行人、自行車、動物、交通信號燈等,在精華數(shù)據(jù)被“灌輸” 給AI 系統(tǒng)前,這些目標都必須打上標簽并手動給出注釋,以便系統(tǒng)能理解自己到底“看”到了什么。
在過去,開發(fā)者能用上的數(shù)據(jù)集相對較小,而且大多由攝像頭采集。安波福開放的數(shù)據(jù)集 NuScenes 則不同,除了攝像頭采集的圖片,這里還有 LiDAR 和雷達數(shù)據(jù)。在開放程度上,Waymo 和 Argo則又高出了一截。
我們先看看 Waymo,在該領(lǐng)域耕耘十年的超級巨頭這次放出的數(shù)據(jù)集包含 3000 個場景,是 NuScenes 的 3 倍。它還有 16.7 小時的視頻數(shù)據(jù),60 萬幀圖片,2500 萬個 3D 限位框與 2200 萬個 3D 限位框。同時,Waymo 數(shù)據(jù)集攝像頭和 LiDAR 信息的同步也要好上不少。此外,5 顆傳感器為 Waymo 提供的 LiDAR 數(shù)據(jù)做了共享,而安波福的數(shù)據(jù)則只來自 1 顆 LiDAR。
Argo AI 的 Argoverse 數(shù)據(jù)集則有些不同。它納入了 LiDAR 和攝像頭數(shù)據(jù),不過只覆蓋了 113 個邁阿密與匹茲堡的場景。當然,從另一個角度來看 Argoverse 的數(shù)據(jù)鏈更加完整,因為它覆蓋了測試車上 9 個攝像頭的視角,同時還囊括了車頂 2 臺 LiDAR 的“所見所聞”。此外,該數(shù)據(jù)集中有超過 10000 個帶注釋的目標。
Argo 的數(shù)據(jù)集注重傳感器與地圖數(shù)據(jù)的結(jié)合
據(jù)雷鋒網(wǎng)了解,最大的不同是,除了上述數(shù)據(jù),Argo 還在數(shù)據(jù)集中加入了高精地圖數(shù)據(jù)。現(xiàn)在的 Argo 會在測試區(qū)域構(gòu)建高精地圖,這些地圖覆蓋了兩座城市 290 千米的測試路線,地理位置、海拔、交通信號燈等數(shù)據(jù)一應(yīng)俱全。在它們看來,有了高精地圖數(shù)據(jù),能省下大量算力,否則車輛還需要在某些區(qū)域開啟全方位掃描以識別交通信號和路標等。
除了安波福、Waymo 和 Argo 三家公司在開放上做的努力,通用旗下的 Cruise 最近也有動作,它們對外分享了自己的可視化工具 Webviz。
與上面的三家公司類似,Cruise 的 180 輛測試車與龐大的虛擬車隊(3 萬臺)每天也會產(chǎn)生海量的數(shù)據(jù),而這些數(shù)據(jù)是 Cruise 軟硬件堆棧進步的源泉。為了利用好這些數(shù)據(jù),Cruise 還專門研發(fā)了自己的可視化工具 Webviz 供工程師使用,而這次 Cruise 要對外分享的就是這個工具。
“在公司成立初期,工程師們要將自動駕駛數(shù)據(jù)可視化需借助一系列工具。雖然這些工具都很強大,但想用好它們必須在特定平臺安裝完整的開發(fā)環(huán)境,同時手動在屏幕上給不同的工具留出地方?!盋ruise 軟件工程師 Esther Weon 回憶道?!艾F(xiàn)在,Webviz 則成了 Cruise 應(yīng)用最為廣泛的數(shù)據(jù)分析工具,我們可以和過去的種種麻煩說拜拜了?!?/p>
經(jīng)過一段時間的開發(fā)與迭代,用戶已經(jīng)可以借助最新版本的 Webviz 保存配置并與其他團隊成員分享工作所需的參數(shù)了。同時,設(shè)計人員還打通了 Webviz 與 Cruise 其它內(nèi)部工具的聯(lián)系,方便工程師們翻閱模擬數(shù)據(jù)。
當然,這次對外開放的 Webviz 并沒有 Cruise 內(nèi)部使用的那么強大,但它依然擁有許多通用面板,這就夠大多數(shù)開發(fā)者使用了。此外,Webviz 團隊還在為外部開發(fā)者設(shè)計新功能。未來它們還會放出一個公共 API,方便開發(fā)者們 DIY 出最適合自己的可視化工具。
在 Webviz 對外開放之前,Cruise 還開源了 Worldview,一款 2D 和 3D 場景圖形堆棧工具,用戶可配合鼠標與內(nèi)建命令使用。與 Cruise“打?qū)尽钡氖?Uber,它們也開放了基于網(wǎng)絡(luò)的車輛數(shù)據(jù)平臺 AVS。
總的來說,各家公司試水開源對廣大的自動駕駛開發(fā)者來說是場及時雨,希望未來能有更多巨頭加入這一行列,畢竟大家要先把蛋糕做大才有更廣闊的商業(yè)空間。
PS:以下為雷鋒網(wǎng)整理的三大數(shù)據(jù)集下載地址
Argoverse 數(shù)據(jù)集下載地址:www.argoverse.org
Waymo 開放數(shù)據(jù)集下載地址:https://waymo.com/open/
安波福 NuScenes 數(shù)據(jù)集下載地址:https://www.nuscenes.org/
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。