丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
智能駕駛 正文
發(fā)私信給大壯旅
發(fā)送

0

從三篇論文說起:看蘋果和百度如何進(jìn)行深度神經(jīng)網(wǎng)絡(luò)開發(fā)的?

本文作者: 大壯旅 2017-12-10 11:34
導(dǎo)語:蘋果有關(guān)自動駕駛的論文到底有什么乾坤?

從三篇論文說起:看蘋果和百度如何進(jìn)行深度神經(jīng)網(wǎng)絡(luò)開發(fā)的?

雷鋒網(wǎng):最近,一向低調(diào)的蘋果居然一改原本“封閉”的傳統(tǒng),悄悄發(fā)布了一篇有關(guān)深度神經(jīng)網(wǎng)絡(luò)研究的研究論文。

顯然,蘋果的這篇論文與自動駕駛有關(guān),而它多年前就開始自動駕駛研發(fā)的小秘密早已大白于天下。該論文中的神經(jīng)網(wǎng)絡(luò)名為 VoxelNet,蘋果一直在通過激光雷達(dá)點(diǎn)云訓(xùn)練它執(zhí)行目標(biāo)識別任務(wù)。

誠然,這樣的方式相比基于圖像的目標(biāo)識別(很多年來一直是深度學(xué)習(xí)研究的主題之一)高級不了多少,但對自動駕駛汽車行業(yè)的深度學(xué)習(xí)來說,這確實(shí)是個新興領(lǐng)域。因此,蘋果的研究結(jié)果具有重大的參考價值。

自動駕駛汽車是人工智能和機(jī)器學(xué)習(xí)領(lǐng)域研究者們數(shù)十年科研的成果匯聚,他們這段漫長而豐富的研究過程,值得我們一起重新領(lǐng)略。在蘋果、百度的科學(xué)家們發(fā)布的研究成果便是這樣的例子。

2018年1月16日,雷鋒網(wǎng)新智駕將在硅谷舉辦GAIR硅谷智能駕駛峰會,我們也邀請了重磅嘉賓進(jìn)行主題報告分享,希望與大家一起領(lǐng)略這些探索者們、先鋒們在自動駕駛科研生涯過程中的精彩點(diǎn)滴。更多峰會信息點(diǎn)擊 https://gair.leiphone.com/gair/gairsv2018。

據(jù)雷鋒網(wǎng)了解,蘋果的 VoxelNet 還吸收了此前兩個將深度學(xué)習(xí)應(yīng)用在激光雷達(dá)點(diǎn)云上的經(jīng)驗(yàn),它們都來自與百度相關(guān)的研究者。由于這三篇論文就像三重唱,因此下面我將對它們進(jìn)行一次快速掃描。

第一篇名為《適用于點(diǎn)云車輛探測的 3D全卷積網(wǎng)絡(luò)》(3D Fully Convolutional Network for Vehicle Detection in Point Cloud),作者為來自百度的 Bo Li。

在該論文中,Bo Li 主要在一個 3D 點(diǎn)云上應(yīng)用了 DenseBox 全卷積網(wǎng)絡(luò)(FCN)架構(gòu)。

為此,Li 將點(diǎn)云分成了體素,這樣就不用通過神經(jīng)網(wǎng)絡(luò)運(yùn)行 2D 像素了,運(yùn)行 3D 體素就行。

隨后,訓(xùn)練全卷積網(wǎng)絡(luò)來識別體素點(diǎn)云中的功能。

對全卷積網(wǎng)絡(luò)進(jìn)行非樣本處理以產(chǎn)生兩個輸出張量:其中一個是客體性張量,另一個則是包圍盒張量。

從感知的目的來看,包圍盒張量可能更有趣,它會在車輛周圍“畫”出一個包圍盒。

第二篇論文是清華大學(xué)和百度多位研究者(Xiaozhi Chen, Huimin Ma, Ji Wan, Bo Li, Tian Xia)的智慧結(jié)晶,該論文名為《自動駕駛多視角 3D 目標(biāo)探測網(wǎng)絡(luò)》(Multi-View 3D Object Detection Network for Autonomous Driving)。

研究人員開發(fā)了多視角 3D 網(wǎng)絡(luò)(MV3D),它將激光雷達(dá)和攝像頭圖像整合進(jìn)了一個復(fù)雜的神經(jīng)網(wǎng)絡(luò)管道。

與第一篇論文相反(在激光雷達(dá)點(diǎn)云之外構(gòu)建立體像素),MV3D 只是用到了點(diǎn)云中兩個單獨(dú)的 2D 視角:一個來自前端,一個則來自頂端(鳥瞰角度)。此外,MV3D 還用到了與激光雷達(dá)掃描有關(guān)的 2D 攝像頭圖像。它們能提供三個單獨(dú)的 2D 圖像(激光雷達(dá)前置視角、激光雷達(dá)頂端視角和攝像頭前端視角)。

隨后,MV3D 可利用每個視角生成一個 2D 包圍盒。鳥瞰視角的 LiDAR 生成的包圍盒與地面平行,另外兩個視角生成的 2D 包圍盒則與地面垂直。將這些包圍盒相結(jié)合,就能生成一個“護(hù)衛(wèi)”住車輛的 3D 包圍盒。

在網(wǎng)絡(luò)末端,MV3D 則用到了“深度融合”來結(jié)合三個神經(jīng)網(wǎng)絡(luò)管道的輸出。最終得出的結(jié)果就是目標(biāo)分類和 3D 包圍盒。不過實(shí)話說,我不太清楚“深度融合”是如何工作的。

第三篇論文就是最近一石激起千層浪的蘋果論文,該論文名為《VoxelNet:基于 3D 目標(biāo)識別點(diǎn)云的端對端學(xué)習(xí)》(VoxelNet: End-to-End Learning for Point Cloud Based 3D Object Detection)。

VoxelNet 有三個組成部分,它們分別是:特征學(xué)習(xí)網(wǎng)絡(luò)、卷積中間層和區(qū)域建議網(wǎng)絡(luò)。

學(xué)者認(rèn)為,特征學(xué)習(xí)網(wǎng)絡(luò)是“知識的主要來源”。這個網(wǎng)絡(luò)的工作是開啟立體像素中半隨機(jī)的點(diǎn)樣本,隨后這些點(diǎn)樣本會穿過一個全互聯(lián)網(wǎng)絡(luò)(非全卷積網(wǎng)絡(luò))。該網(wǎng)絡(luò)能學(xué)習(xí)逐點(diǎn)特性,這些特性與體素(與這些點(diǎn)同源)息息相關(guān)。

事實(shí)上,該網(wǎng)絡(luò)在利用這些逐點(diǎn)特性培養(yǎng)體素特性,它們是這些體素的素描。雖然這里講的有些過于簡單,不過它們其實(shí)就是學(xué)習(xí)特性,不但能描述每個體素,還與車輛各部分的分類有關(guān)。因此,一個體素可能會帶有“黑色”、“橡膠”和“胎面”等特性,從這里我們就能猜測到,這個體素“盯上”的是輪胎。當(dāng)然,人不一定能理解每一個真實(shí)特性,但這確實(shí)是一個好思路。

最后這些體素特性經(jīng)由卷積中間層進(jìn)入?yún)^(qū)域建議網(wǎng)絡(luò),隨后穿過該區(qū)域進(jìn)入包圍盒和分類區(qū)域。

這條研究線最令人印象深刻的地方其實(shí)在于它的新。那兩篇百度論文一年前才首次公布,過去半年才開始得到大家的熱烈討論,而蘋果的論文更是剛剛出爐。

現(xiàn)在可真是個為自動駕駛汽車打造深度神經(jīng)網(wǎng)絡(luò)的好時候。

雷鋒網(wǎng)推薦閱讀:

蘋果首次發(fā)表自動駕駛論文,透露秘密計劃背后的野心

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

分享:
相關(guān)文章
當(dāng)月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說