丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
智能駕駛 正文
發(fā)私信給宗仁
發(fā)送

2

SLAM的前世今生 終于有人說清楚了 | 雷鋒網(wǎng)公開課

本文作者: 宗仁 2016-05-16 19:40 專題:雷峰網(wǎng)公開課
導語:根據(jù)雷鋒網(wǎng)的調(diào)查,了解SLAM并能真正把它說清楚的國內(nèi)大牛并不多,今天,我們請來了速感科技的CTO張一茗,從SLAM的前世開始……

今年8月,雷鋒網(wǎng)(搜索“雷鋒網(wǎng)”公眾號關(guān)注)將在深圳舉辦“全球人工智能與機器人創(chuàng)新大會”(GAIR),在本次大會上,我們將發(fā)布“人工智能與機器人Top25創(chuàng)新企業(yè)榜“,速感科技是我們重點關(guān)注的公司之一。今天,我們邀請到了速感科技CTO張一茗,為大家揭秘SLAM技術(shù)的前世今生。

SLAM的前世今生    終于有人說清楚了  | 雷鋒網(wǎng)公開課

張一茗。速感科技CTO。畢業(yè)于北京航空航天大學,師從中國慣性技術(shù)領(lǐng)域的著名專家馮培德院士,多年組合導航定位系統(tǒng)研究經(jīng)驗。熱愛技術(shù)和研發(fā),摘得過許多諸如Intel iot創(chuàng)客馬拉松、清華創(chuàng)客馬拉松等創(chuàng)客比賽第一名。速感科技經(jīng)過多年歷練,發(fā)展出一套以視覺SLAM為核心,集探索、導航、定位、避障、路徑規(guī)劃為一體的成熟化機器人無源導航算法。

SLAM作為一種基礎(chǔ)技術(shù),從最早的軍事用途(核潛艇海底定位就有了SLAM的雛形)到今天,已經(jīng)逐步走入人們的視野,過去幾年掃地機器人的盛行讓它名聲大噪,近期基于三維視覺的VSLAM又讓它越來越顯主流,許多人不得不關(guān)注它,但根據(jù)雷鋒網(wǎng)的調(diào)查,了解它并能真正把它說清楚的國內(nèi)大牛并不多,今天,我們請來了速感科技的CTO,張一茗,從SLAM的前世今生開始,徹底掃清我們心中的疑惑。

▌SLAM的前世

我之前從本科到研究生,一直在導航與定位領(lǐng)域?qū)W習,一開始偏重于高精度的慣性導航、衛(wèi)星導航、星光制導及其組合導航。出于對實現(xiàn)無源導航的執(zhí)念,我慢慢開始研究視覺導航中的SLAM方向,并與傳統(tǒng)的慣性器件做組合,實現(xiàn)獨立設(shè)備的自主導航定位。

定位、定向、測速、授時是人們惆悵千年都未能完全解決的問題,最早的時候,古人只能靠夜觀天象和司南來做簡單的定向。直至元代,出于對定位的需求,才華橫溢的中國人發(fā)明了令人嘆為觀止的牽星術(shù),用牽星板測量星星實現(xiàn)緯度估計。

1964年美國投入使用GPS,突然就打破了大家的游戲規(guī)則。軍用的P碼可以達到1-2米級精度,開放給大眾使用的CA碼也能夠?qū)崿F(xiàn)5-10米級的精度。

后來大家一方面為了突破P碼封鎖,另一方面為了追求更高的定位定姿精度,想出了很多十分具有創(chuàng)意的想法來挺升GPS的精度。利用RTK的實時相位差分技術(shù),甚至能實現(xiàn)厘米的定位精度,基本上解決了室外的定位和定姿問題。

但是室內(nèi)這個問題就難辦多了,為了實現(xiàn)室內(nèi)的定位定姿,一大批技術(shù)不斷涌現(xiàn),其中,SLAM技術(shù)逐漸脫穎而出。SLAM是一個十分交叉學科的領(lǐng)域,我先從它的傳感器講起。

▌離不開這兩類傳感器

目前用在SLAM上的Sensor主要分兩大類,激光雷達和攝像頭。(待會兒發(fā)的部分素材摘自官網(wǎng)、論文、專利,侵刪)。

SLAM的前世今生    終于有人說清楚了  | 雷鋒網(wǎng)公開課

這里面列舉了一些常見的雷達和各種深度攝像頭。激光雷達有單線多線之分,角分辨率及精度也各有千秋。SICK、velodyne、Hokuyo以及國內(nèi)的北醒光學、Slamtech是比較有名的激光雷達廠商。他們可以作為SLAM的一種輸入形式。

這個小視頻里展示的就是一種簡單的2D SLAM。

SLAM的前世今生    終于有人說清楚了  | 雷鋒網(wǎng)公開課

這個小視頻是賓大的教授kumar做的特別有名的一個demo,是在無人機上利用二維激光雷達做的SLAM。

SLAM的前世今生    終于有人說清楚了  | 雷鋒網(wǎng)公開課

而VSLAM則主要用攝像頭來實現(xiàn),攝像頭品種繁多,主要分為單目、雙目、單目結(jié)構(gòu)光、雙目結(jié)構(gòu)光、ToF幾大類。他們的核心都是獲取RGB和depth map(深度信息)。簡單的單目和雙目(Zed、leapmotion)我這里不多做解釋,我主要解釋一下結(jié)構(gòu)光和ToF。

▌最近流行的結(jié)構(gòu)光和TOF

結(jié)構(gòu)光原理的深度攝像機通常具有激光投射器、光學衍射元件(DOE)、紅外攝像頭三大核心器件。

SLAM的前世今生    終于有人說清楚了  | 雷鋒網(wǎng)公開課

這個圖(下圖)摘自primesense的專利。

SLAM的前世今生    終于有人說清楚了  | 雷鋒網(wǎng)公開課

可以看到primesense的doe是由兩部分組成的,一個是擴散片,一個是衍射片。先通過擴散成一個區(qū)域的隨機散斑,然后復(fù)制成九份,投射到了被攝物體上。根據(jù)紅外攝像頭捕捉到的紅外散斑,PS1080這個芯片就可以快速解算出各個點的深度信息。

這兒還有兩款結(jié)構(gòu)光原理的攝像頭。

SLAM的前世今生    終于有人說清楚了  | 雷鋒網(wǎng)公開課

SLAM的前世今生    終于有人說清楚了  | 雷鋒網(wǎng)公開課

第一頁它是由兩幅十分規(guī)律的散斑組成,最后同時被紅外相機獲得,精度相對較高。但據(jù)說DOE成本也比較高。

還有一種比較獨特的方案(最后一幅圖),它采用mems微鏡的方式,類似DLP投影儀,將激光器進行調(diào)頻,通過微鏡反射出去,并快速改變微鏡姿態(tài),進行行列掃描,實現(xiàn)結(jié)構(gòu)光的投射。(產(chǎn)自ST,ST經(jīng)常做出一些比較炫的黑科技)。

ToF(time of flight)也是一種很有前景的深度獲取方法。

傳感器發(fā)出經(jīng)調(diào)制的近紅外光,遇物體后反射,傳感器通過計算光線發(fā)射和反射時間差或相位差,來換算被拍攝景物的距離,以產(chǎn)生深度信息。類似于雷達,或者想象一下蝙蝠,softkinetic的DS325采用的就是ToF方案(TI設(shè)計的),但是它的接收器微觀結(jié)構(gòu)比較特殊,有2個或者更多快門,測ps級別的時間差,但它的單位像素尺寸通常在100um的尺寸,所以目前分辨率不高。以后也會有不錯的前景,但我覺得并不是顛覆性的。

好,那在有了深度圖之后呢,SLAM算法就開始工作了,由于Sensor和需求的不同,SLAM的呈現(xiàn)形式略有差異。大致可以分為激光SLAM(也分2D和3D)和視覺SLAM(也分Sparse、semiDense、Dense)兩類,但其主要思路大同小異。

SLAM的前世今生    終于有人說清楚了  | 雷鋒網(wǎng)公開課

這個是Sparse(稀疏)的

SLAM的前世今生    終于有人說清楚了  | 雷鋒網(wǎng)公開課

這個偏Dense(密集)的

SLAM的前世今生    終于有人說清楚了  | 雷鋒網(wǎng)公開課

▌SLAM算法實現(xiàn)的4要素

SLAM算法在實現(xiàn)的時候主要要考慮以下4個方面吧:

1. 地圖表示問題,比如dense和sparse都是它的不同表達方式,這個需要根據(jù)實際場景需求去抉擇

2. 信息感知問題,需要考慮如何全面的感知這個環(huán)境,RGBD攝像頭FOV通常比較小,但激光雷達比較大

3. 數(shù)據(jù)關(guān)聯(lián)問題,不同的sensor的數(shù)據(jù)類型、時間戳、坐標系表達方式各有不同,需要統(tǒng)一處理

4. 定位與構(gòu)圖問題,就是指怎么實現(xiàn)位姿估計和建模,這里面涉及到很多數(shù)學問題,物理模型建立,狀態(tài)估計和優(yōu)化

其他的還有回環(huán)檢測問題,探索問題(exploration),以及綁架問題(kidnapping)。

SLAM的前世今生    終于有人說清楚了  | 雷鋒網(wǎng)公開課

這個是一個比較有名的SLAM算法,這個回環(huán)檢測就很漂亮。但這個調(diào)用了cuda,gpu對運算能力要求挺高,效果看起來比較炫。

▌以VSLAM舉個栗子

SLAM的前世今生    終于有人說清楚了  | 雷鋒網(wǎng)公開課

我大概講一種比較流行的VSLAM方法框架。

整個SLAM大概可以分為前端和后端,前端相當于VO(視覺里程計),研究幀與幀之間變換關(guān)系。首先提取每幀圖像特征點,利用相鄰幀圖像,進行特征點匹配,然后利用RANSAC去除大噪聲,然后進行匹配,得到一個pose信息(位置和姿態(tài)),同時可以利用IMU(Inertial measurement unit慣性測量單元)提供的姿態(tài)信息進行濾波融合

后端則主要是對前端出結(jié)果進行優(yōu)化,利用濾波理論(EKF、UKF、PF)、或者優(yōu)化理論TORO、G2O進行樹或者圖的優(yōu)化。最終得到最優(yōu)的位姿估計。

后端這邊難點比較多,涉及到的數(shù)學知識也比較多,總的來說大家已經(jīng)慢慢拋棄傳統(tǒng)的濾波理論走向圖優(yōu)化去了。

因為基于濾波的理論,濾波器穩(wěn)度增長太快,這對于需要頻繁求逆的EKF(擴展卡爾曼濾波器),PF壓力很大。而基于圖的SLAM,通常以keyframe(關(guān)鍵幀)為基礎(chǔ),建立多個節(jié)點和節(jié)點之間的相對變換關(guān)系,比如仿射變換矩陣,并不斷地進行關(guān)鍵節(jié)點的維護,保證圖的容量,在保證精度的同時,降低了計算量。

列舉幾個目前比較有名的SLAM算法:PTAM,MonoSLAM, ORB-SLAM,RGBD-SLAM,RTAB-SLAM,LSD-SLAM。

SLAM的前世今生    終于有人說清楚了  | 雷鋒網(wǎng)公開課

SLAM的前世今生    終于有人說清楚了  | 雷鋒網(wǎng)公開課

SLAM的前世今生    終于有人說清楚了  | 雷鋒網(wǎng)公開課

SLAM的前世今生    終于有人說清楚了  | 雷鋒網(wǎng)公開課

所以大家如果想學習SLAM的話,各個高校提高的素材是很多的,比如賓大、MIT、ETH、香港科技大學、帝國理工等等都有比較好的代表作品,還有一個比較有前景的就是三維的機器視覺,普林斯頓大學的肖劍雄教授結(jié)合SLAM和Deep Learning做一些三維物體的分類和識別, 實現(xiàn)一個對場景深度理解的機器人感知引擎。

SLAM的前世今生    終于有人說清楚了  | 雷鋒網(wǎng)公開課

http://robots.princeton.edu/talks/2016_MIT/RobotPerception.pdf  這是他們的展示。

總的來說,SLAM技術(shù)從最早的軍事用途(核潛艇海底定位就有了SLAM的雛形)到今天,已經(jīng)逐步走入人們的視野,掃地機器人的盛行更是讓它名聲大噪。同時基于三維視覺的VSLAM越來越顯主流。在地面/空中機器人、VR/AR/MR、汽車/AGV自動駕駛等領(lǐng)域,都會得到深入的發(fā)展,同時也會出現(xiàn)越來越多的細分市場等待挖掘。

SLAM的前世今生    終于有人說清楚了  | 雷鋒網(wǎng)公開課

這個是occipital團隊出的一個產(chǎn)品,是個很有意思的應(yīng)用,國內(nèi)賣4000+,大概一個月1000出貨量吧(雖然不是很多,但是效果不錯,pad可玩)虛擬家居、無人飛行/駕駛、虛擬試衣、3D打印、刑偵現(xiàn)場記錄、沉浸式游戲、增強現(xiàn)實、商場推送、設(shè)計輔助、地震救援、工業(yè)流水線、GIS采集等等,都等待著VSLAM技術(shù)一展宏圖

▌SLAM的今生——還存在著問題

多傳感器融合、優(yōu)化數(shù)據(jù)關(guān)聯(lián)與回環(huán)檢測、與前端異構(gòu)處理器集成、提升魯棒性和重定位精度都是SLAM技術(shù)接下來的發(fā)展方向,但這些都會隨著消費刺激和產(chǎn)業(yè)鏈的發(fā)展逐步解決。就像手機中的陀螺儀一樣,在不久的將來,也會飛入尋常百姓家,改變?nèi)祟惖纳睢?/p>

不過說實話,SLAM在全面進入消費級市場的過程中,也面對著一些阻力和難題。比如Sensor精度不高、計算量大、Sensor應(yīng)用場景不具有普適性等等問題。

多傳感器融合、優(yōu)化數(shù)據(jù)關(guān)聯(lián)與回環(huán)檢測、與前端異構(gòu)處理器集成、提升魯棒性和重定位精度都是SLAM技術(shù)接下來的發(fā)展方向,但這些都會隨著消費刺激和產(chǎn)業(yè)鏈的發(fā)展逐步解決。就像手機中的陀螺儀一樣,在不久的將來,也會飛入尋常百姓家,改變?nèi)祟惖纳睢?/p>

(激光雷達和攝像頭兩種 SLAM 方式各有什么優(yōu)缺點呢,有沒有一種綜合的方式互補各自的缺點的呢?)

激光雷達優(yōu)點是可視范圍廣,但是缺點性價比低,低成本的雷達角分辨率不夠高,影響到建模精度。vSLAM的話缺點就是FOV通常不大,50-60degree,這樣高速旋轉(zhuǎn)時就容易丟,解決方案有的,我們公司就在做vSLAM跟雷達還有IMU的組合。

(請問目前基于視覺的SLAM的計算量有多大?嵌入式系統(tǒng)上如果要做到實時30fps,是不是只有Nvidia的芯片(支持cuda)才可以?)

第一個問題,雖然基于視覺的SLAM計算量相對較大,但在嵌入式系統(tǒng)上是可以跑起來的,Sparse的SLAM可以達到30-50hz(也不需要GPU和Cuda),如果dense的話就比較消耗資源,根據(jù)點云還有三角化密度可調(diào),10-20hz也是沒有問題。

并不一定要用cuda,一些用到cuda和GPU的算法主要是用來加速SIFT、ICP,以及后期三角化和mesh的過程,即使不用cuda可以采用其他的特征點提取和匹配策略也是可以的。

▌最后一個問題

(今年8月,雷鋒網(wǎng)將在深圳舉辦“全球人工智能與機器人創(chuàng)新大會”(簡稱:GAIR)。想了解下,您對機器人的未來趨勢怎么看?)

這個問題就比較大了。

機器人產(chǎn)業(yè)是個很大的Ecosystem,短時間來講,可能產(chǎn)業(yè)鏈不夠完整,消費級市場缺乏爆點爆款。雖然大家都在談?wù)撟鰴C器人,但是好多公司并沒有解決用戶痛點,也沒有為機器人產(chǎn)業(yè)鏈創(chuàng)造什么價值。

但是大家可以看到, 大批缺乏特色和積淀的機器人公司正在被淘汰,行業(yè)格局越來越清晰,分工逐漸完善,一大批細分市場成長起來。

從機器人的感知部分來說,傳感器性能提升、前端處理(目前的sensor前端處理做的太少,給主CPU造成了很大的負擔)、多傳感器融合是一個很大的增長點。

現(xiàn)在人工智能也開始揚頭,深度學習、神經(jīng)網(wǎng)絡(luò)專用的分布式異構(gòu)處理器及其協(xié)處理器成為緊急需求,我個人很希望國內(nèi)有公司能把這塊做好。

也有好多創(chuàng)業(yè)公司做底層工藝比如高推重比電機、高能量密度電池、復(fù)合材料,他們和機器人產(chǎn)業(yè)的對接,也會加速機器人行業(yè)的發(fā)展。整個機器人生態(tài)架構(gòu)會越來越清晰,從硬件層到算法層到功能層到SDK 再到應(yīng)用層,每一個細分領(lǐng)域都有公司切入,隨著這些產(chǎn)業(yè)節(jié)點的完善,能看到機器人行業(yè)的前景還是很棒的,相信不久之后就會迎來堪比互聯(lián)網(wǎng)的指數(shù)式增長!

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

分享:
相關(guān)文章

專注AIR(人工智能+機器人)

專注人工智能+機器人報道,經(jīng)驗分享請加微信keatslee8(請注明原因)。 科學的本質(zhì)是:問一個不恰當?shù)膯栴},于是走上了通往恰當答案的路。
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說