2
本文作者: 宗仁 | 2016-05-12 21:03 |
什么是SLAM?機(jī)器人在未知環(huán)境中,要實(shí)現(xiàn)智能化需要完成三個(gè)任務(wù),第一個(gè)是定位(Localization),第二個(gè)是建圖(Mapping),第三個(gè)則是隨后的路徑規(guī)劃(Navigation)。
之前地平線(xiàn)的高翔博士用這樣一句話(huà)概括SLAM的釋義。不過(guò)實(shí)際生活中的SLAM都是和激光雷達(dá)或者單目/雙目攝像頭結(jié)合的形式出現(xiàn)在我們面前的,有時(shí)甚至跟更多的傳感器融合,這讓很多人覺(jué)得這個(gè)技術(shù)不是一兩句話(huà)能概括清楚的,但當(dāng)我們熟悉完它在每一個(gè)領(lǐng)域的應(yīng)用啊,就會(huì)明白,它,SLAM,原來(lái)是這樣一個(gè)東西,而且會(huì)比我們所想象的要重要的多。
若是兩年前有人跟我們提SLAM技術(shù)的話(huà),很多人的印象是那個(gè)是用在室內(nèi)移動(dòng)機(jī)器人上的技術(shù),如果非要找個(gè)剛需場(chǎng)景的話(huà),掃地機(jī)那邊畫(huà)圖邊掃地的樣子簡(jiǎn)直是最好像向陌生人解釋這東西有多牛掰的神器。
但是,誰(shuí)也沒(méi)料到,兩年后,因?yàn)橛?jì)算機(jī)視覺(jué)技術(shù)的快速發(fā)展,攝像頭和激光雷達(dá)成本的降低,SLAM正在A(yíng)R、機(jī)器人、無(wú)人機(jī)、無(wú)人駕駛等領(lǐng)域火速入侵,用夸張點(diǎn)的說(shuō)法,就像移動(dòng)互聯(lián)網(wǎng)時(shí)代的手機(jī)地圖定位一樣,只要是跟位置相關(guān)的生意,誰(shuí)拋棄了這張地圖,誰(shuí)將拋棄了自己的未來(lái)。
至于SLAM技術(shù)為什么這么重要,用SLAM技術(shù)發(fā)燒友Guang Ling的話(huà)說(shuō)。
一個(gè)機(jī)器人也好,無(wú)人汽車(chē)也好,其中最核心,最根本的問(wèn)題有四個(gè),定位技術(shù)(Localization), 跟蹤技術(shù)(Tracking), 路徑規(guī)劃技術(shù)(Path Planning), 還有就是控制技術(shù)(Controlling)。 而這四個(gè)問(wèn)題中的前三個(gè),SLAM都扮演了最核心的功能, 其意義,打個(gè)比方,就像移動(dòng)互聯(lián)網(wǎng)時(shí)代中,wifi和3/4G數(shù)據(jù)傳輸技術(shù)對(duì)手機(jī)的意義,是一樣的。扮演一個(gè)最核心,也是最不可或缺的角色。
若是手機(jī)離開(kāi)了WIFI和數(shù)據(jù)網(wǎng)絡(luò),就像無(wú)人車(chē)和機(jī)器人,離開(kāi)了SLAM一樣。但對(duì)于A(yíng)R和AI來(lái)說(shuō),因?yàn)檫@兩個(gè)品類(lèi)非常寬泛,所以,SLAM對(duì)其影響,就相對(duì)比較有限。
一個(gè)技術(shù)重要的最好證據(jù),就是看見(jiàn)它正在在各個(gè)領(lǐng)域深入應(yīng)用,并且各個(gè)領(lǐng)域都視它為未來(lái),下面我們從這四個(gè)時(shí)下最熱的領(lǐng)域一窺它的火爆。
掃地機(jī)要算機(jī)器人里最早用到SLAM技術(shù)這一批了,國(guó)內(nèi)的科沃斯、塔米掃地機(jī)通過(guò)用SLAM算法結(jié)合激光雷達(dá)或者攝像頭的方法,讓掃地機(jī)可以高效繪制室內(nèi)地圖,智能分析和規(guī)劃掃地環(huán)境,從而成功讓自己步入了智能導(dǎo)航的陣列。
不過(guò)有意思的是,科沃斯引領(lǐng)時(shí)尚還沒(méi)多久,一大幫懂Slam算法的掃地機(jī)廠(chǎng)商就開(kāi)始陸陸續(xù)續(xù)地推出自己的智能導(dǎo)航,直到昨天雷鋒網(wǎng)還看到一款智能掃地機(jī)新鮮出爐,而這追逐背后的核心,大家都知道就是SLAM技術(shù)的應(yīng)用。
而另一個(gè)跟SLAM息息相關(guān)的室內(nèi)移動(dòng)機(jī)器人,因?yàn)槟壳笆袌?chǎng)定位和需求并不明確,我們目前只能在商場(chǎng)導(dǎo)購(gòu)室內(nèi)機(jī)器人和Buddy那樣的demo視頻里才能看到,國(guó)內(nèi)Watchhhh Slam和Slam Tech兩家公司都是做這方面方案提供的,以現(xiàn)實(shí)的觀(guān)點(diǎn)看,現(xiàn)在室內(nèi)移動(dòng)機(jī)器人市場(chǎng)定位和需求沒(méi)落地的時(shí)候,由方案商公司推動(dòng),商用室內(nèi)移動(dòng)機(jī)器人先行,這反而是一種曲線(xiàn)救國(guó)的發(fā)展方式。
目前基于SLAM技術(shù)開(kāi)發(fā)的代表性產(chǎn)品有微軟的Hololens,谷歌的Project Tango以及同樣有名的Magic Leap,后者4月20號(hào)公布它的新一代水母版demo后,國(guó)內(nèi)的AR公司更加看到了這個(gè)趨勢(shì),比如進(jìn)化動(dòng)力近期就公布了他們的SLAM demo, 用一個(gè)小攝像頭實(shí)現(xiàn)VR頭顯空間定位,而易瞳去年10月雷鋒網(wǎng)去試用新品的時(shí)候,就發(fā)現(xiàn)已經(jīng)整合SLAM技術(shù)了,國(guó)內(nèi)其他公司雖然沒(méi)有正式公布,但我們可以肯定,他們都在暗暗研發(fā)這項(xiàng)技術(shù),只等一個(gè)成熟的時(shí)機(jī)就會(huì)展現(xiàn)給大家。
進(jìn)化動(dòng)力CTO聶崇嶺向雷鋒網(wǎng)表示,如果用一個(gè)準(zhǔn)確的說(shuō)法
很多VR應(yīng)用需要用到SLAM技術(shù),定位只是一個(gè)feature,路徑記錄、3D重構(gòu)、地圖構(gòu)建都可以是SLAM技術(shù)的輸出。
國(guó)外的話(huà),原來(lái)做 Google X Project Wing 無(wú)人機(jī)的創(chuàng)始人 MIT 機(jī)器人大牛 Nicholas Roy 的學(xué)生 Adam Bry 創(chuàng)辦的 Skydio,挖來(lái)了 Georgia Tech 的 Slam 大牛教授 Frank Dellaert 做他們的首席科學(xué)家。
國(guó)內(nèi)大家非常熟悉的大疆精靈四避障用的雙目視覺(jué)+超聲波,一位大疆工程師徐梟涵在百度百家的撰文里坦率承認(rèn)
“P4里面呈現(xiàn)的主動(dòng)避障功能就是一種非常非常典型的Slam的弱應(yīng)用,無(wú)人機(jī)只需要知道障礙物在哪,就可以進(jìn)行 Planning,并且繞開(kāi)障礙物。當(dāng)然Slam能做的事情遠(yuǎn)遠(yuǎn)不止這些,包括災(zāi)區(qū)救援,包括探洞,包括人機(jī)配合甚至集群,所有的關(guān)于無(wú)人機(jī)的夢(mèng)想都建立在Slam之上,這是無(wú)人機(jī)能飛(具有定位,姿態(tài)確定以后)的時(shí)代以后,無(wú)人機(jī)最核心的技術(shù)。”
而近期另一個(gè)號(hào)稱(chēng)刷爆美國(guó)朋友圈的hover camera無(wú)人機(jī),因?yàn)槠鋭?chuàng)始人的的計(jì)算機(jī)視覺(jué)背景,正式把SLAM技術(shù)應(yīng)用進(jìn)來(lái)了,在介紹他們無(wú)人機(jī)的主要產(chǎn)品技術(shù)時(shí),提到了
●SLAM(即時(shí)定位與地圖構(gòu)建):通過(guò)感知自身周?chē)h(huán)境來(lái)構(gòu)建3D增量式地圖,從而實(shí)現(xiàn)自主定位和導(dǎo)航。
因?yàn)镚oogle無(wú)人駕駛車(chē)的科普,很多人都知道了基于激光雷達(dá)技術(shù)的Lidar Slam。Lidar Slam是指利用激光雷達(dá)作為外部傳感器,獲取地圖數(shù)據(jù),使機(jī)器人實(shí)現(xiàn)同步定位與地圖構(gòu)建。雖然成本高昂,但目前為止是最穩(wěn)定、最可靠、高性能的SLAM方式。
另外,2011 年,牛津大學(xué)Mobile Robotics Group 首次向公眾展示他們的第一輛無(wú)人駕駛汽車(chē)野貓(Wildcat),這是一輛由 Bowler Wildcat 4X4 改裝而成的車(chē)。汽車(chē)頭頂?shù)南鄼C(jī)和激光能夠搜集信息然后即時(shí)分析導(dǎo)航,已經(jīng)成功通過(guò)了測(cè)試。2014 年,他們改裝的一輛 Nissan 的 Leaf 也成功路測(cè)。
Mobile Robotics Group主要研究領(lǐng)域是大規(guī)模的導(dǎo)航和對(duì)自然場(chǎng)景理解。據(jù)稱(chēng),團(tuán)隊(duì)所擁有的技術(shù)非常牛逼,其復(fù)雜和先進(jìn)性遠(yuǎn)遠(yuǎn)超過(guò)一般的同步定位與地圖構(gòu)建(SLAM)算法。
可圈可點(diǎn)的是,對(duì)于無(wú)人駕駛技術(shù),他們并沒(méi)有使用 GPS 或者是嵌入式的基礎(chǔ)設(shè)施(信標(biāo)之類(lèi)的),而是使用算法來(lái)導(dǎo)航,包括機(jī)器學(xué)習(xí)和概率推理來(lái)建立周?chē)牡貓D等。
既然SLAM技術(shù)如文章SLAM的世紀(jì)意義所說(shuō),它對(duì)于機(jī)器人是個(gè)通用技術(shù),要更深入的了解它,你只能通過(guò)它在不同領(lǐng)域應(yīng)用的異同來(lái)比較,你才會(huì)知道它到底是個(gè)什么東西。
* 關(guān)于SLAM技術(shù)在A(yíng)R行業(yè)的應(yīng)用,跟在機(jī)器人上使用時(shí)有什么不同的地方。Watchhhh Slam創(chuàng)始人劉博士在接受arinchina采訪(fǎng)的時(shí)候曾給出了很好的答案,雷鋒網(wǎng)這里就不重復(fù)了:
1)精度上,AR一般更關(guān)注于局部精度,要求恢復(fù)的相機(jī)運(yùn)動(dòng)避免出現(xiàn)漂移、抖動(dòng),這樣疊加的虛擬物體才能看起來(lái)與現(xiàn)實(shí)場(chǎng)景真實(shí)地融合在一起;機(jī)器人一般更關(guān)注全局精度,需要恢復(fù)的整條運(yùn)動(dòng)軌跡誤差累積不能太大,循環(huán)回路要能閉合,而在某個(gè)局部的漂移、 抖動(dòng)等問(wèn)題往往對(duì)機(jī)器人應(yīng)用來(lái)說(shuō)影響不大。
2)效率上,AR需要在有限的計(jì)算資源下實(shí)時(shí)求解,人眼的刷新率為24幀,所以AR的計(jì)算效率通常需要到達(dá)30幀以上; 機(jī)器人本身運(yùn)動(dòng)就很慢,可以把幀率降低,所以對(duì)算法效率的要求相對(duì)較低。
3)配置上,AR對(duì)硬件的體積、功率、成本等問(wèn)題比機(jī)器人更敏感,比如機(jī)器人上可以配置魚(yú)眼、雙目或深度攝像頭、高性能CPU等硬件來(lái)降低SLAM的難度,而AR應(yīng)用更傾向于采用更為高效、魯邦的算法達(dá)到需求。
* 關(guān)于SLAM技術(shù)在A(yíng)R行業(yè)的應(yīng)用,跟在無(wú)人機(jī)行業(yè)的應(yīng)用有什么不同的地方。易瞳CTO艾韜表示
無(wú)人機(jī)范圍大,精度要求沒(méi)那么高,有其他的光流、超聲波傳感器的輔助;而應(yīng)用在A(yíng)R的話(huà),AR的幀率要求高,定位要求更高,對(duì)體驗(yàn)也要求更高。
* 關(guān)于SLAM技術(shù)在機(jī)器人行業(yè)的應(yīng)用,跟在無(wú)人車(chē)行業(yè)的應(yīng)用有什么不同的地方。Velodyne激光雷達(dá)的老翁表示
SLAM在無(wú)人駕駛中的應(yīng)用和移動(dòng)機(jī)器人中的應(yīng)用,從原理上講,沒(méi)有任何區(qū)別,無(wú)人駕駛汽車(chē),就是移動(dòng)機(jī)器人中的一種。sabastian教授的《Aritificial Inteligence for Robot》教程中,直接把無(wú)人駕駛汽車(chē),叫做移動(dòng)機(jī)器人。
但實(shí)際應(yīng)用場(chǎng)景的差別,會(huì)讓傳感器和所用激光雷達(dá)的成本很不一樣。
* 關(guān)于SLAM技術(shù)在無(wú)人機(jī)行業(yè)的應(yīng)用,跟在無(wú)人車(chē)行業(yè)的應(yīng)用有什么不同的地方。Velodyne激光雷達(dá)的老翁接著表示
關(guān)于無(wú)人車(chē)和無(wú)人機(jī)中,Slam的區(qū)別,最大的區(qū)別是二維和三維。無(wú)人車(chē)是二維,無(wú)人機(jī)是三維。SLAM在二維世界中,有三個(gè)量,x軸,y軸,和方向角。三維世界中,會(huì)復(fù)雜很多,有6個(gè)量,x,y,z,roll,yaw,pitch。就是說(shuō),在確定位置時(shí),無(wú)人機(jī)要多確定三個(gè)量,相應(yīng)的計(jì)算量會(huì)大很多。但是原理仍然是一樣的。
很多人注意到,同一個(gè)行業(yè)的SLAM應(yīng)用,有人用相對(duì)傳統(tǒng)的激光雷達(dá)技術(shù),有人用號(hào)稱(chēng)必定是未來(lái)趨勢(shì)的計(jì)算機(jī)視覺(jué)技術(shù)(單目+雙目攝像頭),以室內(nèi)機(jī)器人為例,它們的區(qū)別在哪里呢?
速騰聚創(chuàng)CEO邱純鑫表示
區(qū)別應(yīng)該從傳感器分,再?gòu)乃惴ㄉ戏?,他們精度上目前能做到差不多,激光相?duì)要穩(wěn)定一些,而幀數(shù),視覺(jué)要快很多,比如比30針(人眼上限)要快很多,畢竟每秒出數(shù)不同,配置的話(huà),現(xiàn)在激光雷達(dá)也有平價(jià)華的方案了,配置要求都不是那么高。
而以無(wú)人機(jī)為例,不管精靈四還是Hover camera的SLAM,各家都要在SLAM技術(shù)上結(jié)合額外的超聲波或者光流技術(shù)定位,雷鋒網(wǎng)問(wèn)邱純鑫這是不是表明純SLAM技術(shù)有硬傷,邱純鑫表示
純SLAM算法是有些問(wèn)題的,比如基于已經(jīng)地圖的SLAM還是基于未知環(huán)境的SLAM,后者就有難度。
從上面SLAM在各大領(lǐng)域的小荷才露尖尖角,我們已經(jīng)嗅到了SLAM將在各個(gè)領(lǐng)域全面入侵的苗頭。
有了它,將讓真正的智能機(jī)器人觸手可及。
有了它,無(wú)人機(jī)將不再依賴(lài)于雞肋的色塊識(shí)別。
有了它,Magic Leap 這樣的AR神話(huà)將變成現(xiàn)實(shí)。
……
如果僅僅是一個(gè)無(wú)人機(jī)行業(yè),借用大疆那位工程師的經(jīng)典點(diǎn)評(píng)“所有的關(guān)于無(wú)人機(jī)的夢(mèng)想都建立在SLAM之上”,那其它行業(yè)SLAM將帶給我們?cè)鯓拥恼鸷?,你能預(yù)見(jiàn)嗎?
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。