2
本文作者: 天諾 | 2017-05-16 22:13 |
雷鋒網(wǎng)「新智造」正在啟動(dòng)“新智造成長(zhǎng)榜2017”評(píng)選活動(dòng),雷鋒網(wǎng)「新智造」將對(duì)人工智能與機(jī)器人行業(yè)進(jìn)行大規(guī)模報(bào)道、梳理和調(diào)研,并聯(lián)合數(shù)十家著名投資機(jī)構(gòu)根據(jù)這些創(chuàng)新公司的技術(shù)實(shí)力、商業(yè)能力和成長(zhǎng)性進(jìn)行深度評(píng)選,最終從多個(gè)領(lǐng)域分別選出一些極具潛力成長(zhǎng)性的創(chuàng)新公司。如果你想?yún)⑴c雷鋒網(wǎng)「新智造」的評(píng)選,可點(diǎn)擊「報(bào)名」鏈接,或通過郵箱xinzhizao@leiphone.com聯(lián)系我們!
最近,卡內(nèi)基梅隆大學(xué)機(jī)器人專家 Dhiraj Gandhi,Lerrel Pinto 和 Abhinay Gupta 發(fā)表了一篇題為《通過墜機(jī)學(xué)習(xí)如何飛行》的論文,在此,不妨讓我們來(lái)看看這項(xiàng)研究究竟是什么:
模擬世界和現(xiàn)實(shí)世界之間的最大差距,其實(shí)就是感知問題。絕大多數(shù)無(wú)人機(jī)實(shí)驗(yàn)都避免大量使用實(shí)際數(shù)據(jù),因?yàn)楝F(xiàn)實(shí)中無(wú)人機(jī)墜機(jī)情況時(shí)有發(fā)生!在這篇論文中,我們就“勉為其難”,從收集無(wú)人機(jī)自己墜機(jī)的數(shù)據(jù)集合入手!我們開發(fā)了一款無(wú)人機(jī),它只有一個(gè)目的,就是撞向物體墜機(jī)……我們會(huì)使用所有這些墜機(jī)數(shù)據(jù)和相同軌跡采樣的正常飛行數(shù)據(jù)相結(jié)合,然后讓無(wú)人機(jī)學(xué)習(xí)一個(gè)簡(jiǎn)單、且強(qiáng)大的導(dǎo)航策略。
聽起來(lái)是不是很酷?現(xiàn)在,就讓我們開始?jí)嫏C(jī)吧!
在思考如何成功飛行(或是駕駛、步行、以及其他任何形式的運(yùn)動(dòng))時(shí),一個(gè)方法就是讓無(wú)人機(jī)不斷地出現(xiàn)飛行失敗、墜機(jī)——就像孩子學(xué)習(xí)走路時(shí)會(huì)經(jīng)常摔倒一樣。從這個(gè)角度來(lái)看,學(xué)習(xí)飛行最有效的方法,就是通過從摧毀中得到大量經(jīng)驗(yàn),這樣才能學(xué)會(huì)如何避免出現(xiàn)墜毀。一旦你可以成功避免碰撞,那么基本上就能知道該如何飛行了,是不是很簡(jiǎn)單?然而,我們往往不會(huì)采用這種學(xué)習(xí)方式,因?yàn)闊o(wú)論是對(duì)機(jī)器人,還是對(duì)人類而言,墜毀通常都是非常糟糕的一種結(jié)果。
卡內(nèi)基梅隆大學(xué)的機(jī)器人專家則希望另辟蹊徑,和過去人們盡可能嘗試尋找不去讓無(wú)人機(jī)墜毀的解決方案不同,他們能夠從無(wú)人機(jī)墜毀中找到一條新方法,因此他們研發(fā)了一款 AR Drone 2.0 無(wú)人機(jī),可以在二十多種室內(nèi)環(huán)境下不斷墜毀——短短四十小時(shí)的飛行時(shí)間中,這款無(wú)人機(jī)就墜毀了 11.5 萬(wàn)次。正如研究人員所指出的那樣:“由于無(wú)人機(jī)的外殼價(jià)格很便宜,而且易于更換,所以即便出現(xiàn)災(zāi)難性故障,成本也可以忽略不計(jì)?!泵看闻鲎捕际请S機(jī)的,無(wú)人機(jī)會(huì)在室內(nèi)空間內(nèi)的隨機(jī)位置起飛,然后開始緩慢超前飛行,直到撞上某個(gè)物體。之后,它會(huì)重新回到起點(diǎn),然后再選擇一個(gè)新方向——當(dāng)然,前提是這款無(wú)人機(jī)還能繼續(xù)飛。
在此過程中,無(wú)人機(jī)的前置攝像機(jī)會(huì)以 30 Hz 的頻率來(lái)記錄圖像。一旦碰撞發(fā)生之后,飛行軌跡上的圖像就會(huì)被分成兩部分:一部分是無(wú)人機(jī)正常飛行的,另一部分則是墜毀一瞬間的圖像。這兩部分圖像集合會(huì)被發(fā)送給一個(gè)深度卷積神經(jīng)網(wǎng)絡(luò),利用人工智能技術(shù)來(lái)學(xué)習(xí)、分析給定的拍攝圖像,然后判斷直線飛行是否是一個(gè)好主意。在 11.5 萬(wàn)次碰撞之后,算法所學(xué)習(xí)到的經(jīng)驗(yàn)已經(jīng)能夠讓無(wú)人機(jī)自主飛行了,即便是在狹窄、混亂的環(huán)境中,無(wú)人機(jī)也能輕松避開障礙物,甚至是一些毫無(wú)明顯特征的白色墻壁和玻璃門,無(wú)人機(jī)也能躲開。不僅如此,控制無(wú)人機(jī)的算法其實(shí)也很簡(jiǎn)單:它將 AR Drone 無(wú)人機(jī)的前置攝像頭拍攝的圖像分割成了左圖像和右圖像,如果這兩個(gè)圖像中的任意一個(gè)看起來(lái)比較不容易出現(xiàn)碰撞,那么無(wú)人機(jī)就會(huì)朝那個(gè)方向飛行,否則無(wú)人機(jī)將會(huì)繼續(xù)保持直線飛行。
那么,這種解決方案是否有效呢?坦白說,無(wú)人機(jī)自主飛行效果肯定沒有人類直接操控的那么好,不過在相對(duì)比較復(fù)雜的環(huán)境中,比如狹窄的走廊和布滿椅子的走廊里,人類反應(yīng)往往沒有機(jī)器算法判斷的快。
最后一個(gè)顯而易見的問題,那就是這種解決方案,是否比傳統(tǒng)訓(xùn)練無(wú)人機(jī)學(xué)習(xí)飛行的方法更好?畢竟,這種解決方案是教導(dǎo)無(wú)人機(jī)墜毀,而不是飛行。實(shí)際上,現(xiàn)在我們都還不知道答案是什么,但最重要的是,如果允許無(wú)人機(jī)墜機(jī),那么整個(gè)學(xué)習(xí)過程都可以是自我監(jiān)督的:就把無(wú)人機(jī)放到一個(gè)房間里,讓它自己飛、自己撞、自己墜毀——當(dāng)然你得去給它更換電池,而除了更換電池之外,你所收集的數(shù)據(jù)、以及無(wú)人機(jī)學(xué)習(xí)過程完全都是自主完成的。另一方面,如果你試圖較無(wú)人機(jī)不要碰撞,那么就必須還得找到一種方法來(lái)確保它不會(huì)墜毀。當(dāng)然,你可以通過從人類飛行員身上學(xué)習(xí),或是把無(wú)人機(jī)放置在具有運(yùn)動(dòng)捕捉系統(tǒng)以及一些部署 3D 障礙物的環(huán)境下飛行,不過所有這些解決方案都會(huì)增加大量成本和復(fù)雜度。所以,讓無(wú)人機(jī)從墜機(jī)中學(xué)習(xí)飛行,要容易的多。
VIA ieee
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。