三年競賽落下帷幕,CERBERUS團隊贏得DARPA地下挑戰(zhàn)賽冠軍!作者 | 吳彤
編輯 | 陳彩嫻
DARPA,Defense Advanced Research Projects Agency,為美國國防高級研究計劃局,也是一所以軍事目的的科研機構。作為引領美軍科技創(chuàng)新的“技術引擎”,自創(chuàng)立以來,DARPA一直是美國國防部的核心研發(fā)部門。
可以說,美國人工智能的發(fā)展很大程度上歸功于DARPA的支持。
從20世紀60年代初至今,在60余年的研究中,從最初的基礎研究項目到軍事應用研究,DARPA在基礎研究和應用研究之間建立了平衡,先后進行了自然語言理解、感知和機器人、可解釋的人工智能、下一代人工智能、人機融合、基于人工智能的網絡攻擊與防御技術等領域的研究。
DARPA一向具有對未來極具前瞻性,通過舉辦系列挑戰(zhàn)賽,DARPA充分發(fā)掘利用民間商用前沿技術對接軍事應用需求的潛力。

比賽時間線:https://www.youtube.com/watch?v=HuJGIAjuxLE
從2018年比賽至今的地下挑戰(zhàn)賽(SubT挑戰(zhàn)賽),終于在今年9月24日終于落下帷幕。
在SubT 系統(tǒng)挑戰(zhàn)賽總決賽中,有兩支隊伍戰(zhàn)績不差毫分!第二名是CSIRO Data61與CERBERUS同樣獲得23分,最終以CERBERUS先于幾個小時得分而獲得冠軍。CERBERUS團隊以“四足多形態(tài)機器人”贏得DARPA地下挑戰(zhàn)賽一等獎,200萬美元!
地下挑戰(zhàn)賽(Subterranean Challenge,SubT)在2018年由DARPA開始組織。由兩條賽道組成:系統(tǒng)賽道和虛擬賽道,這兩條賽道都分為三個子領域,即隧道、城市和洞穴賽道。虛擬競賽的重點是開發(fā)能夠參與基于模擬的活動的軟件,而系統(tǒng)競賽的重點是在真實野外環(huán)境中運行的物理機器人。通過人造環(huán)境和天然環(huán)境的競賽,挑戰(zhàn)各團隊的自主和地下機器人技術的極限,為實現(xiàn)"開發(fā)創(chuàng)新技術,擴大地下作業(yè)"的目標角逐新方法。

DARPA戰(zhàn)術技術辦公室項目經理 Timothy Chung 表示,舉辦“SubT”挑戰(zhàn)賽的目的就是為了在執(zhí)行地下行動時獲得從未有過的態(tài)勢感知能力,尋求在地下環(huán)境中快速偵查、通過、搜索等任務的新方法。這些挑戰(zhàn)的目的是為無法使用GPS和直接通信的地下環(huán)境中的急救人員開發(fā)自主機器人解決方案,同時這種為地球上的極端環(huán)境探索而開發(fā)的技術也可直接應用于空間探索。
今年,有10個團隊在整個地下挑戰(zhàn)賽中只采用了虛擬形式,爭奪75萬美元的最高獎金。進入地下挑戰(zhàn)賽系統(tǒng)賽道決賽的隊伍共有8個,涉及到的學校及組織機構有30多個,匯聚在前肯塔基石灰石礦,參與一系列復雜的地下場景競賽。
在總決賽中,還出現(xiàn)了六足仿蜘蛛機器人,四輪車型機器人、履帶坦克型機器人、飛行機器人




最后一場競賽在400萬平方英尺(37萬平方米)的路易斯維爾巨型洞穴舉行,其特點是DARPA設計的所有三個子競賽的結合,從具有不規(guī)則通道和大型洞穴的洞穴系統(tǒng)到具有復雜布局的地下結構,達到幾層樓高。
對于每個賽道,團隊必須完成一系列目標。主要任務是搜索、檢測并提供競賽所要求的 10 到 30 件物品精確的地理參考位置。這些物品可能包括人類幸存者(人體模型)、門、電動泵、閥門、背包、滅火器、收音機或手機,以及更多抽象的東西,如煤氣泄漏。團隊的最終得分主要取決于他們能夠找到多少物品,以及用時多長。但 DARPA 希望團隊在整個過程中可以提供連續(xù)、實時的 3D 地圖更新。
DARPA 強調了“SubT”的四個技術領域,包括自主、感知、網絡和移動性。所有這些都是由“SubT”環(huán)境驅動的,它們包含了一系列技術挑戰(zhàn)元素,DARPA 將使用它們來大體評估系統(tǒng)性能。
具體來說,以下就是參賽團隊必須要面對和處理的事情:
嚴格導航:挑戰(zhàn)包括多個級別,傾斜、循環(huán)、死角、滑動誘導地形界面和急轉彎等??梢姸扔邢蓿щy地形和稀疏特征的這種環(huán)境可導致顯著的定位誤差并且在延長的運行期間漂移。
降級傳感:比賽包括從受限制的通道到大開口,照明區(qū)域到完全黑暗,以及潮濕到多塵的條件。感知和本體感受器將需要在這些低光、模糊或散射環(huán)境中可靠地操作,同時具有適應這種變化條件的動態(tài)范圍?;覊m、霧、水和煙霧都在這個挑戰(zhàn)元素的范圍內。極端溫度,火災和有害物質預計不在范圍內。
嚴密通信:有限的視距,無線電頻率傳播挑戰(zhàn)以及地下環(huán)境中不同地質的影響對可靠的網絡和通信鏈路造成嚴重障礙。物理競賽階段以及“SubT”虛擬測試平臺環(huán)境旨在盡可能地涵蓋這些通信限制。鼓勵團隊思考出克服這些約束的解決方案,包括硬件、軟件、波形、協(xié)議、分布式或分散式概念或部署方法的新穎組合。
地形障礙:要求系統(tǒng)在導航一系列具有移動性的地形特征和障礙物時表現(xiàn)出穩(wěn)健性。地形元素和障礙物可包括受約束的通道、急轉彎、陡坡、傾斜、臺階、梯子以及泥沙和水。環(huán)境可包括有機或人造材料; 結構化或非結構化的構造; 完整或倒塌的結構和碎片。
動態(tài)地形:地形特征和障礙物還可以包括動態(tài)元素,其可以包括例如移動障礙物、移動墻壁和障礙物,落下的碎片或環(huán)境的其他物理變化,其測試系統(tǒng)自主性的敏捷性、反應,并可能從地圖變化的可能性中恢復。
耐力限制:預計成功的系統(tǒng)需要具有 120 分鐘的團隊聚合耐力才能完成任務。預計每個賽道的運行時間為 60 - 90 分鐘,每場總決賽的運行時間為 60 - 120 分鐘。這種總體耐久性可能需要新穎的部署理念、能量感知規(guī)劃、能量收集或轉移技術,以及各種方法的組合以克服各種挑戰(zhàn)元素。
在任務中,團隊合作者依靠各種各樣的機器人來完成任務目標。他們首先派出機器人偵察員探索環(huán)境,然后根據(jù)機器人的運動模式選擇最能集體滿足總體任務目標的機器人子集。
CEREBUS通過成功定位放置在不同領域內的40件文物中的23件而贏得了比賽。雖然該團隊利用了多旋翼無人機和地面機器人的協(xié)作組合,但大部分工作是由蘇黎世聯(lián)邦理工學院的衍生公司ANYbotics制造的四個ANYmal C四足機器人完成和拍攝。除其他外,ANYmal C的四足行走步態(tài)使機器人能在不平坦的地形上移動,在被碰撞時保持穩(wěn)定,甚至可以爬上和爬下樓梯。

在本次的極端環(huán)境挑戰(zhàn)中的ANYmal C, 是一種適用于極限環(huán)境的四足行走機器人。
它像一只大型犬,重100斤,將高端計算機系統(tǒng)與堅固的硬件結合在一起,并配備了傳感系統(tǒng),可以執(zhí)行搜救行動,檢查和其他監(jiān)視任務。
四足機器人的形態(tài),不僅保證了它在運動過程中,身體部分的姿態(tài)會動態(tài)調整。在運動中,能以每秒1米的速度移動,管理20度斜坡和45度樓梯,跨越25厘米的間隙,并通過寬度僅為60厘米的通道。并且,它還配備了攝像頭和3D傳感器,包括用于3D繪圖和同步定位和映射(SLAM)的激光雷達。所有這些傳感器以及通過ANYmal完成的大量步態(tài)研究,使其成為最可靠的自主四足人工智能機器人之一,具有實時運動規(guī)劃和避障功能。
在過去的十年中,ANYmal 系列機器人經歷了一系列的更新?lián)Q代和技術革新,從最初的 ANYmal Alph 到 ANYmal Beth、ANYmal B 再到如今的 ANYmal C,數(shù)次迭代,ANYmal 愈發(fā)強大。其設計團隊ANYbotics 表示,他們從事腿式機器人的研究已經超過 10 年,2019年又根據(jù)工業(yè)需求重新對 ANYmal 機器人進行了設計。他們的研究核心是設計出強大的扭矩可控制動器,使得機器人能夠爬上陡峭的樓梯,承受各種環(huán)境變化帶來的壓力。在地下挑戰(zhàn)賽中,是ANYmal C被部署在實際環(huán)境中進行應用的例子,并證明從研發(fā)至今,ANYmal C依舊保持優(yōu)秀的性能、安全性和可靠性。作為一只應對工業(yè)的商用機器人來說,ANYmal C大部分性能提升受到行業(yè)客戶或商業(yè)經驗的驅動?,F(xiàn)實中,客戶心中的大多數(shù)用例都是現(xiàn)實的,要實現(xiàn)的,比如在50°C的高溫環(huán)境中爬50°樓梯、行過一條長度3公里的地下煤炭隧道,并拍到實地圖。隨著考慮更多場景,用于在崎嶇等特殊地形上進行腿式運動的常規(guī)系統(tǒng)的復雜性不斷升級,尤其是機器人自主決策。在主人“離線”的情況下,“跟著感覺走”?在不平坦的地形上,常規(guī)腿式運動方法方法使得控制架構越來越復雜。許多情況都要依賴復雜的狀態(tài)機來協(xié)調運動原語和反射控制器的執(zhí)行。為了觸發(fā)狀態(tài)之間的轉換或反射的執(zhí)行,許多系統(tǒng)都明確地預估狀態(tài),例如地面接觸和滑行移動。這種預估通常是基于經驗設置的,并且在存在諸如泥土、雪地或植被等未建模因素的情況下可能會變得不穩(wěn)定。還有一些在腳部使用接觸式傳感器的系統(tǒng),在野外條件下也會變得不可靠。無模型強化學習(RL)成為腿式機器人運動控制器開發(fā)中的一種替代方法。強化學習方向的觀點是調整控制器以優(yōu)化給定的獎勵函數(shù)。優(yōu)化是通過執(zhí)行控制器本身獲取的數(shù)據(jù)來執(zhí)行的,這會隨著經驗的增加而改進。強化學習已經用于簡化運動控制器的設計,自動化設計過程的各個部分以及學習之前的方法無法設計的行為。但是,將強化學習用于腿式運動在很大程度上僅限于實驗中的環(huán)境和條件。此前的研究實現(xiàn)了運動和恢復行為的端到端學習,但僅限于在實驗室的平坦地面上進行。其他研究也開發(fā)了用于腿式運動的強化學習技術,但同樣是在實驗的環(huán)境中,主要集中在平坦或帶有中等紋理的表面上。ANYbotics 的研究者提出了一種穩(wěn)健的控制器,用于在充滿挑戰(zhàn)的地形上進行盲四足運動。該控制器僅使用聯(lián)合編碼器和慣性測量單元的本體感受(proprioceptive)度量,這是腿式機器人上最耐用最可靠的傳感器。研究人員介紹說,這個控制器由一種神經網絡策略驅動,在模擬環(huán)境中進行訓練。雖然沒有任何現(xiàn)實世界的數(shù)據(jù)和精確的地形模型,該控制器仍然能克服野外的各種不規(guī)則地形。研究人員還強調說,「我們的系統(tǒng)可以穿越幾乎所有地形,而且一次都沒有摔倒?!?/span>此外,這項研究中提到的方法并沒有用到攝像頭、激光雷達或接觸式傳感器信息,只依賴本體感受傳感器信號(proprioceptive sensor signal)來提高控制策略在不同地形中的適應性和穩(wěn)健性。從這次挑戰(zhàn)賽的結果來看,ANYmal C不需要進行艱苦的建模過程,以及危險且高成本的實地測試,物理世界的極度復雜性也可以被克服,這一方法還在繼續(xù)引領腿式機器人的發(fā)展。CEREBUS團隊是一個國際財團(即工商企業(yè)聯(lián)合組織),團隊名字的全稱叫CollaborativE walking and flying RoBots for autonomous ExploRation in Underground Settings(在地下環(huán)境中自主探索的協(xié)作行走和飛行機器人),由來自內華達大學里諾分校、蘇黎世聯(lián)邦理工學院、挪威科技大學(NTNU)、加州大學伯克利分校、牛津大學、無人機制造商Flyability和內華達山脈公司的人員組成。項目于2018年9月18日啟動,由NTNU工程控制論系的Kostas Alexis教授領導,他在內華達大學(UNR)里諾分校任教時獲得了項目撥款,并一直擔任團隊負責人。團隊領導還包括Marco Hutter教授(蘇黎世聯(lián)邦理工學院機器人系統(tǒng)實驗室)、Roland Siegwart教授(蘇黎世聯(lián)邦理工學院自主系統(tǒng)實驗室)、Mark Mueller教授(加州大學伯克利分校)、Maurice Fallon教授(牛津大學)、Adrien Briod教授(Flyability)、Eelke Folmer教授(UNR)以及Sierra Nevada公司的公司領導。這次地下挑戰(zhàn)賽獲得200萬美元的獎金,對整個團隊來說,都是一次振奮。但創(chuàng)立之初,牽頭人Kostas Alexis還有遲疑,“團隊該如何吸引世界優(yōu)秀學生?”UNR的計算機科學與工程系主任Eelke Folmer說到:“ 我記得Kostas一開始甚至對申請DARPA的挑戰(zhàn)都有所保留,因為他必須與世界上最好的大學的團隊競爭,但是這些大學擁有更好的學生和更多的資源?!?/span>Eelke Folmer透漏出細節(jié),Kostas為了這個項目,長期把辦公桌“安”在實驗室,與學生一起做研究。“作為一名導師,Kostas 真的很出色,他對學生都很好,無論他們是研究生、本科生還是暑期在他實驗室實習的高中生。Kostas的辦公室實際上就是他實驗室中間的一張桌子,這讓他有很多時間和他的學生在一起。他沒有讓學生為他工作,而是去幫助學生,一起解決最難的人工智能挑戰(zhàn)。隨著他在機器人界的聲望不斷提高,也幫助他吸引了頂尖大學的學生?!?/span>目前,對于CERBERUS團隊的所有成員來說,能夠將彈性自主機器人的工作向前推進,并借由團隊力量充分交流,對科技發(fā)展來說彌足珍貴。DARPA表示,已經啟動了開發(fā)第三代AI技術的下一代人工智能(AI Next)項目,以及大型的、多樣的基礎及應用的人工智能項目組合—人工智能探索(AIE)計劃致力于將AI提升為有洞察力和可信賴的合作者的AIRA計劃以及為第三代AI開發(fā)新算法的虛擬智能處理(VIP)項目。未來第三代AI技術可能會極大地改變軍事任務規(guī)劃,科學家可利用機器開展研究,人類可與機器互動,兩者之間更加密切的合作可實現(xiàn)更好的決策能力和產生更具創(chuàng)造性的思維。本身就具有軍事目的的DARPA,在SubT官網中引用了Clausewitz在《戰(zhàn)爭論》中的一句話,“戰(zhàn)爭與地形的關系需要作戰(zhàn)雙方快速準確地掌握任何區(qū)域地形的能力。”這是否暗示未來軍事交戰(zhàn)將下沉到地下作戰(zhàn),形成“海陸空+地道戰(zhàn)”的新型作戰(zhàn)形式?或借助地下空間進行隱藏、機動、休整、支援保障的戰(zhàn)后修養(yǎng)工作?不管大國是否瞄準至暗之地,服務現(xiàn)世才是剛需。無論如何,自主機器人將徹底改變我們在地下領域的運作方式。參考資料:
https://www.newscientist.com/article/2293061-team-of-underground-rescue-robots-wins-2-million-darpa-prize/https://www.163.com/dy/article/FPP8O3NE0514R9P4.htmlhttps://www.anybotics.com/news/https://www.darpa.mil/about-us/subterranean-challenge
雷鋒網雷鋒網
雷峰網原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知。