0
本文作者: 汪思穎 | 2018-11-03 22:52 |
雷鋒網(wǎng) AI 科技評(píng)論按,就在上個(gè)月,波士頓動(dòng)力在 YouTube 上刷了一波 Atlas 2 的新技能。從視頻中可以看到,相比今年五月在跨越障礙時(shí)還得停頓片刻,這次 Atlas 2 可以直接奔跑著跨越了。
Atlas 2 這次秀出的技能分為兩段,跨越障礙+三級(jí)跳,這次的技能銜接和釋放更為流暢,也受到了眾多媒體的一致好評(píng)。一方面,大家感嘆技術(shù)越來越成熟,另一方面,卻由于報(bào)導(dǎo)在專業(yè)性上失實(shí)而引得相關(guān)研究人員反感。
比如如下言論:
硬件方面其實(shí)已經(jīng)成熟,最難的就是算法,從機(jī)器人設(shè)計(jì)來看,每一種動(dòng)作背后是一個(gè)算法,像是跑步、蹲、跳躍等,要把各種算法軟件結(jié)合,進(jìn)而協(xié)調(diào)雙足自由度的運(yùn)作,其中人工智能在此扮演了關(guān)鍵角色。
從這可以看到他做到了讓算法快速迭代,人工智能在此顯然扮演了重要角色。
波士頓動(dòng)力需要用到復(fù)雜的人工智能算法,以保證機(jī)器人的平衡以及定位和導(dǎo)航功能。
來自意大利技術(shù)研究院(IIT),研究方向?yàn)榉氯藱C(jī)器人的博士生任賾宇,近日就針對此言論發(fā)表了非常不同的觀點(diǎn)。他認(rèn)為,現(xiàn)階段 Atlas 2 只是在極佳性能的硬件平臺(tái)上使用傳統(tǒng)的運(yùn)動(dòng)控制方法去實(shí)現(xiàn)了這一系列令人震撼的高爆發(fā)力的跑跳運(yùn)動(dòng),并沒有使用任何與人工智能相關(guān)的機(jī)器學(xué)習(xí)算法。
以上言論在他看來都有些「可笑」?!覆恢肋@類信口開河的自信是從何而來」,他如是說道。他也表示,雖然一些做腿足式機(jī)器人相關(guān)的同行也都義正辭嚴(yán)對以上言論進(jìn)行了留言和批評(píng),但總的來說,保持頭腦清晰、客觀理智的人還是少數(shù),大部分人還都在跟風(fēng)鼓吹人工智能和機(jī)器學(xué)習(xí)。
他進(jìn)一步談到,大約從 17 年開始,很多研究人員嘗試將機(jī)器學(xué)習(xí)的理念應(yīng)用于腿足式機(jī)器人,尤其是雙足機(jī)器人的行走(locomotion)控制中,取得了很好的成果。但大方向上,還是體現(xiàn)了當(dāng)前機(jī)器學(xué)習(xí)類方法在雙足機(jī)器人硬件平臺(tái)上落地的局限性,包括訓(xùn)練周期長,可供采集的樣本少,機(jī)電系統(tǒng)不穩(wěn)定性帶來的 corner case ,設(shè)置 Reward 難度大,仿真模型和實(shí)際模型相差太大等等,還有相當(dāng)長的道路要走。
現(xiàn)在機(jī)器人界對機(jī)器學(xué)習(xí)這類新的方法和可能是非常開放的,但對于把現(xiàn)階段將波士頓動(dòng)力的核心定位于人工智能+機(jī)器學(xué)習(xí),是極其不合適的。初衷也很簡單:
一方面,明明是一群做機(jī)電液壓系統(tǒng)實(shí)現(xiàn)+傳統(tǒng)運(yùn)動(dòng)控制的硬件和控制工程師辛勤工作的成果,憑什么要被人工智能收割?
另一方面,還原事實(shí)真相,找準(zhǔn)現(xiàn)階段的差距和發(fā)展方向,我們才能盡可能縮短和別人的差距,否則只能被瘋狂收「智商稅」。
任賾宇進(jìn)一步解釋,波士頓動(dòng)力創(chuàng)始人 Marc Raibert 已經(jīng)在很多場合公開聲明「目前沒有使用到機(jī)器學(xué)習(xí)相關(guān)的算法,仍是基于傳統(tǒng)的運(yùn)動(dòng)控制去做實(shí)現(xiàn),但并不否認(rèn)未來使用的可能性」。
在今年馬德里 IROS 的 Planetary Talk 上,他也和朋友在會(huì)場又親耳聽 Marc Raibert 重復(fù)了一次,并且今年他的導(dǎo)師(Nikos G. Tsagarakis)被邀請為 Marc Raibert 的 Planetary Talk 的介紹人,和 Marc Raibert 私下聊了很多,再三確認(rèn)過現(xiàn)階段 Atlas 2 仍然是基于傳統(tǒng)的運(yùn)動(dòng)方法。
從 Marc Raibert 在 IROS 整場 Plantary Talk 傳遞的觀點(diǎn)來看,任賾宇認(rèn)為波士頓動(dòng)力 Atlas 2 的核心是在于其:
獨(dú)一無二性能極佳的硬件平臺(tái) +「飽經(jīng)錘煉」的運(yùn)動(dòng)控制算法(QP+RHC)
獨(dú)一無二性能極佳的硬件平臺(tái)
Atlas 2 相關(guān)的集成結(jié)構(gòu)與液壓系統(tǒng)
這類高能量密度、高集成緊湊度、高結(jié)構(gòu)強(qiáng)度的液壓元件與機(jī)電系統(tǒng),很難在地球上找到第二家。Raibert 在今年 IROS Planetary Talk 也提及:Atlas 2 的動(dòng)力源液壓泵是做到了極小尺寸的高能量密度(5kw/5kg)——「You can not find it anywhere else in the world.」Raibert 相當(dāng)自豪地說到。
對于「硬件方面已經(jīng)成熟」這種言論,任賾宇表示,不知這樣的自信從何而來。另外,更不要談?chuàng)碛杏布脚_(tái)之后,后續(xù)相應(yīng)的優(yōu)化,維護(hù)和調(diào)試工作了。
「飽經(jīng)錘煉」的運(yùn)動(dòng)控制算法
具體來說,Atlas 2 的運(yùn)動(dòng)控制大方向是基于 QP+RHC (Raibert 2018 IROS 口頭敘述):
Quadratic Programming(QP)二次規(guī)劃;
Receding Horizon Control(RHC)= Model Predictive Control(MPC)模型預(yù)測控制。
QP 與 RHC(MPC)是做運(yùn)動(dòng)控制的同行比較熟悉的,但把這類大家都熟知的控制方法應(yīng)用在 Atlas 2 這個(gè)大人型上,實(shí)現(xiàn)最近我們看到的后空翻、三級(jí)跳與跑酷相當(dāng)困難——需要一個(gè)漫長而復(fù)雜的基于實(shí)際硬件系統(tǒng)(考慮單個(gè)驅(qū)動(dòng)器存在的超調(diào)、滯后與誤差與多個(gè)驅(qū)動(dòng)器誤差的疊加與耦合)的調(diào)試和優(yōu)化。
任賾宇舉了如下兩個(gè)小例子去簡單闡述當(dāng)前實(shí)驗(yàn)室中做的運(yùn)動(dòng)控制與波士頓動(dòng)力的差距:
仿真環(huán)境中的運(yùn)動(dòng)控制 ≠ 實(shí)際硬件平臺(tái)的運(yùn)動(dòng)控制;
小尺寸雙足人形(諸如 Nao)的運(yùn)動(dòng)控制 ≠ 大尺寸仿人雙足人形的運(yùn)動(dòng)控制。
他表示,真正好的運(yùn)動(dòng)控制算法需要在實(shí)際的硬件平臺(tái)上花心思精力去調(diào)試,也即他所指的「飽經(jīng)錘煉」!
「Marc Raibert 也再次著重提及要大膽在硬件平臺(tái)上做調(diào)試的重要性——『People nowadays are afriad of breaking robots, the right way is building it, breaking it and fixing it!』也希望大家不要以訛傳訛,多和國際交流,找準(zhǔn)正確的方向,腳踏實(shí)地去追趕?!?/p>
參考:https://zhuanlan.zhihu.com/p/47984991
雷鋒網(wǎng)雷鋒網(wǎng)
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。