0
本文作者: 高秀松 | 2023-10-08 11:11 |
1950年,英國(guó)數(shù)學(xué)家艾倫·圖靈提出,當(dāng)一個(gè)測(cè)試者與一個(gè)計(jì)算機(jī)程序進(jìn)行對(duì)話,如果測(cè)試者無(wú)法區(qū)分程序的回答是由人類還是計(jì)算機(jī)生成的,那么該計(jì)算機(jī)程序被認(rèn)為具備與人類智能相當(dāng)?shù)哪芰Α?/p>
這便是AI領(lǐng)域赫赫有名的圖靈測(cè)試。在通用足式機(jī)器人領(lǐng)域,也有類似的測(cè)試:如果機(jī)器人能夠在任意情況下抓取任意的杯子,那么該機(jī)器人便具備了真正的運(yùn)動(dòng)智能。
要通過(guò)這個(gè)測(cè)試非常困難,其中,機(jī)器人必須具備極強(qiáng)的感知能力,與環(huán)境進(jìn)行實(shí)時(shí)交互,不斷調(diào)整運(yùn)動(dòng)控制,才有可能完成任務(wù),整個(gè)“感知到控制”的閉環(huán)是完全實(shí)時(shí)、動(dòng)態(tài)、無(wú)法預(yù)先設(shè)定的。
通用足式機(jī)器人公司逐際動(dòng)力創(chuàng)始人張巍直言,機(jī)器人要通過(guò)類似測(cè)試,“比自動(dòng)駕駛還難”。原因在于,自動(dòng)駕駛僅解決移動(dòng)(mobility)的問(wèn)題,即從A點(diǎn)到B點(diǎn),只需要位置關(guān)系的感知;足式機(jī)器人在此基礎(chǔ)上,還增加了接觸關(guān)系感知,比如地形感知、觸覺(jué)感知。機(jī)器人必須要通過(guò)這兩種感知做實(shí)時(shí)交互,實(shí)現(xiàn)移動(dòng),然后執(zhí)行操作(manipulation),才能被稱之為運(yùn)動(dòng)智能。
現(xiàn)階段四足機(jī)器人的窘境在于,多數(shù)機(jī)器人處于「弱感知」階段,只有微弱的感知或者用了少量數(shù)據(jù),甚至是沒(méi)有感知,行動(dòng)能力十分受限,效率不高且通過(guò)復(fù)雜場(chǎng)景的魯棒性較低。
張巍表示,機(jī)器人的核心是運(yùn)動(dòng),包括“腿”的移動(dòng)和“手”的操作。而運(yùn)動(dòng)智能化的核心來(lái)源于感知,這類感知指的是基于復(fù)雜場(chǎng)景的實(shí)時(shí)感知。機(jī)器人基于實(shí)時(shí)感知進(jìn)行決策、控制,完成整個(gè)運(yùn)動(dòng)的閉環(huán)。
移動(dòng)機(jī)器人按照移動(dòng)結(jié)構(gòu)可大致分為兩類:以底盤(pán)為重心的輪式,與動(dòng)物和人類相似的足式(四足、雙足)。
輪式機(jī)器人主要在結(jié)構(gòu)化道路上進(jìn)行運(yùn)動(dòng),典型的如酒店配送機(jī)器人。這類機(jī)器人技術(shù)已經(jīng)非常成熟,各大細(xì)分賽道已經(jīng)出現(xiàn)了許多明星公司。但輪式機(jī)器人的不足之處在于,地形的適應(yīng)能力較差,很難克服樓梯、凹凸不平的路面、野外等非結(jié)構(gòu)化的場(chǎng)景;并且,輪式機(jī)器人有一個(gè)比較重的底盤(pán),來(lái)支撐機(jī)身保持穩(wěn)定,但這個(gè)底盤(pán)除了承重和搭載傳感器以外,能夠執(zhí)行的任務(wù)比較有限。
張巍告訴雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng)),如果機(jī)器人要像“人”一樣提供各種服務(wù),腿的結(jié)構(gòu)至關(guān)重要,因?yàn)椤坝型鹊臋C(jī)器人末端自由度更高”。而且機(jī)器人必須具備實(shí)時(shí)調(diào)整重心的能力,保持平衡,提高負(fù)載自重比,才具備復(fù)雜場(chǎng)景運(yùn)動(dòng)的基本能力,這是輪式機(jī)器人沒(méi)辦法做到的。
基于此,張巍認(rèn)為,未來(lái)的機(jī)器人會(huì)往兩個(gè)方向發(fā)展。一個(gè)是「專用機(jī)器人」,即單一或者簡(jiǎn)單場(chǎng)景下,機(jī)器人能夠根據(jù)人設(shè)定的流程代替人高效地執(zhí)行任務(wù),比如工廠的AGV/AMR、配送機(jī)器人等等。另一個(gè)則是「通(多)用機(jī)器人」,即機(jī)器人要滿足復(fù)雜地形、場(chǎng)景,執(zhí)行多種任務(wù)。
現(xiàn)階段,「專用機(jī)器人」已經(jīng)殺成一片紅海,不論是送餐、酒店,還是工廠,都已經(jīng)出現(xiàn)了許多機(jī)器人公司,從拼技術(shù)到卷價(jià)格,最終到渠道和服務(wù),已經(jīng)漸漸跑通商業(yè)閉環(huán)。而足式機(jī)器人才剛剛起步,即便四足、雙足機(jī)器人已不是新鮮事物,但市面上還沒(méi)有一款真正具備智能的足式機(jī)器人產(chǎn)品。
這一現(xiàn)象的本質(zhì)原因,在于當(dāng)前的足式機(jī)器人缺少「感知」。
“機(jī)器人本質(zhì)上是理解用戶指令,然后根據(jù)機(jī)器人收集的環(huán)境信息,讓電機(jī)轉(zhuǎn)起來(lái),實(shí)現(xiàn)運(yùn)動(dòng)控制?!睆埼”硎?,要實(shí)現(xiàn)精準(zhǔn)高效的控制,這與環(huán)境感知密不可分。
舉個(gè)例子,足式機(jī)器人要上下樓梯,需要知道樓梯與自身的相對(duì)位置(實(shí)時(shí))、什么地形、踩哪兒、用多少力...在這些感知信息的基礎(chǔ)上,自主規(guī)劃路線、姿態(tài)等等,整個(gè)過(guò)程都是動(dòng)態(tài)的,而非預(yù)先設(shè)定的運(yùn)動(dòng)控制。
機(jī)器人實(shí)際上是通過(guò)感知來(lái)理解環(huán)境,再通過(guò)關(guān)節(jié)來(lái)產(chǎn)生作用力,實(shí)現(xiàn)控制運(yùn)動(dòng),所有的運(yùn)動(dòng)都會(huì)有環(huán)境反饋。這里面既有位置關(guān)系的感知,也有接觸式感知,將二者完美融合起來(lái)的難度非常之大。并且,機(jī)器人與環(huán)境交互需求越大,根據(jù)實(shí)時(shí)感知環(huán)境來(lái)重新規(guī)劃動(dòng)作(而不是按照事先預(yù)設(shè)流程)就越難,本身的控制和穩(wěn)定性問(wèn)題會(huì)更難。
簡(jiǎn)單而言,足式機(jī)器人必然要與環(huán)境產(chǎn)生感知交互,對(duì)應(yīng)的任務(wù)不是提前設(shè)置好的動(dòng)作流程,直接進(jìn)行replay,而是根據(jù)現(xiàn)場(chǎng)情況進(jìn)行動(dòng)態(tài)感知,并實(shí)時(shí)規(guī)劃動(dòng)作。
張巍表示,機(jī)器人要“類人”,一定要跟環(huán)境交互,否則就沒(méi)有智能而只是一個(gè)機(jī)器,很難產(chǎn)生真正的價(jià)值,實(shí)現(xiàn)商業(yè)閉環(huán)。但是,從環(huán)境感知到運(yùn)動(dòng)控制,這又是一件非常難的事情。
相當(dāng)一段時(shí)間里,足式機(jī)器人都默默無(wú)聞。直到來(lái)自MIT的 Patrick Wensing 和Benjamin Katz 分別開(kāi)源了兩套影響深遠(yuǎn)的方案之后,越來(lái)越多的玩家躬身入局,越來(lái)越多的機(jī)器狗從實(shí)驗(yàn)室走向公眾視野,這個(gè)行業(yè)才漸漸被看到,接著有了資本助力,產(chǎn)品開(kāi)始落地到具體場(chǎng)景。
雖然現(xiàn)在不少機(jī)器狗可以行走、爬樓梯甚至跳舞、翻跟斗,但從做一個(gè)demo展示到實(shí)際量產(chǎn)甚至落地到具體、復(fù)雜的業(yè)務(wù)場(chǎng)景,仍然會(huì)遇到兩個(gè)問(wèn)題:效率低,以及穩(wěn)定性弱。
比如,機(jī)器狗在通過(guò)非結(jié)構(gòu)化地面時(shí),速度不高,而且缺乏穩(wěn)定性,容易“趴窩”。
張巍認(rèn)為,這一問(wèn)題的本質(zhì),甚至是足式機(jī)器人還沒(méi)有很好的商業(yè)化落地的原因之一就在于,這些機(jī)器人缺少 Perceptive Locomotion(基于感知的運(yùn)動(dòng)控制)。沒(méi)有感知,意味著機(jī)器人的運(yùn)動(dòng)失去了“眼睛“,只能靠盲走,就像閉上眼睛的人直立行走,一定會(huì)走得歪歪斜斜,因?yàn)槿鄙俑兄獊?lái)實(shí)時(shí)調(diào)整路線。
當(dāng)前,機(jī)器人的控制主要有兩種方法,一種是基于模型(Model)的控制,一種是基于學(xué)習(xí)(Learning)的控制。這兩種方法都是為了解決同一個(gè)「最優(yōu)控制」的問(wèn)題,控制機(jī)器人的本體以最好的姿態(tài)高效、高質(zhì)量地完成動(dòng)作,卻也有不同之處。
“Model是用解析模型做推演、設(shè)計(jì)控制;Learning是減少使用Model的顯性表達(dá),用仿真器來(lái)預(yù)測(cè)控制的效果。實(shí)際上,Learning本質(zhì)上也是基于模型的,仿真器都是基于模型設(shè)計(jì),但是更側(cè)重于強(qiáng)化學(xué)習(xí),需要機(jī)器人反復(fù)迭代、試錯(cuò)來(lái)改進(jìn)其控制器?!?/p>
打個(gè)比方,在高空飛行的飛機(jī),從A點(diǎn)到B點(diǎn),可以用一個(gè)固定的模型來(lái)解決;但如果機(jī)器在低空環(huán)境中飛行,會(huì)遇到建筑物、動(dòng)植物、飛行物等復(fù)雜場(chǎng)景,機(jī)器人需要自己辨別障礙物是什么、怎么避開(kāi)、怎么實(shí)現(xiàn)控制等,就需要Learning。
換句話說(shuō),復(fù)雜場(chǎng)景的感知交互,一定要用到Learning。機(jī)器人需要把各種傳感器(攝像頭、IMU、雷達(dá))的數(shù)據(jù)融合起來(lái),先構(gòu)建一個(gè)高精度地形圖,然后定位、規(guī)劃行走,行走過(guò)程中不斷進(jìn)行感知,實(shí)時(shí)調(diào)整運(yùn)動(dòng)控制。
現(xiàn)階段,機(jī)器人行業(yè)專注于基于感知的運(yùn)動(dòng)控制的有Boston Dynamics、Anybotics、逐際動(dòng)力LimX Dynamics等。Boston Dynamics 是業(yè)內(nèi)最領(lǐng)先的足式機(jī)器人公司,而逐際動(dòng)力也正在進(jìn)行追趕,并走了一條差異化路線。
張巍告訴雷峰網(wǎng),逐際動(dòng)力既有Model-based的控制,也有Learning-based的控制,這兩種方法有各自適合的任務(wù),通過(guò)模型數(shù)據(jù)混合的方式來(lái)做迭代。
在足式機(jī)器人的功能方面,逐際動(dòng)力的路線是,首先完成腿部的基本功能,例如高效穩(wěn)定地上下樓梯、穿越復(fù)雜地形;然后攻克全身運(yùn)動(dòng)的問(wèn)題,即運(yùn)動(dòng)+操作;最后將產(chǎn)品打磨足夠穩(wěn)定之后,針對(duì)細(xì)分場(chǎng)景進(jìn)行作業(yè)。
目前,逐際動(dòng)力已經(jīng)可以實(shí)現(xiàn)帶感知的運(yùn)動(dòng)控制,雖然成熟度上相對(duì)于Boston Dynamics還有待提高,但能力已經(jīng)接近。在陡峭的、真實(shí)的鏤空的工業(yè)場(chǎng)景下,逐際動(dòng)力的機(jī)器人已經(jīng)可以實(shí)現(xiàn)穩(wěn)定的上下樓梯,以及克服草地石板路、斜坡等各類場(chǎng)景。
張巍本科畢業(yè)于中國(guó)科技大學(xué)自動(dòng)化系, 2005年開(kāi)始在美國(guó)普渡大學(xué)攻讀博士學(xué)位,研究基于模型的混雜動(dòng)態(tài)系統(tǒng)的控制(Hybrid Dynamical System)。
博士后期間,張巍加入了加州伯克利分校的Hybrid System 實(shí)驗(yàn)室,導(dǎo)師為美國(guó)工程院院士Claire Tomlin和Shanker Sastry ,該實(shí)驗(yàn)室的著名人物還包括李澤湘、馬毅等。
2011年9月,張巍加入俄亥俄州立大學(xué),在電氣與計(jì)算機(jī)工程系先后擔(dān)任助理教授和長(zhǎng)聘教授,繼續(xù)從事混雜動(dòng)態(tài)系統(tǒng)控制的研究和教學(xué)。值得一提的是,MIT開(kāi)源方案核心人物之一的Patrick Wensing,彼時(shí)也還在俄亥俄州立大學(xué)學(xué)習(xí)機(jī)器人與控制理論。直到2014年,Patrick Wensing才前往MIT仿生機(jī)器人實(shí)驗(yàn)室,負(fù)責(zé)足式機(jī)器人的控制算法。
張巍認(rèn)為,機(jī)器人的足在踩踏地面時(shí),是一個(gè)離散事件,并且速度和系統(tǒng)狀態(tài)會(huì)發(fā)生跳變,本質(zhì)上就是Hybrid Dynamical System。如何系統(tǒng)地控制這類運(yùn)動(dòng),是張巍一直在研究的課題。
2019年5月,張巍回國(guó)加入南方科技大學(xué),擔(dān)任機(jī)械與能源工程系教授,創(chuàng)辦了機(jī)器人控制與學(xué)習(xí)實(shí)驗(yàn)室(CLEAR LAB),并指導(dǎo)學(xué)生開(kāi)始以強(qiáng)化學(xué)習(xí)的方式訓(xùn)練足式機(jī)器人,并于三年后下場(chǎng)創(chuàng)業(yè),成立了逐際動(dòng)力。
張巍告訴雷峰網(wǎng),逐際動(dòng)力是通用足式機(jī)器人公司,先要解決機(jī)器人的核心痛點(diǎn):全地形移動(dòng)能力,即像人一樣移動(dòng),人能去的地方,機(jī)器人都能去。
鑒于當(dāng)前四足機(jī)器人欠缺復(fù)雜場(chǎng)景移動(dòng)能力、效率低能耗高的等問(wèn)題,逐際動(dòng)力對(duì)機(jī)器人進(jìn)行了「系統(tǒng)升級(jí)」,包含兩方面,一是以感知為核心的運(yùn)動(dòng)控制,二是將足式和輪式的優(yōu)點(diǎn)結(jié)合,形成輪足式。
“逐際動(dòng)力要解決的是復(fù)雜場(chǎng)景下,四足機(jī)器人從A點(diǎn)穩(wěn)定快速地到B點(diǎn)。至于機(jī)器人的使用場(chǎng)景,是巡檢、配送,還是裝了機(jī)械臂做更復(fù)雜的工作,將結(jié)合客戶本身的業(yè)務(wù)去做落地?!?/p>
就像大疆的無(wú)人機(jī),在天空上飛來(lái)飛去,客戶可以用來(lái)拍照、撒農(nóng)藥,也可以用來(lái)巡檢、表演,而逐際動(dòng)力打造的是“地面的大疆”——全地形移動(dòng)底盤(pán),并推出了首款四輪足產(chǎn)品W1。
W1 基于逐際動(dòng)力「運(yùn)動(dòng)智能Motion Intelligence」研發(fā),將腿式和輪式結(jié)構(gòu)相結(jié)合,具備實(shí)時(shí)地形感知與全地形移動(dòng)能力,在效率上比單純的足式機(jī)器人更高效,適用場(chǎng)景也更加豐富、復(fù)雜,可以實(shí)現(xiàn)上下樓梯、斜坡、伏地穿越、過(guò)草地石板路等功能。
張巍表示,四足機(jī)器人已經(jīng)有足夠的技術(shù)積累,基礎(chǔ)研究與商業(yè)化的交集業(yè)已出現(xiàn)。現(xiàn)階段能落地并產(chǎn)生價(jià)值的,首先是封閉場(chǎng)景,例如危險(xiǎn)、復(fù)雜的工業(yè)環(huán)境,代替人的工作,這類環(huán)境比較可控,機(jī)器人能很快適應(yīng);開(kāi)放場(chǎng)景存在的不可控因素太多,比如人為干擾、突發(fā)事件等,不太容易落地。
因此,逐際動(dòng)力計(jì)劃首先將W1在固定路線上落地,如工業(yè)巡檢、物流配送、特種作業(yè)等場(chǎng)景,并持續(xù)打磨產(chǎn)品;在固定路線跑通后,再逐步嘗試開(kāi)放場(chǎng)景,循序漸進(jìn),最終打通四足機(jī)器人的廣泛應(yīng)用。
從世界第一臺(tái)機(jī)器人誕生至今,機(jī)器人的發(fā)展已接近百年歷史。每一次技術(shù)革命都將給機(jī)器人的發(fā)展帶來(lái)強(qiáng)大的助推力:能源、信息、大數(shù)據(jù)、芯片、人工智能...都推動(dòng)了機(jī)器人持續(xù)進(jìn)化,從簡(jiǎn)單的模仿到惟妙惟肖,從實(shí)驗(yàn)室走向生產(chǎn)生活,從不能行動(dòng)到穩(wěn)定行走,從輪式到四足再到雙足。
如今,機(jī)器人已經(jīng)以各種形態(tài)融入人們的生產(chǎn)生活,比如掃地機(jī)器人、工業(yè)機(jī)器人。雖然現(xiàn)階段的機(jī)器人還比較“笨”,距離通過(guò)“圖靈測(cè)試”還有很長(zhǎng)一段距離。不過(guò),技術(shù)本身是「涌現(xiàn)」出的,誰(shuí)也無(wú)法預(yù)測(cè)這個(gè)「奇點(diǎn)」。
但無(wú)可爭(zhēng)議的是,正如人的進(jìn)化史一樣,機(jī)器人也在慢慢進(jìn)化,且終將迎來(lái)一個(gè)新的時(shí)代。
雷峰網(wǎng)長(zhǎng)期關(guān)注機(jī)器人行業(yè)報(bào)道,即將推出《中國(guó)足式機(jī)器人簡(jiǎn)史》。讀者若有一手信息、觀點(diǎn)、故事、項(xiàng)目,歡迎添加作者微信 nanshu0126 交流。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。