0
本文作者: 貝爽 | 2020-08-12 16:41 | 專題:CCF-GAIR 2020 全球人工智能與機(jī)器人峰會(huì) |
8 月 7 日,2020全球人工智能和機(jī)器人峰會(huì)(CCF-GAIR 2020)在深圳前海華僑城JW萬(wàn)豪酒店啟幕。大會(huì)由中國(guó)計(jì)算機(jī)學(xué)會(huì)(CCF)主辦,香港中文大學(xué)(深圳)、雷鋒網(wǎng)(公眾號(hào):雷鋒網(wǎng))聯(lián)合承辦,鵬城實(shí)驗(yàn)室、深圳市人工智能與機(jī)器人研究院協(xié)辦。
從 2016 年的學(xué)產(chǎn)結(jié)合,2017 年的產(chǎn)業(yè)落地,2018 年的垂直細(xì)分,2019 年的中國(guó)人工智能 40 周年,峰會(huì)一直致力于打造國(guó)內(nèi)人工智能和機(jī)器人領(lǐng)域規(guī)模最大、規(guī)格最高、跨界最廣的學(xué)術(shù)、工業(yè)和投資平臺(tái)。
根據(jù)大會(huì)安排,8月8日在『機(jī)器人前沿專場(chǎng)』上,清華大學(xué)研究員,優(yōu)必選人形機(jī)器人首席科學(xué)家趙明國(guó)教授做了題為《基于計(jì)算的智能機(jī)器人控制》主題演講。
趙明國(guó)教授表示,在傳統(tǒng)控制系統(tǒng)中,算法能力常常受到控制器的制約,智能機(jī)器人要想實(shí)現(xiàn)多模態(tài)非常不便捷,要么難實(shí)現(xiàn),要么功耗大、體積大,如果將AI芯片融入機(jī)器人中,提供算法和算力支持則可以有效地解決機(jī)器人運(yùn)動(dòng)和感知的問(wèn)題。
演講中,趙明國(guó)教授介紹了其最新機(jī)器人案例——無(wú)人駕駛自行車。這款機(jī)器人能夠在復(fù)雜的現(xiàn)實(shí)環(huán)境中,應(yīng)對(duì)變速,不同粗糙度、不同材質(zhì)的路面等干擾因素的影響,實(shí)現(xiàn)完全地自主行進(jìn)。在他看來(lái),無(wú)人駕駛自行車的實(shí)現(xiàn)過(guò)程需要滿足三種基本功能:
運(yùn)動(dòng)控制:通過(guò)嵌入式系統(tǒng)運(yùn)行控制算法來(lái)實(shí)現(xiàn)。
定位與導(dǎo)航:通過(guò)高主頻的系統(tǒng)做迭代運(yùn)算來(lái)實(shí)現(xiàn)。
交互與感知:利用GPU的并行計(jì)算做識(shí)別或算法推理來(lái)實(shí)現(xiàn)。
其中,對(duì)應(yīng)的三種算法需求可以全部交由芯片來(lái)完成。趙明國(guó)教授稱,他們?cè)跓o(wú)人駕駛自行車中內(nèi)置了“天機(jī)芯片”,實(shí)現(xiàn)了駕駛路徑識(shí)別、障礙物識(shí)別、語(yǔ)音導(dǎo)航、運(yùn)動(dòng)控制等多種功能。這款芯片是去年清華大學(xué)施路平教授團(tuán)隊(duì)重磅發(fā)布的一款類腦芯片。它可以同時(shí)實(shí)現(xiàn)三種不同算法,而且是動(dòng)態(tài)的,可定義,可重新編程。
基于天機(jī)芯片完成無(wú)人駕駛自行車的演示驗(yàn)證,趙明國(guó)教授針對(duì)未來(lái)智能機(jī)器人研究方向,提出了兩條新的路徑:
芯片+機(jī)器人:用機(jī)器人做芯片及AI算法的研究平臺(tái)。
機(jī)器人+芯片:用芯片做機(jī)器人控制及智能算法的實(shí)現(xiàn)平臺(tái)。
在他看來(lái),未來(lái)智能機(jī)器人必將與人工智能技術(shù)深度融合,AI芯片會(huì)在機(jī)器人控制領(lǐng)域激發(fā)出更多潛能。
趙明國(guó)教授表示,無(wú)人駕駛車只是完成了地面行進(jìn)的初級(jí)任務(wù),接下來(lái)還會(huì)進(jìn)一步探索自行車如何實(shí)現(xiàn)騰空、落地等高難度特技。在他看來(lái),
只有把控制問(wèn)題推向極致,探索技術(shù)的邊界,才能推動(dòng)整個(gè)技術(shù)的進(jìn)步。我們的愿景就是讓機(jī)器人能夠達(dá)到,甚至超越人類操作自行車的水平。
此外,趙明國(guó)教授還分享了雙足機(jī)器人的研究案例。他強(qiáng)調(diào),無(wú)論是足式機(jī)器人還是輪式機(jī)器人,它們都是用于測(cè)試算法的工具或者載體,其最終成品并不會(huì)用于商業(yè)化。
會(huì)后,在接受雷鋒網(wǎng)編輯采訪時(shí),趙明國(guó)教授也表示,人形機(jī)器人整體還處于學(xué)術(shù)研究的階段,距離商業(yè)化還有一段路程。從行業(yè)發(fā)展來(lái)看,因研發(fā)投入高,技術(shù)路線長(zhǎng),很少有企業(yè)專注人形機(jī)器人的研究。在國(guó)家政策支持下,高校團(tuán)隊(duì)和部分企業(yè)的研發(fā)團(tuán)隊(duì)的工作比較多,近些年也不斷有突破性研究成果發(fā)表。
另外,趙明國(guó)教授透露,目前正在開(kāi)拓一些新的研究,預(yù)計(jì)明年會(huì)有相應(yīng)的成果發(fā)表。
以下是趙明國(guó)教授的演講全文,雷鋒網(wǎng)編輯在不改變?cè)獾幕A(chǔ)上進(jìn)行了編輯和整理:
大家上午好!今天我和大家分享關(guān)于我們做機(jī)器人遇到的問(wèn)題和思考。我的題目是“基于計(jì)算的智能機(jī)器人控制”。在機(jī)器人控制過(guò)程中,我們需要用到控制器來(lái)實(shí)現(xiàn)各種算法,但這里存在一個(gè)現(xiàn)實(shí)問(wèn)題,即控制器的能力決定算法的能力。很長(zhǎng)一段時(shí)間內(nèi)我們沒(méi)有辦法突破控制器的限制,算法只能停留在比較初級(jí)或者中級(jí)階段,難以到達(dá)高級(jí)。于是我們換了個(gè)思路,讓算法來(lái)推動(dòng)控制器的發(fā)展。
在這里我們做了兩個(gè)實(shí)驗(yàn)案例,無(wú)人駕駛自行車和雙足機(jī)器人。
需要說(shuō)明的是,這兩個(gè)機(jī)器人一個(gè)是輪式,一個(gè)是足式。我做輪式機(jī)器人不是為了實(shí)用,也不是為了商業(yè)化。無(wú)人駕駛自行車是我用來(lái)檢測(cè)算法或者解決某些問(wèn)題的實(shí)驗(yàn)工具。同樣,雙足機(jī)器人也是為了做研究性質(zhì)的實(shí)驗(yàn)。他們的實(shí)用性有待于后續(xù)的商業(yè)開(kāi)發(fā)。
首先我們講什么叫無(wú)人車?沒(méi)有人操控,可以自主行進(jìn)的車都叫無(wú)人車。機(jī)器人本身會(huì)涉及到大量動(dòng)力學(xué)原理。盡管自行車發(fā)明將近200年,但是力學(xué)機(jī)理始終沒(méi)有研究透,直到2016年一群學(xué)者在Nature雜志上發(fā)表的一篇文章,才把復(fù)雜的動(dòng)力學(xué)系統(tǒng)解釋的比較透徹。我們做機(jī)器人控制也是要充分利用自行車的動(dòng)力學(xué)原理來(lái)做。
人對(duì)自行車的控制能力很強(qiáng),比如大家在校園里或者沒(méi)有障礙的路面可以松手騎自行車。那么如何讓自行車保持平衡,并自主行進(jìn)呢?其實(shí)這里面涉及很多力學(xué)原理,總體來(lái)講有以下幾方面的影響因素。
如果自行車在圓弧軌道上行駛就會(huì)產(chǎn)生離心力,這個(gè)離心力會(huì)幫助它保持平衡。
自行車特殊的前叉結(jié)構(gòu)——前叉角度和前輪拖曳距,這兩個(gè)物理參數(shù)的變化會(huì)自動(dòng)讓車把自動(dòng)扶正并保持平衡中起到重要作用。
整個(gè)車體質(zhì)量的均衡分布也是讓保持平衡的原因之一。
人在騎車時(shí),上身運(yùn)動(dòng)會(huì)產(chǎn)生反作用力讓自行車保持平衡。
車輪的陀螺效應(yīng),陀螺力矩會(huì)幫助車保持平衡。
加裝反作用輪(航天器上經(jīng)常用),或者加力矩陀螺會(huì)產(chǎn)生平衡作用。
上述的前兩項(xiàng)是我們的研究方向,中間三項(xiàng)需要加裝外部裝置,與獨(dú)立自行車沒(méi)有關(guān)系,最后一項(xiàng)是與研究原理不相關(guān)。所以我們只選擇了最前面兩項(xiàng)。
我們利用前兩項(xiàng)做控制的時(shí)候遇到了一些難點(diǎn),比如低速、變速行駛影響離心力,風(fēng)力干擾,大坡度,載荷變化,車輪與不同地面的相互作用等。
以下是一個(gè)相對(duì)簡(jiǎn)單的自行車動(dòng)力學(xué)模型,其中的車身、車把和行駛速度可以用三個(gè)變量來(lái)描述,描述完這三個(gè)變量以后我們可以得到一個(gè)動(dòng)力學(xué)方程,這個(gè)方程具有很強(qiáng)的非線性,而且不同狀態(tài)下的角度和車速是耦合的,它對(duì)參數(shù)也很敏感。另外,我們可以看到方程中很多參數(shù)都與速度相關(guān)。只要速度變化,動(dòng)力學(xué)方程就會(huì)改變,這對(duì)我們來(lái)說(shuō)是一個(gè)有意思的挑戰(zhàn),如果能夠解決速度的影響,我們的控制算法就能向前更近一步。
單一速度下的車把轉(zhuǎn)向控制依靠普通的控制手段就可以解決,我覺(jué)得大二、大三的學(xué)生可以嘗試做固定速度的自行車實(shí)驗(yàn)。我們要做的是如何解決變速下的車把轉(zhuǎn)向平衡控制。
以前我們嘗試過(guò)采用速度估計(jì)+分段控制的方法實(shí)現(xiàn)變速控制。當(dāng)時(shí)我們用了1個(gè)多?的時(shí)間?為調(diào)整了20段左右的參數(shù),隨著速度變化去切換,就可以?較好地解決車的穩(wěn)定性問(wèn)題;再?這些數(shù)據(jù)做初始參數(shù)去做強(qiáng)化學(xué)習(xí),效果還會(huì)更好?點(diǎn),可以適應(yīng)地?材質(zhì)。遺憾的是,在零初始知識(shí)的情況下的學(xué)習(xí)沒(méi)有成功,雖然?Segway平衡車在零知識(shí)的情況下的強(qiáng)化學(xué)習(xí)我們做成了正負(fù)10 度范圍內(nèi)的平衡。因?yàn)榛緦W(xué)到的是線性部分的知識(shí),所以就沒(méi)有?到??車上。因此,我們得出結(jié)論,“暴?”的強(qiáng)化學(xué)習(xí)可能不適合這個(gè)問(wèn)題,還需要進(jìn)一步探索。
我們的無(wú)人駕駛自行車是在普通自行車后輪加驅(qū)動(dòng)器,在前車把加轉(zhuǎn)向,加剎車、控制器和相應(yīng)的各種傳感器、電池,這樣自行車已經(jīng)能夠?qū)崿F(xiàn)定速駕駛。其實(shí)任何控制器通過(guò)反饋控制本身就具有一定的魯棒性,所以它在基本路面行走是沒(méi)有問(wèn)題的。只要把各種速度下的參數(shù)都對(duì)應(yīng)好,實(shí)現(xiàn)平滑切換就可以做到比較好的魯棒性。
另外,我們也實(shí)現(xiàn)了變速下的自動(dòng)導(dǎo)航行走,這是我們?cè)谇迦A校園內(nèi)拍攝的短片,視頻中的自行車可以從低速到高速,通過(guò)不同粗糙程度、不同材質(zhì)的路面,我們?cè)谄渲屑尤肓藗鞲衅鬟M(jìn)行路面識(shí)別,它也可以按照比較簡(jiǎn)單的路徑進(jìn)行導(dǎo)航。
無(wú)人自行車能夠達(dá)到這樣的效果,我們做了幾件事。除了實(shí)現(xiàn)機(jī)器人控制外,還加入了感知模塊,所以這是我們的動(dòng)力學(xué)模型。
從圖中的兩個(gè)紅色圈來(lái)看,有些項(xiàng)跟陀螺效應(yīng)相關(guān),有些項(xiàng)與離心力相關(guān),有些項(xiàng)和結(jié)構(gòu)相關(guān),最重要的第一項(xiàng)是和重力相關(guān)。這些項(xiàng)都會(huì)隨著速度不斷變化。
傳統(tǒng)方法用NI控制器或者任何工業(yè)控制器,再集成大量傳感器來(lái)做,可以實(shí)現(xiàn)這樣的效果。當(dāng)然這里面也有失敗的過(guò)程,我們經(jīng)常會(huì)摔倒再重新調(diào)整參數(shù)再做。不過(guò),這是相當(dāng)傳統(tǒng)和復(fù)雜的機(jī)器人控制方法。
后來(lái)我們就沒(méi)有這樣做了。傳統(tǒng)任務(wù)里面做運(yùn)動(dòng)控制需要嵌入式系統(tǒng),因?yàn)榍度胧较到y(tǒng)要實(shí)現(xiàn)控制算法。同時(shí)做定位和導(dǎo)航時(shí),我們需要高主頻的系統(tǒng)來(lái)做迭代運(yùn)算,比如SLAM或其他(SLAM也可以在GPU上做)。交互和感知往往需要用GPU做一些識(shí)別或者推理算法??傊m合并行計(jì)算、高頻計(jì)算和實(shí)時(shí)性要求,這三種計(jì)算在智能機(jī)器人里面是同時(shí)需要的。尤其我們?cè)趨⒓覴oboCup比賽時(shí)做的人形機(jī)器人同時(shí)需要這幾種計(jì)算,最簡(jiǎn)單的辦法是用三臺(tái)計(jì)算機(jī),這三臺(tái)需要具備不同算力,然后用網(wǎng)線把它們接起來(lái),用操作系統(tǒng)維護(hù)數(shù)據(jù)溝通。
這次我們并沒(méi)有采用這樣的方法。去年清華大學(xué)施路平教授團(tuán)隊(duì)發(fā)布了一款類腦芯片“天機(jī)芯”,在一個(gè)芯片上就可以實(shí)現(xiàn)三類計(jì)算,而且是動(dòng)態(tài)的,可以定義,可以重新編程。這是兩個(gè)學(xué)科或者多個(gè)學(xué)科進(jìn)行交叉的結(jié)果,我們就和做芯片的老師進(jìn)行了合作,我們用具備這些功能的芯片完成三個(gè)任務(wù)來(lái)測(cè)試,如果三個(gè)任務(wù)都可以實(shí)現(xiàn),就說(shuō)明芯片具備這三種計(jì)算功能。
這對(duì)于傳統(tǒng)機(jī)器人控制硬件來(lái)說(shuō)是很難實(shí)現(xiàn)的,如果能夠?qū)崿F(xiàn)也必然體積大,功耗大。那么我們就希望能夠利用混合架構(gòu)的芯片來(lái)實(shí)現(xiàn)這種功能。于是,我們把駕駛路徑的識(shí)別、障礙物的識(shí)別、語(yǔ)音導(dǎo)航、運(yùn)動(dòng)控制的功能全部放到一款芯片中(當(dāng)然不是一個(gè)芯片,而是芯片組成陣列的主板)。
如上面的動(dòng)圖演示,芯片實(shí)現(xiàn)了所有的計(jì)算功能。我們這項(xiàng)工作成果去年8月1日發(fā)表在了Nature雜志上,是我們國(guó)家在人工智能領(lǐng)域研究第一篇發(fā)表在Nature上的文章。
受這項(xiàng)工作的啟發(fā),利用天機(jī)芯片完成無(wú)人駕駛自行車的演示驗(yàn)證,為自動(dòng)機(jī)器人的研發(fā)提供了一個(gè)新思路,可以有兩條途徑:
芯片+機(jī)器人:用機(jī)器人做芯片或者AI算法研究平臺(tái),以此來(lái)證明算法可行性。算法在推進(jìn)的同時(shí),以此反饋到機(jī)器人上,最終推動(dòng)高算力或者多性能芯片的實(shí)現(xiàn)。
機(jī)器人+芯片:利用芯片破解機(jī)器人算力不足的問(wèn)題。
這套新思路最早是2016年,張鈸老師在Science發(fā)表的一篇文章中提到的,其目的是希望人工智能技術(shù)和機(jī)器人能夠相互結(jié)合,相互促進(jìn)。
目前這項(xiàng)研究成果得到了國(guó)際著名的雜志和專業(yè)人士的認(rèn)可。另外,值得說(shuō)明的是,Nature雜志的編輯告訴我們,通常一篇在Nature上發(fā)文章的報(bào)道量是100,而我們這篇文章的報(bào)道量達(dá)到了1400,是目前為止最好的。
到現(xiàn)在為止,對(duì)機(jī)器人控制的需求,對(duì)算力的需求還遠(yuǎn)沒(méi)有結(jié)束,我們經(jīng)常在Youtobe視頻中看到一些山地越野挑戰(zhàn)賽,這些視頻足以證明人類對(duì)車的控制能力有多強(qiáng)。
我們的愿景就是讓機(jī)器人能夠達(dá)到,甚至超越人類操作自行車的水平。因?yàn)檫@樣能夠把控制問(wèn)題推到極限,從而發(fā)現(xiàn)技術(shù)的邊界在哪里,以此來(lái)推動(dòng)整個(gè)技術(shù)的進(jìn)步。長(zhǎng)期來(lái)看,未來(lái)機(jī)器人控制可以劃分為三個(gè)發(fā)展階段:
第一階段:自行車能夠在低速、變速、粗糙/障礙路面正常的行進(jìn)。
第二階段:自行車能夠自主完成騰空、落地等特技任務(wù)。
第三階段:在落地應(yīng)用中,融入控制和感知系統(tǒng)的自行車,可以像極限山地運(yùn)動(dòng)員一樣在復(fù)雜的環(huán)境中可以自如的行進(jìn)。
目前初級(jí)階段的任務(wù)我們已經(jīng)完成,中期任務(wù)和長(zhǎng)期任務(wù)我們還沒(méi)有明確方案,不過(guò)可以肯定的是這些任務(wù)實(shí)現(xiàn)必須要有強(qiáng)大的計(jì)算作為支撐,如果沒(méi)有計(jì)算,其他局部做得再好也不會(huì)達(dá)成目標(biāo)。
早在1990年就有人提出了機(jī)器人被動(dòng)行走理論。當(dāng)時(shí)機(jī)器人是純機(jī)械結(jié)構(gòu),只要給它初始條件就可以產(chǎn)生穩(wěn)定的行走。到了2005年,康奈爾大學(xué)研究團(tuán)隊(duì)基于被動(dòng)行走理論,研發(fā)出了與人類等效的行走機(jī)器人。當(dāng)時(shí)這項(xiàng)研究成果發(fā)表在Science雜志上引起了不小的轟動(dòng),之后也陸續(xù)有不少關(guān)于被動(dòng)理論的擴(kuò)展研究發(fā)表。不過(guò),除了哈佛研發(fā)的機(jī)器人軟體外骨骼以外,幾乎沒(méi)有研究成果能夠帶來(lái)實(shí)際的應(yīng)用價(jià)值。
外骨骼研究一直是近幾年的熱門(mén)研究領(lǐng)域,在國(guó)內(nèi)就有幾十家公司在做。它對(duì)于有功能性障礙、特殊工種人士確實(shí)有一定使用價(jià)值??吹竭@些成果,我們對(duì)其中涉及的理論產(chǎn)生了好奇。
人的步態(tài)到底是什么?很多醫(yī)學(xué)科學(xué)家在分析了人的步態(tài)后發(fā)現(xiàn),所記錄的行走軌跡像一團(tuán)亂麻,是周期性但不是重復(fù)的,起初以為是噪音或者步態(tài)不均勻?qū)е碌慕Y(jié)果,最后發(fā)現(xiàn)其實(shí)人走路是混沌的步態(tài)。在1998年,就有人發(fā)現(xiàn)當(dāng)參數(shù)變化到特定值時(shí),被動(dòng)模型中就會(huì)表現(xiàn)出混沌特性,后來(lái),這一點(diǎn)在實(shí)物中也被證實(shí)。
比如,我們利用被動(dòng)理論做了一款足式機(jī)器人,從它的行走數(shù)據(jù)來(lái)看有明顯的混沌趨勢(shì)。那么問(wèn)題來(lái)了,人走路是混沌的,為什么機(jī)器人走路是單周期控制的?
TED上有這樣一則視頻,一位帕金森患者上下樓梯必須扶著扶手,后來(lái),它的孫女做了一個(gè)實(shí)驗(yàn),在平面的地上畫(huà)了多層臺(tái)階,結(jié)果患者可以在無(wú)任何扶手的情況下完成獨(dú)立行走。當(dāng)然這和帕金森癥的機(jī)理有關(guān),但也說(shuō)明其本身與動(dòng)力學(xué)有關(guān),帕金森的本質(zhì)是神經(jīng)系統(tǒng)局部存在障礙、傳導(dǎo)不通的情況。這個(gè)案例說(shuō)明,可以通過(guò)視覺(jué)上的刺激恢復(fù)神經(jīng)系統(tǒng)的正常功能,或許可以解決這一問(wèn)題。
傳統(tǒng)的行走機(jī)器人都是按單周期步態(tài)在做控制,首要解決的問(wèn)題是穩(wěn)定性,而人類步態(tài)可能是混沌的。我們能否從被動(dòng)步行中找到一些人類步態(tài)的動(dòng)力學(xué)解釋,并利用這些動(dòng)力學(xué)來(lái)提高機(jī)器人或助行器性能的控制方法?如果按照混沌的特點(diǎn)去控制,可能會(huì)有完全不一樣的效果。在這里,我們做了一些動(dòng)力學(xué)軌跡的案例分析。如下圖:
從SK出發(fā)繞一圈回到下次落地的狀態(tài),是周期性且重復(fù)的。從S0出發(fā),下次落地到S1、S2、S3以及S4,紅色點(diǎn)是最終去的地方,是穩(wěn)定的值,單周期步態(tài)是吻合的,這和我們的系統(tǒng)很像。如果是給系統(tǒng)這個(gè)參數(shù),系統(tǒng)會(huì)最終落到紅點(diǎn),如果我給系統(tǒng)另外一個(gè)參數(shù),用一個(gè)紅色的參數(shù)欺騙它,結(jié)果是當(dāng)它走到第二步或者某一步的時(shí)候就會(huì)經(jīng)過(guò)紅色附近。顯然對(duì)目標(biāo)紅點(diǎn)來(lái)講,采用紅色的參數(shù)會(huì)更好,而不是采用本身黑色的參數(shù)(它有漸進(jìn)收斂的過(guò)程)。
如果用假目標(biāo)欺騙它,那么就要考慮用哪個(gè)目標(biāo)欺騙它會(huì)更好?在這里需要做很多運(yùn)算,首先我需要知道紅色軌跡、所有可能的黑色軌跡是什么,把他們都算出來(lái),從中選出來(lái)最優(yōu)化軌跡,再把參數(shù)發(fā)送給系統(tǒng)。最后,系統(tǒng)等效成傳統(tǒng)的現(xiàn)代控制理論中的狀態(tài)方程的反饋控制問(wèn)題。
這個(gè)方法來(lái)自于混沌控制里最經(jīng)典OGY方法,這里,我們提出了一種MPC的方法,發(fā)現(xiàn)通過(guò)大量計(jì)算的MPC遠(yuǎn)好過(guò)傳統(tǒng)的OGY方法。而且如果機(jī)器人處于將跌到狀態(tài),也可以通過(guò)計(jì)算機(jī)找到適當(dāng)?shù)能壽E來(lái)恢復(fù)運(yùn)動(dòng),遠(yuǎn)遠(yuǎn)擴(kuò)大了穩(wěn)定的范圍。
目前,我們還無(wú)法實(shí)現(xiàn)在線計(jì)算和預(yù)測(cè),但我們實(shí)現(xiàn)了一個(gè)只有5組參數(shù)的實(shí)驗(yàn)。即,我們提前算好了5組不同參數(shù)的步態(tài),每組參數(shù)對(duì)應(yīng)一個(gè)穩(wěn)定的周期性步態(tài),也就是5組不同的速度(草地、斜坡、獅石子路等5種不同的路徑),通過(guò)計(jì)算來(lái)切換軌跡就可以達(dá)到穩(wěn)定性。這和我們?cè)瓉?lái)的暴力增強(qiáng)穩(wěn)定性方法不一樣。我們的控制量不是控制系統(tǒng)的某個(gè)指標(biāo),而只控制參數(shù),如果指標(biāo)變了,我改變參數(shù),而不是改變輸入量,參數(shù)的改變?cè)僮儞Q到每個(gè)關(guān)節(jié)的電機(jī)上。這樣就可以做出另類的結(jié)果,跟傳統(tǒng)的控制不一樣,屬于參數(shù)激勵(lì)方法。
另外,我們還做了具有真正的兩條腿、兩個(gè)手臂的人行機(jī)器人,它同樣需要嚴(yán)格依賴計(jì)算的方法,目前還沒(méi)有得到最終結(jié)果,以后有機(jī)會(huì)給大家展示最終效果。
今天我的報(bào)告就到這里。謝謝大家!
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。
本專題其他文章