0
本文作者: 饒舒瑋 | 2024-07-11 17:33 |
作者丨饒舒瑋
編輯丨岑峰
仿生學(xué),一向被認(rèn)為是一門“古老又年輕”的學(xué)科。古老在于人類從直立行走時(shí)期就已經(jīng)學(xué)會從自然界獲得靈感,年輕是因?yàn)椴粩嘣谀7碌倪^程中創(chuàng)造出新的事物。創(chuàng)造力,是人類區(qū)別于別的生物的一種本領(lǐng),也是人類戰(zhàn)勝 AI 的一項(xiàng)天生能力。
在這個(gè)“AI 取代人類”言論喧囂塵上的時(shí)代,機(jī)器人開始進(jìn)入家庭場景,大模型的出色表現(xiàn)讓人們不斷驚嘆,人們擔(dān)心人類和機(jī)器之間的界限逐漸模糊,焦慮情緒不斷蔓延。但在港科大(廣州)教授馬書根看來,“算力再高也算不出創(chuàng)造力”,對于人工智能威脅論他不擔(dān)心,他擔(dān)心的另有其事。
師從日本蛇形機(jī)器人之父,深耕機(jī)器人領(lǐng)域三十余年,馬書根自認(rèn)為是“保守派”。當(dāng)這個(gè)領(lǐng)域的熱錢不斷涌向人形機(jī)器人和大模型時(shí),馬書根表示,社會資本應(yīng)該往更需要的地方流動,而不是僅局限于智能方向。
具身智能的出現(xiàn),讓硬件的重要性重新被看見。擁有仿生學(xué)背景的馬書根更加注重機(jī)器人在與外界環(huán)境互動時(shí)的身體表現(xiàn)。盡管仿生是從模仿開始,但是掌握機(jī)理,才是關(guān)鍵。在馬書根看來,如果沒有掌握機(jī)理,機(jī)器人就只能停留在按照指令完成動作,無法與外界環(huán)境實(shí)現(xiàn)互動,還遠(yuǎn)沒有達(dá)到“具身智能”的程度。但要如何找到機(jī)理,如何驗(yàn)證機(jī)理的正確性,馬書根仍在探索,這是一條尚待開拓的路。
對于機(jī)器人領(lǐng)域,馬書根有自己堅(jiān)持的哲學(xué)思考。他始終認(rèn)為,這個(gè)產(chǎn)業(yè)的發(fā)展目標(biāo)不應(yīng)該是全球經(jīng)濟(jì)產(chǎn)值,而是對人類社會發(fā)展的影響,即利用機(jī)器解放人類勞動力,為人類擺脫繁重勞動的枷鎖,改變多數(shù)人因工作重負(fù)而情感枯竭的社會現(xiàn)狀,讓人們的生活重心回歸到個(gè)體之間的相處上。
在AI科技評論對馬書根教授的專訪中,我們可以了解到在傳統(tǒng)機(jī)器人領(lǐng)域?qū)τ诰呱碇悄艿目捶?,以及仿生學(xué)發(fā)展對于具身智能的影響和當(dāng)前面臨的行業(yè)挑戰(zhàn)等。
以下即為AI科技評論與馬書根就具身智能這一話題的訪談實(shí)錄,限于篇幅,AI科技評論進(jìn)行了不改原意的編輯:
AI科技評論:當(dāng)年您為何選擇赴日深造,又是如何確定的研究方向?
馬書根:因?yàn)樵谏鲜澜?0年代初期,日本在機(jī)器人領(lǐng)域處于世界領(lǐng)先地位,所以當(dāng)時(shí)的留學(xué)目標(biāo)就是日本。1985年,我畢業(yè)一年后就前往日本東京工業(yè)大學(xué)進(jìn)行深造,跟隨梅谷陽二和廣瀨茂男兩位教授學(xué)習(xí),他們自70年代末便開始研究蛇形機(jī)器人。
之所以選擇蛇形,主要還是我的興趣驅(qū)使。從科研的角度來說,研究蛇形機(jī)器人有兩點(diǎn)優(yōu)勢,第一是蛇結(jié)構(gòu)簡單,只有像一條繩索似的生物結(jié)構(gòu);第二是蛇的大腦較小,卻能控制全身運(yùn)動,這對于我們?nèi)绾卧谫Y源有限的情況下實(shí)現(xiàn)功能最大化的研究很有啟發(fā)。
當(dāng)時(shí)的日本經(jīng)濟(jì)繁榮,產(chǎn)業(yè)界對技術(shù)創(chuàng)新的需求迫切,從那時(shí)我開始意識到,僅僅依靠興趣驅(qū)動的研究難以在產(chǎn)業(yè)界獲得廣泛的認(rèn)可和應(yīng)用。我的導(dǎo)師也多次找我談話,給我提供了航天機(jī)器人這一方向,主要解決零重力環(huán)境下機(jī)器人減震的問題。
但我還是更偏向研究工業(yè)機(jī)器人,在我博士期間就開始研究工業(yè)機(jī)器人的多關(guān)節(jié)和象鼻機(jī)器人。博士畢業(yè)后我去了小松制造所開始工作。在小松呆了一年,我認(rèn)識到工業(yè)界不太合適自己,想繼續(xù)赴美深造。于是我在1992年去了美國,1993年又回到日本成立了自己的實(shí)驗(yàn)室,正式開始科研方面的工作。
AI科技評論:作為深耕機(jī)器人領(lǐng)域三十多年的學(xué)者,您怎么理解具身智能?
馬書根:我們可以從一個(gè)簡單的例子出發(fā)理解其概念。比如,一條已經(jīng)失去生命的魚,借助一定流速的水流就可以讓身體實(shí)現(xiàn)“游動”的狀態(tài)。像這樣的身體形態(tài)與外界環(huán)境產(chǎn)生交互,正是具身智能的一個(gè)重要表現(xiàn)。
在我看來,具身智能包含兩種類型:一種是內(nèi)在智能,它負(fù)責(zé)穩(wěn)定身體內(nèi)部的動態(tài)平衡;另一種則是從外界環(huán)境中獲取信息,并根據(jù)這些信息調(diào)整內(nèi)部狀態(tài)以適應(yīng)外界。
以人類為例,我們的日常技能并不只是通過教導(dǎo)完成,更多時(shí)候是身體為了適應(yīng)環(huán)境進(jìn)行主動學(xué)習(xí)。為了在不同的地形上穩(wěn)定行走,我們的身體會自動調(diào)整姿勢和動作。這種適應(yīng)性和反應(yīng)能力,正是具身智能的體現(xiàn)。
在過去,人工智能領(lǐng)域更多地關(guān)注計(jì)算和數(shù)據(jù)處理等虛擬層面的能力,現(xiàn)在人們開始思考如何把大腦的智能部分轉(zhuǎn)移到身體上,從而在現(xiàn)實(shí)世界進(jìn)行互動和操作,因此具身智能得以發(fā)展。
AI科技評論:仿生學(xué)這一學(xué)科背景對于您之后研究具身智能有何影響?
馬書根:運(yùn)用仿生學(xué)的知識,我們可以通過觀測生物的運(yùn)動方式,運(yùn)用現(xiàn)有的控制方法來實(shí)現(xiàn)機(jī)器人與環(huán)境之間的交互。比如蛇在冰面上、在平地上、在崎嶇的地面上,就會出現(xiàn)不一樣的運(yùn)動形態(tài),這正是其內(nèi)在智能的一種體現(xiàn)。生物體會根據(jù)其所處的不同環(huán)境演化出不同形狀和運(yùn)動方式。
1994年前后,具身智能這一概念還沒出現(xiàn),仿生學(xué)領(lǐng)域已經(jīng)開始通過研究生物的動態(tài)行走來研發(fā)機(jī)器人,不僅僅是兩條腿的生物,還有四條、六條甚至八條腿的都有,像仿昆蟲的六條腿,仿蜘蛛的八條腿。像是現(xiàn)在的四足機(jī)器人就是動態(tài)模型,實(shí)際上和我們所研究的一脈相承。
但讓機(jī)器人走起來還不夠,還要實(shí)現(xiàn)穩(wěn)定地行走,并具有承載重物的功能。要想實(shí)現(xiàn)穩(wěn)定,最理想的狀態(tài)就是和地面有三條腿以上的接觸,保持穩(wěn)定的三角結(jié)構(gòu)。
從仿生學(xué)的角度來看,很多研究就是從觀察開始的。我們當(dāng)時(shí)為了研究穩(wěn)定行走這一課題參考了鱉這一生物,關(guān)注這類生物的運(yùn)動機(jī)制。雖然研究工作往往從觀察開始,但我們不能僅停留在模仿現(xiàn)象的層面,而是應(yīng)該理解其中的機(jī)理和內(nèi)在的運(yùn)行邏輯。
現(xiàn)在具身智能的研究也常提到大腦和小腦的類似功能,對此我持保留意見。有實(shí)驗(yàn)顯示,有些生物即使切斷了某些神經(jīng)但仍然能運(yùn)動,會跟隨跑步機(jī)的速率變化改變自己的運(yùn)動速度,這說明運(yùn)動控制了并非全由大腦主導(dǎo)。
而人類的一些基本日?;顒右膊⒉恍枰玫叫∧X。類似漫步行走運(yùn)動由脊髓等低級中樞所控制,它們驅(qū)動我們進(jìn)行最基礎(chǔ)的運(yùn)動,使得我們能夠自然地進(jìn)行日?;顒?。但如騎行運(yùn)動或跳水等復(fù)雜技能,就需要小腦協(xié)調(diào)訓(xùn)練。
AI科技評論:仿生如何避免單純的模仿?您在研究仿生機(jī)器人時(shí)期,有遇到哪些印象深刻的技術(shù)挑戰(zhàn)?
馬書根:在仿生學(xué)研究中,每次都會遇到技術(shù)挑戰(zhàn)。比如在研究蛇的行動時(shí),讓蛇按照預(yù)期爬上樹棍就很難,因?yàn)樯卟宦犞笓]。對于蛇的爬行動作,要研究各種爬的方法和樣式。像是我們想象的蛇上樹是轉(zhuǎn)圈往上,但其實(shí)蛇是曲線爬行,其中有些平衡機(jī)制需要考慮。同時(shí),要想實(shí)現(xiàn)機(jī)器人完全像蛇一樣爬行還很困難,因?yàn)樯哧P(guān)節(jié)短且柔軟,而機(jī)器則很難做到。
所以仿生也不并是完全模仿,要先學(xué)后破再創(chuàng)造。最初人類模仿鳥類用手臂上下拍動嘗試飛行但失敗了,后來靠核心機(jī)和固定翼才發(fā)明了飛機(jī),之后才有了空氣動力學(xué)等研究出現(xiàn)。
就仿人機(jī)器人這一塊來看,“破”這一方面還有待發(fā)現(xiàn)?,F(xiàn)在的人形機(jī)器人以電機(jī)為主,關(guān)節(jié)肌肉等模擬技術(shù)還在發(fā)展,短期內(nèi)想要完全代替人類不太可能。
其實(shí),仔細(xì)研究人體就會發(fā)現(xiàn),人在完成動作時(shí)力學(xué)系統(tǒng)配合得很流暢合理。比如我們會發(fā)現(xiàn)快走比小跑還累,這是因?yàn)閮煞N運(yùn)動的能量模式不一樣。人在走動時(shí)單腿擺動,重心有上下變化,向前走時(shí)重心會下降再上升。而跑步時(shí)不只是重心上下變化,你也會感覺到跟腱被拉伸。人走動速度不固定,有快有慢。速度低時(shí)勢能和動能有效傳遞,不需要太多肌肉能量;快速行走時(shí),來源于重心上下變化的勢能遠(yuǎn)遠(yuǎn)達(dá)不到動能的需求,依靠肌肉提供更多的能量。人跑步時(shí),不只重心上下的勢能還有跟腱的彈性勢能用于和動能有效傳遞,這樣比同速度走動需要較少的肌肉能量。所以感覺小跑比快走要輕松。
AI科技評論:不同于模擬環(huán)境,您認(rèn)為面對復(fù)雜多變的現(xiàn)實(shí)環(huán)境,機(jī)器人可以如何應(yīng)對?
馬書根:機(jī)器人需要通過傳感器獲取數(shù)據(jù),識別障礙物,再規(guī)劃動作,這個(gè)過程就是一整套的閉環(huán)控制。如果在其中某一環(huán)節(jié)沒能夠及時(shí)反應(yīng),就會導(dǎo)致其余環(huán)節(jié)脫節(jié),可能出現(xiàn)機(jī)器人在高速運(yùn)動時(shí)發(fā)生碰撞的情況。所以,我們提出了一個(gè)理念,即不能完全依賴認(rèn)知來完成動作,而要通過機(jī)構(gòu)設(shè)計(jì)實(shí)現(xiàn)。
在機(jī)構(gòu)設(shè)計(jì)上,我們合理利用了欠驅(qū)動系統(tǒng)。比如,當(dāng)機(jī)器遇到障礙物時(shí),傳統(tǒng)思維是抬起或避開,但我們嘗試通過來源于障礙物推力被動改變運(yùn)動模式來繼續(xù)前進(jìn)。這種創(chuàng)新的設(shè)計(jì)思路讓我們在解決問題時(shí)有了更多的選擇。通過科研上的不斷進(jìn)步,讓我們開始嘗試通過機(jī)構(gòu)本身的調(diào)整來解決問題,從而實(shí)現(xiàn)更可靠更高效的移動方式。
例如,現(xiàn)在我們在研發(fā)機(jī)器人抓手的時(shí)候,經(jīng)常需要面臨這么一種情況,即如何在高速運(yùn)動的時(shí)候提高抓取的魯棒性。按照一般的思路,一般會在機(jī)器人抓穩(wěn)后再用驅(qū)動器吸取固定,但這樣驅(qū)動器數(shù)增加并控制會復(fù)雜。運(yùn)用調(diào)整機(jī)構(gòu)設(shè)計(jì)的方式,當(dāng)遇到電機(jī)功率滿足“抓”這一動作后,可以讓同一電機(jī)驅(qū)動吸取機(jī)構(gòu)移動,實(shí)現(xiàn)安全可靠抓取。同時(shí)利用氣壓驅(qū)動也能夠完成抓取和吸附動作,如此也能夠可靠的完成目標(biāo)任務(wù)。
AI科技評論:在您看來,目前仿生機(jī)器人發(fā)展到什么水平?未來的突破方向會是什么?
馬書根:按滿分100分來看的話,目前的仿生水平未達(dá)到40分,一些動作像走動、跑動、翻跟斗等,與人的動作還有差距。雖然像波士頓動力等公司的電機(jī)技術(shù)在近幾年有很大的進(jìn)步,但像往上跳、打跟頭、背躍式跳高等高難度動作,要么是所需電機(jī)功率太大,要么是機(jī)體需要較大彈性,導(dǎo)致這些動作都很難實(shí)現(xiàn)。
尤其是在模擬人體肌肉的復(fù)雜性和協(xié)同性方面,目前的技術(shù)仍處于初級階段。人體在行走、奔跑乃至跳躍時(shí),不僅依賴于四肢的力量,還涉及到腰部、背部等多塊肌肉的協(xié)同作用,這種全身性的動力鏈傳遞機(jī)制是現(xiàn)有機(jī)器人技術(shù)難以完全復(fù)制的。
剩下的60分,我認(rèn)為突破的關(guān)鍵在于基本的驅(qū)動器,就如電梯平衡系數(shù)一樣,運(yùn)行時(shí)所需的能量與自身重量比值越高越好,但目前我認(rèn)為這一方面并未達(dá)標(biāo)。相反算法方面整體都有了很大的提高,也相對容易實(shí)現(xiàn)優(yōu)化。但基于機(jī)理的算法相對不足,需要硬件方面更要努力跟上。
AI科技評論:您認(rèn)為機(jī)器人領(lǐng)域突破發(fā)展瓶頸的關(guān)鍵點(diǎn)會是什么?
馬書根:我認(rèn)為是機(jī)理,我一直覺得現(xiàn)在的機(jī)器人研究始終沒有把握真正的機(jī)理。即使大模型出現(xiàn)后,這一部分也并沒有得到發(fā)展。
因?yàn)殡m然大模型能夠幫助處理大量數(shù)據(jù),并在感知到?jīng)Q策的過程中展現(xiàn)出了巨大的潛力,但因?yàn)槠洹昂谙洹钡奶匦砸矌砹丝煽啃缘膯栴}。這也在某種程度上限制了工業(yè)界對于大模型的使用,特別是高精度高可靠性要求的領(lǐng)域。這些領(lǐng)域的企業(yè)需要有很明確的排障方案,而大模型因?yàn)殡y以解釋其決策依據(jù)往往找不出故障原因。
在算力還沒那么強(qiáng)的上個(gè)世紀(jì)70年代,計(jì)算機(jī)領(lǐng)域尚可通過日積月累形成一定的機(jī)理基礎(chǔ)。到了八九十年代,計(jì)算機(jī)的算力逐步提升,但機(jī)理方面還沒有大的突破。如今,盡管這個(gè)領(lǐng)域有了很多突破,但其實(shí)很多都是因?yàn)樗懔Φ奶嵘诺靡越鉀Q,并不是因?yàn)閷C(jī)理掌握程度的提高。
此外,盡管機(jī)器人技術(shù)日新月異,但機(jī)器人學(xué)科的基礎(chǔ)科學(xué)知識尚顯薄弱。在90年代中期,日本等國就開始探討這一問題,任何學(xué)科都一定要有堅(jiān)實(shí)的基礎(chǔ)知識來支撐其發(fā)展。無論是機(jī)械、電子還是信息科學(xué),都需要在各自領(lǐng)域內(nèi)深化基礎(chǔ)研究,才能推動機(jī)器人學(xué)科的成熟。
AI科技評論:機(jī)理可以通過什么方式探索?未來的機(jī)器人發(fā)展方向會是什么?
馬書根:目前沒有一個(gè)定論,也沒有方法可以驗(yàn)證機(jī)理的正確性。所謂的機(jī)理都還是假設(shè),需要有實(shí)際的東西來證明。
以人形機(jī)器人為例,盡管它目前非常熱門,但我們并不認(rèn)為人形是機(jī)器人發(fā)展的唯一方向。機(jī)器人的形態(tài)應(yīng)該根據(jù)具體應(yīng)用場景和需求來確定,而不是盲目追求人形。
在功能上,我們更強(qiáng)調(diào)機(jī)器人的輔助性,它們應(yīng)該能夠輔助人類完成一些危險(xiǎn)、繁重或人類不愿意從事的工作。試想一下,當(dāng)危險(xiǎn)系數(shù)很高的工程全部可以由機(jī)器人自動化完成,人類得以解放享受生活,那才是機(jī)器人真正理想的應(yīng)用場景。而不是像現(xiàn)在的一些宣傳概念,機(jī)器人取代人類出現(xiàn)在日常的家庭場景中,尤其是在養(yǎng)老和育兒這兩大類看護(hù)型場景中,這才是人類最需要存在的地方。這類需要人類進(jìn)行情感關(guān)懷的角色絕不能由機(jī)器人來承擔(dān)。
世界上的產(chǎn)值增加了多少,對于人類社會的發(fā)展來說并不是最關(guān)鍵的,如何利用自動化解放人類才是需要我們思考的東西。所以我認(rèn)為目前的社會資本應(yīng)該往更多需要的地方流動,而不是只局限在一個(gè)方向。
AI科技評論:您如何看待具身智能領(lǐng)域現(xiàn)在的發(fā)展現(xiàn)狀?
馬書根:具身智能這個(gè)領(lǐng)域現(xiàn)在學(xué)習(xí)算法方向的年輕人多了,但是這個(gè)領(lǐng)域還很需要機(jī)器人方向的人才。學(xué)習(xí)算法無可厚非,軟件實(shí)力也已經(jīng)大大提升了,需要有一些新的東西出現(xiàn)。
要想做機(jī)器人的研究,不能光靠軟實(shí)力,必須兩條腿走路。算法這方面現(xiàn)在相對來說比較容易解決,硬件背后的機(jī)理研究更需要受到重視。特別是在這個(gè)時(shí)代,人的創(chuàng)造力才是最重要的,這是無論怎樣提高算力都沒辦法從人工智能那里得到的東西。創(chuàng)造力也沒辦法從書本里的知識里得出,很多時(shí)候反而是“玩出來”的。所以,我現(xiàn)在經(jīng)常和學(xué)生說,別只是鉆研書本,要多接觸社會,要多看看外面的世界。
AI科技評論:在您看來,您怎么衡量一個(gè)研究的科研價(jià)值?
馬書根:我現(xiàn)在衡量一個(gè)研究成果的科研價(jià)值時(shí),主要考慮這個(gè)成果能不能經(jīng)過市場經(jīng)驗(yàn),實(shí)踐后能不能看到效果??偨Y(jié)此前與企業(yè)合作的經(jīng)歷,我們更希望研發(fā)成果不僅只局限在某幾家企業(yè)應(yīng)用,還能為更廣泛的應(yīng)用場景提供借鑒。
舉例來說,當(dāng)某鋼廠希望我們能設(shè)計(jì)一套管道檢測機(jī)器人時(shí),我們更關(guān)注這一設(shè)備日后的應(yīng)用和共性需求。比如,檢測的內(nèi)容是什么,這個(gè)尺寸是否適用于別的場景,如何確保檢測的準(zhǔn)確性和效率等。我們更希望這套設(shè)備具備通用性,而不是只用于這一個(gè)公司。所以在研發(fā)的時(shí)候,提煉出適用于類似場景的共性技術(shù),為未來的研究和應(yīng)用提供有價(jià)值的參考,如此研發(fā)投入才更有意義。
我現(xiàn)在認(rèn)為,在開始一個(gè)研究前,就要從實(shí)用性層面來思考,在這個(gè)場景里到底需要什么樣的形狀,什么樣的材質(zhì),要達(dá)到什么樣技術(shù)水平等。在我看來,科研價(jià)值可以分為兩種,一種是基礎(chǔ)科學(xué), 像是數(shù)學(xué)、物理等學(xué)科知識,在全行業(yè)適用;一種是技能的應(yīng)用,可以發(fā)展出什么樣的產(chǎn)業(yè),真正可以投入使用,這樣科研的價(jià)值才得以體現(xiàn)。
AI科技評論:您下一步想要攻克的科研方向是什么?
馬書根:我希望研究出一種醫(yī)療機(jī)器人,可以直接進(jìn)入人的身體,打通血管,解決血栓等問題,或是直接可以達(dá)到病灶,減少藥物對人身體的副作用。最后處理完,就可以通過某種方式變成營養(yǎng)增強(qiáng)人體抵抗力。
AI科技評論:能介紹一下您現(xiàn)在的研究項(xiàng)目嗎?
馬書根:我最近在研究適用于近海領(lǐng)域的水下機(jī)器人。這類水下機(jī)器人通常使用螺旋槳作為推進(jìn)器。如果是在深海,這可能沒問題,但在近海就比較難實(shí)現(xiàn),因?yàn)槁菪龢赡軙硭篮Q笾参?,或者是在靠近海底面觀測時(shí)卷起雜質(zhì)影響觀測等。
所以我們團(tuán)隊(duì)希望通過仿生學(xué)的方式,研究什么樣的機(jī)器人可以在不對生物造成影響的情況下進(jìn)行作業(yè),這在近海養(yǎng)殖等藍(lán)色經(jīng)濟(jì)領(lǐng)域有比較大的需求。
雷峰網(wǎng)雷峰網(wǎng)(公眾號:雷峰網(wǎng))雷峰網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。