丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
人工智能 正文
發(fā)私信給賴文昕
發(fā)送

0

戴盟機(jī)器人王煜:「具身技能」才能發(fā)揮人形機(jī)器人的作用 | 具身智能十人談

本文作者: 賴文昕 2024-07-17 10:22
導(dǎo)語(yǔ):導(dǎo)語(yǔ):「大腦派」正當(dāng)紅,解決精細(xì)操作的「細(xì)小腦」同樣重要。


作者:賴文昕

編輯:岑峰

本月,在爆火的世界人工智能大會(huì)(WAIC 2024)中,人形機(jī)器人「十八金剛」成為了會(huì)場(chǎng)中當(dāng)之無(wú)愧的焦點(diǎn)。

由青龍、智元-遠(yuǎn)征A2、宇樹-H1、傅利葉-GR-1、星動(dòng)紀(jì)元-XBot-L、樂聚-夸父4代等一眾人形機(jī)器人組成的先鋒陣列,作為「鎮(zhèn)館之寶」被陳列在展覽館進(jìn)門處,成為了所有進(jìn)場(chǎng)觀眾看到的首個(gè)驚喜。

在大模型技術(shù)的加持下,長(zhǎng)出「大腦」的人形機(jī)器人被視為通向 AGI 的必經(jīng)之路,「具身智能元年」似乎已經(jīng)到來(lái)。

概念被炒得火熱,但具身智能的故事仍面臨著一個(gè)核心問題:「大腦」真的能帶來(lái)質(zhì)的改變并實(shí)現(xiàn)商業(yè)化落地嗎?

對(duì)此,香港科技大學(xué)機(jī)器人研究院創(chuàng)始院長(zhǎng)王煜教授提出了「具身技能」的概念。

「如果把具身智能稱為大腦,那么中腦或小腦則是大關(guān)節(jié)控制,精細(xì)操作為細(xì)小腦,也可叫具身技能,需要有硬件、學(xué)習(xí)方法、數(shù)據(jù)的支持?!雇蹯辖淌诮忉尩?,「不到具身技能的層次其實(shí)無(wú)法發(fā)揮人形機(jī)器人的作用?!?/p>

作為戴盟機(jī)器人聯(lián)合創(chuàng)始人與首席科學(xué)家,王煜教授在 1984 年前往美國(guó)卡內(nèi)基梅隆大學(xué)(CMU)讀博,師從 CMU 時(shí)任機(jī)器人研究所所長(zhǎng) Matthew Thomas Mason,是我國(guó)最早公派留學(xué)的學(xué)生之一。

彼時(shí)在這個(gè)頂尖機(jī)器人實(shí)驗(yàn)室中,Matthew Thomas Mason 與 Marc Raibert(波士頓動(dòng)力創(chuàng)始人)堪稱「CMU 機(jī)器人雙雄」,分別帶領(lǐng)團(tuán)隊(duì)研發(fā)機(jī)器人手部與腿部。作為少數(shù)的華人面孔,王煜教授成為了 Matthew 的第一個(gè)畢業(yè)博士生。

1989年,王煜教授獲得 CMU 機(jī)械工程博士學(xué)位后,分別在美國(guó)馬里蘭大學(xué)、新加坡國(guó)立大學(xué)及香港中文大學(xué)任職,后在2015年與李澤湘教授共同創(chuàng)辦了香港科技大學(xué)機(jī)器人研究院,并擔(dān)任港科大機(jī)器人創(chuàng)始院長(zhǎng)。

此外,王煜教授還獲得過(guò) 973 首席科學(xué)家、國(guó)家杰青、長(zhǎng)江學(xué)者特聘教授、國(guó)家科技進(jìn)步二等獎(jiǎng)等多份榮譽(yù), 并曾任 IEEE Fellow、IEEE 機(jī)器人與自動(dòng)化學(xué)會(huì)制造自動(dòng)化技術(shù)委員會(huì)主席以及 IEEE TASE 主編。

戴盟機(jī)器人王煜:「具身技能」才能發(fā)揮人形機(jī)器人的作用 | 具身智能十人談

2021年末,王煜教授與學(xué)生段江嘩博士共同創(chuàng)立戴盟機(jī)器人,致力于深度融合 AI 和機(jī)器人技術(shù),研發(fā)和生產(chǎn)真正可商用的多系列通用仿人機(jī)器人產(chǎn)品。

今年3月,戴盟機(jī)器人發(fā)布首款心靈手巧型人形機(jī)器人 Sparky 1。

Sparky 1 擁有持續(xù)自主學(xué)習(xí)的智能大腦,多自由度仿人關(guān)節(jié),多維觸覺感知五指靈巧手,可通過(guò)外骨骼方案收集的遙操作數(shù)據(jù)進(jìn)行機(jī)器人學(xué)習(xí),技能包括但不限于插線束接口、焊接電路板、滴試劑、熨衣服、倒酒、物體分揀、整理書架……解鎖了人形機(jī)器人在工業(yè)、研發(fā)、家庭、商業(yè)等多個(gè)場(chǎng)景的可能性。

Sparky 1 能實(shí)現(xiàn)「心靈手巧」離不開三大自研法寶:多模態(tài)集成技術(shù)、新型視觸覺傳感器和集成了視觸覺傳感器的五指靈巧手。

解決精細(xì)操作問題,成為了王煜教授與戴盟機(jī)器人的首要目標(biāo)。

以下是 AI 科技評(píng)論與王煜教授的對(duì)話,內(nèi)容經(jīng)過(guò)不改原意的編輯:


觸覺是精細(xì)操作的關(guān)鍵

AI 科技評(píng)論:您在2021年成立戴盟機(jī)器人,當(dāng)時(shí)的契機(jī)是什么呢?

王煜:最主要是為了轉(zhuǎn)化科研成果。經(jīng)過(guò)多年的研究與實(shí)踐,我深刻認(rèn)識(shí)到觸覺傳感在人形機(jī)器人領(lǐng)域的重要性。隨著人形機(jī)器人技術(shù)的不斷進(jìn)步和市場(chǎng)需求的日益增長(zhǎng),我認(rèn)為,觸覺傳感器技術(shù)已經(jīng)成熟,具備了轉(zhuǎn)化為商業(yè)產(chǎn)品的潛力和條件。這一轉(zhuǎn)化不僅能夠推動(dòng)人形機(jī)器人技術(shù)的發(fā)展,也將為其商業(yè)落地帶來(lái)新的可能。

AI 科技評(píng)論:戴盟機(jī)器人為什么會(huì)將重點(diǎn)放在觸覺傳感器上呢?

王煜:有這樣一個(gè)視頻,一個(gè)眼睛圓圓的小女孩,視力很好,但她的皮膚卻沒有感知,當(dāng)她想從火柴盒里取出火柴并點(diǎn)火時(shí),能看得清清楚楚的她卻需要比平常人花上多 5 倍的時(shí)間才能成功。

這個(gè)案例說(shuō)明了觸覺對(duì)精細(xì)操作的重要性,如果沒有掌握到真正的操作能力和足夠的信息,即使是看似簡(jiǎn)單的操作,如用螺絲刀擰螺絲,也難以完成,因?yàn)檫@需要真正的技能和手感。雖然 AI 和機(jī)器人技術(shù)在某些領(lǐng)域取得了進(jìn)展,但在執(zhí)行更復(fù)雜的任務(wù)時(shí),仍然存在局限性。更精細(xì)的操作能力和真正的技能是目前技術(shù)難以實(shí)現(xiàn)的,不能光靠視覺和強(qiáng)化學(xué)習(xí)。

具體來(lái)說(shuō),從視覺和圖像出發(fā)可以建立多個(gè) pick and place 模型,實(shí)現(xiàn)位移。但精細(xì)操作還需要手能做功,根據(jù)力的反饋?zhàn)鼍?xì)運(yùn)動(dòng),就像工業(yè)界裝配中存在公差,比如擰螺絲時(shí)空隙較小,需要更大的力,所以需要熟練工人操作,這就是技能的問題。

戴盟想要做有精細(xì)操作能力的機(jī)器人,有了觸覺傳感和手,機(jī)器人就可以自己探索、學(xué)習(xí)、掌握技能。如果把具身智能稱為大腦,那么中腦或小腦則是大關(guān)節(jié)控制,精細(xì)操作為細(xì)小腦,也可叫「具身技能」,需要有硬件、學(xué)習(xí)方法、數(shù)據(jù)的支持。不到具身技能的層次其實(shí)無(wú)法發(fā)揮人形機(jī)器人的作用,我們不能只有pick and place,比如拖地這個(gè)操作不止是拿起拖把,還需要用力拖地。

戴盟機(jī)器人王煜:「具身技能」才能發(fā)揮人形機(jī)器人的作用 | 具身智能十人談

AI 科技評(píng)論:那現(xiàn)在觸覺的探索有什么新發(fā)現(xiàn)以及有哪些技術(shù)路徑呢?

王煜:前沿科研探索發(fā)現(xiàn),人手的神經(jīng)有三類,有一些神經(jīng)能記住手指受力變形中半秒鐘的變化,還會(huì)利用半秒以前變形的歷史指導(dǎo)下一步。這意味著部分手部操作不需要大腦控制,觸感信息的處理在手上的神經(jīng)系統(tǒng)就可以完成計(jì)算。當(dāng)然,在新的、復(fù)雜的環(huán)境,就需要大腦的參與。

靈巧手的手指需要有觸覺傳感器收集信息、進(jìn)行力反饋,還要能控制。主要是兩種思路:一是產(chǎn)生數(shù)據(jù)后學(xué)習(xí),建立多個(gè)小模型再整合,如開蓋、擰螺絲等不同操作各有小模型;二是由數(shù)據(jù)驅(qū)動(dòng),像人一樣學(xué)技能,類似馬斯克機(jī)器人的端到端神經(jīng)網(wǎng)絡(luò),甚至不一定需要全面的模型。

但無(wú)論哪種方法,最基本的要求是,靈巧手的功能要做到足夠好,觸覺傳感信息充足,人手與機(jī)器人靈巧手的觸覺信息都需要采集,這也是戴盟十分重視的環(huán)節(jié)。


把靈巧手做到極致

AI 科技評(píng)論:那在「具身技能」這樣的關(guān)鍵點(diǎn)上,除了觸覺傳感器之外,您認(rèn)為還需要哪些關(guān)鍵的技術(shù)?

王煜:除了觸覺傳感技術(shù)外,靈巧手是否「夠精致」,同樣十分關(guān)鍵。如果偷工減料,技能表現(xiàn)將大打折扣。因此,追求極致的精細(xì)度至關(guān)重要,比如電機(jī)夠多夠好,盡管這可能會(huì)導(dǎo)致成本上升。

目前市場(chǎng)上較為暢銷的產(chǎn)品通常只有9個(gè)自由度,而像馬斯克所提的至少需要12-15個(gè)自由度。如果產(chǎn)品不能達(dá)到高標(biāo)準(zhǔn),就無(wú)法滿足高技能要求,進(jìn)行有效操作。只有保證基礎(chǔ)牢固后,我們才能去探究如果精細(xì)操作出現(xiàn)問題,到底是傳感信息不足、學(xué)習(xí)方法不當(dāng)還是模型不完善。當(dāng)然,自由度低的靈巧手成本更低,肯定有特定的應(yīng)用場(chǎng)景,但無(wú)法滿足很多技能需求。

不過(guò)戴盟從一開始就致力于將手部做到極致,再根據(jù)需求降維開發(fā)不同的產(chǎn)品,即當(dāng)產(chǎn)品不需要高級(jí)技能時(shí),我們可以降低成本,減少自由度,但需要明確的是,往下走的路很清楚,但更需要做到往上走,即當(dāng)有高級(jí)技能需求時(shí),我們的產(chǎn)品也能滿足。

這其實(shí)和波士頓動(dòng)力的理念是相似的,他們是將腿部做到極致,賦予了機(jī)器人強(qiáng)大的能力。我們認(rèn)為,只有通過(guò)這種方式,才能充分發(fā)揮機(jī)器人的潛力,并根據(jù)市場(chǎng)需求定義產(chǎn)品,同時(shí)控制好價(jià)格。

戴盟機(jī)器人王煜:「具身技能」才能發(fā)揮人形機(jī)器人的作用 | 具身智能十人談

AI 科技評(píng)論:您在之前的采訪中提到,機(jī)器人的「靈巧手」比「足」更難發(fā)展,這是為什么呢?

王煜:主要問題在于靈巧手手部操作的難度較高,與腿部操作不同,手部操作的難點(diǎn)不在于動(dòng)力學(xué)本身,而在于與物體互動(dòng)時(shí)達(dá)到一定技能水平的工作。

簡(jiǎn)單來(lái)說(shuō),靈巧手的硬件技術(shù)尚未跟上。手的硬件比身體和腿都難做,進(jìn)程較慢,以前手指關(guān)節(jié)的驅(qū)動(dòng)系統(tǒng)使用線纜拉動(dòng),會(huì)存在反饋時(shí)間延遲,影響操作效率。但現(xiàn)在的全電又對(duì)空間有要求,空間有限,電機(jī)得做得越來(lái)越小,優(yōu)質(zhì)的電機(jī)還很貴,每個(gè)約1萬(wàn)人民幣,想做15個(gè)自由度的靈巧手,光電機(jī)的成本就15萬(wàn)了,所以現(xiàn)在每家企業(yè)都需要有自研電機(jī)的人才。

軟件方面,靈巧手的進(jìn)展也相對(duì)落后。與已廣泛應(yīng)用于工業(yè)自動(dòng)化領(lǐng)域、通過(guò)預(yù)編程控制的夾爪或機(jī)械手不同,靈巧手的抓取模型等都不夠完善,目前還做不到將精細(xì)操作技能反映在程序中,實(shí)現(xiàn)自動(dòng)化操作。

我們這批最早研究靈巧手的人一開始認(rèn)為精細(xì)操作和技能是物理問題,只需做好模型后解決控制即可,后來(lái)發(fā)現(xiàn)涉及的因素太多,物理模型無(wú)法準(zhǔn)確覆蓋。機(jī)器人的手是硬的,人手卻是軟的,因此模型并不準(zhǔn)確,不是真實(shí)物體的模型,但如果要做真實(shí)人手的物理模型,很容易發(fā)現(xiàn),這是做不完的。

另外,傳感技術(shù)也存在不足,手部缺乏足夠的物理信息反饋,這影響了操作的精確性。而且,如果僅依賴視覺反饋,信息量也是不夠的。因此,自 2012 年 Schunk 的 SVH 靈巧手以來(lái),靈巧手的發(fā)展相對(duì)緩慢,盡管有了一些進(jìn)展,但整體上仍然面臨挑戰(zhàn)。

與之相比,腿部硬件的發(fā)展較為成熟,從大功率到全電動(dòng),國(guó)內(nèi)外已經(jīng)形成了一條完整的發(fā)展路徑,成本也得到了有效控制。從全球來(lái)看,波士頓動(dòng)力表現(xiàn)最為出色,其最新的產(chǎn)品完全摒棄了機(jī)械性,轉(zhuǎn)而采用全電動(dòng),成功解決了復(fù)雜的動(dòng)力學(xué)問題,實(shí)現(xiàn)了精確控制,甚至能夠完成翻跟頭等動(dòng)作。值得關(guān)注的是,模型預(yù)測(cè)控制(MPC)在1980年左右被開發(fā)出來(lái)在石化領(lǐng)域普及應(yīng)用,而波士頓動(dòng)力堅(jiān)持將 MPC 控制人形機(jī)器人這條路走通了,這如今成為他們的招牌技術(shù),也給現(xiàn)在的人形機(jī)器人控制奠定了良好的基礎(chǔ)。

戴盟機(jī)器人王煜:「具身技能」才能發(fā)揮人形機(jī)器人的作用 | 具身智能十人談

正在倒酒的 Sparky 1


人形機(jī)器人不能只依賴視覺模仿學(xué)習(xí)

AI 科技評(píng)論:感覺您對(duì)「大腦」的態(tài)度比較謹(jǐn)慎,那您認(rèn)為人形機(jī)器人還需要在哪些技術(shù)方向做出突破呢?

王煜:最近十年,AI 技術(shù)的發(fā)展打破了機(jī)器人傳統(tǒng)的 pick and place 模式,具備基礎(chǔ)的理解能力以及能做更智能的操作規(guī)劃?,F(xiàn)在人形機(jī)器人行業(yè)內(nèi)引領(lǐng)潮流的是 AI 大模型與視覺圖像,這種思路更重視「大腦」、與人的交互,成果也比較直觀,比如在家庭場(chǎng)景中最重要的是機(jī)器人如何理解人的需求,在人餓的時(shí)候拿來(lái)食物、甚至用微波爐加熱,但需要注意的是,具體到執(zhí)行切蘋果的操作技能,中小腦、甚至是細(xì)小腦就十分重要了。

隨著 AI 大模型的興起,通過(guò)視覺技術(shù)和模仿學(xué)習(xí),簡(jiǎn)單的二指或三指就可以實(shí)現(xiàn)基礎(chǔ)的拖拽操作。但實(shí)際上,現(xiàn)在只能完成一些抓取杯子、倒水或洗碗的簡(jiǎn)單任務(wù),在更復(fù)雜的工業(yè)和家庭場(chǎng)景中遠(yuǎn)遠(yuǎn)不夠。

值得關(guān)注的是,操作技能不可僅依賴基于視覺感知的模仿學(xué)習(xí),僅依靠視覺感知不夠,需要在收集的數(shù)據(jù)中引入觸覺信息。有的技術(shù)思路是自研數(shù)據(jù)采集手套,由人帶上后采集信息,并讓機(jī)器人也帶上同樣的手套。現(xiàn)在進(jìn)展比較好的是由人帶上兩指爪,并安裝上相機(jī)假裝洗碗,然后機(jī)器人通過(guò)模仿學(xué)習(xí)在旁邊洗碗。但碗如果太重太滑,沒有及時(shí)調(diào)整,這就是沒掌握好技能。

我們需要認(rèn)識(shí)到技能的重要性和難度,盡管觸覺傳感器技術(shù)太難、成本太高、很少人做,但依舊有往這方面突破的強(qiáng)需求,因此戴盟還有市場(chǎng)空間。

AI 科技評(píng)論:在您看來(lái),人形機(jī)器人會(huì)在哪些場(chǎng)景率先商業(yè)落地,戴盟對(duì)此有什么計(jì)劃?

王煜:主要還是工業(yè)場(chǎng)景。比如汽車裝配有大操作和小操作,雖然大操作更多,但只要有工具就會(huì)有小操作。包括半導(dǎo)體生產(chǎn)線,每個(gè)工人負(fù)責(zé)一道工序,但如果人形機(jī)器人只學(xué)一個(gè)技能、替代一個(gè)工人,實(shí)在是太浪費(fèi)了。機(jī)器人需要能適應(yīng)不同的任務(wù),要代替至少5個(gè)工人做精細(xì)化操作才有價(jià)值。

工業(yè)場(chǎng)景對(duì)「大腦」的要求相對(duì)低些,因?yàn)樽龅氖虑楹芫唧w,甚至不需要理解,比如現(xiàn)在的工業(yè)機(jī)器人在特定場(chǎng)景下執(zhí)行固定流程的任務(wù)。難度更高的任務(wù)需要使用工具,具體執(zhí)行是做功,需要根據(jù)力和加速度信息執(zhí)行,比如抬起、安裝輪胎,就是一個(gè)突然加速到突然減速的過(guò)程。

戴盟下一步會(huì)先把觸覺靈巧手和含觸覺的上肢操作模型做好,先走入高??蒲袉挝唬?yàn)閮r(jià)值在科研單位被認(rèn)識(shí)到就會(huì)培養(yǎng)一批有想法的人才。在工業(yè)場(chǎng)景,比如柔性物料和精密裝配的自動(dòng)化,如果戴盟的靈巧手能夠?qū)崿F(xiàn)無(wú)可替代的操作能力的話,商業(yè)價(jià)值自然會(huì)被認(rèn)可。


本文作者 anna042023 將持續(xù)關(guān)注具身智能領(lǐng)域的人事、企業(yè)、商業(yè)應(yīng)用以及行業(yè)發(fā)展趨勢(shì),歡迎添加交流,互通有無(wú)。雷峰網(wǎng)雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))


雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

戴盟機(jī)器人王煜:「具身技能」才能發(fā)揮人形機(jī)器人的作用 | 具身智能十人談

分享:
相關(guān)文章

資深編輯

關(guān)注具身智能。
當(dāng)月熱門文章
最新文章
請(qǐng)?zhí)顚懮暾?qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說(shuō)