丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
人工智能 正文
發(fā)私信給賴文昕
發(fā)送

0

戴盟機器人王煜:「具身技能」才能發(fā)揮人形機器人的作用 | 具身智能十人談

本文作者: 賴文昕 2024-07-17 10:22
導語:導語:「大腦派」正當紅,解決精細操作的「細小腦」同樣重要。


作者:賴文昕

編輯:岑峰

本月,在爆火的世界人工智能大會(WAIC 2024)中,人形機器人「十八金剛」成為了會場中當之無愧的焦點。

由青龍、智元-遠征A2、宇樹-H1、傅利葉-GR-1、星動紀元-XBot-L、樂聚-夸父4代等一眾人形機器人組成的先鋒陣列,作為「鎮(zhèn)館之寶」被陳列在展覽館進門處,成為了所有進場觀眾看到的首個驚喜。

在大模型技術(shù)的加持下,長出「大腦」的人形機器人被視為通向 AGI 的必經(jīng)之路,「具身智能元年」似乎已經(jīng)到來。

概念被炒得火熱,但具身智能的故事仍面臨著一個核心問題:「大腦」真的能帶來質(zhì)的改變并實現(xiàn)商業(yè)化落地嗎?

對此,香港科技大學機器人研究院創(chuàng)始院長王煜教授提出了「具身技能」的概念。

「如果把具身智能稱為大腦,那么中腦或小腦則是大關(guān)節(jié)控制,精細操作為細小腦,也可叫具身技能,需要有硬件、學習方法、數(shù)據(jù)的支持。」王煜教授解釋道,「不到具身技能的層次其實無法發(fā)揮人形機器人的作用?!?/p>

作為戴盟機器人聯(lián)合創(chuàng)始人與首席科學家,王煜教授在 1984 年前往美國卡內(nèi)基梅隆大學(CMU)讀博,師從 CMU 時任機器人研究所所長 Matthew Thomas Mason,是我國最早公派留學的學生之一。

彼時在這個頂尖機器人實驗室中,Matthew Thomas Mason 與 Marc Raibert(波士頓動力創(chuàng)始人)堪稱「CMU 機器人雙雄」,分別帶領(lǐng)團隊研發(fā)機器人手部與腿部。作為少數(shù)的華人面孔,王煜教授成為了 Matthew 的第一個畢業(yè)博士生。

1989年,王煜教授獲得 CMU 機械工程博士學位后,分別在美國馬里蘭大學、新加坡國立大學及香港中文大學任職,后在2015年與李澤湘教授共同創(chuàng)辦了香港科技大學機器人研究院,并擔任港科大機器人創(chuàng)始院長。

此外,王煜教授還獲得過 973 首席科學家、國家杰青、長江學者特聘教授、國家科技進步二等獎等多份榮譽, 并曾任 IEEE Fellow、IEEE 機器人與自動化學會制造自動化技術(shù)委員會主席以及 IEEE TASE 主編。

戴盟機器人王煜:「具身技能」才能發(fā)揮人形機器人的作用 | 具身智能十人談

2021年末,王煜教授與學生段江嘩博士共同創(chuàng)立戴盟機器人,致力于深度融合 AI 和機器人技術(shù),研發(fā)和生產(chǎn)真正可商用的多系列通用仿人機器人產(chǎn)品。

今年3月,戴盟機器人發(fā)布首款心靈手巧型人形機器人 Sparky 1。

Sparky 1 擁有持續(xù)自主學習的智能大腦,多自由度仿人關(guān)節(jié),多維觸覺感知五指靈巧手,可通過外骨骼方案收集的遙操作數(shù)據(jù)進行機器人學習,技能包括但不限于插線束接口、焊接電路板、滴試劑、熨衣服、倒酒、物體分揀、整理書架……解鎖了人形機器人在工業(yè)、研發(fā)、家庭、商業(yè)等多個場景的可能性。

Sparky 1 能實現(xiàn)「心靈手巧」離不開三大自研法寶:多模態(tài)集成技術(shù)、新型視觸覺傳感器和集成了視觸覺傳感器的五指靈巧手。

解決精細操作問題,成為了王煜教授與戴盟機器人的首要目標。

以下是 AI 科技評論與王煜教授的對話,內(nèi)容經(jīng)過不改原意的編輯:


觸覺是精細操作的關(guān)鍵

AI 科技評論:您在2021年成立戴盟機器人,當時的契機是什么呢?

王煜:最主要是為了轉(zhuǎn)化科研成果。經(jīng)過多年的研究與實踐,我深刻認識到觸覺傳感在人形機器人領(lǐng)域的重要性。隨著人形機器人技術(shù)的不斷進步和市場需求的日益增長,我認為,觸覺傳感器技術(shù)已經(jīng)成熟,具備了轉(zhuǎn)化為商業(yè)產(chǎn)品的潛力和條件。這一轉(zhuǎn)化不僅能夠推動人形機器人技術(shù)的發(fā)展,也將為其商業(yè)落地帶來新的可能。

AI 科技評論:戴盟機器人為什么會將重點放在觸覺傳感器上呢?

王煜:有這樣一個視頻,一個眼睛圓圓的小女孩,視力很好,但她的皮膚卻沒有感知,當她想從火柴盒里取出火柴并點火時,能看得清清楚楚的她卻需要比平常人花上多 5 倍的時間才能成功。

這個案例說明了觸覺對精細操作的重要性,如果沒有掌握到真正的操作能力和足夠的信息,即使是看似簡單的操作,如用螺絲刀擰螺絲,也難以完成,因為這需要真正的技能和手感。雖然 AI 和機器人技術(shù)在某些領(lǐng)域取得了進展,但在執(zhí)行更復雜的任務時,仍然存在局限性。更精細的操作能力和真正的技能是目前技術(shù)難以實現(xiàn)的,不能光靠視覺和強化學習。

具體來說,從視覺和圖像出發(fā)可以建立多個 pick and place 模型,實現(xiàn)位移。但精細操作還需要手能做功,根據(jù)力的反饋做精細運動,就像工業(yè)界裝配中存在公差,比如擰螺絲時空隙較小,需要更大的力,所以需要熟練工人操作,這就是技能的問題。

戴盟想要做有精細操作能力的機器人,有了觸覺傳感和手,機器人就可以自己探索、學習、掌握技能。如果把具身智能稱為大腦,那么中腦或小腦則是大關(guān)節(jié)控制,精細操作為細小腦,也可叫「具身技能」,需要有硬件、學習方法、數(shù)據(jù)的支持。不到具身技能的層次其實無法發(fā)揮人形機器人的作用,我們不能只有pick and place,比如拖地這個操作不止是拿起拖把,還需要用力拖地。

戴盟機器人王煜:「具身技能」才能發(fā)揮人形機器人的作用 | 具身智能十人談

AI 科技評論:那現(xiàn)在觸覺的探索有什么新發(fā)現(xiàn)以及有哪些技術(shù)路徑呢?

王煜:前沿科研探索發(fā)現(xiàn),人手的神經(jīng)有三類,有一些神經(jīng)能記住手指受力變形中半秒鐘的變化,還會利用半秒以前變形的歷史指導下一步。這意味著部分手部操作不需要大腦控制,觸感信息的處理在手上的神經(jīng)系統(tǒng)就可以完成計算。當然,在新的、復雜的環(huán)境,就需要大腦的參與。

靈巧手的手指需要有觸覺傳感器收集信息、進行力反饋,還要能控制。主要是兩種思路:一是產(chǎn)生數(shù)據(jù)后學習,建立多個小模型再整合,如開蓋、擰螺絲等不同操作各有小模型;二是由數(shù)據(jù)驅(qū)動,像人一樣學技能,類似馬斯克機器人的端到端神經(jīng)網(wǎng)絡,甚至不一定需要全面的模型。

但無論哪種方法,最基本的要求是,靈巧手的功能要做到足夠好,觸覺傳感信息充足,人手與機器人靈巧手的觸覺信息都需要采集,這也是戴盟十分重視的環(huán)節(jié)。


把靈巧手做到極致

AI 科技評論:那在「具身技能」這樣的關(guān)鍵點上,除了觸覺傳感器之外,您認為還需要哪些關(guān)鍵的技術(shù)?

王煜:除了觸覺傳感技術(shù)外,靈巧手是否「夠精致」,同樣十分關(guān)鍵。如果偷工減料,技能表現(xiàn)將大打折扣。因此,追求極致的精細度至關(guān)重要,比如電機夠多夠好,盡管這可能會導致成本上升。

目前市場上較為暢銷的產(chǎn)品通常只有9個自由度,而像馬斯克所提的至少需要12-15個自由度。如果產(chǎn)品不能達到高標準,就無法滿足高技能要求,進行有效操作。只有保證基礎(chǔ)牢固后,我們才能去探究如果精細操作出現(xiàn)問題,到底是傳感信息不足、學習方法不當還是模型不完善。當然,自由度低的靈巧手成本更低,肯定有特定的應用場景,但無法滿足很多技能需求。

不過戴盟從一開始就致力于將手部做到極致,再根據(jù)需求降維開發(fā)不同的產(chǎn)品,即當產(chǎn)品不需要高級技能時,我們可以降低成本,減少自由度,但需要明確的是,往下走的路很清楚,但更需要做到往上走,即當有高級技能需求時,我們的產(chǎn)品也能滿足。

這其實和波士頓動力的理念是相似的,他們是將腿部做到極致,賦予了機器人強大的能力。我們認為,只有通過這種方式,才能充分發(fā)揮機器人的潛力,并根據(jù)市場需求定義產(chǎn)品,同時控制好價格。

戴盟機器人王煜:「具身技能」才能發(fā)揮人形機器人的作用 | 具身智能十人談

AI 科技評論:您在之前的采訪中提到,機器人的「靈巧手」比「足」更難發(fā)展,這是為什么呢?

王煜:主要問題在于靈巧手手部操作的難度較高,與腿部操作不同,手部操作的難點不在于動力學本身,而在于與物體互動時達到一定技能水平的工作。

簡單來說,靈巧手的硬件技術(shù)尚未跟上。手的硬件比身體和腿都難做,進程較慢,以前手指關(guān)節(jié)的驅(qū)動系統(tǒng)使用線纜拉動,會存在反饋時間延遲,影響操作效率。但現(xiàn)在的全電又對空間有要求,空間有限,電機得做得越來越小,優(yōu)質(zhì)的電機還很貴,每個約1萬人民幣,想做15個自由度的靈巧手,光電機的成本就15萬了,所以現(xiàn)在每家企業(yè)都需要有自研電機的人才。

軟件方面,靈巧手的進展也相對落后。與已廣泛應用于工業(yè)自動化領(lǐng)域、通過預編程控制的夾爪或機械手不同,靈巧手的抓取模型等都不夠完善,目前還做不到將精細操作技能反映在程序中,實現(xiàn)自動化操作。

我們這批最早研究靈巧手的人一開始認為精細操作和技能是物理問題,只需做好模型后解決控制即可,后來發(fā)現(xiàn)涉及的因素太多,物理模型無法準確覆蓋。機器人的手是硬的,人手卻是軟的,因此模型并不準確,不是真實物體的模型,但如果要做真實人手的物理模型,很容易發(fā)現(xiàn),這是做不完的。

另外,傳感技術(shù)也存在不足,手部缺乏足夠的物理信息反饋,這影響了操作的精確性。而且,如果僅依賴視覺反饋,信息量也是不夠的。因此,自 2012 年 Schunk 的 SVH 靈巧手以來,靈巧手的發(fā)展相對緩慢,盡管有了一些進展,但整體上仍然面臨挑戰(zhàn)。

與之相比,腿部硬件的發(fā)展較為成熟,從大功率到全電動,國內(nèi)外已經(jīng)形成了一條完整的發(fā)展路徑,成本也得到了有效控制。從全球來看,波士頓動力表現(xiàn)最為出色,其最新的產(chǎn)品完全摒棄了機械性,轉(zhuǎn)而采用全電動,成功解決了復雜的動力學問題,實現(xiàn)了精確控制,甚至能夠完成翻跟頭等動作。值得關(guān)注的是,模型預測控制(MPC)在1980年左右被開發(fā)出來在石化領(lǐng)域普及應用,而波士頓動力堅持將 MPC 控制人形機器人這條路走通了,這如今成為他們的招牌技術(shù),也給現(xiàn)在的人形機器人控制奠定了良好的基礎(chǔ)。

戴盟機器人王煜:「具身技能」才能發(fā)揮人形機器人的作用 | 具身智能十人談

正在倒酒的 Sparky 1


人形機器人不能只依賴視覺模仿學習

AI 科技評論:感覺您對「大腦」的態(tài)度比較謹慎,那您認為人形機器人還需要在哪些技術(shù)方向做出突破呢?

王煜:最近十年,AI 技術(shù)的發(fā)展打破了機器人傳統(tǒng)的 pick and place 模式,具備基礎(chǔ)的理解能力以及能做更智能的操作規(guī)劃?,F(xiàn)在人形機器人行業(yè)內(nèi)引領(lǐng)潮流的是 AI 大模型與視覺圖像,這種思路更重視「大腦」、與人的交互,成果也比較直觀,比如在家庭場景中最重要的是機器人如何理解人的需求,在人餓的時候拿來食物、甚至用微波爐加熱,但需要注意的是,具體到執(zhí)行切蘋果的操作技能,中小腦、甚至是細小腦就十分重要了。

隨著 AI 大模型的興起,通過視覺技術(shù)和模仿學習,簡單的二指或三指就可以實現(xiàn)基礎(chǔ)的拖拽操作。但實際上,現(xiàn)在只能完成一些抓取杯子、倒水或洗碗的簡單任務,在更復雜的工業(yè)和家庭場景中遠遠不夠。

值得關(guān)注的是,操作技能不可僅依賴基于視覺感知的模仿學習,僅依靠視覺感知不夠,需要在收集的數(shù)據(jù)中引入觸覺信息。有的技術(shù)思路是自研數(shù)據(jù)采集手套,由人帶上后采集信息,并讓機器人也帶上同樣的手套?,F(xiàn)在進展比較好的是由人帶上兩指爪,并安裝上相機假裝洗碗,然后機器人通過模仿學習在旁邊洗碗。但碗如果太重太滑,沒有及時調(diào)整,這就是沒掌握好技能。

我們需要認識到技能的重要性和難度,盡管觸覺傳感器技術(shù)太難、成本太高、很少人做,但依舊有往這方面突破的強需求,因此戴盟還有市場空間。

AI 科技評論:在您看來,人形機器人會在哪些場景率先商業(yè)落地,戴盟對此有什么計劃?

王煜:主要還是工業(yè)場景。比如汽車裝配有大操作和小操作,雖然大操作更多,但只要有工具就會有小操作。包括半導體生產(chǎn)線,每個工人負責一道工序,但如果人形機器人只學一個技能、替代一個工人,實在是太浪費了。機器人需要能適應不同的任務,要代替至少5個工人做精細化操作才有價值。

工業(yè)場景對「大腦」的要求相對低些,因為做的事情很具體,甚至不需要理解,比如現(xiàn)在的工業(yè)機器人在特定場景下執(zhí)行固定流程的任務。難度更高的任務需要使用工具,具體執(zhí)行是做功,需要根據(jù)力和加速度信息執(zhí)行,比如抬起、安裝輪胎,就是一個突然加速到突然減速的過程。

戴盟下一步會先把觸覺靈巧手和含觸覺的上肢操作模型做好,先走入高校科研單位,因為價值在科研單位被認識到就會培養(yǎng)一批有想法的人才。在工業(yè)場景,比如柔性物料和精密裝配的自動化,如果戴盟的靈巧手能夠?qū)崿F(xiàn)無可替代的操作能力的話,商業(yè)價值自然會被認可。


本文作者 anna042023 將持續(xù)關(guān)注具身智能領(lǐng)域的人事、企業(yè)、商業(yè)應用以及行業(yè)發(fā)展趨勢,歡迎添加交流,互通有無。雷峰網(wǎng)雷峰網(wǎng)(公眾號:雷峰網(wǎng))


雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知

戴盟機器人王煜:「具身技能」才能發(fā)揮人形機器人的作用 | 具身智能十人談

分享:
相關(guān)文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說