0
本文作者: 饒舒瑋 | 2024-05-30 16:06 | 專題:ICRA 2017:創(chuàng)新、創(chuàng)業(yè)和解決方法 |
隨著人工智能技術的飛速發(fā)展,具身智能作為其重要的分支,正逐漸成為科技界關注的焦點。雷峰網(wǎng)(公眾號:雷峰網(wǎng))特此推出"具身智能十人談"系列文章,旨在深入探討這一領域的前沿動態(tài)、技術挑戰(zhàn)和未來趨勢,為我們的讀者提供深度的行業(yè)洞察和思考。
作為該系列的開篇之作,我們有幸邀請到了ICRA 2024大會主席、機器人學領域的杰出專家王志東教授,分享他對具身智能崛起之路的深刻見解。王教授不僅回顧了機器人學的發(fā)展歷程,更特別強調了中國在這一領域的快速崛起,以及技術融合如何推動行業(yè)的創(chuàng)新和健康發(fā)展。
我們希望通過"具身智能十人談"系列,搭建一個開放、多元的交流平臺,匯聚來自學術界、產業(yè)界不同視角的聲音,共同推動具身智能領域的進步。同時,我們也非常高興地預告,"具身智能十人談"系列的第二篇文章將帶來聯(lián)想集團CTO芮勇博士的精彩觀點。芮博士作為人工智能領域的資深專家,將從企業(yè)實踐的角度,為我們解讀具身智能在產業(yè)應用中的機遇與挑戰(zhàn),敬請期待。
作者丨饒舒瑋
編輯丨岑峰
ICRA 2024 的舉辦地點在日本橫濱,距大會主席王志東所工作的千葉工業(yè)大學大約1小時車程。這短短的距離,凝聚了多年來他在機器人學領域的不懈追求和深厚積累。
面對規(guī)模超過七千人的盛會,王志東和他的團隊前后花費了兩年多的時間來準備。在大會期間,他與同樣擔任過 ICRA 或者其姊妹會議 IROS 大會主席的老朋友們——包括南方科技大學的孟慶虎教授、張宏教授、香港中文大學的劉云輝教授、香港科技大學(廣州)的馬書根教授、德國漢堡大學的張建偉教授等人得以相見。一起吃飯時,王志東所談的第一個感受就是“累壞了”,而朋友們則是恭喜他,因為“你終于上岸了”。
也正因為在組織大會上花費了大量精力,王志東在采訪中謙遜地表示自己沒能及時關注到日新月異的行業(yè)變化。盡管如此,憑借著深耕領域數(shù)十年的經(jīng)驗,王志東往往能一眼看出一些熱潮之下的本質,并對其始終保持“技術至上”的務實態(tài)度?!安灰忸欀s潮流,要真正把技術做扎實做好?!边@是王志東對于整個行業(yè)向前健康發(fā)展的建議。
1989年,王志東來到日本東北大學開始他的碩士學習,1992年是他的博士生涯的開始。同一年,日本“第五代計算機”項目正式宣告失敗,日本 AI 行業(yè)的輝煌時代正式落幕。從日本早稻田大學加藤一郎教授團隊研發(fā)出世界上第一個人形機器人,到“五代機”這一持續(xù)數(shù)年、耗資巨大的項目流產,行業(yè)急轉直下的境況與決策失誤、方向選擇不無關系。
而此后數(shù)年,日本國內對于深度學習等前沿技術不夠開放的態(tài)度,更是讓其 AI 行業(yè)再難有泉涌式的爆發(fā)熱度。或許正因為是日本 AI 行業(yè)浮沉的旁觀者,王志東對于方向有更深刻的理解。也許光有技術并不是全部,找準大方向,才是事半功倍的選擇。
如今,隨著全球人工智能的發(fā)展進入一個新的階段,機器人領域也迎來了新一輪的井噴。
王志東將 ICRA 大會這些年人數(shù)增長歸因于整個行業(yè)的蓬勃發(fā)展。機器人行業(yè)不斷的增長,研究領域的不斷擴大,還有人工智能的出現(xiàn),這方面使得這一領域加入了很多新人。
其中,奮起直追的中國在這一領域已經(jīng)成為不容忽視的存在。王志東很明顯地感受到,近些年,中國在機器人領域和AI領域的影響力肉眼可見地提升了。相較于往年,王志東驚喜地發(fā)現(xiàn)在大會上、頂刊里、展會上都能看到越來越多中國面孔的出現(xiàn)。在今年的 ICRA ,中國團隊的參會人數(shù)更是創(chuàng)了新高。作為同胞,王志東希望能將 ICRA 大會辦成一個連接中國和世界的橋梁。
談及我們所關注的具身智能,王志東教授對未來充滿了期待。他認為,具身智能是機器人學未來發(fā)展的關鍵方向之一,它涉及到機器人本體設計、控制和系統(tǒng)集成等多個方面。盡管目前人形機器人尚未達到如人類般自由行動的水平,但他相信,隨著技術的不斷進步,具身智能將為機器人技術帶來革命性的突破。
在這個春意盎然的季節(jié),在 ICRA 2024 的大會現(xiàn)場,我們有幸與王志東教授進行了一次深入的對話,探求他對于具身智能、機器人領域和未來技術趨勢的思考。
AI科技評論:對于現(xiàn)在討論度很高的具身智能,您怎么看待這股熱潮?
王志東:具身智能現(xiàn)在熱度很高,但我認為如果機器人本體做得不夠好,那么這個瓶頸就在那兒了,即使有智能層面的加成,也還是沒辦法實現(xiàn)突破性的進展。
對于具身智能,結合這些年的研究趨勢,我有兩點思考:
第一個是,其實 AI 出來的時候,ChatGPT 也好還是別的也好,它是找到一個 application 作為落點,讓大家比較容易知道,其實所謂的系統(tǒng)模型很早就開始做了,是已經(jīng)做到一定程度了才有了重大進展。
然后這個行業(yè)跟風涌進來了幾百個公司,但一年之后這些公司百分之八十、九十都不存在了,這個說明什么?說明怎么運用好這個技術才是關鍵,有哪些東西能真正延續(xù)下去,這個才是我們需要思考的大模型的真正意義。
從我參加各種各樣的論壇經(jīng)驗來看,發(fā)展就是不斷尋找道路的過程?,F(xiàn)在大家都在思考如何將大語言模型和機器人融合,其中機器人的運動控制是個挑戰(zhàn)。我在這次 ICRA 2024 會議里已經(jīng)聽到有一些新的想法在冒頭了,估計兩三年肯定又有一套新的東西出來了。
第二個就是機器人的控制問題。具身是 embodied,顧名思義,和身體相結合的東西。機器人的體型是高是矮,動作設計都不盡相同,這些都和整體的控制相關。
在方面,其實有很多東西可以做。就像波士頓動力所展示的產品視頻一樣,看起來可能沒什么,但背后有很高的技術含量,至少以國內現(xiàn)有的水平要做到像他們那樣,還有很多工作要做。
但就像我經(jīng)常和日本學生說的那樣,因為中國有人口優(yōu)勢,所以只要繼續(xù)朝著這一方面努力鉆研,會有超越世界的一天,對此我比較有信心。
當下需要注意的是,如何把一項東西研究透,這點很重要,然后就是把握好機器人領域的方向性。如果把目標定為“超過 Boston Dynamics ”,那這樣的想法只會讓你成為另外一個 Boston Dynamics。這個行業(yè)最終要往哪個方向走?怎么做得更好?這是需要思考的問題。
AI科技評論:相較于機器人本體,ICRA 2024 大會會更側重于對機器人智能的研究嗎?現(xiàn)在行業(yè)的目光都聚焦在哪些方向?
王志東:從會議收錄的論文來看,機器人學習與智能這一方向確實是最多人關注的。其中可以提煉出三個 keywords——醫(yī)療、機器人的作業(yè)和導航。這些方向在如今大熱的汽車自動駕駛或者是別的方面都能體現(xiàn)出來。
但是像人形機器人,大家對它的想象中還停留在和機器人對下象棋,可這不是一個目標,這只是一個基準。我的夫人有時候會和我說,你趕緊設計一個能和我爸聊天的機器人,這就是一個助老助殘機器人的方向,但這個產業(yè)能不能形成,還有很多因素影響,比如系統(tǒng)控制的技術能不能達到設想的水平。
據(jù)我對 ICRA 大會的觀察,現(xiàn)在大家都在關注,怎么把人工智能領域的新方法運用在機器人上,并對其進行改造發(fā)展,我覺得這是很大的嘗試。有人說這不算創(chuàng)新,我不認為會是這樣。所有的行業(yè)都是通過把別的領域的東西拿過來,通過改造發(fā)展才成為了自己的東西。
我覺得最大的方向不在于怎么提高智能,而是如何把現(xiàn)在人工智能的好模型、好的方向性拿到機器人這個領域里頭,如何在實際場景中真正應用起來,把它能做到就像是一個新的方向性,新的產業(yè)出來,我個人感覺這是這個行業(yè)最大的挑戰(zhàn)。這就是我們所講的具身智能。因為我的研究的方向主要是機器人和人之間的協(xié)調。在我看來,在機器人和人之間的協(xié)調是很重要的東西。就像講到螞蟻,很簡單的智能,但可以做很多事?,F(xiàn)在人工智能這些系統(tǒng)不斷的增加,對我們有很大的幫助。所以現(xiàn)在大家都很努力地想把這些東西拿出來,我覺得這是目前行業(yè)最大的一個方向性。
AI科技評論:您怎么看待具身智能跟 AGI 之間的關系,你們機器人領域會談 AGI 這個事嗎?
王志東:通用人工智能的話,我相信它也是分開來看的,并不是說將來全人類全部適用一個通用的大腦,對不對?特別是搞研究的人,也有存在不同的方向性或者不同的特點。我的一些研究人工智能的朋友,他們也不是除了人工智能之外的事都不關注,他們也在不斷詢問如何實現(xiàn)實際應用。
其次,從機器人廠商出展的情況來看也可以了解到,雖然他們沒有必須線下參加的必要,但他們還是來了,為什么呢?因為這是機器人領域的頂會,他們可以借此機會了解到很多領域內的發(fā)展趨勢。舉個例子,小孩走路的老摔或者拿東西老倒,但人長大后現(xiàn)在不倒了。這學習的實質,這其中的邏輯,其實對人工智能是很大的一個方向。對于機器人廠商而言,他們也會不斷和這方面接觸,所以這方面的融合是肯定存在的。
所以,并不是說研究人工智能和研究機器人完全是分開的兩撥人。更何況,機器人內里有很多互相嵌入的東西,沒有辦法完全獨立開來,包括 planning 類的東西。
AI科技評論:learning 等于 intelligence 嗎?
王志東:并不是。因為我是研究機器人抓取手這一方面的,我們在研究的時候就發(fā)現(xiàn),對在確定位置上的物體,機器人是可以很好做到抓取的動作,但是如果位置不確定不精準,對于機器人就很難實現(xiàn)這個動作??扇四茉谖矬w還沒到固定位置的時候,就預判其動線,在有不確定因素的情況下也能實現(xiàn)抓取動作,這是人類很強的一個智能表現(xiàn),這個動作本身就蘊含了策略的智慧和控制的智慧。
所以智能并不是說一定要通過 AI 或者算出來的才是智能,這些東西也都是智能。從控制上來看,包括走路、拿東西的動作,人的慣用動作都是最省力穩(wěn)定的,這里面有大學問,是有很多“智能”在里面的。
所以如果說 learning 是 intelligence,這是不對的,但是通過 learning 可以增加 intelligence,可以在 learning 的過程中提高 intelligence 的質量。
AI科技評論:單就機器人這個領域而言,對于現(xiàn)在人形機器人的研究浪潮,您是怎么看的?
王志東:我認為,要搞好人形機器人比起單純地做好 vision 或者 ChatGPT 要難得多。因為一個人形機器人集合了很多領域的東西,包括 hardware、control 以及 system integration。怎么能把這些東西都做好,這不是個簡單事兒。
我也有了解到一些人形機器人產品,比如國內的 Unitree 就做得很不錯,但是要說它完全能夠達到和人一樣自由自在的動態(tài)行動,還有一些距離。就機器人公司來說,我個人觀點認為,Boston Dynamics 相較于 Unitree,在控制上會做得更精細。
AI科技評論:像宇樹他們把那個機器人成本降到九萬九的價格,這個在中國的媒體上也引起了比較多的討論,您怎么看待硬件成本下降這一情況?
王志東:對于機器人這個領域而言,硬件成本下降是非常重要的內容。我個人覺得,降成本會讓更多人參與進這個領域,以后更多人使用,就可以做出更多的平臺。人工智能為什么能發(fā)展?因為大家都把東西放在 GitHub 上去,誰都可以用了,所以大家都可以不斷地把這項技術提升。但硬件你不可能免費共享,對吧?如果能把參與門檻降低,到大家都可以用的程度的話,這自然最好。
英偉達的發(fā)展也是如此,他們在過去把 GPU 研究出來,然后利用這個從各方面把 application 積累出來。硬件做得好,做得便宜,用的人多了,發(fā)展方向自然也就多了,將來肯定會有突破性進展。
我個人認為,宇樹這種產品的出現(xiàn)是一個很好的現(xiàn)象。因為國內也有很多廠家在做人形機器人,不同的水平,就意味著不同的狀況,每一款人形機器人之間都是有差異的,技術難度也會不一樣,未來對于社會的影響也是不一樣的。但是可以預測到的是,越多人做,就越有可能實現(xiàn)行業(yè)新的突破口,這是向好的趨勢。同時,我也覺得在機器人方面,研究范圍可以再擴寬一些,不一定要光盯著人形機器人。
AI科技評論:在 ICRA 2024 上,人形機器人的討論度如何?
王志東:人形機器人是其中一個很重要的方向,但我個人覺得,這個大會討論度更高的其實是 learning 和人工智能。如何將最新的人工智能技術、最新的 vision 技術和機器人技術進行融合,這個方向的發(fā)展是我覺得最關鍵的,也是大會最多討論的。
人形機器人并不是能夠創(chuàng)造出新產業(yè)的一個方向。但是有關人形機器人的研究會影響到整個機器人行業(yè)的 system integration 和 intelligent integration 水平。
比如要做一個人形機器人,這個機械臂要怎么設計?像工業(yè)機器人的技術怎么適配到這種體型上,同時還要考慮機器人集成控制的能力。
人形機器人相當于一個萬能的集合,包括優(yōu)化設計和多任務處理能力,就像是個試驗臺。你把人形機器人做好了,你要做好別的東西就游刃有余很多。
現(xiàn)在有些觀點認為,做好了人形機器人,就可以創(chuàng)造出一個完全新的產業(yè),甚至于可以代替汽車的程度。我個人覺得至少現(xiàn)在還看不出來。但如果是讓人形機器人實現(xiàn)物流行業(yè)的“最后一公里”,實現(xiàn)精準定位的送貨上門,這個場景我覺得有可能實現(xiàn)??墒菚粫纱水a生一個全新的產業(yè),我保持懷疑態(tài)度。
尋找產業(yè)落地的出路
AI科技評論:我看這次展會波士頓只派代理商過來,但沒有實際展出產品,所以有人在討論是不是波士頓在走下坡路,您是怎么看待的?
王志東:我不這樣認為。從開發(fā)者的視角來看,其實公司有新的產品,沒有必要特意運過來參展,拍個視頻在網(wǎng)上展示也是一樣的效果。他們現(xiàn)在更大的任務是將技術推廣到實際,因為如果沒辦法投產應用,那么就沒辦法盈利,結果可能又要面臨出售公司的情況。這也是作為一個高科技企業(yè)的挑戰(zhàn)。
從另一方面來看,這個情況也說明了現(xiàn)在除了參展之外,還有很多方式可以展現(xiàn)產品。所以這次中國很多企業(yè)愿意來參展,我非常驚喜。同時需要看見的是,在網(wǎng)上刷屏賺足眼球并不能證明什么,很多東西是要扎扎實實干的。就像 Elon Musk 所宣傳的人形機器人目前還沒看到真的動作展示,在網(wǎng)上聲量卻很大,卻不一定是真的能做到宣傳的效果,說明這個人形機器人其實還是有很多富有挑戰(zhàn)性的東西需要解決。
AI科技評論:我還注意到在這次 ICRA 上有很多家庭機器人的研究,您之前也發(fā)表過關于深度交互,機器人進入家庭生活這么一個趨勢,您感覺今年有一些比較大的 Leap 嗎?
王志東:我相信很快就會有。我個人觀點現(xiàn)在預估有兩個方向能實現(xiàn)快速發(fā)展。
第一個是 logistics物流相關的,因為需求太多了。比如 Boston Dynamics 就有在搞這些卡車裝載紙箱的自動卸貨的系統(tǒng)開發(fā)。但是倉儲電商的取貨過程做得算是比較好了,而裝盒這一環(huán)節(jié)卻還沒有大的進展。考慮到現(xiàn)在電商對于物流方面的需求,這些支脈的自動化需求量也會非常大。
這個其實是和市場相關的,有 Eco(生態(tài)經(jīng)濟)就能夠產生價值。所以說為什么 Amazon 很早能夠成功?他們在早期就收購了 kiva robot,一個能夠載著臺子到處跑的機器人,這是革命性的東西,給電商網(wǎng)購行業(yè)的發(fā)展提供了非常重要的支撐。但卻沒能帶動革命了整個產業(yè),現(xiàn)在還需要人工在環(huán)節(jié)中。所以現(xiàn)在大家都在強調方向性。因為我是搞輔助機器人的,所以我認為輔助機器人協(xié)調這一塊如果能發(fā)展起來的話,會有很大的價值。
第二個就是剛剛講到的家庭機器人。對于這個東西,大家關注度都很高。大家會開始想在家庭或者各種情況下怎么進行 planning,怎么進行 manipulation?怎么進行 task ?我聽到有一個 workshop 大部分都講這事,所以看得出大家對這些比較熱心。但你說明年就會實現(xiàn)重大進展嗎?我不敢打包票,但不遠的將來肯定會有發(fā)展。
AI科技評論:我注意到日本它有一個 moonshot 登月計劃,大會上也圍繞著這個計劃做很多相關的展覽,現(xiàn)在日本的機器人行業(yè)是什么樣的現(xiàn)狀?對于中國機器人行業(yè)的發(fā)展有何建議?
王志東:這個 moonshot program 最大 project 的 leader 就是我們 ICRA 2024 的Advisory Committee Vice Chair——Toshio Fukuda先生。這個 project 集中了日本很多水平比較高的教授研究員的團隊。日本的這個登月計劃是給出了一個方向,就是要瞄準我們現(xiàn)在還完全不可能實現(xiàn)的目標,希望多年以后在一些領域有突破性的技術。
因為日本這些年在科技上的投資比較少,做出的成果也比較少,像 ASIMO 這樣的機器人研發(fā)工作也停了,沒有什么新的東西出現(xiàn),所以 professor Toshio Fukuda比較有緊迫感,他希望在今后十年里頭,通過集智聚力在幾個技術層面的沖刺,能夠把日本機器人領域的研究水平拉上去,提高到一定的水準。
據(jù)我觀察,國內現(xiàn)在很多研究的方向性很好。人形機器人也是一個很好的方向,但我還沒搞清楚它背后的技術難題。做好人形機器人這一塊是有意義的,但是在什么時機研究這些比較合適,我還不太清楚。如果能通過這些東西,像日本的登月計劃一樣,把科技水準提升到一個新階段,那么對今后發(fā)展會有很大的幫助。我的建議是,擴寬研究的著眼點,不一定要完全跟著別人做,不要光顧著趕潮流,要真正把技術做扎實做好。
王志東:ICRA 每三年在亞洲、歐洲、美國輪番舉辦。ICRA2024是第三次在日本舉辦的ICRA。前幾年的會議大概是 4000 人左右的規(guī)模。去年在倫敦的時候,注冊參會者規(guī)模已經(jīng)達到 5000 多人,而今年的注冊線下參會人數(shù)比我們預想的還要多,估計有超過 6500 人,增加了百分之二十,加上在線參會人士,這個規(guī)模可能會達到7000。
這些年參會人數(shù)增長的原因,我猜測有兩個,其一是機器人行業(yè)不斷的增長,包括有從自動駕駛轉行的,有傳統(tǒng)做人形機器人、工業(yè)機器人的,還有人工智能的出現(xiàn),使得這一領域加入了很多新人。其二是,我們中國包括參展商、參會師生都增加了很多。從數(shù)據(jù)來看,去年在倫敦辦會的時候,中國參會者大概只有 300 人,今年的中國團隊來了有 1100 人左右,人數(shù)同比漲了3到4倍。
我希望能將 ICRA 辦成一座橋梁,起到連接各國和世界的作用,這是我作為大會主席能想象到的最滿足的事了。
AI科技評論:此次大會上, 據(jù)您觀察中國參賽者表現(xiàn)如何?
王志東:在這次 ICRA 2024 上,中國的論文投稿數(shù)排行第一,錄取數(shù)是第二,稍遜于美國。但就憑我的觀察來看,美國所投文章里,中國人作為 first author 的占了不小的數(shù)量。我很高興看到中國的研究實力在國際上肉眼可見地提升了。至少在我個人看來,中國已經(jīng)成為世界第二大的研究團體,排在美國之后、德國之前。不管是論文數(shù)量還是研究水平來說,我覺得國內這一領域的研究已經(jīng)達到很高的水準,未來很有希望。
就展區(qū)來看,這次大會布置有一百四十多個位置,其中中國展商就有很多,可見這個產業(yè)發(fā)展是非??善诘?。相比國內舉辦的世界機器人大會 WRC,雖然來這里參展的中國展商沒有那么多,但至少說明還是有相當一部分的企業(yè)有進軍國外市場的打算。而且他們所展出的產品做得非常好。
AI科技評論:這次您作為 chair 的身份組織會議,和以前作為嘉賓參會,感受有什么不同?
王志東:從我的感受上,第一,要組織這么大規(guī)模的會議太辛苦了,我和團隊組織了兩年多的時間。我不是第一個組織這個 ICRA 的中國人,這個會還有個姊妹會叫IROS,我有好多中國朋友,他們都以前做過 ICRA 或者 IROS 的 general chair。
比如我剛才講到的孟慶虎老師,他 2021 年就在西安組織 ICRA,還有港大的席寧老師,港科大的李澤湘老師之前也都分別組辦過ICRA。那之外還有香港中文大學的劉云輝老師,現(xiàn)在南科大的張宏老師、香港科技大廣州的馬書根老師,德國漢堡大學的張建偉,他們也都組織過 IROS,都是我的前輩。當時我和這些朋友一起吃飯,我說自己終于有機會組織這類會議,但已經(jīng)累壞了,他們開玩笑說你終于上岸了。
第二個最大的感受是,我們所在的行業(yè)在不斷增長,越來越活躍,中國的水平越來越高。以前我們的文章投進去過不了,現(xiàn)在不僅投進去過了,還過了不少。雖然采用率的數(shù)字上沒有達到和美國比肩的程度,但中國文章的采用率確實在不斷上漲。更值一提的是ICRA2024有12個最佳論文獎項,其中3個最佳論文獎的獲獎論文是來自中國大陸的。這是以前沒有過的。10個技術方向的最佳論文獎中,華中科大的研究團隊獲得最佳機構與設計論文,浙大的研究團隊獲得最佳Vision論文,兩項技術最佳論文大獎。2個ICRA最佳會議論文獎中,中科院沈自所的研究團隊獲得最佳大會學生論文獎。希望這些成績能激勵到更多的老師同學們,在今后創(chuàng)造出更多更好的成果展示在世界舞臺。
ICRA 2024 獲獎信息詳見:https://2024.ieee-icra.org/awards-and-finalists/
雷峰網(wǎng)雷峰網(wǎng)雷峰網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉載。詳情見轉載須知。
本專題其他文章