丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

<label id="qtdnu"></label>

<li id="qtdnu"><legend id="qtdnu"></legend></li>

<span id="qtdnu"></span>

<label id="99bra"></label>

<span id="99bra"></span>

您正在使用IE低版瀏覽器，為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn)，強(qiáng)烈建議使用更快更安全的瀏覽器

此為臨時(shí)鏈接，僅用于文章預(yù)覽，將在時(shí)失效

業(yè)界正文

發(fā)私信給nebula

發(fā)送

0

智源舉辦2024具身與世界模型專題峰會(huì) 產(chǎn)學(xué)研共促技術(shù)創(chuàng)新與產(chǎn)業(yè)應(yīng)用

本文作者： nebula

2024-11-08 16:07

導(dǎo)語(yǔ)：2024年11月5日，北京智源人工智能研究院主辦的“智源論壇·2024具身與世界模型專題峰會(huì)”在智源大廈舉行。

2024年11月5日，北京智源人工智能研究院主辦的“智源論壇·2024具身與世界模型專題峰會(huì)”在智源大廈舉行，智源研究院理事長(zhǎng)黃鐵軍、智源研究院院長(zhǎng)王仲遠(yuǎn)、智源研究院副院長(zhǎng)林詠華出席大會(huì)。智源具身多模態(tài)大模型研究中心負(fù)責(zé)人、北京大學(xué)研究員仉尚航，智源具身智能研究中心負(fù)責(zé)人、北京大學(xué)助理教授、銀河通用創(chuàng)始人王鶴，Google DeepMind研究科學(xué)家，谷歌RT1、2，SayCan作者Ted Xiao以及來(lái)自清華大學(xué)、香港大學(xué)、康奈爾大學(xué)、UC Berkeley、英國(guó)曼徹斯特大學(xué)、大灣區(qū)大學(xué)（籌），中國(guó)科學(xué)院等知名高校和研究機(jī)構(gòu)的學(xué)者專家，加速進(jìn)化、傅利葉、樂(lè)聚機(jī)器人、星塵智能等具身智能頭部企業(yè)的創(chuàng)始人、CEO圍繞具身智能和世界模型的前沿方向、技術(shù)實(shí)踐進(jìn)行了主題分享與深度探討。

智源舉辦2024具身與世界模型專題峰會(huì) 產(chǎn)學(xué)研共促技術(shù)創(chuàng)新與產(chǎn)業(yè)應(yīng)用

具身智能的發(fā)展，無(wú)論是硬件穩(wěn)定性，數(shù)據(jù)采集與仿真，具身大小腦模型分層架構(gòu)或者端到端技術(shù)路線，還是終端使用場(chǎng)景，都面臨諸多挑戰(zhàn)，需要產(chǎn)學(xué)研深度協(xié)同與廣泛聯(lián)動(dòng)。智源研究院院長(zhǎng)王仲遠(yuǎn)在開(kāi)幕式致辭中表示，智源研究院將依托多模態(tài)大模型技術(shù)優(yōu)勢(shì)資源，聯(lián)合北大、清華、中科院等高校院所以及銀河通用、樂(lè)聚、加速進(jìn)化、宇樹(shù)等產(chǎn)業(yè)鏈上下游企業(yè)，建設(shè)具身智能創(chuàng)新平臺(tái)，重點(diǎn)開(kāi)展數(shù)據(jù)、模型、場(chǎng)景驗(yàn)證等研究，共同打造具身智能創(chuàng)新生態(tài)。

智源具身多模態(tài)大模型研究中心創(chuàng)新地設(shè)計(jì)了面向機(jī)器人具身基礎(chǔ)模型的快慢系統(tǒng)框架，快系統(tǒng)能夠高效快速的預(yù)測(cè)末端執(zhí)行器位姿，慢系統(tǒng)則是在面對(duì)復(fù)雜和錯(cuò)誤行為時(shí)更加深入地思考和糾錯(cuò)，不斷提升機(jī)器人大腦的能力。為了實(shí)現(xiàn)該快慢系統(tǒng)框架，智源探索了具身端到端以及大小腦分層結(jié)構(gòu)的不同技術(shù)路線，進(jìn)行開(kāi)放世界泛化物體操作，并基于大腦模型進(jìn)行語(yǔ)義理解與常識(shí)推理，實(shí)現(xiàn)零樣本物體導(dǎo)航。無(wú)論是端到端模型還是分層結(jié)構(gòu)，最終都是為了讓機(jī)器人能更好地理解物理世界規(guī)律，更好地與環(huán)境交互，更好地執(zhí)行時(shí)序上的準(zhǔn)確行為。因此，智源同時(shí)提出了四維世界模型Robo4D，為世界模型構(gòu)建四維時(shí)空，以解決機(jī)器人在開(kāi)放世界中任務(wù)操作的物體泛化以及場(chǎng)景泛化等問(wèn)題。相關(guān)研究被國(guó)際旗艦會(huì)議NeurIPS 2024、ICML 2024接收。

智源具身多模態(tài)大模型研究中心利用世界模型預(yù)測(cè)機(jī)器人與環(huán)境交互后的未來(lái)事件，從而生成準(zhǔn)確的行為，提前預(yù)測(cè)行為是正確還是失敗。智源設(shè)計(jì)的世界模型的技術(shù)路徑是，首先將世界模型啟動(dòng)和響應(yīng)模態(tài)設(shè)置為視頻模態(tài)，給定關(guān)于動(dòng)作的語(yǔ)言指令和當(dāng)前機(jī)器人的狀態(tài)去生成機(jī)器人執(zhí)行完動(dòng)作后的完整視頻。針對(duì)給定的任務(wù)，模型可以完整預(yù)測(cè)任務(wù)執(zhí)行的過(guò)程，從物理世界中學(xué)習(xí)規(guī)律，生成視頻之后，通過(guò)模型將視頻轉(zhuǎn)換成機(jī)器人的行動(dòng)。其中，任務(wù)到視頻生成以及視頻到行動(dòng)的過(guò)程，利用了智源原生多模態(tài)世界模型Emu3將理解和生成大一統(tǒng)的技術(shù)思路，形成自我反思的思維鏈。

智源舉辦2024具身與世界模型專題峰會(huì) 產(chǎn)學(xué)研共促技術(shù)創(chuàng)新與產(chǎn)業(yè)應(yīng)用

智源具身多模態(tài)大模型研究中心負(fù)責(zé)人仉尚航認(rèn)為，近期的一系列工作展現(xiàn)出具身基礎(chǔ)模型的廣泛前景，中心將繼續(xù)探索具身多模態(tài)大模型與大數(shù)據(jù)構(gòu)建，踐行機(jī)器人領(lǐng)域的Scaling Law。實(shí)現(xiàn)真實(shí)世界的四維時(shí)空世界模型是邁向機(jī)器人整體AGI的重要一步。四維世界模型將作為機(jī)器人的世界基礎(chǔ)模擬器，同時(shí)具備時(shí)間與空間智能，擁有長(zhǎng)短期記憶與物理概念學(xué)習(xí)等能力，與真實(shí)物理世界進(jìn)行交互并從中得到反饋。

智源具身多模態(tài)大模型研究中心在近期的研究中將世界模型從二維拓展至四維，采用先驗(yàn)引導(dǎo)的3D Gaussian Splatting算法，基于單一視角的視頻片段生成四維世界空間。采用多輪世界空間映射模型將不同位置的世界空間映射到視頻域，最終應(yīng)用于下游任務(wù)，生成式數(shù)據(jù)提升了機(jī)器人操作的泛化性。

智源舉辦2024具身與世界模型專題峰會(huì) 產(chǎn)學(xué)研共促技術(shù)創(chuàng)新與產(chǎn)業(yè)應(yīng)用

智源具身智能研究中心負(fù)責(zé)人、北京大學(xué)助理教授、銀河通用創(chuàng)始人王鶴在特邀報(bào)告中強(qiáng)調(diào)，空間智能要注重三維信息的使用，否則對(duì)空間幾何的理解非常有限，還需注重交互智能，而交互智能背后所需的大量數(shù)據(jù)應(yīng)該用合成數(shù)據(jù)替代真實(shí)世界的數(shù)據(jù)采集，才能達(dá)到大模型所需要的數(shù)據(jù)規(guī)模，實(shí)現(xiàn)真正的泛化性。

目前，智源具身智能研究中心展開(kāi)了一系列技能的泛化研究和具身端到端大模型的訓(xùn)練研究。首先把二維真實(shí)世界看到的二維圖像升維到三維，用擴(kuò)散模型預(yù)測(cè)視差。并自研了大規(guī)模動(dòng)作數(shù)據(jù)的仿真合成技術(shù)，覆蓋了桌面物體擺放、桌面紋理、光照等各種空間形態(tài)和位置關(guān)系，在仿真器中對(duì)光線折射和反射進(jìn)行仿真并進(jìn)行渲染。目前團(tuán)隊(duì)最新的進(jìn)展是完成了10億規(guī)模的靈巧抓取數(shù)據(jù)集DexGraspNet 2.0，覆蓋了基于各種物體的大規(guī)模的抓取標(biāo)簽生成，在這樣的大規(guī)模數(shù)據(jù)上訓(xùn)練的靈巧手抓取模型率先實(shí)現(xiàn)了泛化場(chǎng)景真機(jī)成功率90%以上。

在端到端模型研發(fā)方面，團(tuán)隊(duì)訓(xùn)練了全球首個(gè)基于視頻流的端到端導(dǎo)航大模型NaVid，無(wú)需建圖，也不依賴于深度信息和里程計(jì)信息等其它傳感器信號(hào)，完全依靠機(jī)器人攝像頭采集的單視角RGB視頻流，通過(guò)Sim2Real的方式，實(shí)現(xiàn)在真實(shí)世界室內(nèi)場(chǎng)景甚至是室外場(chǎng)景的zero-shot真機(jī)泛化。近期，智源在導(dǎo)航大模型加入了三維模態(tài)，提出了端到端空間導(dǎo)航大模型NaVid-4D，該模型在一系列有更高要求的自然語(yǔ)言指令導(dǎo)航任務(wù)中實(shí)現(xiàn)了進(jìn)一步突破。

智源舉辦2024具身與世界模型專題峰會(huì) 產(chǎn)學(xué)研共促技術(shù)創(chuàng)新與產(chǎn)業(yè)應(yīng)用

大會(huì)期間，智源研究院院長(zhǎng)王仲遠(yuǎn)主持具身智能技術(shù)與應(yīng)用發(fā)展前沿展望圓桌討論，清華大學(xué)自動(dòng)化系教授，加速進(jìn)化聯(lián)合創(chuàng)始人趙明國(guó)，智源具身智能研究中心負(fù)責(zé)人、北京大學(xué)助理教授、銀河通用創(chuàng)始人王鶴、傅利葉創(chuàng)始人兼CEO顧捷，樂(lè)聚機(jī)器人創(chuàng)始人冷曉琨，中科院自動(dòng)化所研究員王鵬，UC Berkeley潘家怡，圍繞具身智能的本體形態(tài)、數(shù)據(jù)、泛化能力、產(chǎn)業(yè)落地前景等議題分享了最新的思考與觀察。

智源舉辦2024具身與世界模型專題峰會(huì) 產(chǎn)學(xué)研共促技術(shù)創(chuàng)新與產(chǎn)業(yè)應(yīng)用

此外，下午的空間智能和世界模型圓桌討論由智源研究院副院長(zhǎng)林詠華主持，清華大學(xué)機(jī)械工程系助理研究員陳睿，清華大學(xué)電子工程系副教授代季峰，星塵智能創(chuàng)始人兼CEO來(lái)杰，香港大學(xué)助理教授李弘揚(yáng) ，北京通用人工智能研究院研究科學(xué)家黃思遠(yuǎn)，分別就機(jī)器人的世界模型技術(shù)路線、關(guān)鍵技術(shù)要點(diǎn)以及面臨的核心挑戰(zhàn)等問(wèn)題進(jìn)行了不同視角的解讀。

智源舉辦2024具身與世界模型專題峰會(huì) 產(chǎn)學(xué)研共促技術(shù)創(chuàng)新與產(chǎn)業(yè)應(yīng)用

在閉幕致辭中，智源研究院理事長(zhǎng)黃鐵軍指出，智能是環(huán)境的產(chǎn)物。人類智能來(lái)源于對(duì)環(huán)境的適應(yīng)演化以及對(duì)世界的抽象。智能應(yīng)該是大大小小各種形態(tài)的，不能變成一個(gè)完全統(tǒng)一的智能。具身智能的發(fā)展是必然趨勢(shì)，無(wú)論是人形還是其他形態(tài)的機(jī)器人，未來(lái)需要龐大的產(chǎn)業(yè)群配套，促進(jìn)具身智能的關(guān)鍵部件與材料，軟件與硬件協(xié)同發(fā)展。

雷峰網(wǎng)(公眾號(hào)：雷峰網(wǎng))

雷峰網(wǎng)版權(quán)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

0人收藏

分享：

相關(guān)文章

nebula

運(yùn)營(yíng)

發(fā)私信

當(dāng)月熱門文章

最新文章

熱門搜索

Uber AR intel 上市具身智能海爾 Airbnb 數(shù)字化轉(zhuǎn)型移動(dòng)醫(yī)療電信供應(yīng)鏈

為了您的賬戶安全，請(qǐng)驗(yàn)證郵箱

您的郵箱還未驗(yàn)證,完成可獲20積分喲！

重發(fā)郵箱修改郵箱

請(qǐng)驗(yàn)證您的郵箱

立即驗(yàn)證

完善賬號(hào)信息

您的賬號(hào)已經(jīng)綁定，現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄

立即設(shè)置 以后再說(shuō)

<rt id="wg9tj"><small id="wg9tj"></small></rt>

<label id="wg9tj"><meter id="wg9tj"></meter></label>

<i id="wg9tj"><meter id="wg9tj"></meter></i>