丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
人工智能 正文
發(fā)私信給岑大師
發(fā)送

0

CoRL上,最有意思的五篇文章

本文作者: 岑大師 2017-11-17 03:47
導(dǎo)語:看一個大會質(zhì)量高不高,除了看大會后的組織者是誰之外,另一個重要因素的是看這個學(xué)術(shù)會議上出過哪些重要的論文。

現(xiàn)在的各種學(xué)術(shù)會議多如牛毛,一個大會質(zhì)量高不高,除了看大會后的組織者是誰之外,另一個重要因素的是看這個學(xué)術(shù)會議上出過哪些重要的論文。如伯克利 BAIR Blog 編委會成員、在讀博士許華哲就和雷鋒網(wǎng)記者開過玩笑,如果要組織一個新的會議,會議組織者不僅需要邀請重量級的演講嘉賓,另一個任務(wù)是盯著自己的學(xué)生做出一兩篇有影響力的論文來,這樣就可以讓大家知道這個會不是水會,第二年參加的人就多了。這固然是個玩笑,但對第一屆舉辦的學(xué)術(shù)會議來說,論文質(zhì)量一定是非常重要的。

近日在山景城召開的第一屆CoLR大會上,雷鋒網(wǎng)也重點(diǎn)了解了這屆大會論文投遞的情況。

CoRL上,最有意思的五篇文章

從大會官方統(tǒng)計(jì)數(shù)據(jù)看,本次大會總共收到212篇論文,數(shù)量最大的三個論文類別分別為增強(qiáng)學(xué)習(xí)、模型學(xué)習(xí)和機(jī)器人視覺;

在現(xiàn)場Oral presentation環(huán)節(jié),長論文的講解時間為20分鐘,短論文講解時間為6分鐘。

以下是雷鋒網(wǎng)在現(xiàn)場發(fā)現(xiàn)的若干有意思的論文:


1. 《One-Shot Visual Imitation Learning via Meta-Learning

作者:Chelsea Finn , Tianhe Yu , Tianhao Zhang, Pieter Abbeel, Sergey Levine

摘要:為了讓機(jī)器人成為可以廣泛地執(zhí)行通用工作,其必須能在復(fù)雜的非結(jié)構(gòu)化環(huán)境中快速有效地獲取各種各樣的技能。 像深度神經(jīng)網(wǎng)絡(luò)這樣的高容量模型可以使機(jī)器人展示出復(fù)雜的技能,但是從頭開始學(xué)習(xí)每個技能就變得不可行。 在本論文中,我們提出了一種元模擬學(xué)習(xí)方法,使機(jī)器人學(xué)習(xí)如何更有效地學(xué)習(xí),從而使其能夠從單個演示中獲得新的技能。 與先前的單次模擬方法不同,我們的方法可以擴(kuò)展到原始像素輸入,所需要前期任務(wù)數(shù)量也大大減少,從而更有效地學(xué)習(xí)新技能。 我們在模擬機(jī)器人和真實(shí)機(jī)器人平臺上進(jìn)行的實(shí)驗(yàn)均證明了從單個視覺演示中學(xué)習(xí)端到端的新任務(wù)的能力。

點(diǎn)評:這篇論文是雷鋒網(wǎng)很早就發(fā)現(xiàn)的一篇論文,詳見《BAIR論文:通過“元學(xué)習(xí)”和“一次性學(xué)習(xí)”算法,讓機(jī)器人快速掌握新技能


2. 《image2mass: Estimating the Mass of an Object from Its Image

作者:Trevor Standley, Ozan Sener, Dawn Chen, Silvio Savarese

摘要:機(jī)器人操縱真實(shí)世界中的物體需要理解這些對象的物理屬性。 我們提出了一個從物體的圖像中估計(jì)物體質(zhì)量的模型, 我們收集了包含圖像,大小和重量等信息的大型數(shù)據(jù)集,并比較了在這個數(shù)據(jù)集上訓(xùn)練的圖像的質(zhì)量的幾個基準(zhǔn)模型。同時,我們對比了也在這個問題上人的表現(xiàn)。 最后,我們提出了一個考慮到對象的3D形狀的模型, 這個模型比上述基準(zhǔn)和與人類的表現(xiàn)相比都要更好。

CoRL上,最有意思的五篇文章

點(diǎn)評:斯坦福Copmutational Vision & Geometry Lab的Silvio Savarese教授團(tuán)隊(duì)的一篇文章,看一張圖片,預(yù)測物體的重量,這個應(yīng)用很酷。據(jù)第一作者Trevor Standley介紹,他們使用Amazon的API接口獲取大量商品信息作為數(shù)據(jù)集,除了估計(jì)體積和密度的兩個模塊,還有一個專門估計(jì)物體3D形狀的神經(jīng)網(wǎng)絡(luò)模塊,從而進(jìn)一步保證物體估計(jì)的準(zhǔn)確度。


3.《Neural Task Programming: Learning to Generalize Across Hierarchical Tasks

作者:Danfei Xu, Suraj Nair, Yuke Zhu, Julian Gao, Animesh Garg, Li Fei-Fei, Silvio Savarese

摘要: 在本論文中,我們提出了一種名為神經(jīng)任務(wù)編程(NTP)的新型機(jī)器人學(xué)習(xí)框架,該方法可以通過較少的示范和神經(jīng)程序引導(dǎo)進(jìn)行學(xué)習(xí)。NTP可將輸入的規(guī)范性任務(wù)(例如任務(wù)的視頻演示)遞歸地將其分解成更精細(xì)的子任務(wù)規(guī)范, 這些規(guī)范被傳遞到分級神經(jīng)程序,通過可調(diào)用的底層子程序是與環(huán)境進(jìn)行交互。同時,我們在三個機(jī)器人操縱任務(wù)中驗(yàn)證了我們的方法,在試驗(yàn)中,NTP展示了在顯示分層結(jié)構(gòu)和組合結(jié)構(gòu)的順序任務(wù)的強(qiáng)泛化能力化。 實(shí)驗(yàn)結(jié)果表明,NTP在學(xué)習(xí)長度不定、可變拓?fù)浜筒粩嘧兓奈粗蝿?wù)的學(xué)習(xí)和拓展有較好的效果。

CoRL上,最有意思的五篇文章

點(diǎn)評:雖然李飛飛團(tuán)隊(duì)之前的研究更多是在計(jì)算機(jī)視覺領(lǐng)域,但正是如此,才有可能從機(jī)器人領(lǐng)域研究者習(xí)慣的視角外去思考問題,這篇論文提出的新思路也值得機(jī)器人研究者注意。


4.《Intention-Net: Integrating Planning and Deep Learning for Goal-Directed Autonomous Navigation

作者:Wei Gao, Wee Sun Lee, Shengmei Shen,Karthikk Subramanian

摘要:如何將送貨機(jī)器人可靠地導(dǎo)航到新辦公大樓中的目的地,并提供最少的先驗(yàn)信息? 為了應(yīng)對這一挑戰(zhàn),本文介紹了一種兩層次的分級方法,它集成了無需模型的深度學(xué)習(xí)和基于模型的路徑規(guī)劃。 在低層次上,一個叫做意圖網(wǎng)絡(luò)的神經(jīng)網(wǎng)絡(luò)運(yùn)動控制器被端對端地訓(xùn)練用于提供魯棒的本地導(dǎo)航。 意圖網(wǎng)絡(luò)將來自單個單目照相機(jī)的圖像和“意圖”直接映射到機(jī)器人控制器。 在高層,路徑規(guī)劃者使用粗略地圖(例如二維平面圖)來計(jì)算從機(jī)器人當(dāng)前位置到目標(biāo)的路徑, 計(jì)劃的路徑向意圖網(wǎng)絡(luò)提供意圖。 初步的實(shí)驗(yàn)表明,學(xué)習(xí)的運(yùn)動控制器是強(qiáng)大的,不受感知的不確定性的影響,并通過與路徑規(guī)劃器的整合,有效地推廣到新的環(huán)境和目標(biāo)。

CoRL上,最有意思的五篇文章

點(diǎn)評:未來的無人駕駛車輛能否像人類一樣,憑借Google Maps就能自動駕駛?這顯然是一個讓無人駕駛更接近“人”的研究。


5. 《Emergent Behaviors in Mixed-Autonomy Traffic

作者:Cathy Wu,Aboudy Kreidieh, Eugene Vinitsky,  Alexandre M. Bayen

摘要:交通動態(tài)往往是一個復(fù)雜的動力系統(tǒng)建模,傳統(tǒng)的分析工具可能難以提供由交通運(yùn)輸機(jī)構(gòu)和規(guī)劃者使用的易處理的策略。如果將自動車輛引入交通系統(tǒng),需要了解自動化對交通網(wǎng)絡(luò)的影響。本文闡述并采用增強(qiáng)學(xué)習(xí)(RL)的強(qiáng)大框架來處理混合交通控制問題(存在自動駕駛車輛和人類司機(jī))中由此產(chǎn)生的政策和緊急行為,提供了通過混合車隊(duì)的自動化和人類司機(jī)車輛實(shí)現(xiàn)交通自動化的潛力。無模式學(xué)習(xí)方法被證明自然選擇之前由模型驅(qū)動的方法設(shè)計(jì)的政策和行為,例如穩(wěn)定和排隊(duì),可以有效提高環(huán)路效率甚至超過理論速度極限。值得注意的是,RL通過有效地利用人類駕駛行為的結(jié)構(gòu)來成功地使速度最大化,以形成交叉口網(wǎng)絡(luò)的有效車輛間距。我們在穩(wěn)定性分析和混合自治分析的現(xiàn)有控制理論結(jié)果的背景下描述我們的結(jié)果。

點(diǎn)評:如果自動駕駛車輛達(dá)到5%,對我們的交通會產(chǎn)生什么影響?這一論文的試驗(yàn)中展示了在一個21輛人類司機(jī)和1輛無人駕駛車在環(huán)形路段的模擬情況,整個運(yùn)行效率可提高60%。現(xiàn)實(shí)交通狀況可能更為復(fù)雜,但如果無人車的加入可以更好地解決擁堵問題,毫無疑問對無人車是個大利好消息。

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

CoRL上,最有意思的五篇文章

分享:
相關(guān)文章
當(dāng)月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說