1
本文作者: AI科技評(píng)論 | 2017-12-08 13:08 |
雷鋒網(wǎng)按:美國(guó)時(shí)間12月4日,第31屆神經(jīng)信息處理系統(tǒng)大會(huì)(Neural Information Processing Systems,NIPS)在美國(guó)長(zhǎng)灘會(huì)議中心開(kāi)幕。其中,在正會(huì)第二天(12月6日)下午,大會(huì)邀請(qǐng)加州大學(xué)伯克利分校教授、機(jī)器人與強(qiáng)化學(xué)習(xí)領(lǐng)域的大牛Pieter Abbeel發(fā)表了題為《Deep Learning for Robots》(深度學(xué)習(xí)在機(jī)器人領(lǐng)域的應(yīng)用)的報(bào)告。雷鋒網(wǎng)特此整理了報(bào)告的視頻及PPT供讀者進(jìn)行學(xué)習(xí)。
Pieter Abbeel 是加州大學(xué)伯克利分校教授、機(jī)器人與強(qiáng)化學(xué)習(xí)領(lǐng)域的大牛。他于比利時(shí) KU Leuven 獲電子工程學(xué)士、碩士學(xué)位,之后在斯坦福大學(xué)師從吳恩達(dá),并與2008年獲得計(jì)算機(jī)科學(xué)博士學(xué)位。Pieter Abbeel 自2008年起在加州大學(xué)伯克利分校擔(dān)任教職。
在攻讀博士期間,Pieter Abbeel發(fā)表了多篇重要的學(xué)術(shù)論文,并與導(dǎo)師吳恩達(dá)提出了學(xué)徒學(xué)習(xí)(Apprenticeship learning)這一增強(qiáng)學(xué)習(xí)的全新概念。2011年,Pieter Abbeel通過(guò)深度神經(jīng)網(wǎng)絡(luò)使用策略搜索所,實(shí)現(xiàn)了機(jī)器人疊毛巾的演示。他也因此被MIT Technology Review評(píng)選為當(dāng)年的“TR35”獲獎(jiǎng)?wù)?。Pieter Abbeel還是創(chuàng)業(yè)公司Embodied Intelligence的董事長(zhǎng)兼首席科學(xué)家(參見(jiàn)雷鋒網(wǎng)文章:《離開(kāi) OpenAI 和導(dǎo)師一起創(chuàng)業(yè),他們要讓機(jī)器人不編程也能像人一樣干活》)。
在報(bào)告中,Pieter Abbeel介紹了人工智能驅(qū)動(dòng)的機(jī)器人研究中的多個(gè)未解決的問(wèn)題,包括:更快的增強(qiáng)學(xué)習(xí)、遠(yuǎn)景推理、任務(wù)可用性、終身學(xué)習(xí)、對(duì)模擬的利用、最大限度地提取現(xiàn)實(shí)世界中的信號(hào)等。接下來(lái)Pieter Abbeel詳細(xì)介紹了多種用于機(jī)器人研究的深度學(xué)習(xí)方法,包括:強(qiáng)化學(xué)習(xí)、元學(xué)習(xí)、模仿學(xué)習(xí)、持續(xù)學(xué)習(xí),以及這些方法的重要參考文獻(xiàn)及細(xì)分領(lǐng)域研究進(jìn)展。
注:大會(huì)官網(wǎng)并未提供本次報(bào)告摘要,以上摘要為雷鋒網(wǎng)根據(jù)現(xiàn)場(chǎng)內(nèi)容整理而成。
PPT下載:付費(fèi)本文或加入雷鋒網(wǎng)會(huì)員,獲取NIPS 2017演講PPT。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。