丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
人工智能學(xué)術(shù) 正文
發(fā)私信給AI研習(xí)社
發(fā)送

0

【新課預(yù)告】加州大學(xué)伯克利分校CS285《深度強化學(xué)習(xí)》學(xué)習(xí)小組成員招募

本文作者: AI研習(xí)社 2019-12-02 19:30
導(dǎo)語:字幕君帶著獲得了加州大學(xué)伯克利分校 CS285 《深度強化學(xué)習(xí)》講師@Sergey Levine正式授權(quán)漢化翻譯,感興趣的同學(xué)也可以報名參與志愿者翻譯團隊。

他來了他來了,字幕君帶著新課的授權(quán)來了!

【新課預(yù)告】加州大學(xué)伯克利分校CS285《深度強化學(xué)習(xí)》學(xué)習(xí)小組成員招募

在這2019年的尾聲,字幕君帶著獲得了加州大學(xué)伯克利分校 CS285 《深度強化學(xué)習(xí)》講師@Sergey Levine正式授權(quán)漢化翻譯,感興趣的同學(xué)也可以報名參與志愿者翻譯團隊。

【新課預(yù)告】加州大學(xué)伯克利分校CS285《深度強化學(xué)習(xí)》學(xué)習(xí)小組成員招募

添加字幕君微信,備注“285翻譯”報名加入翻譯

字幕君深知一人堅持的不易,并想邀請熱愛學(xué)習(xí)的你和諸多志同道合的小伙伴,以相互監(jiān)督,共同進步的形式,一起研習(xí)這門新課程!


 加入學(xué)習(xí)小組

進入2019 UC 伯克利 CS285 深度強化學(xué)習(xí)小組即可視為成功報名!

直達鏈接:https://www.yanxishe.com/overseasCourse/103?from=leiphonecolumn

加入小組后獲得2019 UC 伯克利 CS285 《深度強化學(xué)習(xí)》課件 PPT下載地址


 學(xué)習(xí)形式

1. 課程視頻更新后,學(xué)員需要觀看課程視頻并且在社區(qū)留言打卡; 

2. 每學(xué)完一節(jié)課程,學(xué)員需在自行獨立完成 Quiz 作業(yè)并在社區(qū)博客進行分享 

3. 學(xué)員可以根據(jù)自己的時間及興趣,決定是否進行課后作業(yè)分享的公開課直播。 

4. 為保證社區(qū)的學(xué)習(xí)氛圍,社長會根據(jù)課程完成情況和活躍程度對學(xué)員進行監(jiān)督管理,如有必要,會定期清理不活躍或者長期潛水的學(xué)員;    

5. 課程結(jié)束后,優(yōu)秀的學(xué)員可以獲得社區(qū)提供的福利以及禮品;  

6. 社區(qū)翻譯志愿者持續(xù)招募中,如果對這門課程的翻譯感興趣,可以聯(lián)系社長準(zhǔn)備字幕翻譯工作。

7. 課程有一定難度,且有較多作業(yè),希望學(xué)員一旦加入,能夠克服困難,收獲成長。

 課程介紹

眾所周知,深度強化學(xué)習(xí)是人工智能發(fā)展的重大方向之一。熟悉深度強化學(xué)習(xí)背景知識的優(yōu)秀人才倍受各大科研機構(gòu)與公司青睞,不管是工業(yè)界還是學(xué)術(shù)界,深度強化學(xué)習(xí)都被視為實現(xiàn)通用人工智能最有可能的路徑之一。因此,熟悉深度強化學(xué)習(xí)知識顯得尤為重要。

在CS285這門課程中,Sergey Levine 教授將會深入淺出地講解深度強化學(xué)習(xí)的背景理論知識、實現(xiàn)方式以及核心算法,并布置相應(yīng)的家庭作業(yè)以幫助各位同學(xué)更好地鞏固學(xué)習(xí)內(nèi)容。

這次課程,一共有 21 講,具體如下:

【新課預(yù)告】加州大學(xué)伯克利分校CS285《深度強化學(xué)習(xí)》學(xué)習(xí)小組成員招募

 課件截圖

【新課預(yù)告】加州大學(xué)伯克利分校CS285《深度強化學(xué)習(xí)》學(xué)習(xí)小組成員招募
【新課預(yù)告】加州大學(xué)伯克利分校CS285《深度強化學(xué)習(xí)》學(xué)習(xí)小組成員招募
【新課預(yù)告】加州大學(xué)伯克利分校CS285《深度強化學(xué)習(xí)》學(xué)習(xí)小組成員招募

 學(xué)生評價

首先這門課的質(zhì)量非常好。課程反應(yīng)了Sergey Levine和整伯克利RL的積累,獨立于《RL Introduction》的教學(xué)體系自成一派。最可貴的是涵蓋近1-2年RL最前沿的知識。這門課又難又深,但絕對是飛往RL前沿的航班。研究RL的同學(xué)萬萬不可錯過啊。

By 知乎答主“有道理”

現(xiàn)在強烈推薦這門課程!課程基本可以分為DRL介紹+模仿學(xué)習(xí)、model free、model based、Exploration+遷移+多任務(wù)+Meta-learning等四大部分,一共有四個很有趣的assignment(比春季的更好了)。如果你看過david silver的視頻并且有機器學(xué)習(xí)的基礎(chǔ),那么至少你在model free部分是沒問題的。秋季課程其實降低了對RL基礎(chǔ)的要求,課上推導(dǎo)過程比較清晰。這門課后半model based部分恰好是對david silver等當(dāng)前已有的課程、書籍里講的比較少的內(nèi)容的非常大的補充,不過這部分要求比較高。

By 知乎答主“糖葫蘆喵喵”


 課程大綱

第一講:課程介紹和概覽

第二講:針對行為的監(jiān)督學(xué)習(xí)

第三講:TensorFlow 和神經(jīng)網(wǎng)絡(luò)簡述

第四講:強化學(xué)習(xí)簡介

第五講:策略梯度

第六講:Actor-Critic 算法

第七講:價值函數(shù)

第八講:深度強化學(xué)習(xí)之Q函數(shù)

第九講:高級策略梯度

第十講:基于模型的規(guī)劃

第十一講:基于模型的強化學(xué)習(xí)

第十二講:基于模型的策略學(xué)習(xí)

第十三講:變分推斷和生成模型

第十四講:強化學(xué)習(xí)對控制的概率推斷

第十五講:逆向強化學(xué)習(xí)

第十六講:遷移學(xué)習(xí)與多任務(wù)學(xué)習(xí)

第十七講:分布式強化學(xué)習(xí)

第十八講:探索(上)

第十九講:探索(下)

第二十講:元學(xué)習(xí)

第二十一講:信息理論,開放性問題探討


雷鋒網(wǎng)雷鋒網(wǎng)雷鋒網(wǎng)


雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

【新課預(yù)告】加州大學(xué)伯克利分校CS285《深度強化學(xué)習(xí)》學(xué)習(xí)小組成員招募

分享:
相關(guān)文章

編輯

聚焦數(shù)據(jù)科學(xué),連接 AI 開發(fā)者。更多精彩內(nèi)容,請訪問:yanxishe.com
當(dāng)月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說