0
本文作者: AI研習(xí)社 | 2019-12-02 19:30 |
他來了他來了,字幕君帶著新課的授權(quán)來了!
在這2019年的尾聲,字幕君帶著獲得了加州大學(xué)伯克利分校 CS285 《深度強化學(xué)習(xí)》講師@Sergey Levine正式授權(quán)漢化翻譯,感興趣的同學(xué)也可以報名參與志愿者翻譯團隊。
添加字幕君微信,備注“285翻譯”報名加入翻譯
字幕君深知一人堅持的不易,并想邀請熱愛學(xué)習(xí)的你和諸多志同道合的小伙伴,以相互監(jiān)督,共同進步的形式,一起研習(xí)這門新課程!
進入2019 UC 伯克利 CS285 深度強化學(xué)習(xí)小組即可視為成功報名!
直達鏈接:https://www.yanxishe.com/overseasCourse/103?from=leiphonecolumn
加入小組后獲得2019 UC 伯克利 CS285 《深度強化學(xué)習(xí)》課件 PPT下載地址
1. 課程視頻更新后,學(xué)員需要觀看課程視頻并且在社區(qū)留言打卡;
2. 每學(xué)完一節(jié)課程,學(xué)員需在自行獨立完成 Quiz 作業(yè)并在社區(qū)博客進行分享
3. 學(xué)員可以根據(jù)自己的時間及興趣,決定是否進行課后作業(yè)分享的公開課直播。
4. 為保證社區(qū)的學(xué)習(xí)氛圍,社長會根據(jù)課程完成情況和活躍程度對學(xué)員進行監(jiān)督管理,如有必要,會定期清理不活躍或者長期潛水的學(xué)員;
5. 課程結(jié)束后,優(yōu)秀的學(xué)員可以獲得社區(qū)提供的福利以及禮品;
6. 社區(qū)翻譯志愿者持續(xù)招募中,如果對這門課程的翻譯感興趣,可以聯(lián)系社長準(zhǔn)備字幕翻譯工作。
7. 課程有一定難度,且有較多作業(yè),希望學(xué)員一旦加入,能夠克服困難,收獲成長。
眾所周知,深度強化學(xué)習(xí)是人工智能發(fā)展的重大方向之一。熟悉深度強化學(xué)習(xí)背景知識的優(yōu)秀人才倍受各大科研機構(gòu)與公司青睞,不管是工業(yè)界還是學(xué)術(shù)界,深度強化學(xué)習(xí)都被視為實現(xiàn)通用人工智能最有可能的路徑之一。因此,熟悉深度強化學(xué)習(xí)知識顯得尤為重要。
在CS285這門課程中,Sergey Levine 教授將會深入淺出地講解深度強化學(xué)習(xí)的背景理論知識、實現(xiàn)方式以及核心算法,并布置相應(yīng)的家庭作業(yè)以幫助各位同學(xué)更好地鞏固學(xué)習(xí)內(nèi)容。
這次課程,一共有 21 講,具體如下:
首先這門課的質(zhì)量非常好。課程反應(yīng)了Sergey Levine和整伯克利RL的積累,獨立于《RL Introduction》的教學(xué)體系自成一派。最可貴的是涵蓋近1-2年RL最前沿的知識。這門課又難又深,但絕對是飛往RL前沿的航班。研究RL的同學(xué)萬萬不可錯過啊。
By 知乎答主“有道理”
現(xiàn)在強烈推薦這門課程!課程基本可以分為DRL介紹+模仿學(xué)習(xí)、model free、model based、Exploration+遷移+多任務(wù)+Meta-learning等四大部分,一共有四個很有趣的assignment(比春季的更好了)。如果你看過david silver的視頻并且有機器學(xué)習(xí)的基礎(chǔ),那么至少你在model free部分是沒問題的。秋季課程其實降低了對RL基礎(chǔ)的要求,課上推導(dǎo)過程比較清晰。這門課后半model based部分恰好是對david silver等當(dāng)前已有的課程、書籍里講的比較少的內(nèi)容的非常大的補充,不過這部分要求比較高。
By 知乎答主“糖葫蘆喵喵”
第一講:課程介紹和概覽
第二講:針對行為的監(jiān)督學(xué)習(xí)
第三講:TensorFlow 和神經(jīng)網(wǎng)絡(luò)簡述
第四講:強化學(xué)習(xí)簡介
第五講:策略梯度
第六講:Actor-Critic 算法
第七講:價值函數(shù)
第八講:深度強化學(xué)習(xí)之Q函數(shù)
第九講:高級策略梯度
第十講:基于模型的規(guī)劃
第十一講:基于模型的強化學(xué)習(xí)
第十二講:基于模型的策略學(xué)習(xí)
第十三講:變分推斷和生成模型
第十四講:強化學(xué)習(xí)對控制的概率推斷
第十五講:逆向強化學(xué)習(xí)
第十六講:遷移學(xué)習(xí)與多任務(wù)學(xué)習(xí)
第十七講:分布式強化學(xué)習(xí)
第十八講:探索(上)
第十九講:探索(下)
第二十講:元學(xué)習(xí)
第二十一講:信息理論,開放性問題探討
雷鋒網(wǎng)雷鋒網(wǎng)雷鋒網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。