0
本文作者: AI研習社 | 2020-07-16 09:58 |
內(nèi)容簡介 · · · · · ·
強化學習是一種重要的機器學習方法,在智能體及分析預測等領(lǐng)域有許多應用。
《Python強化學習實戰(zhàn):應用OpenAI Gym和TensorFlow精通強化學習和深度強化學習》共13章,主要包括強化學習的各種要素,即智能體、環(huán)境、策略和模型以及相應平臺和庫;Anaconda、Docker、OpenAIGym、Universe和TensorFlow等安裝配置;馬爾可夫鏈和馬爾可夫過程及其與強化學習問題建模之間的關(guān)系,動態(tài)規(guī)劃的基本概念;蒙特卡羅方法以及不同類型的蒙特卡羅預測和控制方法;時間差分學習、預測、離線/在線策略控制等;多臂賭博機問題以及相關(guān)的各種探索策略方法;深度學習的各種基本概念和RNN、LSTM、CNN等神經(jīng)網(wǎng)絡(luò);深度強化學習算法DQN,以及雙DQN和對抗網(wǎng)絡(luò)體系結(jié)構(gòu)等改進架構(gòu);DRQN以及DARQN;A3C網(wǎng)絡(luò)的基本工作原理及架構(gòu);策略梯度和優(yōu)化問題;最后介紹了強化學習的全新進展以及未來發(fā)展。
作者簡介 · · · · · ·
Sudharsan Ravichandiran 是一位數(shù)據(jù)科學家、研究員、人工智能愛好者以及 YouTuber(搜索 Sudharsan reinforcement learning),獲得了 Anna 大學信息技術(shù)學士學位。他的研究領(lǐng)域包括深度學習和強化學習的實現(xiàn),其中包括自然語言處理和計算機視覺。他曾是一名自由職業(yè)的網(wǎng)頁開發(fā)人員和設(shè)計師,所設(shè)計開發(fā)的網(wǎng)站屢獲殊榮,同時也熱衷于開源,擅長解答堆棧溢出問題。
原書審稿人簡介 Sujit Pal 是 Elsevier 實驗室的技術(shù)研究總監(jiān), Elsevier 實驗室是 Reed-Elservier 集團公司下的一個先進技術(shù)團隊,研究領(lǐng)域包括語義檢索、自然語言處理、機器學習和深度學習。他在 Elsevier 實驗室主要從事搜索質(zhì)量檢測與改進、圖像分類和重復率檢測、醫(yī)學和科學語料庫的標注與本體開發(fā)。他曾與 Antonio Gulli 合作撰寫了一本關(guān)于深度學習的著作,并在博客 Slamon Run 上撰寫了一些科技文章。
Suriyadeepan Ramamoorthy 是一名來自印度 Puducherry 的 AI 研究人員和工程師,主要研究領(lǐng)域是自然語言理解和推理,同時積極撰寫有關(guān)深度學習的博客文章。在 SAAMA 技術(shù)中,他將先進的深度學習技術(shù)應用于生物醫(yī)學文本分析,同時也是一名積極推動 FSFTN領(lǐng)域發(fā)展的免費軟件宣傳者,另外對社交網(wǎng)絡(luò)、數(shù)據(jù)可視化和創(chuàng)造性編程也非常感興趣。
補充說明 · · · · · ·
本站所有資源版權(quán)均屬于原作者所有,這里所提供資源均只能用于參考學習用,請勿直接商用。如需刪除,請聯(lián)系 kefu@yanxishe.com
AI 研習社已經(jīng)和阿里大文娛、曠視、搜狗搜索、小米等知名公司達成聯(lián)系,幫助大家更好地求職找工作,一鍵投遞簡歷至 HR 后臺,準備了一些內(nèi)推渠道群。
歡迎大家添加研習社小學妹微信(aiyanxishe),小學妹拉你加入(備注求職)。
雷鋒網(wǎng)雷鋒網(wǎng)雷鋒網(wǎng)
相關(guān)文章:
資料 | 編寫高質(zhì)量Python代碼的59個有效方法
資料 | 1800頁33章數(shù)學方法精要筆記 —深入數(shù)學建模, 機器學習和深度學習的數(shù)學基礎(chǔ)
資料 | 算法(第4版)【圖靈程序設(shè)計叢書】算法領(lǐng)域的經(jīng)典參考書
資料 |世界著名計算機教材精選:數(shù)據(jù)挖掘十大算法(中文版)
資料 | 《人工智能編程范式:通用Lisp中的案例研究》1048頁PDF免費下載
資料 | Yann LeCun「人工智能發(fā)展的挑戰(zhàn)在于無監(jiān)督學習」原版演講PPT
資料 | 【復旦大學邱錫鵬老師】面向自然語言處理的深度學習基礎(chǔ),199頁ppt
資料 | Python語言程序設(shè)計基礎(chǔ)(第2版)
資料 | Python 神經(jīng)網(wǎng)絡(luò)編程
資料 | 神經(jīng)網(wǎng)絡(luò)與深度學習(邱錫鵬)
資料 | 科技之巔:《麻省理工科技評論》50大全球突破性技術(shù)深度剖析
資料 | 解析深度學習:卷積神經(jīng)網(wǎng)絡(luò)原理與視覺實踐
資料 | 深度學習之美:AI時代的數(shù)據(jù)處理與最佳實踐
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。