0
本文作者: AI研習(xí)社 | 2020-07-16 09:58 |
內(nèi)容簡介 · · · · · ·
強(qiáng)化學(xué)習(xí)是一種重要的機(jī)器學(xué)習(xí)方法,在智能體及分析預(yù)測等領(lǐng)域有許多應(yīng)用。
《Python強(qiáng)化學(xué)習(xí)實(shí)戰(zhàn):應(yīng)用OpenAI Gym和TensorFlow精通強(qiáng)化學(xué)習(xí)和深度強(qiáng)化學(xué)習(xí)》共13章,主要包括強(qiáng)化學(xué)習(xí)的各種要素,即智能體、環(huán)境、策略和模型以及相應(yīng)平臺和庫;Anaconda、Docker、OpenAIGym、Universe和TensorFlow等安裝配置;馬爾可夫鏈和馬爾可夫過程及其與強(qiáng)化學(xué)習(xí)問題建模之間的關(guān)系,動(dòng)態(tài)規(guī)劃的基本概念;蒙特卡羅方法以及不同類型的蒙特卡羅預(yù)測和控制方法;時(shí)間差分學(xué)習(xí)、預(yù)測、離線/在線策略控制等;多臂賭博機(jī)問題以及相關(guān)的各種探索策略方法;深度學(xué)習(xí)的各種基本概念和RNN、LSTM、CNN等神經(jīng)網(wǎng)絡(luò);深度強(qiáng)化學(xué)習(xí)算法DQN,以及雙DQN和對抗網(wǎng)絡(luò)體系結(jié)構(gòu)等改進(jìn)架構(gòu);DRQN以及DARQN;A3C網(wǎng)絡(luò)的基本工作原理及架構(gòu);策略梯度和優(yōu)化問題;最后介紹了強(qiáng)化學(xué)習(xí)的全新進(jìn)展以及未來發(fā)展。
作者簡介 · · · · · ·
Sudharsan Ravichandiran 是一位數(shù)據(jù)科學(xué)家、研究員、人工智能愛好者以及 YouTuber(搜索 Sudharsan reinforcement learning),獲得了 Anna 大學(xué)信息技術(shù)學(xué)士學(xué)位。他的研究領(lǐng)域包括深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)的實(shí)現(xiàn),其中包括自然語言處理和計(jì)算機(jī)視覺。他曾是一名自由職業(yè)的網(wǎng)頁開發(fā)人員和設(shè)計(jì)師,所設(shè)計(jì)開發(fā)的網(wǎng)站屢獲殊榮,同時(shí)也熱衷于開源,擅長解答堆棧溢出問題。
原書審稿人簡介 Sujit Pal 是 Elsevier 實(shí)驗(yàn)室的技術(shù)研究總監(jiān), Elsevier 實(shí)驗(yàn)室是 Reed-Elservier 集團(tuán)公司下的一個(gè)先進(jìn)技術(shù)團(tuán)隊(duì),研究領(lǐng)域包括語義檢索、自然語言處理、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)。他在 Elsevier 實(shí)驗(yàn)室主要從事搜索質(zhì)量檢測與改進(jìn)、圖像分類和重復(fù)率檢測、醫(yī)學(xué)和科學(xué)語料庫的標(biāo)注與本體開發(fā)。他曾與 Antonio Gulli 合作撰寫了一本關(guān)于深度學(xué)習(xí)的著作,并在博客 Slamon Run 上撰寫了一些科技文章。
Suriyadeepan Ramamoorthy 是一名來自印度 Puducherry 的 AI 研究人員和工程師,主要研究領(lǐng)域是自然語言理解和推理,同時(shí)積極撰寫有關(guān)深度學(xué)習(xí)的博客文章。在 SAAMA 技術(shù)中,他將先進(jìn)的深度學(xué)習(xí)技術(shù)應(yīng)用于生物醫(yī)學(xué)文本分析,同時(shí)也是一名積極推動(dòng) FSFTN領(lǐng)域發(fā)展的免費(fèi)軟件宣傳者,另外對社交網(wǎng)絡(luò)、數(shù)據(jù)可視化和創(chuàng)造性編程也非常感興趣。
補(bǔ)充說明 · · · · · ·
本站所有資源版權(quán)均屬于原作者所有,這里所提供資源均只能用于參考學(xué)習(xí)用,請勿直接商用。如需刪除,請聯(lián)系 kefu@yanxishe.com
AI 研習(xí)社已經(jīng)和阿里大文娛、曠視、搜狗搜索、小米等知名公司達(dá)成聯(lián)系,幫助大家更好地求職找工作,一鍵投遞簡歷至 HR 后臺,準(zhǔn)備了一些內(nèi)推渠道群。
歡迎大家添加研習(xí)社小學(xué)妹微信(aiyanxishe),小學(xué)妹拉你加入(備注求職)。
雷鋒網(wǎng)雷鋒網(wǎng)雷鋒網(wǎng)
相關(guān)文章:
資料 | 編寫高質(zhì)量Python代碼的59個(gè)有效方法
資料 | JavaScript框架設(shè)計(jì) 第二版
資料 | 算法(第4版)【圖靈程序設(shè)計(jì)叢書】算法領(lǐng)域的經(jīng)典參考書
資料 |世界著名計(jì)算機(jī)教材精選:數(shù)據(jù)挖掘十大算法(中文版)
資料 | 樹莓派Python編程入門與實(shí)戰(zhàn)
資料 | 《人工智能編程范式:通用Lisp中的案例研究》1048頁P(yáng)DF免費(fèi)下載
資料 | Yann LeCun「人工智能發(fā)展的挑戰(zhàn)在于無監(jiān)督學(xué)習(xí)」原版演講PPT
資料 | 【復(fù)旦大學(xué)邱錫鵬老師】面向自然語言處理的深度學(xué)習(xí)基礎(chǔ),199頁ppt
資料 | Python語言程序設(shè)計(jì)基礎(chǔ)(第2版)
資料 | Python 神經(jīng)網(wǎng)絡(luò)編程
資料 | 神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)(邱錫鵬)
資料 | 科技之巔:《麻省理工科技評論》50大全球突破性技術(shù)深度剖析
資料 | 解析深度學(xué)習(xí):卷積神經(jīng)網(wǎng)絡(luò)原理與視覺實(shí)踐
資料 | 深度學(xué)習(xí)之美:AI時(shí)代的數(shù)據(jù)處理與最佳實(shí)踐
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。