0
AI研習(xí)社是雷鋒網(wǎng)旗下的AI求知求職社區(qū),基于專(zhuān)業(yè)直播平臺(tái),進(jìn)行技術(shù)交流的公益?zhèn)鞑ズ蜕疃冉涣鳌?/p>
AI研習(xí)社公開(kāi)課通過(guò)邀請(qǐng)學(xué)術(shù)界、工業(yè)界學(xué)者進(jìn)行高質(zhì)量?jī)?nèi)容分享,讓廣大學(xué)術(shù)青年了解最前沿的學(xué)術(shù)與行業(yè)技術(shù)進(jìn)展,成為連接學(xué)術(shù)界與工業(yè)界之間的橋梁,雷鋒網(wǎng)希望能夠從中發(fā)現(xiàn)一大批優(yōu)秀AI人才,推動(dòng)國(guó)內(nèi)AI行業(yè)的持續(xù)發(fā)展。
接下來(lái)是本周的公開(kāi)課預(yù)告:
主題:AlphaGo Zero and Deep Learning
分享內(nèi)容:解析AlphaGo Zero如何將白板學(xué)習(xí)、Resnet、MCTS等技術(shù),將Polic Network和Value Network組合框架下使用Self-play解決零經(jīng)驗(yàn)下自學(xué)習(xí)過(guò)程。介紹目前最新的深度學(xué)習(xí)方式如何將機(jī)器感知向機(jī)器認(rèn)知方向的演進(jìn),目前Mercy博士團(tuán)隊(duì)?wèi)?yīng)用深度學(xué)習(xí)的最新研究方向分享。由于演講人多年擔(dān)任SCI期刊編委,對(duì)學(xué)術(shù)論文撰寫(xiě)經(jīng)驗(yàn)進(jìn)行分享。
分享人:王強(qiáng)博士,本科畢業(yè)于西安交通大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)專(zhuān)業(yè),后獲得卡內(nèi)基梅隆大學(xué)軟件工程專(zhuān)業(yè)碩士學(xué)位、機(jī)器人博士學(xué)位。美國(guó)貨幣監(jiān)理署(OCC)審計(jì)專(zhuān)家?guī)斐蓡T、IBM商業(yè)價(jià)值研究院院士及紐約Thomas J. Watson研究院主任研究員。IEEE高級(jí)會(huì)員,并擔(dān)任了2008、2009、2013及未來(lái)2018年CVPR的論文評(píng)委,同時(shí)是PAMI和TIP兩個(gè)全球頂級(jí)期刊的編委。王強(qiáng)博士在國(guó)際頂級(jí)期刊發(fā)表了90多篇論文,并多次在ICCV,CVPR等大會(huì)做論文分享。其主要研究領(lǐng)域圖像理解、機(jī)器學(xué)習(xí)、智能交易、金融反欺詐及風(fēng)險(xiǎn)預(yù)測(cè)等。
主題:強(qiáng)化學(xué)習(xí)與策略評(píng)估
分享內(nèi)容:強(qiáng)化學(xué)習(xí)(Reinforcement learning)在近幾年收到越來(lái)越多的關(guān)注,對(duì)于強(qiáng)化學(xué)習(xí)的理論探討也一直是研究熱點(diǎn)。這次分享,我們將一起探討強(qiáng)化學(xué)習(xí)的理論框架。在此基礎(chǔ)上,策略評(píng)估(policy evaluation)是強(qiáng)化學(xué)習(xí)中最基礎(chǔ)也是最重要的一個(gè)組成部分,其收斂性質(zhì)的分析對(duì)于理解和改進(jìn)這一類(lèi)算法非常重要。但是如果只停留在一些非常理想化的假設(shè)下,得到的結(jié)果往往難以令人信服。在這次要分享的一個(gè)工作中,我們將給出一類(lèi)策略評(píng)估算法在一些更貼近實(shí)際的假定下(RL天然的數(shù)據(jù)不獨(dú)立同分布性,步長(zhǎng)多種設(shè)置方式等 )的收斂速率分析結(jié)果,從而更加確切的回答了關(guān)于這一類(lèi)算法收斂性質(zhì)的疑問(wèn),并且提供了解決類(lèi)似問(wèn)題的一個(gè)可用的理論工具。
分享人:汪躍,北京交通大學(xué)數(shù)學(xué)系三年級(jí)博士生,專(zhuān)業(yè)為概率論與數(shù)理統(tǒng)計(jì),導(dǎo)師是馬志明院士。 他的研究興趣在于機(jī)器學(xué)習(xí)、優(yōu)化算法、強(qiáng)化學(xué)習(xí)的算法設(shè)計(jì)和算法理論分析。 在此之前,他于2015年在北京交通大學(xué)理學(xué)院院獲得學(xué)士學(xué)位。 他現(xiàn)在微軟亞洲研究院機(jī)器學(xué)習(xí)組實(shí)習(xí)。
主題:AI小白的機(jī)器學(xué)習(xí)入門(mén)之路
分享內(nèi)容:隨著機(jī)器學(xué)習(xí)的行業(yè)應(yīng)用越來(lái)越廣泛,行業(yè)前景越來(lái)越廣闊,越來(lái)越多的小伙伴也開(kāi)始關(guān)注這方面的知識(shí)學(xué)習(xí),同時(shí)也遇到了很多學(xué)習(xí)方面的問(wèn)題。
0基礎(chǔ)如何入門(mén)機(jī)器學(xué)習(xí)?有哪些學(xué)習(xí)經(jīng)驗(yàn)可供借鑒?學(xué)習(xí)過(guò)程中又可能遇到哪些“坑”?AI研習(xí)社邀請(qǐng)碩士在讀的清華大學(xué)陳丹陽(yáng)同學(xué)介紹她的AI學(xué)習(xí)之路。作為航天專(zhuān)業(yè)的她,當(dāng)初為何選擇機(jī)器學(xué)習(xí)?學(xué)習(xí)過(guò)程中又有哪些經(jīng)驗(yàn)分享,又是如何加入商湯科技的?
分享人:陳丹陽(yáng),北京航空航天大學(xué)學(xué)士,質(zhì)量與可靠性工程專(zhuān)業(yè)。清華大學(xué)碩士,自動(dòng)化展業(yè),目前在商湯實(shí)習(xí),主要做服飾的識(shí)別檢測(cè)與分類(lèi)。
主題:Deep Learning讀書(shū)分享-卷積網(wǎng)絡(luò)
分享內(nèi)容:本次讀書(shū)分享主要針對(duì)《深度學(xué)習(xí)》第九章內(nèi)容,梳理本章的主要內(nèi)容:卷積運(yùn)算;動(dòng)機(jī);池化;卷積與池化作為一種無(wú)限強(qiáng)的先驗(yàn);基本卷積函數(shù)的變體;結(jié)構(gòu)化輸出;數(shù)據(jù)類(lèi)型;高效的卷積算法;隨機(jī)或無(wú)監(jiān)督的特征;卷積網(wǎng)絡(luò)的神經(jīng)科學(xué)基礎(chǔ);卷積網(wǎng)絡(luò)與深度學(xué)習(xí)的歷史。
分享人:王奇文,前百度、阿里資深算法工程師,先后做過(guò)推薦系統(tǒng)、分布式、數(shù)據(jù)挖掘、用戶(hù)建模、聊天機(jī)器人等。
掃描二維碼備注「雷鋒網(wǎng)」立即報(bào)名活動(dòng)。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。