0
本文作者: 楊文 | 2017-09-29 17:44 | 專題:NIPS 2017 |
雷鋒網(wǎng)AI科技評(píng)論按:作為機(jī)器學(xué)習(xí)和計(jì)算神經(jīng)科學(xué)的國際頂級(jí)學(xué)術(shù)會(huì)議NIPS,隨著近些年人工智能的發(fā)展,也變得越來越火爆。從大會(huì)官方公布的一些數(shù)據(jù)就可以看出:NIPS 2017共收到3240篇論文投稿,有678篇論文被選中作為大會(huì)論文,比例20.9%,其中有40篇被選中進(jìn)行口頭報(bào)告(oral),112篇選為spotlight進(jìn)行展示。毫不意外這些數(shù)字又創(chuàng)了大會(huì)歷史新高。就在論文收錄結(jié)果公布僅僅10天之后,官方數(shù)據(jù)顯示注冊(cè)名額已滿!那么對(duì)于廣大還沒來得及注冊(cè)或者沒有機(jī)會(huì)去到前方會(huì)場(chǎng)的同學(xué)們來說,如何才能更進(jìn)一步的了解本次NIPS的論文情況呢?
由雷鋒網(wǎng)主辦,清華數(shù)據(jù)派THU承辦的第五期“GAIR大講堂”在上周六邀請(qǐng)了5位NIPS 2017論文入選者,5位同學(xué)來到清華大學(xué),為大家做本次NIPS 入選論文的介紹分享。五位嘉賓中年齡最小的還在讀大四,最大的博士還沒畢業(yè),但是各自都在學(xué)術(shù)方向有了一定深度的研究。5位同學(xué)在活動(dòng)現(xiàn)場(chǎng)做了細(xì)致的分享,廣大同學(xué)們都表示受益匪淺,以下為本次活動(dòng)的回顧總結(jié)。
陸洲現(xiàn)場(chǎng)圖
第一位分享的嘉賓是北京大學(xué)數(shù)學(xué)科學(xué)學(xué)院大四本科生陸洲,分享題目是從寬度來看神經(jīng)網(wǎng)絡(luò)的表達(dá)能力(The expressive power of neural networks : A view from the width)
他表示最近雖然有很多神經(jīng)網(wǎng)絡(luò)表達(dá)能力的相關(guān)研究工作,但多數(shù)注重于深度如何影響表達(dá)能力。
而這篇論文則從寬度入手,分別從寬度帶來的相變,以及寬度與深度對(duì)效率的影響來做實(shí)驗(yàn),得到了關(guān)于神經(jīng)網(wǎng)絡(luò)表達(dá)能力的新結(jié)果。
他認(rèn)為,研究深度學(xué)習(xí)表達(dá)能力,有助于我們對(duì)于給定任務(wù),選擇較優(yōu)的網(wǎng)絡(luò)框架。也是數(shù)學(xué)上解釋深度學(xué)習(xí)的必要一環(huán)。
鄧志杰現(xiàn)場(chǎng)圖
第二位分享嘉賓是清華大學(xué)計(jì)算機(jī)系人智所博士生鄧志杰,分享主題為:結(jié)構(gòu)化生成對(duì)抗網(wǎng)絡(luò)(Structured Generative Adversarial Networks)
研究工作是基于指定語義或結(jié)構(gòu)信息的條件產(chǎn)生式建模。現(xiàn)有的模型在搭建條件生成器時(shí),往往需要大量的標(biāo)注數(shù)據(jù)作為監(jiān)督信號(hào),而且不能夠準(zhǔn)確地對(duì)生成樣本的語義信息加以控制。
因此他們提出結(jié)構(gòu)化生成對(duì)抗網(wǎng)絡(luò)(SGAN) 來解決半監(jiān)督條件產(chǎn)生式建模這個(gè)問題。
SGAN 假設(shè)數(shù)據(jù) x 基于兩個(gè)獨(dú)立的隱變量 y 和 z 來生成: y 編碼了指定的語義信息,z 包含其他的可變因素。SGAN 的訓(xùn)練要解決兩個(gè)對(duì)抗游戲,它們能夠保證模型中各部分收斂到數(shù)據(jù)的真實(shí)聯(lián)合分布p(x, y)和p(x, z)。為了確保 y 和 z 的解耦和,SGAN 搭建了兩個(gè)合作游戲,它們?cè)陔[空間上最小化重建誤差。
他們進(jìn)行了大量的實(shí)驗(yàn)來評(píng)估結(jié)構(gòu)化生成對(duì)抗網(wǎng)絡(luò)。實(shí)驗(yàn)表明 SGAN 能夠?qū)W習(xí)出一個(gè)高度可控的條件生成器,以及數(shù)據(jù)的解耦和的表示。
SGAN 在半監(jiān)督分類任務(wù)的多個(gè)數(shù)據(jù)集上都取得了很好的實(shí)驗(yàn)結(jié)果。得益于對(duì) y 和 z 的分開建模,SGAN 能夠生成高質(zhì)量并且嚴(yán)格遵循指定語義的樣本。此外,SGAN 還能被擴(kuò)展來進(jìn)行一些有趣的實(shí)驗(yàn),包括圖像演化和圖像風(fēng)格遷移。
陳鍵飛現(xiàn)場(chǎng)圖
第三位分享嘉賓是清華大學(xué)計(jì)算機(jī)系人智所博士生陳鍵飛,分享主題是:樣本匹配差異及其在深度學(xué)習(xí)中的應(yīng)用(Population Matching Discrepancy and Applications in Deep Learning)
兩個(gè)概率分布之間可導(dǎo)的距離估計(jì)是對(duì)很多深度學(xué)習(xí)任務(wù)重要的問題。其中一種距離估計(jì)是最大平均差異(MMD)。
但是MMD有對(duì)核半徑敏感、梯度弱以及用于訓(xùn)練目標(biāo)時(shí)mini batch過大等問題。
論文中的分享圍繞這一問題,介紹了他們?cè)贜IPS 2017上提出的樣本匹配差異(PMD)。
他們提出了PMD作為分布之間距離的估計(jì),并提出了用PMD作為目標(biāo)函數(shù)時(shí)學(xué)習(xí)分布參數(shù)的算法。PMD定義成兩分布樣本構(gòu)成的二分圖的最小匹配,證明了PMD是Wasserstein度量的強(qiáng)一致估計(jì)量。
實(shí)驗(yàn)中將PMD用于了兩個(gè)深度學(xué)習(xí)問題,包括領(lǐng)域自適應(yīng)和訓(xùn)練產(chǎn)生式模型。結(jié)果表明PMD克服了上述MMD的不足,并在效果和收斂速度上都超過了MMD。
汪躍現(xiàn)場(chǎng)圖
第四位嘉賓是北京交通大學(xué)理學(xué)院博士生汪躍,分享主題是:馬爾科夫情形下的GTD 策略評(píng)估算法有限樣本誤差分析 (Finite sample analysis of the GTD Policy Evaluation Algorithms in Markov Setting)
汪躍說自己雖然是數(shù)學(xué)專業(yè),但是特別喜歡跟應(yīng)用結(jié)合的相關(guān)領(lǐng)域。曾經(jīng)做過一段時(shí)間與腦科學(xué)有關(guān)的影像遺傳學(xué)方面的工作。最近感興趣的方向主要集中在強(qiáng)化學(xué)習(xí)中的算法理論分析和算法設(shè)計(jì)等方面,以及優(yōu)化算法相關(guān)的方向 。
策略評(píng)估是強(qiáng)化學(xué)習(xí)中一個(gè)重要的組成部分。策略評(píng)估的目標(biāo)是估計(jì)給定策略的價(jià)值函數(shù)(從任一狀態(tài)出發(fā),依照給定的策略時(shí),期望意義下未來的累計(jì)回報(bào))。一個(gè)好的策略評(píng)估算法可以更準(zhǔn)確的估計(jì)出當(dāng)前策略的價(jià)值函數(shù),并且有助于找到一個(gè)更好的策略。
當(dāng)狀態(tài)空間特別大或者是連續(xù)空間的時(shí)候,線性函數(shù)近似下的GTD策略評(píng)估算法非常常用??紤]到收集數(shù)據(jù)的過程非常耗費(fèi)時(shí)間和代價(jià),清楚的理解GTD算法在有限樣本情況下的表現(xiàn)就顯得非常重要。
之前的工作將GTD算法與鞍點(diǎn)問題建立了聯(lián)系,并且在樣本獨(dú)立同分布和步長為定值的情況下給出了GTD算法的有限樣本誤差分析。但是,在實(shí)際的強(qiáng)化學(xué)習(xí)問題中,數(shù)據(jù)都是由馬氏決策過程產(chǎn)生的,并不是獨(dú)立同分布的。并且在實(shí)際中,步長往往也不一定是一個(gè)定值。
這篇論文中首先證明了在數(shù)據(jù)來自于馬爾科夫鏈的情況下,鞍點(diǎn)問題的期望意義下和高概率意義下的有限樣本誤差,進(jìn)而得到了更接近于實(shí)際情形下的GTD的算法的有限樣本誤差分析。從結(jié)果中可以看到, 在實(shí)際中的馬爾科夫的情形下:
(1)GTD算法確實(shí)依然收斂;
(2)收斂的速率依賴于步長的設(shè)定和馬爾科夫鏈的混合時(shí)間這一屬性;
(3)通過混合時(shí)間的角度解釋了經(jīng)驗(yàn)回放這一技巧的有效性,其有效性可以理解成縮短了馬爾科夫鏈的混合時(shí)間。
單小涵現(xiàn)場(chǎng)圖
第五位分享嘉賓是中國科學(xué)院計(jì)算技術(shù)研究所博士生單小涵,分享主題是:帶有ε-近似次模閾值函數(shù)的影響力最大化問題(Influence Maximization with epsilon-Almost Submodular Threshold Function )
她分享的主要是社交網(wǎng)絡(luò)影響力最大化算法研究。影響力最大化旨在從社交網(wǎng)絡(luò)中選擇K個(gè)種子節(jié)點(diǎn),使得這k個(gè)種子節(jié)點(diǎn)通過傳播產(chǎn)生的影響范圍最大。這個(gè)問題已經(jīng)被廣泛研究,但是大多的工作專注于次模的影響力傳播模型。然而許多現(xiàn)實(shí)的傳播現(xiàn)象表明,在實(shí)際傳播中非次?,F(xiàn)象十分普遍。
分享開始時(shí),她舉了幾個(gè)通俗的例子,介紹了目前幾個(gè)用戶規(guī)模較大的社交網(wǎng)絡(luò)和三個(gè)經(jīng)典的傳播模型。
隨后分別對(duì)三大傳播模型的算法進(jìn)行了介紹,而這篇論文的價(jià)值所在是作者在論文中提到了一種近次模函數(shù),并以這類函數(shù)作為閾值,研究通用閾值模型下的影響力最大化問題。
嘉賓演講完的提問環(huán)節(jié),同學(xué)們表現(xiàn)非常踴躍積極,收獲滿滿
內(nèi)容分享結(jié)束后,幾位嘉賓還同時(shí)分享了他們?cè)陧敃?huì)上發(fā)論文的心得與體會(huì)。在最后的問答環(huán)節(jié)中,現(xiàn)場(chǎng)有很多剛剛?cè)雽W(xué)的研究生,就學(xué)習(xí)、未來學(xué)術(shù)研究方向以及怎樣才能進(jìn)到像微軟亞研這樣的大企業(yè)實(shí)習(xí)等方面遇到的問題請(qǐng)教了幾位嘉賓,他們都耐心給出了解答,廣大在場(chǎng)的同學(xué)們都收獲良多。以上就是GAIR大講堂NIPS清華專場(chǎng) 5位嘉賓分享的全部內(nèi)容。AI科技評(píng)論為大家整理了本次活動(dòng)現(xiàn)場(chǎng)PPT(可關(guān)注AI科技評(píng)論公眾號(hào),后臺(tái)回復(fù)“清華PPT”即可獲取下載地址和密碼。)
雷鋒網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。
本專題其他文章