0
本文作者: AI研習(xí)社 | 2020-01-10 14:33 |
為了幫助各位學(xué)術(shù)青年更好地學(xué)習(xí)前沿研究成果和技術(shù),AI科技評(píng)論聯(lián)合Paper 研習(xí)社(paper.yanxishe.com),重磅推出【今日 Paper】欄目, 每天都為你精選關(guān)于人工智能的前沿學(xué)術(shù)論文供你學(xué)習(xí)參考。以下是今日的精選內(nèi)容——
Reinforcement Learning via Fenchel-Rockafellar Duality
Scalable Gradients for Stochastic Differential Equations
Streaming automatic speech recognition with the transformer model
The importance of phase in complex compressive sensing
Do As I Do: Transferring Human Motion and Appearance between Monocular Videos with Spatial and Temporal Constraints
Generating Object Stamps
RoboFly: An insect-sized robot with simplified fabrication that is capable of flight, ground, and water surface locomotion
FrequentNet : A New Deep Learning Baseline for Image Classification
Convolutional Networks with Dense Connectivity
Implementing version control with Git as a learning objective in statistics courses
論文名稱:Reinforcement Learning via Fenchel-Rockafellar Duality
作者:Nachum Ofir /Dai Bo
發(fā)表時(shí)間:2020/1/7
論文鏈接:https://paper.yanxishe.com/review/8517?from=leiphonecolumn_papereview0110
推薦理由:作者回顧凸對(duì)偶性的基本概念,重點(diǎn)是非常普遍且極為有用的Fenchel-Rockafellar對(duì)偶性。
作者總結(jié)了如何將這種對(duì)偶性應(yīng)用于各種強(qiáng)化學(xué)習(xí)(RL)設(shè)置,包括策略評(píng)估或優(yōu)化,在線或離線學(xué)習(xí)以及打折或未打折的獎(jiǎng)勵(lì)。 這些推導(dǎo)產(chǎn)生了許多有趣的結(jié)果,包括使用行為不可知的離線數(shù)據(jù)執(zhí)行策略評(píng)估和基于策略的策略梯度的能力,以及通過(guò)最大似然優(yōu)化來(lái)學(xué)習(xí)策略的方法。 盡管許多結(jié)果以前都以各種形式出現(xiàn)過(guò),但是作者對(duì)這些結(jié)果提供了統(tǒng)一的處理方法和觀點(diǎn),作者希望它們能夠使研究人員更好地使用和應(yīng)用凸對(duì)偶工具,從而在RL中取得更大的進(jìn)步。
論文名稱:Scalable Gradients for Stochastic Differential Equations
作者:Li Xuechen /Wong Ting-Kam Leonard /Chen Ricky T. Q. /Duvenaud David
發(fā)表時(shí)間:2020/1/5
論文鏈接:https://paper.yanxishe.com/review/8518?from=leiphonecolumn_papereview0110
推薦理由:伴隨靈敏度方法可縮放地計(jì)算常微分方程解的梯度。 作者將這種方法推廣到隨機(jī)微分方程,從而利用高階自適應(yīng)求解器實(shí)現(xiàn)梯度的時(shí)效性和恒定內(nèi)存計(jì)算。 具體來(lái)說(shuō),作者推導(dǎo)了一個(gè)隨機(jī)微分方程,其解為梯度,一種用于記憶噪聲的內(nèi)存有效算法以及數(shù)值解收斂的條件。 此外,作者將其方法與基于梯度的隨機(jī)變分推斷相結(jié)合,以解決潛在的隨機(jī)微分方程。 作者使用這種方法來(lái)擬合由神經(jīng)網(wǎng)絡(luò)定義的隨機(jī)動(dòng)力學(xué),從而在50維運(yùn)動(dòng)捕獲數(shù)據(jù)集上實(shí)現(xiàn)競(jìng)爭(zhēng)性能。
論文名稱:Streaming automatic speech recognition with the transformer model
作者:Moritz Niko /Hori Takaaki /Roux Jonathan Le
發(fā)表時(shí)間:2020/1/8
論文鏈接:https://paper.yanxishe.com/review/8514?from=leiphonecolumn_papereview0110
推薦理由:基于編碼器-解碼器的序列到序列模型已經(jīng)證明了端到端自動(dòng)語(yǔ)音識(shí)別(ASR)的最新結(jié)果。最近,與基于遞歸神經(jīng)網(wǎng)絡(luò)(RNN)的系統(tǒng)體系結(jié)構(gòu)相比,使用自我注意力對(duì)時(shí)間上下文信息進(jìn)行建模的轉(zhuǎn)換器體系結(jié)構(gòu)已顯示出顯著更低的字錯(cuò)誤率(WER)。盡管獲得了成功,但實(shí)際使用僅限于脫機(jī)ASR任務(wù),因?yàn)榫幋a器/解碼器體系結(jié)構(gòu)通常需要整個(gè)語(yǔ)音發(fā)音作為輸入。
在這項(xiàng)工作中,作者提出了一種基于變壓器的端到端ASR系統(tǒng),用于流式傳輸ASR,在該系統(tǒng)中,每個(gè)口語(yǔ)單詞后必須立即生成輸出。為此,我們對(duì)編碼器應(yīng)用了有時(shí)間限制的自注意力,并為編碼器-解碼器注意機(jī)制觸發(fā)了注意。對(duì)于LibriSpeech的“干凈”和“其他”測(cè)試數(shù)據(jù),作者提出的流媒體轉(zhuǎn)換器體系結(jié)構(gòu)實(shí)現(xiàn)了2.7%和7.0%的WER,據(jù)所知,這是針對(duì)此任務(wù)發(fā)布的最佳流媒體端到端ASR結(jié)果。
論文名稱:The importance of phase in complex compressive sensing
作者:Jacques Laurent /Feuillen Thomas
發(fā)表時(shí)間:2020/1/8
論文鏈接:https://paper.yanxishe.com/review/8513?from=leiphonecolumn_papereview0110
推薦理由:作者考慮從復(fù)雜隨機(jī)測(cè)量的相位(即在僅相位壓縮感測(cè)(PO-CS)場(chǎng)景中)估計(jì)實(shí)際的低復(fù)雜度信號(hào)(例如稀疏矢量或低秩矩陣)的問(wèn)題。
作者表明,如果感測(cè)矩陣是一個(gè)復(fù)雜的高斯隨機(jī)矩陣,并且與信號(hào)空間的復(fù)雜度級(jí)別相比測(cè)量次數(shù)較大,則可以以高概率且高達(dá)全局未知信號(hào)幅度,來(lái)完美地恢復(fù)此類信號(hào)。 。此外,如果每個(gè)測(cè)量值都乘以未知符號(hào),則仍可以恢復(fù)。作者的方法是通過(guò)將(非線性)PO-CS方案重鑄為根據(jù)信號(hào)歸一化約束和相位一致性約束(施加任何信號(hào)估計(jì)以匹配測(cè)量域中的觀測(cè)相位)構(gòu)建的線性壓縮感測(cè)模型而進(jìn)行的。實(shí)際上,可以從壓縮感測(cè)文獻(xiàn)的任何實(shí)例最優(yōu)算法(例如,基本追蹤去噪)中獲得穩(wěn)定且魯棒的信號(hào)方向估計(jì)。通過(guò)證明與該等效線性模型關(guān)聯(lián)的矩陣,可以在上述條件下以測(cè)量次數(shù)高概率滿足受限等軸測(cè)特性,從而確保這一點(diǎn)。作者最終通過(guò)實(shí)驗(yàn)觀察到,穩(wěn)健的信號(hào)方向恢復(fù)大約是壓縮感測(cè)中信號(hào)恢復(fù)所需的測(cè)量次數(shù)的兩倍。
論文名稱:Do As I Do: Transferring Human Motion and Appearance between Monocular Videos with Spatial and Temporal Constraints
作者:Gomes Thiago L. /Martins Renato /Ferreira Jo?o /Nascimento Erickson R.
發(fā)表時(shí)間:2020/1/8
論文鏈接:https://paper.yanxishe.com/review/8515?from=leiphonecolumn_papereview0110
推薦理由:
從真實(shí)演員的圖像創(chuàng)建合理的虛擬演員仍然是計(jì)算機(jī)視覺(jué)和計(jì)算機(jī)圖形學(xué)的主要挑戰(zhàn)之一。無(wú)標(biāo)記的人類運(yùn)動(dòng)估計(jì)和來(lái)自野外圖像的形狀建模使這一挑戰(zhàn)脫穎而出。盡管最近在視圖合成和圖像到圖像的翻譯方面取得了進(jìn)步,但是當(dāng)前可用的配方僅限于僅轉(zhuǎn)移樣式,并且不考慮角色的運(yùn)動(dòng)和形狀,而角色的運(yùn)動(dòng)和形狀天生就混雜在一起以產(chǎn)生合理的人類形式。
在本文中,作者提出了一種統(tǒng)一的公式,用于從涉及所有這些方面的單眼視頻中轉(zhuǎn)移外觀并重新定向人類運(yùn)動(dòng)。作者的方法由四個(gè)主要部分組成,并在最初錄制他們的不同上下文中合成了新的人們視頻。與最近的外觀轉(zhuǎn)移方法不同,作者考慮了身體形狀,外觀和運(yùn)動(dòng)約束。評(píng)估是使用包含嚴(yán)酷條件的可公開獲得的真實(shí)視頻通過(guò)幾次實(shí)驗(yàn)進(jìn)行的。其方法能夠以超越最新技術(shù)的方式傳遞人類動(dòng)作和外觀,同時(shí)保留必須保持的動(dòng)作的特定特征(例如,腳觸摸地板,手觸摸特定對(duì)象)并保持最佳狀態(tài)視覺(jué)質(zhì)量和外觀指標(biāo),例如結(jié)構(gòu)相似度(SSIM)和學(xué)習(xí)的感知圖像補(bǔ)丁相似度(LPIPS)。
論文名稱:Generating Object Stamps
作者:Mejjati Youssef Alami /Shen Zejiang /Snower Michael /Gokaslan Aaron /Wang Oliver /Tompkin James /Kim Kwang In
發(fā)表時(shí)間:2020/1/1
論文鏈接:https://paper.yanxishe.com/review/8516?from=leiphonecolumn_papereview0110
推薦理由:作者提出一種算法來(lái)生成各種前景對(duì)象,并使用GAN架構(gòu)將它們合成為背景圖像。 給定對(duì)象類,用戶提供的邊界框和背景圖像,作者首先使用遮罩生成器創(chuàng)建對(duì)象形狀,然后使用紋理生成器填充遮罩,以使紋理與背景整合。 通過(guò)將對(duì)象插入的問(wèn)題分為兩個(gè)階段,作者證明了其模型可以改善各種對(duì)象生成的真實(shí)感,而這種現(xiàn)實(shí)感也與所提供的背景圖像一致。 與最新的對(duì)象插入方法相比,作者在具有挑戰(zhàn)性的COCO數(shù)據(jù)集上的結(jié)果顯示出更高的整體質(zhì)量和多樣性。
論文名稱:RoboFly: An insect-sized robot with simplified fabrication that is capable of flight, ground, and water surface locomotion
作者:Chukewad Yogesh M /James Johannes /Singh Avinash /Fuller Sawyer
發(fā)表時(shí)間:2020/1/8
論文鏈接:https://paper.yanxishe.com/review/8512?from=leiphonecolumn_papereview0110
推薦理由:像蜜蜂一樣大小的空中機(jī)器人(約100 mg)具有體積小,重量輕和材料成本低等優(yōu)點(diǎn),優(yōu)于大型機(jī)器人。先前的迭代已經(jīng)證明了飛行受控,但是由于它們由組裝在一起的許多獨(dú)立零件組成,因此很難制造。除了飛行之外,他們還無(wú)法執(zhí)行運(yùn)動(dòng)模式。
本文介紹了一種74 mg拍打翼機(jī)器人的新設(shè)計(jì),該機(jī)器人可大大減少零件數(shù)量并簡(jiǎn)化制造過(guò)程。它還具有較低的質(zhì)心,即使在不穩(wěn)定的飛行情況下,也無(wú)需長(zhǎng)腿即可使機(jī)器人額外著陸。此外,作者表明,新設(shè)計(jì)允許機(jī)翼驅(qū)動(dòng)的地面和空氣-水界面移動(dòng),從而提高了機(jī)器人的多功能性。通過(guò)增加相對(duì)于拍打翼的上行程的下行程速度來(lái)產(chǎn)生前向推力。這也允許轉(zhuǎn)向。著陸并隨后沿著地面移動(dòng)的能力使機(jī)器人能夠在障礙物下方和極其精確的位置之間協(xié)商極為狹窄的空間。作者將詳細(xì)描述新設(shè)計(jì),并提供展示這些功能以及懸停飛行和受控著陸的結(jié)果。
論文名稱:FrequentNet : A New Deep Learning Baseline for Image Classification
作者:Li Yifei /Wang Zheng /Song Kuangyan /Sun Yiming
發(fā)表時(shí)間:2020/1/4
論文鏈接:https://paper.yanxishe.com/review/8510?from=leiphonecolumn_papereview0110
推薦理由:在本文中,作者從“ PCANet”方法中概括了這一思想,以實(shí)現(xiàn)用于圖像分類的新基線深度學(xué)習(xí)模型。 代替在“ PCANet”中使用主成分向量作為濾波向量,作者在離散傅里葉分析和小波分析中使用基礎(chǔ)向量作為濾波向量。 兩者在基準(zhǔn)數(shù)據(jù)集中均達(dá)到了與“ PCANet”相當(dāng)?shù)男阅堋?nbsp;值得注意的是,作者的算法不需要任何優(yōu)化技術(shù)即可獲得這些基礎(chǔ)。
論文名稱:Convolutional Networks with Dense Connectivity
作者:Huang Gao /Liu Zhuang /Pleiss Geoff /van der Maaten Laurens /Weinberger Kilian Q.
發(fā)表時(shí)間:2020/1/8
論文鏈接:https://paper.yanxishe.com/review/8511?from=leiphonecolumn_papereview0110
推薦理由:最近的工作表明,如果卷積網(wǎng)絡(luò)在靠近輸入的層和靠近輸出的層之間包含較短的連接,則可以進(jìn)行更深入,更準(zhǔn)確和有效的訓(xùn)練。
在本文中,作者接受了這一觀察,并介紹了密集卷積網(wǎng)絡(luò)(DenseNet),該網(wǎng)絡(luò)以前饋的方式將每一層連接到其他每一層。而具有L層的傳統(tǒng)卷積網(wǎng)絡(luò)具有L連接-每層與其卷積網(wǎng)絡(luò)之間后續(xù)層-作者的網(wǎng)絡(luò)具有L(L + 1)/ 2個(gè)直接連接。對(duì)于每一層,所有先前層的特征圖都用作輸入,而其自身的特征圖則用作所有后續(xù)層的輸入。DenseNets具有幾個(gè)引人注目的優(yōu)勢(shì):它們減輕了消失梯度的問(wèn)題,鼓勵(lì)了特征重用并大大提高了參數(shù)效率。
作者在四個(gè)競(jìng)爭(zhēng)激烈的對(duì)象識(shí)別基準(zhǔn)測(cè)試任務(wù)(CIFAR-10,CIFAR-100,SVHN和ImageNet)上評(píng)估了作者提出的體系結(jié)構(gòu)。DenseNets在大多數(shù)方面都獲得了超越現(xiàn)有技術(shù)的顯著改進(jìn),同時(shí)需要更少的參數(shù)和計(jì)算即可實(shí)現(xiàn)高性能。
論文名稱:Implementing version control with Git as a learning objective in statistics courses
作者:Beckman Matthew D. /?etinkaya-Rundel Mine /Horton Nicholas J. /Rundel Colin W. /Sullivan Adam J. /Tackett Maria
發(fā)表時(shí)間:2020/1/7
論文鏈接:https://paper.yanxishe.com/review/8509?from=leiphonecolumn_papereview0110
推薦理由:版本控制是可復(fù)制工作流的基本元素,在統(tǒng)計(jì)學(xué)課程的學(xué)習(xí)目標(biāo)中應(yīng)適當(dāng)考慮。
本文介紹了四個(gè)在不同機(jī)構(gòu)教授不同課程的貢獻(xiàn)型教師的經(jīng)驗(yàn)和實(shí)施決策。 這些教師中的每一個(gè)都將版本控制作為學(xué)習(xí)目標(biāo),并將Git教學(xué)成功地集成到一個(gè)或多個(gè)統(tǒng)計(jì)課程中。 本文中描述的各種方法跨越了不同的實(shí)施策略,以適應(yīng)學(xué)生的背景,課程類型,軟件選擇和評(píng)估實(shí)踐。 通過(guò)提供廣泛的Git教學(xué)方法,本文旨在作為統(tǒng)計(jì)教員在本科或研究生課程中任何級(jí)別的課程教學(xué)的資源。
雷鋒網(wǎng)雷鋒網(wǎng)雷鋒網(wǎng)
相關(guān)文章:
今日 Paper | 高維感官空間機(jī)器人;主動(dòng)人體姿態(tài)估計(jì);深度視頻超分辨率;行人重識(shí)別等
今日 Paper | 3D手勢(shì)估計(jì);自學(xué)習(xí)機(jī)器人;魯棒語(yǔ)義分割;卷積神經(jīng)網(wǎng)絡(luò);混合高斯過(guò)程等
今日 Paper | 精簡(jiǎn)BERT;面部交換;三維點(diǎn)云;DeepFakes 及 5G 等
今日 Paper | 虛假新聞檢測(cè);馬爾可夫決策過(guò)程;場(chǎng)景文本識(shí)別;博弈論框架等
今日 Paper | 問(wèn)答系統(tǒng);3D人體形狀和姿勢(shì);面部偽造檢測(cè);AdderNet等
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。