0
本文作者: AI研習(xí)社 | 2020-04-03 10:41 |
DeepCap:基于弱監(jiān)督的單目人體動(dòng)作捕捉
使用嵌入正則化和軟相似度度量的方法對(duì)文本分類問題進(jìn)行處理
頻域圖注意力網(wǎng)絡(luò)
CVPR 2020 | 基于多視角自然圖片的弱監(jiān)督3D人體姿態(tài)估計(jì)
基于參數(shù)無關(guān)風(fēng)格投影的任意風(fēng)格遷移
論文名稱:DeepCap: Monocular Human Performance Capture Using Weak Supervision
作者: Habermann Marc /Xu Weipeng /Zollhoefer Michael /Pons-Moll Gerard /Theobalt Christian
發(fā)表時(shí)間:2020/3/18
論文鏈接:https://paper.yanxishe.com/review/14544?from=leiphonecolumn_paperreview0403
推薦原因
人體動(dòng)作捕捉是一個(gè)非常重要的計(jì)算機(jī)視覺問題,在電影制作和虛擬/增強(qiáng)現(xiàn)實(shí)中有許多應(yīng)用。
以前的方法要么需要非常昂貴的多視角裝置或者無法恢復(fù)幀與幀之間的密集幾何一致性。本文提出了一種基于深度學(xué)習(xí)的單目密集人體動(dòng)作捕捉方法,在訓(xùn)練階段基于多視角圖像以弱監(jiān)督的方式進(jìn)行訓(xùn)練,網(wǎng)絡(luò)架構(gòu)基于兩個(gè)獨(dú)立的網(wǎng)絡(luò),以整個(gè)任務(wù)解耦成姿態(tài)估計(jì)和表面非剛性形變兩個(gè)任務(wù)。作者通過定性和定量的比較驗(yàn)證了文章方法在質(zhì)量和魯棒性方面都要優(yōu)于目前最優(yōu)方法。
論文名稱:Text classification with word embedding regularization and soft similarity measure
作者: Vít Novotny Eniafe Festus Ayetiran Michal ?tefánik Petr Sojka
發(fā)表時(shí)間:2020/3/10
論文鏈接:https://paper.yanxishe.com/review/14543?from=leiphonecolumn_paperreview0403
推薦原因
作者從詞嵌入的生成、機(jī)器學(xué)習(xí)正則化方法、深度學(xué)習(xí)正則化方法、針對(duì)詞嵌入的正則化方法等角度詳細(xì)地介紹了對(duì)詞嵌入進(jìn)行正則化的方法和現(xiàn)狀,同時(shí)提出了對(duì)現(xiàn)有的正則化方法的優(yōu)化,并且使用多種文本相似度度量方法在多個(gè)文本分類數(shù)據(jù)集上進(jìn)行驗(yàn)證
作者提出了一種基于正交化方法的詞嵌入正則化方法,并且證明了這種方法對(duì)于多個(gè)文本分類任務(wù)均能有效減少訓(xùn)練時(shí)間和內(nèi)存消耗,并且分類能力還可得到一定的提升。同時(shí),作者驗(yàn)證了使用正交化的詞嵌入時(shí),使用SCM作為文本相似度度量比當(dāng)前最優(yōu)的WMD要快的多
個(gè)人看法,這篇文章對(duì)于基于預(yù)訓(xùn)練的模型進(jìn)行調(diào)優(yōu)或是遷移學(xué)習(xí),有參考意義。
論文名稱:Spectral Graph Attention Network
作者: Heng Chang /Yu Rong /Tingyang Xu /Wenbing Huang /Somayeh Sojoudi /Junzhou Huang /Wenwu Zhu
發(fā)表時(shí)間:2020/3/16
論文鏈接:https://paper.yanxishe.com/review/14497?from=leiphonecolumn_paperreview0403
推薦原因
1 核心問題
用于表示學(xué)習(xí)的圖神經(jīng)網(wǎng)絡(luò)實(shí)在多個(gè)領(lǐng)域上有著豐厚的成果,其中,圖注意力網(wǎng)絡(luò)使用了自注意力機(jī)制,使用時(shí)域?qū)W習(xí)到了每條邊的注意力權(quán)重。然而,此機(jī)制只注意到了圖的局部信息,極大地增加了參數(shù)數(shù)目。本文主要?jiǎng)t面對(duì)的是在頻域引入圖注意力機(jī)制的核心問題。
2 創(chuàng)新點(diǎn)
本文提出的頻域圖注意力網(wǎng)絡(luò),主要學(xué)習(xí)了有關(guān)加權(quán)過濾器和圖小波基的不同頻率分量的表示,并基于全局視角對(duì)圖結(jié)構(gòu)信息進(jìn)行了顯式編碼。具體來說,本文選擇了圖小波作為基,并將其分解為低頻分量和高頻分量,然后,根據(jù)低頻分量和高頻分量構(gòu)造兩個(gè)不同的卷積核,并將注意力機(jī)制運(yùn)用到這兩個(gè)卷積核上,使其得以捕捉其重要性。最后,本文應(yīng)用了池化和激活函數(shù)去產(chǎn)生最終輸出。
3 研究意義
本文提出的方法,比起傳統(tǒng)的圖注意網(wǎng)絡(luò),可以使用更少的學(xué)習(xí)參數(shù),更好的捕捉圖的全局特征,從而實(shí)現(xiàn)了高效性。通過在半監(jiān)督節(jié)點(diǎn)分類任務(wù)對(duì)本論文提出方法的評(píng)估,證明了此機(jī)制的高效性。
論文名稱:Weakly-Supervised 3D Human Pose Learning via Multi-view Images in the Wild
作者: Umar Iqbal /Pavlo Molchanov /Jan Kautz
發(fā)表時(shí)間:2020/3/17
論文鏈接:https://paper.yanxishe.com/review/14471?from=leiphonecolumn_paperreview0403
推薦原因
本文已被CVPR2020接收。從自然圖片進(jìn)行3D人體姿態(tài)估計(jì)是近些年比較火熱的研究課題,但缺乏相應(yīng)的3D標(biāo)注是目前面臨的主要難題。本文提出了一種不需要3D標(biāo)注的弱監(jiān)督方案來解決這一問題,從比較容易獲得的無標(biāo)簽的多視角數(shù)據(jù)預(yù)測(cè)人體的3D姿態(tài)。
作者提出了一種新穎的端到端框架,可以使用多視角圖片的一致性來實(shí)現(xiàn)弱監(jiān)督訓(xùn)練,作者使用基于2.5D的姿態(tài)表示,并提出了一種新穎的目標(biāo)函數(shù),只有在模型預(yù)測(cè)的所有視角的姿態(tài)合理且一致時(shí)才將其最小化。作者最后在兩個(gè)大型數(shù)據(jù)集(Human3.6M和MPII-INF-3DHP)上評(píng)估了文章方法,在所有半監(jiān)督/弱監(jiān)督方法中,文章方法取得了最優(yōu)異的表現(xiàn)。
論文名稱:Parameter-Free Style Projection for Arbitrary Style Transfer
作者: Siyu Huang /Haoyi Xiong /Tianyang Wang /Qingzhong Wang /Zeyu Chen /Jun Huan /Dejing Dou
發(fā)表時(shí)間:2020/3/17
論文鏈接:https://paper.yanxishe.com/review/14461?from=leiphonecolumn_paperreview0403
推薦原因
圖像風(fēng)格遷移是近些年比較熱門的研究方向,但任意圖像的風(fēng)格遷移仍然是一個(gè)具有挑戰(zhàn)性的任務(wù),基于任意一張風(fēng)格圖像來風(fēng)格化內(nèi)容圖像是一個(gè)比較困難的問題。
本文提出了一種參數(shù)無關(guān)的算法Style Projection,來進(jìn)行快速有效的內(nèi)容-風(fēng)格轉(zhuǎn)換。借助提出的Style Projection模塊,作者進(jìn)一步提出了一個(gè)用于任意風(fēng)格遷移的實(shí)時(shí)前饋模型。作者通過定性分析、定量分析和用戶調(diào)研驗(yàn)證了文章方法的有效性和高效性。
雷鋒網(wǎng)雷鋒網(wǎng)雷鋒網(wǎng)
相關(guān)文章:
今日 Paper | 協(xié)作蒸餾;人臉反欺騙;人臉表示;3D-CariGAN等
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。