0
本文作者: AI研習(xí)社 | 2020-03-19 14:50 |
IGNOR: 基于深度學(xué)習(xí)的圖像引導(dǎo)的物體渲染
基于域驗證的圖像和諧化
人體姿態(tài)估計中的無偏數(shù)據(jù)處理方法的研究
面部X射線,可進行更一般的面部偽造檢測
即插即用(Plug and Play)的受限文本生成方法
論文名稱:IGNOR: Image-guided Neural Object Rendering
作者:Thies Justus /Zollh?fer Michael /Theobalt Christian /Stamminger Marc /Nie?ner Matthias
發(fā)表時間:2018/11/26
論文鏈接:https://paper.yanxishe.com/review/13549?from=leiphonecolumn_paperreview0319
推薦原因
本文被ICLR 2020接收!文章提出了一種基于學(xué)習(xí)的圖像引導(dǎo)的渲染技術(shù),該技術(shù)將基于圖像的渲染和基于GAN的圖像合成相結(jié)合,可以生成重建對象的高真實感渲染結(jié)果。
文章技術(shù)的核心是如何處理視角相關(guān)的視覺效果,為了解決這個問題作者首先訓(xùn)練了一個基于特定對象的深度神經(jīng)網(wǎng)絡(luò)來合成目標對象與視角無關(guān)的外觀。為了處理視角相關(guān)的效果,如物體表面的高光等,作者剔除了EffectsNet來進一步預(yù)測與視角相關(guān)的效果。作者在合成和真實數(shù)據(jù)上定性和定量的證明了文章方法的有效性。
論文名稱:Deep Image Harmonization via Domain Verification
作者:Wenyan Cong
發(fā)表時間:2020/1/1
論文鏈接:https://paper.yanxishe.com/review/13544?from=leiphonecolumn_paperreview0319
推薦原因
研究意義:
圖像合成是圖像處理中的重要操作,但是從背景或者其他圖片轉(zhuǎn)移顏色信息到前景上會嚴重降低合成圖像的質(zhì)量。目前沒有用于圖像協(xié)調(diào)的高質(zhì)量公共可用數(shù)據(jù)集極大地阻礙了圖像協(xié)調(diào)的發(fā)展技術(shù)。近年來,已經(jīng)有少量的工作嘗試用深度學(xué)習(xí)做圖像和諧化,但成對的合成圖和真實圖極難獲得。我們通過基于COCO合成的圖像(分別是Adobe5k,F(xiàn)lickr,day2night)來貢獻圖像協(xié)調(diào)數(shù)據(jù)集,通過深度學(xué)習(xí)的訓(xùn)練生成監(jiān)督信息,從而解決目前遇到的弊端。
創(chuàng)新點:
1、構(gòu)建并公布了由四個子數(shù)據(jù)庫組成的圖像和諧化數(shù)據(jù)庫。
2、提出了域驗證 (domain verification) 的概念,嘗試了基于域驗證的圖像和諧化算法。
論文名稱:The Devil is in the Details: Delving into Unbiased Data Processing for Human Pose Estimation
作者:Junjie Huang
發(fā)表時間:2019/12/1
論文鏈接:https://paper.yanxishe.com/review/13543?from=leiphonecolumn_paperreview0319
推薦原因
本文研究意義:
目前,對于人體姿勢預(yù)測的研究主要局限于自上而下的方法。然而,對于訓(xùn)練和預(yù)測的基本組成部分,尚未在姿勢預(yù)測中考慮數(shù)據(jù)的處理?;诖?,本文以此為出發(fā)點,提出了有偏數(shù)據(jù)的處理在研究自上而下的姿態(tài)估計器中的作用。
本文的創(chuàng)新點:
1、UDP,解決了現(xiàn)有的SOTA人體姿態(tài)估計算法中標準編解碼方法存在較大統(tǒng)計誤差的問題。
2、該算法解決了由于翻轉(zhuǎn)測試而導(dǎo)致的結(jié)果不對齊問題。
3、該算法即用即插,在基本不增加模型復(fù)雜度的情況下,有效提升了算法性能。
論文名稱:Face X-ray for More General Face Forgery Detection
作者:Lingzhi Li1
發(fā)表時間:2019/12/1
論文鏈接:https://paper.yanxishe.com/review/13542?from=leiphonecolumn_paperreview0319
推薦原因
本文研究意義:
這篇文章是微軟亞洲研究院的研究paper。在本文中,作者提出了一個方法---面部X射線,它既不需要了解換臉后的圖像數(shù)據(jù),也不需要知道換臉算法,就能對圖像做『X-Ray』,鑒別出是否換臉,以及指出換臉的邊界。
本文的創(chuàng)新點:
作者提出的新模型 Face X-Ray 具有兩大屬性:能泛化到未知換臉算法、能提供可解釋的換臉邊界。要獲得這樣的優(yōu)良屬性,訣竅就藏在換臉算法的一般過程中。在當下工業(yè)界中,盛行的大多數(shù)換臉算法一般可以分為檢測、修改以及融合三部分。而本文標新立異之處在于,該新模型Face X-Ray是通過檢測第三階段產(chǎn)生的誤差來進行實驗的。
論文名稱:PLUG AND PLAY LANGUAGE MODELS: A SIMPLE APPROACH TO CONTROLLED TEXT GENERATION
作者:Sumanth Dathathri
發(fā)表時間:2019/12/1
論文鏈接:https://paper.yanxishe.com/review/13541?from=leiphonecolumn_paperreview0319
推薦原因
本文研究意義:
作者在普通語言模型的基礎(chǔ)上提出了一個用于建模生成句子中的不同屬性的屬性模型,該模型可以實現(xiàn)多種屬性上的受限文本生成。此外,作者提出的新方法PPLM,是不需要改變原有語言模型的結(jié)構(gòu),只需要讓兩個模型同時訓(xùn)練,就可以實現(xiàn)屬性控制效果的顯著提升。
創(chuàng)新點:
1、提出了一種即插即用的受限文本生成方法--PPLM。
2、PPLM不需要改變語言模型的結(jié)構(gòu),只需要讓這兩個模型同時訓(xùn)練即可。
雷鋒網(wǎng)雷鋒網(wǎng)雷鋒網(wǎng)
相關(guān)文章:
今日 Paper | CausalML;隱式函數(shù);慢動作視頻重建;交叉圖卷積網(wǎng)絡(luò)等
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。