0
本文作者: AI研習社 | 2019-12-30 16:18 |
Hi 歡迎來到Paper 研習社每日精選欄目,Paper 研習社(paper.yanxishe.com)每天都為你精選關于人工智能的前沿學術論文供你參考,以下是今日的精選內容——
Scalable Fine-grained Generated Image Classification Based>
Merging Weak and Active Supervision for Semantic Parsing
Detecting GAN generated errors
A Billion Ways to Grasp: An Evaluation of Grasp Sampling Schemes>
Look, Read and Feel: Benchmarking Ads Understanding with Multimodal Multitask Learning
Improved Mixed-Example Data Augmentation
A Baseline for Few-Shot Image Classificatio
Mixup Inference: Better Exploiting Mixup to Defend Adversarial Attacks
Extracting urban water by combining deep learning and Google Earth Engine
Facial Synthesis from Visual Attributes via Sketch using Multi-Scale Generators
Scalable Fine-grained Generated Image Classification Based>作者:Xuan Xinsheng /Peng Bo /Wang Wei /Dong Jing
發(fā)表時間:2019/12/10
論文鏈接:https://paper.yanxishe.com/review/7899
推薦理由:最近,生成的圖像可以達到非常高的質量,即使人眼也無法分辨真實圖像。盡管目前在法醫(yī)界已經有一些檢測生成圖像的方法,但是這些方法大多數(shù)都用于檢測生成圖像的一種類型。生成的新型圖像層出不窮,現(xiàn)有的檢測方法無法很好地應對。這些問題促使作者提出了一種基于深度度量學習的可擴展的多類別分類框架,旨在對生成的圖像進行更好的分類。
此外,作者增加了框架的可伸縮性,以應對不斷涌現(xiàn)的新型生成圖像,并通過微調使模型對新型生成數(shù)據獲得更好的檢測性能。
Merging Weak and Active Supervision for Semantic Parsing
作者:Ni Ansong /Yin Pengcheng /Neubig Graham
發(fā)表時間:2019/11/29
論文鏈接:https://paper.yanxishe.com/review/7900
推薦理由:語義解析器將來自用戶的自然語言命令(NL)映射到可執(zhí)行的含義表示(MR),然后在特定環(huán)境中執(zhí)行這些以獲得所需的結果。對此類解析器的全監(jiān)督培訓需要NL / MR對,并由領域專家進行注釋,這使得收集它們的成本很高。
但是,僅從成對的NL和預期的執(zhí)行結果中學習了弱監(jiān)督的語義解析器,從而使MR變得很隱蔽。雖然薄弱的監(jiān)督成本較低,但是從這些投入中學習仍然很困難。它要求解析器以非常弱的學習信號搜索較大的空間,并且很難避免以錯誤的方式獲得正確答案的虛假MR。這些因素導致在弱監(jiān)督和全監(jiān)督環(huán)境下訓練的解析器之間的性能差距。
為了彌合這一差距,作者研究了弱監(jiān)督與主動學習之間的交集,這使學習者可以主動選擇示例并查詢人工注釋作為額外的監(jiān)督,以改進在弱監(jiān)督下訓練的模型。本文研究了用于選擇示例進行查詢的各種主動學習啟發(fā)式方法,以及針對此類查詢的各種形式的額外監(jiān)督。作者在兩個不同的數(shù)據集上評估了其方法的有效性。WikiSQL上的實驗表明,通過僅注釋1.8%的示例,作者將最新的弱監(jiān)督基線提高了6.4%,達到了79.0%的準確度,與經過訓練的模型僅相距1.3%在充分監(jiān)督下。在WikiTableQuestions上使用人工注釋器進行的實驗表明,作者的方法僅使用100個活動查詢就可以提高性能,尤其是對于從冷啟動中學到的弱監(jiān)督解析器。
Detecting GAN generated errors
作者:Zhu Xiru /Che Fengdi /Yang Tianzi /Yu Tzuyang /Meger David /Dudek Gregory
發(fā)表時間:2019/12/2
論文鏈接:https://paper.yanxishe.com/review/7901
推薦理由:盡管最新的GAN在生成超逼真的圖像方面具有令人印象深刻的性能,但GAN鑒別器仍然難以評估單個生成樣本的質量。這是因為評估所生成圖像的質量的任務不同于確定圖像是真實的還是偽造的。生成的圖像可能很完美,除了在單個區(qū)域之外,但仍被檢測為偽造的。
相反,作者提出了一種新穎的方法來檢測生成的圖像中錯誤的位置。通過將實際圖像與生成的圖像進行比較,作者為每個像素計算其屬于真實分布還是生成的分布。此外,作者利用注意力來建立遠程依賴模型。這允許檢測局部上合理但不是整體上的錯誤。
為了進行評估,作者表明,與FID和IS不同,實驗的錯誤檢測可以作為單個圖像的質量指標。作者利用改進的Wasserstein,BigGAN和StyleGAN來顯示基于本文的指標的排名與FID分數(shù)有著顯著的相關性。
作者的工作為更好地了解GAN以及從GAN模型中選擇最佳樣本的能力打開了大門。
A Billion Ways to Grasp: An Evaluation of Grasp Sampling Schemes>作者:Eppner Clemens /Mousavian Arsalan /Fox Dieter
發(fā)表時間:2019/12/11
論文鏈接:https://paper.yanxishe.com/review/7902
推薦理由:機器人抓取通常被公式化為學習問題。隨著物理仿真速度和質量的提高,生成用于學習算法的大規(guī)模抓取數(shù)據集變得越來越流行。一個經常被忽略的問題是如何生成構成這些數(shù)據集的掌握信息。
在本文中,作者回顧,分類和比較了不同的抓取抽樣策略。作者的評估基于SE(3)的細粒度離散化,并使用基于物理的模擬來評估相應的平行下頜抓握的質量和魯棒性。具體來說,作者認為YCB數(shù)據集中的21個對象中的每個對象都擁有超過10億個抓取。這個密集的數(shù)據集使作者可以評估現(xiàn)有的采樣方案w.r.t. 他們的偏見和效率。
作者的實驗表明,一些流行的采樣方案包含很大的偏差,并且沒有涵蓋可以抓住物體的所有可能方式。
Look, Read and Feel: Benchmarking Ads Understanding with Multimodal Multitask Learning
作者:Zhang Huaizheng /Luo Yong /Ai Qiming /Hou Nana /Wen Yonggang
發(fā)表時間:2019/12/21
論文鏈接:https://paper.yanxishe.com/review/7892
推薦理由:這篇論文要解決的是廣告內容理解的問題。
由于廣告行業(yè)的巨大市場和在線多媒體內容(如視頻)的急劇增長,將廣告與多媒體內容一起推廣的方式逐漸流行起來。然而要為提供的內容找尋相應的廣告將耗費大量人力,因此一些自動化的廣告技術發(fā)展起來。為了進一步提升用戶體驗,理解廣告的主題與情感是必要的。這篇論文的貢獻在于提出了一種新的深度多模態(tài)多任務框架,來整合多個模態(tài)以獲得目標廣告的有效主題與情感,使得理解更容易。具體而言,所提模型首先從廣告里抽取多模態(tài)信息并學習一個高層級和可比較的表示向量。廣告的可視化元素在無監(jiān)督的情況下解碼,獲得的特征隨后被帶入所提的分層多模態(tài)注意力模塊中,用以學習為了作出最終預測而在特定任務下獲得的表示向量。另外,這篇論文還設計了一個多任務損失函數(shù)來聯(lián)合訓練主題與情感預測模型。在最新與最大規(guī)模的廣告數(shù)據集上的實驗表明所提方法取得了最佳效果。
Improved Mixed-Example Data Augmentation
作者:Summers Cecilia /Dinneen Michael J.
發(fā)表時間:2018/5/29
論文鏈接:https://paper.yanxishe.com/review/7909
推薦理由:為了減少過擬合,通常會使用數(shù)據增強來訓練神經網絡,這是通過現(xiàn)有訓練實例的保留標簽的變換人工生成額外訓練數(shù)據來完成的。盡管這些類型的轉換具有直覺上的意義,但最近的工作表明,即使是不保留標簽的數(shù)據增強也很有效果,它通過實例對的線性組合實現(xiàn)數(shù)據擴充。盡管它們有效,但對于這種方法為何起作用知之甚少。
在這項工作中,作者旨在探索這種類型的數(shù)據增強的一種新的更通用的形式,以確定這種線性是否必要。通過考慮“混合實例數(shù)據增強”的更廣泛范圍,作者發(fā)現(xiàn)了實用增強技術的更大空間,其中包括對現(xiàn)有技術進行改進的方法。這種概括所帶來的好處超出了提高性能的希望,它揭示了許多混合實例數(shù)據增強類型,這些類型與先前工作中所考慮的完全不同,這提供了證據表明此類方法有效性的理論是不完整的,并表明任何這樣的理論都必須解釋更廣泛的現(xiàn)象。
A Baseline for Few-Shot Image Classification
作者:Dhillon Guneet S. /Chaudhari Pratik /Ravichandran Avinash /Soatto Stefano
發(fā)表時間:2019/9/6
論文鏈接:https://paper.yanxishe.com/review/7912
推薦理由:對經過標準交叉熵損失訓練的深度網絡進行微調是進行小樣本學習的一個強基準。如果對它們進行傳導性微調,它的性能將優(yōu)于標準數(shù)據集(如Mini-Imagenet,Tiered-Imagenet,CIFAR-FS和FC-100)中具有相同超參數(shù)的最新技術。
這種方法的簡單性使作者能夠在Imagenet-21k數(shù)據集上演示最初的幾次學習結果。
作者發(fā)現(xiàn)使用大量的元訓練類,即使對于大量的測試類,也能獲得極高的準確率。作者不提倡他們的方法作為小樣本學習的解決方案,而只是使用結果突出顯示當前基準和小樣本學習的局限性。作者對基準數(shù)據集進行了廣泛的研究,以提出量化測試集“硬度”的指標。此度量標準可用于以更系統(tǒng)的方式說明小樣本學習算法的性能。
Mixup Inference: Better Exploiting Mixup to Defend Adversarial Attacks
作者:Pang Tianyu /Xu Kun /Zhu Jun
發(fā)表時間:2019/9/25
論文鏈接:https://paper.yanxishe.com/review/7913
推薦理由:人們已經普遍認識到,對抗性的實例可以很容易地被用來愚弄深層網絡,而深層網絡的愚弄主要來源于輸入實例附近的局部非線性行為。
在訓練過程中應用mixup,可以有效地提高泛化性能和模型的魯棒性,在訓練實例之間引入全局線性行為。然而,在以往的工作中,混合訓練模型只是通過直接對輸入進行分類,被動地防御對抗性攻擊,而誘導的全局線性并沒有得到很好的利用。也就是說,由于對抗擾動的局部性,通過模型預測的全局性主動打破局部性將更為有效。
在簡單幾何直覺的啟發(fā)下,作者發(fā)展了一種用于混合訓練模型的推理原理,稱為混合推理(MI)。MI將輸入與其他隨機干凈的樣本混合,如果輸入是對抗性的,則可以收縮并傳遞等效擾動。
作者在CIFAR-10和CIFAR-100上的實驗表明,MI可以進一步提高mixup及其變形訓練的模型的對抗魯棒性。
Extracting urban water by combining deep learning and Google Earth Engine
作者:Wang Y. D. /Li Z. W. /Zeng C. /Xia G. S. /Shen H. F.
發(fā)表時間:2019/12/23
論文鏈接:https://paper.yanxishe.com/review/7895
推薦理由:這篇論文要解決的是城市水系信息提取的問題。
城市水系對于城市生態(tài)而言至關重要。使用遠程感知數(shù)據的精準高效水系檢測對城市規(guī)劃與管理有著顯著作用。這篇論文提出了一種新方法來結合谷歌地球引擎和多粒度卷積神經網絡,通過離線訓練與預測的方式,從陸地衛(wèi)星圖像中抽取城市水系信息。
這是一篇深度學習應用于水利行業(yè)的應用,可以啟發(fā)更多計算機技術在其他領域應用的研究。
Facial Synthesis from Visual Attributes via Sketch using Multi-Scale Generators
作者:Di Xing /Patel Vishal M.
發(fā)表時間:2019/12/17
論文鏈接:https://paper.yanxishe.com/review/7894
推薦理由:這篇論文要解決的是人臉合成的問題。
從視覺屬性自動合成人臉對于計算機視覺領域而言是個重要的任務,并在法律與娛樂方面都有廣泛的落地場景。隨著深度生成卷積神經網絡的發(fā)展,從屬性合成人類圖像和文本描述的研究已有不少工作。這篇論文則是將這個問題為一個分階段學習問題:首先基于可視化屬性合成面部草圖,然后基于合成的草圖生成面部圖像。所提框架基于兩個不同的生成對抗網絡:1. 一個草圖生成網絡,以從輸入屬性中合成真實的草圖;2. 一個面部生成器,從合成的草圖中合成人臉圖像。擴展實驗證明了所提方法的有效性。
雷鋒網雷鋒網雷鋒網
相關文章:
雷峰網原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知。