0
本文作者: AI研習社 | 2020-04-15 10:14 |
句子和文檔的分布式表示
基于元學習的場景自適應視頻幀插值
美國對COVID-19的反應的縣級數(shù)據(jù)集
跨域文檔對象檢測:基準套件和方法
GPS-NET:用于場景圖形生成的圖形屬性傳感網絡
論文名稱:Distributed Representations of Sentences and Documents
作者:Quoc Le /Tomas Mikolov
發(fā)表時間:2014/4/16
論文鏈接:https://paper.yanxishe.com/review/16072?from=leiphonecolumn_paperreview0415
推薦原因
核心問題:這篇文章主要做了一個問題,就是如何表示一個文檔或者句子的向量,過去我們常常學習到詞向量,而這個工作進一步的提升,變?yōu)榱巳绾伪硎菊麄€句子的詞向量。
創(chuàng)新點:本文應用了word2vec中詞向量的訓練方法,具體來說在每詞輸入的時候,都將文章的id進行輸入,通過反向傳播算法,此時文章id對應的embedding就是最終的文檔的編碼。
研究意義:文檔的表示應用很多,如果能夠得到一個非常好的文檔表示,那么詞向量的表示就可以進行省略了。
論文名稱:Scene-Adaptive Video Frame Interpolation via Meta-Learning
作者:Choi Myungsub /Choi Janghoon /Baik Sungyong /Kim Tae Hyun /Lee Kyoung Mu
發(fā)表時間:2020/4/2
論文鏈接:https://paper.yanxishe.com/review/16066?from=leiphonecolumn_paperreview0415
推薦原因
這篇論文被CVPR 2020接收,考慮的是視頻幀插值的問題。
在這個問題中,根據(jù)前景和背景運動、幀速率和遮擋的變化,每個視頻都有不同場景。因此具有固定參數(shù)的單個網絡很難跨不同視頻進行概括。理想情況下每個場景都可以有一個不同網絡,但在實際應用的計算中是不可行的。這篇論文提出通過利用在測試時容易獲得的其他信息來使模型適應每個視頻。首先通過簡單的網絡微調來展示“測試時間自適應”(test-time adaptation)的好處,然后通過將其與元學習融合以顯著提高效率。這篇論文表明僅需進行一次梯度更新即可獲得顯著性能提升,而無需任何其他參數(shù)。最后,這篇論文證明元學習框架可以輕松應用于任何視頻幀插值網絡,且可以在多個基準數(shù)據(jù)集上持續(xù)提高其性能。
論文名稱:A County-level Dataset for Informing the United States' Response to COVID-19
作者:Killeen Benjamin D. /Wu Jie Ying /Shah Kinjal /Zapaishchykova Anna /Nikutta Philipp /Tamhane Aniruddha /Chakraborty Shreya /Wei Jinchi /Gao Tiger /Thies Mareike /Unberath Mathias
發(fā)表時間:2020/4/1
論文鏈接:https://paper.yanxishe.com/review/16065?from=leiphonecolumn_paperreview0415
推薦原因
這篇論文為COVID-19的疫情研究者和政策制定者貢獻了一個新的數(shù)據(jù)集,該數(shù)據(jù)集匯總了縣級政府、新聞和學術來源的相關數(shù)據(jù)。除JHU CSSE COVID-19信息中心的縣級時間序列數(shù)據(jù)外,該數(shù)據(jù)集還包含300多個變量,這些變量匯總了人口估計值、人口統(tǒng)計學、族裔、住房、教育、就業(yè)以及未來收入、氣候、過境得分及與醫(yī)療保健系統(tǒng)相關的各項指標。此外,這篇論文匯總了每個縣(包括雜貨店和醫(yī)院)各個景點的戶外活動信息,并匯總了SafeGraph的數(shù)據(jù)。通過收集這些數(shù)據(jù),并提供讀取這些數(shù)據(jù)的工具,該文作者希望能夠幫助研究人員調查疾病的傳播方式以及哪些社區(qū)最能適應在家中工作。
論文名稱:Cross-Domain Document Object Detection: Benchmark Suite and Method
作者:Li Kai /Wigington Curtis /Tensmeyer Chris /Zhao Handong /Barmpalios Nikolaos /Morariu Vlad I. /Manjunatha Varun /Sun Tong /Fu Yun
發(fā)表時間:2020/3/30
論文鏈接:https://paper.yanxishe.com/review/15953?from=leiphonecolumn_paperreview0415
推薦原因
這篇論文被CVPR 2020接收,考慮的是文檔對象檢測(Document Object Detection,DOD)的問題。
這篇論文研究跨域DOD,使用源域中的標記數(shù)據(jù)和目標域中的未標記數(shù)據(jù)來學習目標域的檢測器。為此這篇論文建立了一個基準套件,其中包含可用于跨域DOD模型訓練和評估的不同類型PDF文檔數(shù)據(jù)集。對于每個數(shù)據(jù)集,這篇論文提供頁面圖像、邊框標注、PDF文件及從PDF文件提取的渲染層。此外,這篇論文提出了一種新跨域DOD模型,該模型基于標準檢測模型并通過合并三個新的對齊模塊來解決域偏移:特征金字塔對齊模塊,區(qū)域對齊模塊和渲染層對齊模塊。在基準套件上進行的實驗證實了新方法的優(yōu)越性。
論文名稱:GPS-Net: Graph Property Sensing Network for Scene Graph Generation
作者:Lin Xin /Ding Changxing /Zeng Jinquan /Tao Dacheng
發(fā)表時間:2020/3/29
論文鏈接:https://paper.yanxishe.com/review/15952?from=leiphonecolumn_paperreview0415
推薦原因
這篇論文被CVPR 2020接收,要處理的是場景圖生成(Scene Graph Generation,SGG)問題,即檢測圖像中的對象及其成對關系。
這篇論文提出了一種圖形屬性傳感網絡(Graph Property Sensing Network,GPS-Net)。GPS-Net首先通過一種新的消息傳遞模塊,使用特定于節(jié)點的上下文信息來增強節(jié)點特征,并通過三線性模型對邊緣方向信息進行編碼。其次,GPS-Net引入節(jié)點優(yōu)先級敏感損失,以反映訓練期間節(jié)點之間的優(yōu)先級差異。第三,GPS-Net通過首先軟化分布,然后根據(jù)每個對象對的視覺外觀對其進行調整來緩解長尾分布問題。GPS-Net在三個數(shù)據(jù)庫,即VG,OI和VRD上實現(xiàn)了當前的最佳性能。
雷鋒網雷鋒網雷鋒網
相關文章:
今日 Paper | MaskGAN;深度人臉識別;人體姿態(tài)估計;妝容遷移等
雷峰網原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知。