0
本文作者: AI研習(xí)社 | 2020-02-28 11:49 |
JRMOT:一個實(shí)時3D多對象跟蹤器和一個新的大規(guī)模數(shù)據(jù)集
SD-GAN:重建被遮擋臉部部分的結(jié)構(gòu)和去噪GAN
像詞一樣表達(dá)對象:用于圖像-文本匹配的循環(huán)視覺嵌入
ADAM:一種隨機(jī)優(yōu)化方法
小冰樂隊(duì):流行音樂的旋律與編排生成框架
論文名稱:JRMOT: A Real-Time 3D Multi-Object Tracker and a New Large-Scale Dataset
作者:Shenoi Abhijeet /Patel Mihir /Gwak JunYoung /Goebel Patrick /Sadeghian Amir /Rezatofighi Hamid /Martin-Martin Roberto /Savarese Silvio
發(fā)表時間:2020/2/19
論文鏈接:https://paper.yanxishe.com/review/12209?from=leiphonecolumn_paperreview0228
推薦原因
這篇論文考慮的是自主導(dǎo)航的問題。自主導(dǎo)航代理需要感知并跟蹤周圍物體和其他代理的運(yùn)動,以實(shí)現(xiàn)健壯和安全的運(yùn)動計(jì)劃和動作執(zhí)行。盡管自主導(dǎo)航需要多對象跟蹤系統(tǒng)來提供3D信息,但是大多數(shù)已有研究都是通過RGB視頻在2D多對象跟蹤中完成的。這篇論文提出了一個新的3D多對象跟蹤系統(tǒng)JRMOT,它將來自2D RGB圖像和3D點(diǎn)云的信息集成到實(shí)時執(zhí)行框架中。這篇論文還將JRMOT合并到多模式遞歸卡爾曼架構(gòu)中的聯(lián)合概率數(shù)據(jù)關(guān)聯(lián)框架中,以實(shí)現(xiàn)在線實(shí)時3D多對象跟蹤。這篇論文同時還發(fā)布了一個新的大規(guī)模2D與3D數(shù)據(jù)集,在超過54個室內(nèi)和室外場景中標(biāo)注了超過200萬個邊框和3500種時間一致的2D+3D軌跡。
論文名稱:SD-GAN: Structural and Denoising GAN reveals facial parts under occlusion
作者:Banerjee Samik /Das Sukhendu
發(fā)表時間:2020/2/19
論文鏈接:https://paper.yanxishe.com/review/12208?from=leiphonecolumn_paperreview0228
推薦原因
這篇論文考慮的是臉部重建的問題。
在人臉識別中,如果顯著的面部特征被遮擋了,模型的識別能力會大大下降。為此這篇論文提出了一個名為SD-GAN的生成模型來重建被遮擋臉部部分,并保留原始圖像中的光照變化以及臉部身份信息。這篇論文還提出了一種新的對抗“結(jié)構(gòu)性”損失函數(shù),該函數(shù)包括兩個部分:整體損失和局部損失,分別由SSIM和逐塊MSE進(jìn)行構(gòu)建。在真實(shí)和合成的遮擋人臉數(shù)據(jù)集的實(shí)驗(yàn)表明,即使是在提高人臉識別性能方面,這篇論文提出的技術(shù)也比其他基準(zhǔn)模型具有更大的優(yōu)勢。
論文名稱:Expressing Objects just like Words: Recurrent Visual Embedding for Image-Text Matching
作者:Chen Tianlang /Luo Jiebo
發(fā)表時間:2020/2/20
論文鏈接:https://paper.yanxishe.com/review/12207?from=leiphonecolumn_paperreview0228
推薦原因
這篇論文考慮的是圖像-文本匹配問題。
圖像-文本匹配方法通常通過捕獲和聚集文本與圖像的每個獨(dú)立對象之間的親和度來推斷圖像-文本對的相似性,但是這類方法忽略了語義相關(guān)對象之間的連接。這篇論文提出了一個名為DP-RNN的雙路徑循環(huán)神經(jīng)網(wǎng)絡(luò),給定一個輸入的圖像-文本對,根據(jù)圖像對象在文本中最相關(guān)的詞的位置對圖像對象進(jìn)行重排序。與從單詞嵌入中提取隱藏特征相同,新模型利用RNN從重新排序的對象輸入中提取高級對象特征。為計(jì)算圖像-文本相似度,這篇論文將多注意交叉匹配模型合并到DP-RNN中,通過跨模態(tài)引導(dǎo)的注意和自注意機(jī)制聚集了對象和單詞之間的親和力。Flickr30K和MS-COCO數(shù)據(jù)集上的實(shí)驗(yàn)證明了DP-RNN的有效性。
論文名稱:ADAM: A METHOD FOR STOCHASTIC OPTIMIZATION
作者:Diederik P. Kingma /Jimmy Lei Ba
發(fā)表時間:2017/1/30
論文鏈接:https://paper.yanxishe.com/review/12206?from=leiphonecolumn_paperreview0228
推薦原因
核心問題:神經(jīng)網(wǎng)絡(luò)的優(yōu)化是一個重要的課題,比如梯度下降算法,動量梯度下降算法,本文介紹一種新優(yōu)化算法。
創(chuàng)新點(diǎn):Adam 是一種可以替代傳統(tǒng)隨機(jī)梯度下降(SGD)過程的一階優(yōu)化算法,它能基于訓(xùn)練數(shù)據(jù)迭代地更新神經(jīng)網(wǎng)絡(luò)權(quán)重,該方法實(shí)現(xiàn)簡單,計(jì)算效率高,對內(nèi)存的要求很小,使得神經(jīng)網(wǎng)絡(luò)訓(xùn)練很快。
研究意義:Adam比其他隨機(jī)優(yōu)化方法要好很多。
論文名稱:XiaoIce Band: A Melody and Arrangement Generation Framework for Pop Music
作者:Hongyuan Zhu / Qi Liu /Nicholas Jing Yuan /Chuan Qin /Jiawei Li
發(fā)表時間:2018/8/19
論文鏈接:https://paper.yanxishe.com/review/12205?from=leiphonecolumn_paperreview0228
推薦原因
核心問題:這篇文章簡單的看了看,雖然和自己的研究領(lǐng)域不同,但是看著挺有意思的。他們做了一個小冰樂隊(duì),一個用于歌曲生成的端到端旋律和編曲生成框架。
創(chuàng)新點(diǎn):提出基于和弦的節(jié)奏和旋律交叉生成模型來生成給定和弦進(jìn)行為條件的旋律。然后論文作者引入多樂器聯(lián)合編曲模型用于多軌音樂,這兩個任務(wù)相互協(xié)調(diào)。
研究意義:對現(xiàn)實(shí)世界數(shù)據(jù)集的廣泛實(shí)驗(yàn)證明了我們的模型相對于單軌和多軌音樂生成的基線模型的優(yōu)勢。
為了更好地服務(wù)廣大 AI 青年,AI 研習(xí)社正式推出全新「論文」版塊,希望以論文作為聚合 AI 學(xué)生青年的「興趣點(diǎn)」,通過論文整理推薦、點(diǎn)評解讀、代碼復(fù)現(xiàn)。致力成為國內(nèi)外前沿研究成果學(xué)習(xí)討論和發(fā)表的聚集地,也讓優(yōu)秀科研得到更為廣泛的傳播和認(rèn)可。
我們希望熱愛學(xué)術(shù)的你,可以加入我們的論文作者團(tuán)隊(duì)。
加入論文作者團(tuán)隊(duì)你可以獲得
1.署著你名字的文章,將你打造成最耀眼的學(xué)術(shù)明星
2.豐厚的稿酬
3.AI 名企內(nèi)推、大會門票福利、獨(dú)家周邊紀(jì)念品等等等。
加入論文作者團(tuán)隊(duì)你需要:
1.將你喜歡的論文推薦給廣大的研習(xí)社社友
2.撰寫論文解讀
如果你已經(jīng)準(zhǔn)備好加入 AI 研習(xí)社的論文兼職作者團(tuán)隊(duì),可以添加運(yùn)營小姐姐的微信(ID:julylihuaijiang),備注“論文兼職作者”
雷鋒網(wǎng)雷鋒網(wǎng)雷鋒網(wǎng)
相關(guān)文章:
今日 Paper | 聯(lián)合多任務(wù)模型;3D人體重建;可視化理解機(jī)器翻譯;深入研究整流器等
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。