0
本文作者: AI研習(xí)社 | 2020-01-14 15:06 |
為了幫助各位學(xué)術(shù)青年更好地學(xué)習(xí)前沿研究成果和技術(shù),AI科技評論聯(lián)合Paper 研習(xí)社(paper.yanxishe.com),重磅推出【今日 Paper】欄目, 每天都為你精選關(guān)于人工智能的前沿學(xué)術(shù)論文供你學(xué)習(xí)參考。以下是今日的精選內(nèi)容——
NWPU-Crowd: A Large-Scale Benchmark for Crowd Counting
A Collaborative Learning Framework via Federated Meta-Learning
VITON: An Image-based Virtual Try-on Network
Transfer learning for time series classification
PR Product: A Substitute for Inner Product in Neural Networks
FASTER NEURAL NETWORKS STRAIGHT FROM JPEG
Object Detection in 20 Years: A Survey
Spherical Text Embedding
Mechanism Design with Predicted Task Revenue for Bike Sharing Systems
Semantics-aware BERT for Language Understanding
論文名稱:NWPU-Crowd: A Large-Scale Benchmark for Crowd Counting
作者:Wang Qi /Gao Junyu /Lin Wei /Li Xuelong
發(fā)表時(shí)間:2020/1/10
論文鏈接:https://paper.yanxishe.com/review/8731?from=leiphonecolumn_paperreview0114
推薦原因:這篇論文考慮的是人群計(jì)數(shù)的問題。
目前公開的人群基數(shù)數(shù)據(jù)集規(guī)模都太小,不適合基于卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練。這篇論文的貢獻(xiàn)是一個(gè)一個(gè)大規(guī)模擁擠人群計(jì)數(shù)數(shù)據(jù)集NWPU-Crowd,包含了5109張圖像,共標(biāo)注了2133238個(gè)人。與其他數(shù)據(jù)集相比,新數(shù)據(jù)集包含各種光照場景,并具有目前該類問題的最大密度范圍。除此之外,研究者還開放了一個(gè)針對該數(shù)據(jù)集的評測網(wǎng)站,可以在上面提交最新結(jié)果,促進(jìn)大家的研究成果進(jìn)行比較。
論文名稱:A Collaborative Learning Framework via Federated Meta-Learning
作者:Lin Sen /Yang Guang /Zhang Junshan
發(fā)表時(shí)間:2020/1/9
論文鏈接:https://paper.yanxishe.com/review/8732?from=leiphonecolumn_paperreview0114
這篇論文考慮的是實(shí)時(shí)邊緣智能的問題。
物聯(lián)網(wǎng)中邊緣設(shè)備由于其受限的計(jì)算資源和有限的本地?cái)?shù)據(jù),通常無法實(shí)現(xiàn)實(shí)時(shí)邊緣智能。為此這篇論文提出了一個(gè)平臺增強(qiáng)的協(xié)同過濾框架,首先通過聯(lián)合元學(xué)習(xí)方法在一組邊緣節(jié)點(diǎn)上訓(xùn)練模型,然后僅通過幾個(gè)樣本就可以使得模型快速適應(yīng)目標(biāo)邊緣節(jié)點(diǎn)上的新任務(wù)。同時(shí)這篇論文還研究了其所提出的聯(lián)合元學(xué)習(xí)算法在節(jié)點(diǎn)相似性和目標(biāo)邊緣的自適應(yīng)性能上的收斂性。為了防御元學(xué)習(xí)算法可能遭受的對抗性攻擊,這篇論文進(jìn)一步提出了基于分布魯棒性優(yōu)化的聯(lián)合元學(xué)習(xí)算法。在不同數(shù)據(jù)集上進(jìn)行的實(shí)驗(yàn)證明了這篇論文所提出的基于聯(lián)合元學(xué)習(xí)的框架的有效性。
論文名稱:VITON: An Image-based Virtual Try-on Network
作者:Han Xintong /Wu Zuxuan /Wu Zhe /Yu Ruichi /Davis Larry S.
發(fā)表時(shí)間:2017/11/22
論文鏈接:https://paper.yanxishe.com/review/8579?from=leiphonecolumn_paperreview0114
推薦原因
1、第一篇關(guān)于虛擬試衣的論文
2、采用TPS的 Wrap技術(shù)
3、開源代碼;(目前數(shù)據(jù)源因法律風(fēng)險(xiǎn)關(guān)閉了)
4、值得入門閱讀
論文名稱:Transfer learning for time series classification
作者:Fawaz Hassan Ismail /Forestier Germain /Weber Jonathan /Idoumghar Lhassane /Muller Pierre-Alain
發(fā)表時(shí)間:2018/11/5
論文鏈接:https://paper.yanxishe.com/review/70?from=leiphonecolumn_paperreview0114
推薦理由:深度神經(jīng)網(wǎng)絡(luò)的轉(zhuǎn)移學(xué)習(xí)是首先在源數(shù)據(jù)集上訓(xùn)練基礎(chǔ)網(wǎng)絡(luò),然后將學(xué)習(xí)到的特征(網(wǎng)絡(luò)權(quán)重)轉(zhuǎn)移到第二個(gè)要在目標(biāo)數(shù)據(jù)集上進(jìn)行訓(xùn)練的網(wǎng)絡(luò)的過程。該想法已被證明可以在許多計(jì)算機(jī)視覺任務(wù)(例如圖像識別和對象定位)中提高深度神經(jīng)網(wǎng)絡(luò)的泛化能力。除了這些應(yīng)用程序外,深度卷積神經(jīng)網(wǎng)絡(luò)(CNN)最近在時(shí)間序列分類(TSC)社區(qū)中也很受歡迎。但是,與圖像識別問題不同,對于TSC任務(wù),尚未對傳遞學(xué)習(xí)技術(shù)進(jìn)行徹底研究。這令人驚訝,因?yàn)槿绻麖念A(yù)先訓(xùn)練的神經(jīng)網(wǎng)絡(luò)(而不是從頭開始訓(xùn)練)對模型進(jìn)行微調(diào),則可以潛在地提高TSC深度學(xué)習(xí)模型的準(zhǔn)確性。
在本文中,作者通過研究如何為TSC任務(wù)傳輸深層CNN來填補(bǔ)這一空白。為了評估轉(zhuǎn)移學(xué)習(xí)的潛力,作者使用UCR檔案進(jìn)行了廣泛的實(shí)驗(yàn),該檔案是包含85個(gè)數(shù)據(jù)集的最大的公開TSC基準(zhǔn)。對于檔案中的每個(gè)數(shù)據(jù)集,預(yù)先訓(xùn)練了一個(gè)模型,然后在其他數(shù)據(jù)集上進(jìn)行了微調(diào),產(chǎn)生了7140個(gè)不同的深度神經(jīng)網(wǎng)絡(luò)。這些實(shí)驗(yàn)表明,轉(zhuǎn)移學(xué)習(xí)可以根據(jù)轉(zhuǎn)移所使用的數(shù)據(jù)集來改善或降低模型的預(yù)測。因此,為了預(yù)測給定目標(biāo)數(shù)據(jù)集的最佳源數(shù)據(jù)集,作者提出了一種依靠動態(tài)時(shí)間扭曲來測量數(shù)據(jù)集間相似性的新方法,并描述了其方法如何指導(dǎo)轉(zhuǎn)移以選擇最佳源數(shù)據(jù)集,從而提高了85個(gè)數(shù)據(jù)集中的71個(gè)數(shù)據(jù)集的準(zhǔn)確性。
論文名稱:PR Product: A Substitute for Inner Product in Neural Networks
作者:Wang Zhennan /Zou Wenbin /Xu Chen
發(fā)表時(shí)間:2019/4/30
論文鏈接:https://paper.yanxishe.com/review/176?from=leiphonecolumn_paperreview0114
推薦理由:權(quán)重向量w與特征向量x的內(nèi)積運(yùn)算在神經(jīng)網(wǎng)絡(luò)中無處不在,但幾乎沒有人思考和研究過使用內(nèi)積帶來的負(fù)面影響。
本文指出了內(nèi)積運(yùn)算的缺點(diǎn),新提出了PR乘積運(yùn)算,該運(yùn)算克服了內(nèi)積運(yùn)算的缺點(diǎn),能夠降低網(wǎng)絡(luò)的訓(xùn)練難度。
1.研究動機(jī):內(nèi)積運(yùn)算在向量夾角接近0或pi時(shí)會使反向傳播的梯度變小,增大了網(wǎng)絡(luò)訓(xùn)練的難度
2.創(chuàng)新點(diǎn):提出PR乘積運(yùn)算,該運(yùn)算在前向傳播中與內(nèi)積等價(jià),但是在反向傳播中能夠令參數(shù)梯度與向量夾角無關(guān)
3.實(shí)驗(yàn)結(jié)果:單純的將內(nèi)積運(yùn)算替換成PR乘積就能夠明顯的提升各類網(wǎng)絡(luò)的性能,且FC、CNN、RNN均適用。
PR乘積簡單有效,即插即用,像一把趁手的瑞士軍刀,該文已被ICCV 2019 接收為口頭報(bào)告論文。
作者順手提供了PR乘積版本的Dense層、卷積層和LSTM單元的PyTorch代碼,即拆即用。
論文名稱:FASTER NEURAL NETWORKS STRAIGHT FROM JPEG
作者:Lionel Gueguen /Alex Sergeev /Ben Kadlec /Rosanne Liu /Jason Yosinski
發(fā)表時(shí)間:2018/3/21
論文鏈接:https://paper.yanxishe.com/review/72?from=leiphonecolumn_paperreview0114
推薦理由:如果沒有了解過圖像編碼,那么你可能會認(rèn)為圖片就等于三通道RGB張量。但事實(shí)上,電子設(shè)備中的圖片都是經(jīng)過編碼的,編碼后的圖像文件往往更小更緊湊,便于存儲和傳輸?,F(xiàn)有的神經(jīng)網(wǎng)絡(luò)都使用原始的RGB像素作為輸入,需要對圖片文件進(jìn)行完全解碼,但既然NN是萬能的映射學(xué)習(xí)器,能不能省去繁瑣的解碼步驟,直接基于編碼文件學(xué)習(xí)“輸入 -> 標(biāo)簽的”映射關(guān)系呢?
這篇來自NIPS18的論文以應(yīng)用最廣泛的JPEG編碼圖像為例做了嘗試。他們以“半解碼”的JPEG圖像(離散的DCT系數(shù)塊)作為輸入數(shù)據(jù),以ResNet-50網(wǎng)絡(luò)為例進(jìn)行了適應(yīng)性改造(適應(yīng)尺寸),在ImageNet數(shù)據(jù)集上的分類任務(wù)評估實(shí)驗(yàn)表明網(wǎng)絡(luò)在保持同等性能的情況下速度提升了1.77倍!也就是說“偷懶”為網(wǎng)絡(luò)帶來了顯著的提升!個(gè)人認(rèn)為其奧秘在于量化后的DCT系數(shù)表。相較于原始的像素點(diǎn)輸入,它是一個(gè)基于頻域的更加精煉、更加緊湊的新表示(Representation),好的表征自然更容易產(chǎn)生好的結(jié)果,有數(shù)據(jù)挖掘比賽經(jīng)歷的同學(xué)可以聯(lián)想一下所謂的“強(qiáng)特上分”,也就不難理解這篇論文為什么work了。
這篇文章出自Uber AI Lab,內(nèi)容簡單易理解,10分鐘快速一覽,給你新的有趣見解。
論文名稱:Object Detection in 20 Years: A Survey
作者:Zou Zhengxia /Shi Zhenwei /Guo Yuhong /Ye Jieping
發(fā)表時(shí)間:2019/5/13
論文鏈接:https://paper.yanxishe.com/review/53?from=leiphonecolumn_paperreview0114
推薦理由:這是一篇昨天于arXiv發(fā)布的目標(biāo)檢測綜述,作者對目標(biāo)檢測領(lǐng)域進(jìn)行了深度剖析,從數(shù)據(jù)集、評估指標(biāo)到技術(shù)演化,從早期的VJ Det、HOG Det等傳統(tǒng)方法到近年的FPN、RetinaNet等新方法,更有多尺度檢測的演變、候選框回歸的發(fā)展、NMS的進(jìn)步、檢測速度的突破、實(shí)際應(yīng)用的繁榮等大量干貨。誠意滿滿,強(qiáng)烈推薦!
論文名稱:Spherical Text Embedding
作者:Meng Yu /Huang Jiaxin /Wang Guangyuan /Zhang Chao /Zhuang Honglei /Kaplan Lance /Han Jiawei
發(fā)表時(shí)間:2019/11/4
論文鏈接:https://paper.yanxishe.com/review/4532?from=leiphonecolumn_paperreview0114
推薦理由:本文是數(shù)據(jù)挖掘領(lǐng)域?qū)<翼n家煒教授極力推薦的文章,非常值得一讀。
研究背景:無監(jiān)督文本嵌入在各種NLP任務(wù)中顯示了強(qiáng)大的功能。大量的文本數(shù)據(jù)本身就隱含了大量的隱模式、結(jié)構(gòu)和知識, 盡管通常在歐幾里德空間中學(xué)習(xí)文本嵌入,但是方向相似性在諸如單詞相似性和文檔聚類之類的任務(wù)中通常更有效,這在文本嵌入的訓(xùn)練階段和使用階段之間造成了差距。
創(chuàng)新點(diǎn):為了彌補(bǔ)這一差距,作者提出了一種球形生成模型,在該模型的基礎(chǔ)上,可以共同學(xué)習(xí)無監(jiān)督的單詞和段落嵌入。為了學(xué)習(xí)球形空間中的文本嵌入,本文作者開發(fā)了一種基于黎曼優(yōu)化的具有收斂保證的高效優(yōu)化算法。
研究意義:作者的模型具有很高的效率,并且在包括單詞相似性和文檔聚類在內(nèi)的各種文本嵌入任務(wù)上均具有最先進(jìn)的性能。因此我們可以借助該模型,來探索 如何將海量數(shù)據(jù)從非結(jié)構(gòu)化的數(shù)據(jù)轉(zhuǎn)化為有用的知識。
論文名稱:Mechanism Design with Predicted Task Revenue for Bike Sharing Systems
作者:Lv Hongtao /Zhang Chaoli /Zheng Zhenzhe /Luo Tie /Wu Fan /Chen Guihai
發(fā)表時(shí)間:2019/11/18
論文鏈接:https://paper.yanxishe.com/review/5496?from=leiphonecolumn_paperreview0114
推薦理由:這篇論文被AAAI 2020接收,解決的核心問題是利用用戶進(jìn)行共享單車的調(diào)度的激勵(lì)問題。
與之前的紅包車類似,共享單車公司可以通過紅包的形式激勵(lì)用戶將單車騎到指定的位置。這篇論文考慮的是當(dāng)共享單車公司可以預(yù)測調(diào)度任務(wù)可以帶來的預(yù)期收入(例如基于歷史數(shù)據(jù))場景下,提出了一種名為TruPreTar的機(jī)制,包含用戶的任務(wù)分配和獎勵(lì)方案,來激勵(lì)用戶完成單車的調(diào)度任務(wù)以實(shí)現(xiàn)供需的平衡。這種機(jī)制可以滿足包括真實(shí)上報(bào)和預(yù)算可行等經(jīng)濟(jì)學(xué)和計(jì)算性質(zhì)。當(dāng)公司預(yù)算有限時(shí),這個(gè)機(jī)制也能帶來超過預(yù)算的預(yù)期收入。作者們在摩拜的數(shù)據(jù)集上驗(yàn)證了他們提出的方案的有效性。
目前共享單車市場已經(jīng)不再野蠻擴(kuò)張,而是進(jìn)入了精細(xì)化運(yùn)作的階段。激勵(lì)用戶主動進(jìn)行單車的調(diào)度不僅可以省下專門的運(yùn)營人員的費(fèi)用,也能夠提高單車的利用率。然而如何根據(jù)有限的預(yù)算,設(shè)計(jì)高效的用戶激勵(lì)方案,以及這類激勵(lì)方案是否會被用戶接受、如何防止用戶薅羊毛等問題仍然有待進(jìn)一步研究。
論文名稱:Semantics-aware BERT for Language Understanding
作者:Zhang Zhuosheng /Wu Yuwei /Zhao Hai /Li Zuchao /Zhang Shuailiang /Zhou Xi /Zhou Xiang
發(fā)表時(shí)間:2019/9/5
論文鏈接:https://paper.yanxishe.com/review/6193?from=leiphonecolumn_paperreview0114
推薦理由:關(guān)于語言表示的最新工作將上下文相關(guān)的功能仔細(xì)地集成到了語言模型訓(xùn)練中,從而取得了一系列成功,尤其是在各種機(jī)器閱讀理解和自然語言推理任務(wù)中。但是,現(xiàn)有的語言表示模型(包括ELMo,GPT和BERT)僅利用普通的上下文相關(guān)功能,例如字符或單詞嵌入。他們很少考慮合并可以為語言表示提供豐富語義的結(jié)構(gòu)化語義信息。
創(chuàng)新點(diǎn):為了促進(jìn)對自然語言的理解,作者建議從預(yù)先訓(xùn)練的語義角色標(biāo)簽中加入顯式的上下文語義,并引入一種改進(jìn)的語言表示模型,即語義感知的BERT(SemBERT),該模型能夠在BERT骨干上顯式吸收上下文語義。SemBERT可以通過微調(diào)的方式保持BERT前驅(qū)設(shè)備的便利可用性,而無需進(jìn)行大量針對特定任務(wù)的修改。與BERT相比,語義感知BERT在概念上簡單但功能強(qiáng)大。在十項(xiàng)閱讀理解和語言推理任務(wù)上,它獲得了最新的技術(shù)水平或顯著提高了結(jié)果。
雷鋒網(wǎng)雷鋒網(wǎng)雷鋒網(wǎng)
相關(guān)文章:
今日 Paper | 人體圖像生成和衣服虛擬試穿;魯棒深度學(xué)習(xí);圖像風(fēng)格遷移等
今日 Paper | 隨機(jī)微分方程;流式自動語音識別;圖像分類等
今日 Paper | 高維感官空間機(jī)器人;主動人體姿態(tài)估計(jì);深度視頻超分辨率;行人重識別等
今日 Paper | 3D手勢估計(jì);自學(xué)習(xí)機(jī)器人;魯棒語義分割;卷積神經(jīng)網(wǎng)絡(luò);混合高斯過程等
今日 Paper | 精簡BERT;面部交換;三維點(diǎn)云;DeepFakes 及 5G 等
今日 Paper | 虛假新聞檢測;馬爾可夫決策過程;場景文本識別;博弈論框架等
今日 Paper | 問答系統(tǒng);3D人體形狀和姿勢;面部偽造檢測;AdderNet等
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。