丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
人工智能 正文
發(fā)私信給AI研習(xí)社-譯站
發(fā)送

0

CV 屆的金雞百花獎(jiǎng):盤點(diǎn)我心中的 CVPR 2018 創(chuàng)意 TOP10

本文作者: AI研習(xí)社-譯站 2018-07-16 15:04
導(dǎo)語(yǔ):CVPR 2018的10篇最酷論文

雷鋒網(wǎng)按:本文為雷鋒字幕組編譯的技術(shù)博客,原標(biāo)題  The 10 coolest papers from CVPR 2018 ,作者為  George Seif 。

翻譯 | 程煒  廖穎     校對(duì) |  林驍    整理 |  MY


2018 計(jì)算機(jī)視覺(jué)與模式識(shí)別會(huì)議 (CVPR) 上周在美國(guó)鹽湖城舉行,它是世界計(jì)算機(jī)視覺(jué)領(lǐng)域的頂級(jí)會(huì)議。今年,CVPR 收到了主要會(huì)議論文投稿 3300 份,接受了其中的 979 份。超過(guò) 6500 人出席了會(huì)議!6500 人齊聚一堂:

CV 屆的金雞百花獎(jiǎng):盤點(diǎn)我心中的 CVPR 2018 創(chuàng)意 TOP10

2018年度CVPR宏偉的會(huì)議廳

每年,CVPR 都會(huì)帶來(lái)杰出的人以及他們偉大的研究,我們總能看到并學(xué)習(xí)到新的東西。當(dāng)然,總有些論文發(fā)表新的突破性成果并帶來(lái)新的知識(shí)。這些論文經(jīng)常為計(jì)算機(jī)視覺(jué)的許多子領(lǐng)域帶來(lái)最新技術(shù)。

最近,很樂(lè)于看到的是具有創(chuàng)造性的論文!伴隨著深度學(xué)習(xí)在計(jì)算機(jī)視覺(jué)領(lǐng)域的突飛猛進(jìn),我們?nèi)栽谔剿魉械目赡苄?。許多論文將提出全新的深度網(wǎng)絡(luò)在視覺(jué)上的應(yīng)用。它們可能不是最根本的、具有突破性的工作,但它們很有趣。它們提供了創(chuàng)造性和啟發(fā)性的視野,經(jīng)常從新的角度引發(fā)新的想法??偠灾鼈兒芸?!

在這里,我將向你們展示我認(rèn)為是CVPR 2018中最酷的10篇論文。我們將看到最近才可能使用深度網(wǎng)絡(luò)的新應(yīng)用。另外,其他論文提供了一個(gè)如何使用它們的新方法。你可以沿著這個(gè)方向找到一些新的想法。無(wú)需多言,讓我們來(lái)看看吧!


利用綜合數(shù)據(jù)訓(xùn)練深度網(wǎng)絡(luò):通過(guò)域隨機(jī)化來(lái)彌補(bǔ)現(xiàn)實(shí)差距

這篇論文來(lái)自英偉達(dá) ( NVIDIA )。它在使用合成數(shù)據(jù)來(lái)訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò) (CNNs) 上獲得長(zhǎng)足進(jìn)步。它為 Unreal Engine 創(chuàng)建了一個(gè)插件,用于生成合成的訓(xùn)練數(shù)據(jù)。真正的關(guān)鍵是它們將訓(xùn)練數(shù)據(jù)的變量隨機(jī)化,包括:

  • 對(duì)象的數(shù)量和類型

  • 干擾項(xiàng)的數(shù)量、類型、顏色和尺度

  • 感興趣物體的紋理和背景照片

  • 虛擬攝影機(jī)相對(duì)于場(chǎng)景的位置 

  • 攝像機(jī)相對(duì)于場(chǎng)景的角度

  • 點(diǎn)光源的數(shù)量和位置

他們展示了一些大有前途的結(jié)果,證明了用合成數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練的有效性。這個(gè)結(jié)果是以前沒(méi)有達(dá)到。如果你缺少一些重要資源,它可能會(huì)對(duì)如何生成和使用合成數(shù)據(jù)有所幫助。

CV 屆的金雞百花獎(jiǎng):盤點(diǎn)我心中的 CVPR 2018 創(chuàng)意 TOP10

該論文中出現(xiàn)的圖片


WISPE:數(shù)碼相機(jī)弱監(jiān)督照片增強(qiáng)器

真是機(jī)智?。∷麄冇?xùn)練生成對(duì)抗網(wǎng)絡(luò) (GAN) 來(lái)自動(dòng)美化照片。最酷的部分是它是弱監(jiān)督的,你不需要輸入-輸出圖像對(duì)!你訓(xùn)練的網(wǎng)絡(luò)需要的是一組“好看”的圖像(對(duì)于輸出的標(biāo)注圖像)和一組你想要增強(qiáng)的“難看”的圖像(對(duì)于輸入圖像)。然后,對(duì) GAN 進(jìn)行訓(xùn)練以產(chǎn)生輸入圖像的美化后的版本,通常極大地增強(qiáng)圖像的顏色和對(duì)比度。

它是快速并且容易使用的,因?yàn)槟悴恍枰_的圖像對(duì),最后你會(huì)得到一個(gè)“通用”的圖像增強(qiáng)器。我也喜歡這種弱監(jiān)督的方法。無(wú)監(jiān)督的學(xué)習(xí)似乎相當(dāng)遙遠(yuǎn)。但是對(duì)于計(jì)算機(jī)視覺(jué)中的許多子領(lǐng)域來(lái)說(shuō),弱監(jiān)督似乎是一個(gè)有前途、有利可圖的方向。

CV 屆的金雞百花獎(jiǎng):盤點(diǎn)我心中的 CVPR 2018 創(chuàng)意 TOP10

該論文中出現(xiàn)的圖片


Polygon-RNN++ 分割數(shù)據(jù)集的高效交互標(biāo)注

深度網(wǎng)絡(luò)工作得如此好的一個(gè)主要原因是有大量和完全注釋的數(shù)據(jù)集可供使用。然而,對(duì)于許多計(jì)算機(jī)視覺(jué)任務(wù)來(lái)說(shuō),這樣的數(shù)據(jù)既耗時(shí)又昂貴。特別是分割數(shù)據(jù)需要圖像中的每個(gè)像素的類標(biāo)記。正如你所想象的…對(duì)于大數(shù)據(jù)集來(lái)說(shuō),這個(gè)過(guò)程可能永遠(yuǎn)持續(xù)下去!

Polygon-RNN++ 允許用戶在圖片中每個(gè)目標(biāo)周圍設(shè)置粗略的多邊形,然后神經(jīng)網(wǎng)絡(luò)會(huì)自動(dòng)生成分割標(biāo)記。這篇論文很好地論述了這種方法,這種方法也可以在分割任務(wù)中創(chuàng)建快速、簡(jiǎn)單的標(biāo)記。

CV 屆的金雞百花獎(jiǎng):盤點(diǎn)我心中的 CVPR 2018 創(chuàng)意 TOP10

該論文中出現(xiàn)的圖片


在時(shí)尚大片中創(chuàng)造膠囊衣柜

我今天應(yīng)該穿什么呢? 如果每天早上都有人或東西來(lái)回答這個(gè)問(wèn)題而不需要你去想,那該有多好啊。如果想擁有這樣的東西,來(lái)認(rèn)識(shí)一下膠囊衣柜 (Capsule Wardrobes) 吧。

這篇論文作者設(shè)計(jì)了一個(gè)模型,給定一個(gè)待選服裝和飾品的清單,膠囊用最少的物品組成物品集,而這個(gè)集合可以提供最多的混搭配備。模型使用目標(biāo)函數(shù)進(jìn)行基本的訓(xùn)練,而目標(biāo)函數(shù)的設(shè)計(jì)是用來(lái)獲取視覺(jué)兼容性、多功能性和用戶特定喜好的關(guān)鍵因素。使用膠囊衣柜,可以輕松地從你的衣櫥里找到符合你品位的最佳搭配。

CV 屆的金雞百花獎(jiǎng):盤點(diǎn)我心中的 CVPR 2018 創(chuàng)意 TOP10

該論文中出現(xiàn)的圖片


Super SloMo :視頻插值中多幅中間幀的高質(zhì)量估計(jì)

你有想過(guò)用超級(jí)慢動(dòng)作拍攝一些超級(jí)酷的東西嗎? 不妨看看英偉達(dá) (Nvdia) 的 Super SloMo 吧!他們的卷積神經(jīng)網(wǎng)絡(luò)估計(jì)出視頻中間幀,并且能夠?qū)?biāo)準(zhǔn)的 30fps 的視頻轉(zhuǎn)換為看上去驚人的 240fps 下的慢動(dòng)作!模型估計(jì)幀間光流,使用該模型還可以不影響畫質(zhì)地插入視頻幀,從而慢鏡頭看上去也是清晰的。

CV 屆的金雞百花獎(jiǎng):盤點(diǎn)我心中的 CVPR 2018 創(chuàng)意 TOP10

一顆子彈穿過(guò)雞蛋,super SloMo!


誰(shuí)在控制狗? 根據(jù)視覺(jué)數(shù)據(jù)對(duì)狗的行為建模

這可能是有史以來(lái)最酷的研究論文名字!它的思路是嘗試并建模狗的所行所想。作者在狗的四肢安裝了大量的傳感器來(lái)收集它的運(yùn)動(dòng)數(shù)據(jù),也在其頭部安裝照相機(jī)來(lái)獲取狗看世界的第一視角。使用了一組卷積神經(jīng)網(wǎng)絡(luò)特征提取器來(lái)提取從視頻幀中得到的圖像中的特征,然后這些特征就和傳感器數(shù)據(jù)一起傳到一組長(zhǎng)短期記憶網(wǎng)絡(luò),來(lái)學(xué)習(xí)和預(yù)測(cè)狗的行為。這是一個(gè)很新穎且具有創(chuàng)造力的應(yīng)用。這個(gè)任務(wù)獨(dú)特的框架和實(shí)現(xiàn),都讓這篇文章值得一讀!希望這篇文章可以給未來(lái)的研究激發(fā)創(chuàng)造力,不管是對(duì)我們采集數(shù)據(jù)的方式還是深度學(xué)習(xí)技術(shù)的應(yīng)用。

CV 屆的金雞百花獎(jiǎng):盤點(diǎn)我心中的 CVPR 2018 創(chuàng)意 TOP10

該論文中出現(xiàn)的圖片


學(xué)習(xí)著分割一切

最近幾年,何凱明團(tuán)隊(duì)(早先在微軟亞洲研究院,現(xiàn)在在 Facebook 人工智能研究實(shí)驗(yàn)室)進(jìn)行了大量的計(jì)算機(jī)視覺(jué)研究。他們文章的厲害之處就在于將創(chuàng)新性與簡(jiǎn)潔性有效結(jié)合。 ResNets 和 Mask R-CNN 都不是最瘋狂、最復(fù)雜的研究思路。它們都非常簡(jiǎn)單、易于實(shí)現(xiàn),在實(shí)踐中也非常有效。這一篇也是一樣。

學(xué)習(xí)著分割一切是 Mask R-CNN 的擴(kuò)展,使得神經(jīng)網(wǎng)絡(luò)在訓(xùn)練過(guò)程中不看見(jiàn)類也能進(jìn)行分割! 這對(duì)快速、低成本獲取數(shù)據(jù)集標(biāo)記十分有效。它可以獲得不可見(jiàn)目標(biāo)類強(qiáng)大的基準(zhǔn)庫(kù)分割,這對(duì)在野外部署分割神經(jīng)網(wǎng)絡(luò)是十分重要的,因?yàn)樵谀菢拥沫h(huán)境中,存在著大量的不可見(jiàn)目標(biāo)類。整體看來(lái),這是我們朝著如何思考最大限度利用深度神經(jīng)網(wǎng)絡(luò)模型正確方向走了一步。

CV 屆的金雞百花獎(jiǎng):盤點(diǎn)我心中的 CVPR 2018 創(chuàng)意 TOP10

該論文中出現(xiàn)的圖片


在筆記本上親臨球賽

在世界杯進(jìn)行之際,這篇論文的發(fā)布可以獲得最佳時(shí)機(jī)獎(jiǎng)了!這真的是 CVPR 計(jì)算機(jī)視覺(jué)里比較酷的應(yīng)用之一。簡(jiǎn)單地說(shuō),給定一個(gè)足球比賽視頻能夠輸出比賽的三維動(dòng)態(tài)重建,從而訓(xùn)練模型。這就意味著你可以使用增強(qiáng)現(xiàn)實(shí)技術(shù)在任何地方觀看這場(chǎng)比賽!

模型比較機(jī)智的地方在于不同類型信息的結(jié)合使用。使用視頻比賽數(shù)據(jù)訓(xùn)練網(wǎng)絡(luò),根據(jù)這些數(shù)據(jù)可以非常輕易地提取三維網(wǎng)格。測(cè)試時(shí),運(yùn)動(dòng)員的邊界框、姿態(tài)和軌跡(在多幀之間)被提取來(lái)對(duì)其進(jìn)行分割。 這些三維分割可以簡(jiǎn)單地投影到任意空間(這樣你就可以任意制作虛擬球場(chǎng))實(shí)現(xiàn)增強(qiáng)現(xiàn)實(shí)的足球比賽觀看!在我看來(lái),使用合成數(shù)據(jù)來(lái)訓(xùn)練時(shí)很聰明的做法,同樣也是很有趣的應(yīng)用!

CV 屆的金雞百花獎(jiǎng):盤點(diǎn)我心中的 CVPR 2018 創(chuàng)意 TOP10

該論文中出現(xiàn)的圖片


LayoutNet :從單幅彩色圖像實(shí)現(xiàn)房間布局的三維建模

我們中大多數(shù)有都有過(guò)這樣的想法:給某個(gè)東西拍張照片,然后在數(shù)字三維對(duì)其進(jìn)行重建 。這篇論文就是一個(gè)計(jì)算機(jī)視覺(jué)的應(yīng)用,也正好是來(lái)實(shí)現(xiàn)這個(gè)想法的,尤其是對(duì)房間的三維重建。他們將全景圖像作為輸入來(lái)獲得房間的整個(gè)視野,輸出就是一個(gè)非常精確的三維重建的房間布局!這個(gè)模型有足夠的能力來(lái)生成不同形狀的房間,房間中可以包含許多不同的家居擺設(shè)。這個(gè)應(yīng)用非常有趣,不用看大量計(jì)算機(jī)視覺(jué)研究員的工作,可以很好地閱讀。

CV 屆的金雞百花獎(jiǎng):盤點(diǎn)我心中的 CVPR 2018 創(chuàng)意 TOP10

該論文中出現(xiàn)的圖片


學(xué)習(xí)轉(zhuǎn)換架構(gòu)實(shí)現(xiàn)可擴(kuò)展圖像識(shí)別

最后但也重要的就是關(guān)于深度學(xué)習(xí)的未來(lái)的思考:神經(jīng)架構(gòu)搜索 (NAS)。 NAS 背后的基本思想是取代手動(dòng)設(shè)計(jì)網(wǎng)絡(luò)架構(gòu),我們可以采用另外的神經(jīng)網(wǎng)絡(luò)來(lái) “搜索”最好的模型結(jié)構(gòu)。這個(gè)搜索基于回報(bào)函數(shù),是很聰明的。回報(bào)函數(shù)對(duì)那些在驗(yàn)證數(shù)據(jù)集上表現(xiàn)良好的模型進(jìn)行獎(jiǎng)勵(lì)。作者在文中展示了一個(gè)比手動(dòng)設(shè)計(jì)更加精確的架構(gòu)。這在未來(lái)是有很大發(fā)展空間的,尤其是特定應(yīng)用的設(shè)計(jì)。因?yàn)槲覀冎恍枰獙⑷烤Ψ旁谠O(shè)計(jì)好手動(dòng)設(shè)計(jì) NAS 算法,而不是為我們特定的應(yīng)用設(shè)計(jì)特定的網(wǎng)絡(luò)。一個(gè)良好設(shè)計(jì)大的 NAS 算法是足夠靈活的,可以為任意特定任務(wù)找到好的網(wǎng)絡(luò)。

CV 屆的金雞百花獎(jiǎng):盤點(diǎn)我心中的 CVPR 2018 創(chuàng)意 TOP10

該論文中出現(xiàn)的圖片


總結(jié)

感謝你的閱讀!真心希望你學(xué)到新穎有用的知識(shí),有朝一日可能將其中一些用到你自己的工作當(dāng)中。如果你喜歡我們的內(nèi)容,請(qǐng)給我們點(diǎn)贊吧,讓更多的人看到這個(gè)海報(bào),和我們一起加入學(xué)習(xí)之旅吧!

CV 屆的金雞百花獎(jiǎng):盤點(diǎn)我心中的 CVPR 2018 創(chuàng)意 TOP10

原文鏈接:https://towardsdatascience.com/the-10-coolest-papers-from-cvpr-2018-11cb48585a49

CV 屆的金雞百花獎(jiǎng):盤點(diǎn)我心中的 CVPR 2018 創(chuàng)意 TOP10

雷鋒網(wǎng)雷鋒網(wǎng)

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

CV 屆的金雞百花獎(jiǎng):盤點(diǎn)我心中的 CVPR 2018 創(chuàng)意 TOP10

分享:
相關(guān)文章

知情人士

AI研習(xí)社(yanxishe.com)譯站頻道,傳播前沿人工智能知識(shí),讓語(yǔ)言不再成為學(xué)習(xí)知識(shí)的門檻。(原雷鋒字幕組)
當(dāng)月熱門文章
最新文章
請(qǐng)?zhí)顚懮暾?qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說(shuō)