0
雷鋒網(wǎng) AI 科技評論按:兩年一次的計算機視覺頂會 ECCV 正在德國慕尼黑進行中。繼正會第一天的開場演講中介紹了多項基本情況之后,各項論文獎項也在 12 日的參會人員大聚餐 Gala Dinner 上、在歡樂輕松的氛圍中、在美食的香氣里逐項揭曉。
Implicit 3D Orientation Learning for 6D Object Detection from RGB Images
根據(jù) RGB 圖像檢測 6 維位姿的隱式三維朝向?qū)W習(xí)
論文摘要:作者們提出了一個 RGB 彩色圖像處理系統(tǒng),它可以進行實時的物體檢測與 6 維位姿估計。其中的全新的三維朝向估計器是基于降噪自動編碼的一個變種,然后借助「任務(wù)隨機化」(domain randomization)技巧用 3D 模型的模擬視角進行訓(xùn)練。這個所謂的「增強自動編碼器」相比現(xiàn)有的方法有數(shù)個優(yōu)點:它不需要真實的、標注過位姿的訓(xùn)練數(shù)據(jù),它可以泛化到多種不同的測試傳單器上,并且天然地就可以處理物體和視角的對稱性。這個模型學(xué)到的并不是從輸入圖像到物體位姿的顯式映射,實際上它會根據(jù)圖像樣本在隱含空間內(nèi)建立一個隱式的物體位姿表征。基于 T-LESS 和 LineMOD 數(shù)據(jù)集的實驗表明所提的方法不僅比類似的基于模型的方法有更好的表現(xiàn),而且表現(xiàn)也接近目前頂級的、需要真實的位姿標注圖像的方法。
Group Normalization
組歸一化
論文作者:Facebook 人工智能研究院吳育昕、何愷明。(又雙叒叕是何愷明,往期最佳論文獎已經(jīng)有 ICCV 2017 最佳論文以及兩次 CVPR 最佳論文,可以說是最亮眼的華人研究人員之一了)
論文內(nèi)容:雷鋒網(wǎng) AI 科技評論往期文章介紹過這篇論文的重點內(nèi)容,參見 這里
GANimation: Anatomically-aware Facial Animation from a Single Image
GANimation:基于解剖學(xué)知識從單張圖像生成人臉表情動畫
論文摘要:生成式對抗性網(wǎng)絡(luò)(GANs)的近期進步已經(jīng)在面部表情生成任務(wù)中展現(xiàn)出了令人驚喜的結(jié)果。這項任務(wù)上最成功的架構(gòu)是 StarGAN,它把 GANs 的圖像生成過程限定在了一個具體的范圍中,也就是一組不同的人做出同一個表情的照片。這種方法雖然很有效,但是它只能生成若干種離散的表情,具體是哪一種由訓(xùn)練數(shù)據(jù)的內(nèi)容決定。為了消除這種限制,作者們在這篇論文中提出了一種新的 GAN 條件限定方式,它基于的是動作單元(Action Units)的標注,而動作單元標注就可以在一個連續(xù)的流形中描述足以定義人類表情的解剖學(xué)面部動作。通過這種方法,作者們得以控制每一個動作單元的激活程度,并且組合多個多個動作單元。除此之外,作者們還提出了一個完全無監(jiān)督的策略用于訓(xùn)練模型,它只需要標注了激活的動作單元的圖像,然后通過注意力機制的應(yīng)用就可以讓網(wǎng)絡(luò)對于背景和光照條件的改變保持魯棒。大量實驗評估表明他們的方法比其他的條件生成方法有明顯更好的表現(xiàn),不僅表現(xiàn)在有能力根據(jù)解剖學(xué)上可用的肌肉動作生成非常多種多樣的表情,而且也能更好地處理來自不同分布的圖像。
Hamming embedding and weak geometric consistency for large scale image search
用于大規(guī)模圖像搜索的無線嵌入與弱幾何一致性
Semi-supervised On-Line Boosting for Robust Tracking
用于魯棒追蹤的半監(jiān)督在線增強方法.
ECCV 還在繼續(xù)進行當中,雷鋒網(wǎng) AI 科技評論也有多個角度的論文解讀、會議動態(tài)文章。更多信息請繼續(xù)關(guān)注。感謝中國科學(xué)院自動化研究所楊陽提供的現(xiàn)場資訊。
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。