1
雷鋒網(wǎng) AI 科技評論消息,計算機(jī)視覺歐洲大會(European Conference on Computer Vision,ECCV)于 9 月 8 -14 日在德國慕尼黑召開,今天已進(jìn)入會議第二日。會議前兩日為 workshop 和 tutorial 預(yù)熱環(huán)節(jié),主會將于當(dāng)?shù)貢r間 9 月 10 日召開。
今年 ECCV 共計 11 個 tutorial,議題涵蓋當(dāng)前熱門的對抗性機(jī)器學(xué)習(xí)、面部追蹤、行人重識別、視頻識別等多個方向。接下來,AI 科技評論將會對這些議題進(jìn)行具體介紹,關(guān)注 ECCV 的小伙伴們,快快 mark 吧!
Tutorial 1 對抗性機(jī)器學(xué)習(xí)
包括深度神經(jīng)網(wǎng)絡(luò)在內(nèi)的機(jī)器學(xué)習(xí)和數(shù)據(jù)驅(qū)動的人工智能技術(shù)目前已經(jīng)有諸多應(yīng)用,涵蓋了從計算機(jī)視覺到網(wǎng)絡(luò)安全等諸多領(lǐng)域。在垃圾郵件和惡意軟件檢測在內(nèi)的應(yīng)用中,學(xué)習(xí)算法必須應(yīng)對手段高超、適應(yīng)性強(qiáng)的攻擊者,因為攻擊者可以操縱數(shù)據(jù)故意破壞學(xué)習(xí)過程。
由于最初設(shè)計這些算法的時候并沒有考慮到這種攻擊情況,一旦面臨精心設(shè)計、復(fù)雜的攻擊時,這些算法毫無招架之力,攻擊形式包括測試時的逃逸攻擊(evasion attack)和訓(xùn)練時的藥餌攻擊(poisoning attacks,也稱對抗性樣本)。對抗這些威脅以及在對抗性環(huán)境下學(xué)習(xí)安全的分類器和人工智能系統(tǒng)已經(jīng)成為機(jī)器學(xué)習(xí)和人工智能安全領(lǐng)域一個新興的研究主題,被稱為對抗性機(jī)器學(xué)習(xí)。
這次 tutorial 將涵蓋如下四點(diǎn)內(nèi)容:
對抗性機(jī)器學(xué)習(xí)的基礎(chǔ)知識;
用于對抗性任務(wù)的機(jī)器學(xué)習(xí)算法的設(shè)計周期;
最新提出的評估學(xué)習(xí)算法在遭受攻擊時性能的技術(shù),能夠評估算法漏洞,并提升面對攻擊時魯棒性的防御策略;
一些對抗性機(jī)器學(xué)習(xí)算法在目標(biāo)識別、生物特征識別、垃圾郵件和惡意軟件檢測中的應(yīng)用。
PDF地址:http://www.diee.unica.it/~biggio/slides/Roli-Biggio-ECCV18-tutorial.pdf
Tutorial 2 對于人、物體和環(huán)境的超快三維感知、重建以及理解
虛擬現(xiàn)實和增強(qiáng)現(xiàn)實的興起讓人們希望三維場景捕獲、重建和理解系統(tǒng)的魯棒性更強(qiáng)。設(shè)計這樣的系統(tǒng)需要開發(fā)高質(zhì)量的傳感器和能夠利用新技術(shù)和現(xiàn)有技術(shù)的高效算法。基于這一考慮,我們設(shè)計了具有兩個特征的深度傳感器,大大簡化了融合不完整的傳感器數(shù)據(jù)的問題。
首先,我們使用一個超快的深度數(shù)據(jù)流,顯著減少了幀到幀之間的運(yùn)動。其次,我們通過使多個傳感器能夠容易地組合(不干擾的情況下)從而消除遮擋。最終,我們開發(fā)了一系列高效的算法,用于場景重建、目標(biāo)跟蹤和場景理解,而這些算法都是為了配合這項技術(shù)而設(shè)計的。
在這一 tutorial 中,我們將帶領(lǐng)讀者從頭到尾構(gòu)建這樣一個程序棧,最開始將建立一個用于特別強(qiáng)調(diào)高速三維場景捕獲系統(tǒng)的混合現(xiàn)實應(yīng)用的傳感器。
Tutorial 3 將微軟 HoloLens 全息眼鏡用作計算機(jī)視覺研究工具
微軟 HoloLens 是世界上第一臺獨(dú)立的全息電腦,它同時也是一種強(qiáng)大的計算機(jī)視覺研究設(shè)備。應(yīng)用程序代碼可以訪問音頻、視頻流和表面網(wǎng)格,所有這些數(shù)據(jù)都存儲在 HoloLens 高度精確的頭部跟蹤技術(shù)維護(hù)的世界坐標(biāo)空間中。
這一 tutorial 將深入介紹 HoloLens 的新「研究模式」功能,展示如何訪問原始頭跟蹤和深度傳感器數(shù)據(jù)流,,此外,還將展示 Azure 項目的 Kinect 中的飛行深度感知技術(shù)的最新進(jìn)展。
Tutorial 4 面部追蹤及其應(yīng)用
這一 tutorial 的內(nèi)容與單目面部追蹤技術(shù)相關(guān),并討論了這一技術(shù)可能的應(yīng)用場景。具體而言,涵蓋以下主題:
輸入方式(RGB 和 RGB-D 傳感器);
成像模型(攝像機(jī)模型和光傳輸模型);
統(tǒng)計面部先驗和融合變形;
先進(jìn)的人臉模型和參數(shù)綁定;
基于優(yōu)化的面部重建;
面部重建的應(yīng)用;
視頻編輯、面部重建、視頻配音、面部投影映射;
用于面部重建的深度學(xué)習(xí)技術(shù);
開放性的挑戰(zhàn);
社會影響。
相關(guān)研究包括:
Zollh?fer 等人的「單眼三維人臉重建、跟蹤及其應(yīng)用的研究進(jìn)展」;
Sylianou 等人的「基于圖像的三維面部重建綜述」;
Klehm 等人最近發(fā)表的關(guān)于捕獲面部外貌特征的報告,試圖通過 CG 技術(shù)重新繪制人臉;
Bouaziz 等人的面部跟蹤與非剛性表面配準(zhǔn)問題,其目標(biāo)是將特定的表面與圖像或三維掃描結(jié)果對齊;
Orvalho 等人討論面部表情綁定的綜述和 Lewis 等人關(guān)于給予融合變形的面部動畫的綜述。
Tutorial 5 行人重識別的表征學(xué)習(xí)
行人重識別任務(wù)的目的是在一個龐大的行人圖像數(shù)據(jù)庫中找到一個待查的人,這樣我們就可以通過攝像頭定位感興趣的人。該課題的研究和應(yīng)用具有重要的意義,近年來迅速受到了學(xué)術(shù)界和產(chǎn)業(yè)界廣泛的關(guān)注。傳統(tǒng)意義上說,行人重識別的特點(diǎn)是視覺描述符和相似性度量的有效組合。目前,前沿研究已經(jīng)進(jìn)展到深入學(xué)習(xí)到既具有判別能力又高效的不變特征嵌入。
這一 tutorial 還介紹了許多研究任務(wù),例如基于視頻的、基于語言的、基于檢測信息的重識別工作,將指出當(dāng)前的研究進(jìn)展,討論用于行人重識別任務(wù)的表征學(xué)習(xí)的最先進(jìn)的方法,討論未來可能的研究方向。
數(shù)據(jù)集:http://robustsystems.coe.neu.edu/sites/robustsystems.coe.neu.edu/files/systems/projectpages/reiddataset.html
代碼:https://wangzwhu.github.io/home/re_id_resources.html
Tutorial 6 訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)的歸一化方法:理論和實踐
特征、權(quán)重(kernel)和梯度歸一化方法已成為深度神經(jīng)網(wǎng)絡(luò)(DNN)的重要組成部分。然而,我們對這些方法的理論基礎(chǔ)和數(shù)學(xué)原理仍然不很清楚。此外,在實際的計算機(jī)視覺任務(wù)中使用各種大規(guī)模深度神經(jīng)網(wǎng)絡(luò)(如卷積神經(jīng)網(wǎng)絡(luò)(CNN)和小批量循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN))等理論是一個挑戰(zhàn)。
為此,這一 tutorial 將首先回顧最近的工作,為不同的輸入-輸出通道中應(yīng)用的不同歸一化方法的幾何和統(tǒng)計特性提供數(shù)學(xué)證明。本 tutorial 提出的歸一化方法的理論分析利用了數(shù)學(xué)工具,可以指導(dǎo)研究者開發(fā)新的歸一化方法,幫助更好地理解歸一化方法的理論基礎(chǔ)。此外,在重要的視覺應(yīng)用環(huán)境中,將考慮使用批量歸一化、塊正交權(quán)值、小批量卷積神經(jīng)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò)的梯度歸一化等各種特殊歸一化方法。
PDF地址:
https://eccv2018.org/wp-content/uploads/2018/08/v2.pdf
Tutorial 7 Functional Map:學(xué)習(xí)和計算的對應(yīng)關(guān)系的靈活表示
這一 tutorial 將介紹基于 functional map 表示的形狀之間的學(xué)習(xí)、計算和處理相似情況的技術(shù),廣義上可以理解為領(lǐng)域或 signal geometry、接近或連接(例如圖像、點(diǎn)云、網(wǎng)格或圖形)。這一 tutorial 將提供該框架在計算機(jī)視覺和機(jī)器學(xué)習(xí)問題中的數(shù)學(xué)背景、計算方法和各種應(yīng)用。
PDF 地址:
https://drive.google.com/file/d/1lADZt9WQEJV0kCf6BJcLZqbg_7PtmNUB/view
https://drive.google.com/open?id=1DomCVGjwzE163lRW4jXz2v0RAGPOiMyn
https://drive.google.com/open?id=1bLYAkFjaTQ03uJXii0Ntvn8pISYEQL1f
Tutorial 8 視覺定位:基于特征的方法 vs 基于學(xué)習(xí)的方法
該 tutorial 主要會講如下內(nèi)容:
基于特征的定位研究現(xiàn)狀
涵蓋基礎(chǔ)知識:圖像局部特征、相機(jī)姿態(tài)估計、描述符匹配;高效(移動)定位;可伸縮的基于特征的定位。
基于學(xué)習(xí)的定位研究現(xiàn)狀
涵蓋基礎(chǔ)知識:隨機(jī)森林,卷積神經(jīng)網(wǎng)絡(luò);學(xué)習(xí)相機(jī)姿態(tài)回歸;場景坐標(biāo)回歸。
當(dāng)前的熱點(diǎn)話題和開放性問題
涵蓋基于特征和基于學(xué)習(xí)的方法的失敗案例;長期定位:對更高層次場景的理解;基于學(xué)習(xí)方法的開放問題。
PDF:
https://drive.google.com/open?id=1s6Y8FM3K654z0ZslDdjYkJUz-uH_0523
https://drive.google.com/open?id=1Kuk_H2eYW1hc7b16jiOipUdigjmM6GV8
https://drive.google.com/open?id=1Oxv6k_gGaom9vFOyg-7b3Klo8Emu8_Hp
https://drive.google.com/open?id=1VHn0W4PqzO1xRd56O2zhgNq86W6v6hfU
Tutorial 9 在 TRECVID 對比基準(zhǔn)實驗中的視頻識別和檢索
這一 tutorial 將重點(diǎn)回顧 TREC 視頻檢索評估(TRECVID)的歷史,討論一些 TRECVID 任務(wù),并強(qiáng)調(diào)參與者的方法,總結(jié)教訓(xùn)。下面是具體內(nèi)容:
第 1 講:TRECVID 簡介
討論 TRECVID 的歷史,包括 TRECVID 的目標(biāo)、自 2001 年以來支持的不同任務(wù)和數(shù)據(jù)集,該項目對研究社區(qū)的影響,可用的資源和未來的發(fā)展方向。
第 2 講:視頻轉(zhuǎn)文本(VTT)
涵蓋 TRECVID 視頻轉(zhuǎn)文本的操作,包括使用的數(shù)據(jù),參與者采用的方法,學(xué)到的經(jīng)驗教訓(xùn)和評價視頻標(biāo)題生成的獨(dú)特方式。
第 3 講:Ad-Hoc 視頻搜索(AVS)
相關(guān)主題有:大型概念庫的構(gòu)建,通過自然語言處理技術(shù)從一個ad-hoc 查詢中選擇搜索關(guān)鍵字,利用搜索關(guān)鍵字選擇概念分類器。
第4 講:活動識別(MED/SED)
重點(diǎn)介紹在多媒體事件檢測(MED)和監(jiān)督事件檢測(SED)的語境下,對活動的時空檢測的經(jīng)驗教訓(xùn),活動例如「做木工」、「打開樹干」、「在沒有車的情況下贏得比賽」。
第5 講:實例搜索(INS)
將對實例搜索任務(wù)進(jìn)行概述,接著給出標(biāo)準(zhǔn)的處理流程,包括使用視覺詞袋技術(shù)生成短列表,處理幾何信息和語境。
Tutorial 10 通過步態(tài)和面部分析實現(xiàn)的遠(yuǎn)距離人體識別
主要會講到如下內(nèi)容:
1. 動機(jī)、挑戰(zhàn)、可用的步態(tài)和人臉數(shù)據(jù)集
2. 基于步態(tài)和人臉的人體識別系統(tǒng)的全面綜述
傳統(tǒng)的基于步態(tài)和人臉特征的遠(yuǎn)距離人體識別方法:圖像表示;特征降維;分類
先進(jìn)的基于步態(tài)和人臉特征的遠(yuǎn)距離人體識別的深度學(xué)習(xí)方法:步態(tài)和人臉識別的網(wǎng)絡(luò)架構(gòu)設(shè)計;輸入特性、輸入分辨率、時序信息、數(shù)據(jù)增強(qiáng)等對性能的影響因素;在共同的對比基準(zhǔn)上的最先進(jìn)的步態(tài)和面部識別結(jié)果。
Tutorial 11 實例級視覺識別
該 tutorial 涵蓋了視覺識別研究的前沿課題,介紹了圖像分類、目標(biāo)檢測、實例分割、語義分割、全景分割和密集人體姿態(tài)估計的方法和原理。
議程如下:
學(xué)習(xí)視覺識別的深層表征
泛化 R-CNN 對象檢測框架
全景分割:統(tǒng)一語義和實例分割
深入分析用于視頻識別的卷積神經(jīng)網(wǎng)絡(luò)
基于自然數(shù)據(jù)集學(xué)習(xí)稠密對應(yīng)
注:各大 tutorial 的 PDF 持續(xù)更新中,具體信息可以參見:
https://eccv2018.org/program/workshops_tutorials/
雷鋒網(wǎng)雷鋒網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。