0
雷鋒網(wǎng) AI 科技評論按,CVPR 2018 將于 2018 年 06 月 18-22 日在美國鹽湖城舉辦,除了主會議程,各式各樣的 Workshop 也值得大家一探究竟。
其中,CVPR 2018 Visual Understanding of Humans in Crowd Scene (VUHCS 2018)Workshop 尤為亮眼,該 Workshop 由新加坡國立大學 LV 組聯(lián)合美國卡內(nèi)基梅隆大學、中國中山大學主辦。今年,主辦方在 VUHCS 2017 的基礎上進行了延伸與拓展,除接收相關論文,還將迎來 5 項極具吸引力的比賽,主要針對人物解析與姿態(tài)估計等以人物為中心的視覺感知與處理任務。
當前,探索與研發(fā)自然場景下基于計算機視覺技術對人物進行全面理解的有效解決方案已成為計算機視覺領域的最根本問題,并對諸多工業(yè)應用領域(如自動駕駛、虛擬現(xiàn)實、視頻監(jiān)控、人機交互以及人物行為分析等)產(chǎn)生至關重要的影響。其中,人物解析與姿態(tài)估計通常被視為活動/事件識別/檢測的第一步。然而,當前的計算機視覺技術發(fā)展與實際應用需求尚存在較大差距。
據(jù)雷鋒網(wǎng) AI 科技評論了解,VUHCS 2018 的舉辦初衷在于鼓勵來自人物視覺理解領域及其他相關領域的專家、學者、老師、同學們展示他們的科研成果,共同探討、交流、構思新想法、新方案,并由此推動和促進實際應用場景下的有關技術與系統(tǒng)的性能和實用價值。
VUHCS 2018 日程為期 1 天 (2018 年 06 月 18 日),阿里巴巴杰出工程師、副總裁華先勝,奇虎 360 首席科學家、人工智能研究院院長、副總裁顏水成,加利福尼亞大學伯克利分校教授 Trevor Darrell,約翰?霍普金斯大學教授 Alan Yuille 將受邀做主題報告。預期最終接收 20 篇海報文章,5 篇口頭報告文章 (來自 5 項競賽的冠軍團隊)。接下來雷鋒網(wǎng) AI 科技評論將帶來詳細信息:
Part 1 征稿信息
重要日期:
截稿:2018 年 04 月 15 日
審稿通知:2018 年 04 月 18 日
終稿提交:2018 年 04 月 20 日
會議:2018 年 06 月 18 日
投稿網(wǎng)址:
https://cmt3.research.microsoft.com/VUHCS2018
征稿范圍:
本次征稿范圍包含但不限于以下解決以人物為中心的視覺感知與處理任務的相關方向:
多人解析與姿態(tài)估計
基于單張(段)彩色/深度圖像/視頻的二維/三維人物姿態(tài)估計
自然場景下的行人檢測
人物動作識別與軌跡識別/預測
多人視頻與交叉視角相機下的人物重識別
三維人物形態(tài)估計與仿真
人物衣服與屬性識別
監(jiān)控視頻下的人物重識別,人臉識別--確認/鑒別
用于性能評估與/或驗證分析現(xiàn)有方法的新數(shù)據(jù)集
人物理解的有關前沿應用,包括:自動駕駛、事件識別與預測、機器人操作、室內(nèi)導航、圖像/視頻檢索與虛擬現(xiàn)實
此外,VUHCS 2018 還旨在其他有關人物綜合分析的主題,如:人物部位的分割與識別、人物活動識別、三維人物形態(tài)生成,以及人群中的人物行為分析等,這些主題極具挑戰(zhàn)性、實用性,貼合現(xiàn)實應用場景。
Part 2 競賽信息
VUHCS 2018 包含單人解析、多人解析、單人姿態(tài)估計、細粒度多人解析與多人姿態(tài)估計共計 5 項競賽。
其中前 3 項競賽由卡內(nèi)基梅隆大學與中山大學承辦,后 2 項競賽由新加坡國立大學 LV 組承辦。
單人解析與姿態(tài)估計競賽:主辦方提供 50000 張帶有 19 個語義類別像素級標注及 16 個二維關節(jié)點標注的圖片數(shù)據(jù)。
多人解析競賽:主辦方提供 38280 張帶有 19 個語義類別像素級標注的多人場景圖片數(shù)據(jù)。
細粒度多人解析與多人姿態(tài)估計競賽:主辦方提供 25403 張帶有 59 個細粒度語義類別像素級精細標注及 20 個二維關節(jié)點標注的多人場景圖片數(shù)據(jù)。
與以往的比賽相比,VUHCS 2018 設置的問題更具挑戰(zhàn)性與實用性:
不同于 ECCV16 Joint ImageNet and MS Coco Visual Recognition Challenge Workshop 的關鍵點預測競賽,VUHCS 2018 的競賽主要針對解決更加精細的像素級的人物解析與人物姿態(tài)估計,從而可以加強與促進更加復雜與細粒度的實際應用,如:虛擬現(xiàn)實中的三維人物形態(tài)生成等。
不同于 ChaLearn Looking at People Workshop on Apparent Personality Analysis and First Impressions Challenge 專注于顯著性人格分析 (如:視頻個性特征識別),VUHCS 2018 的競賽著重于自然場景下的細粒度人物解析與姿態(tài)估計。
相關數(shù)據(jù)集已開放下載并開始接受參賽隊伍注冊及結果提交。更多詳細信息請參閱 http://sysu-hcp.net/lip/ 和 https://lv-mhp.github.io/。
Part 3 Workshop 詳情
議程安排:
08:30-08:40 開幕致辭與歡迎儀式
08:40-09:10 競賽介紹與結果公示
09:10-09:25 口頭報告 1:單人解析競賽冠軍團隊
09:25-09:55 受邀報告 1:華先勝,杰出工程師/副總裁,阿里巴巴
09:55-10:25 海報展示與茶歇
10:25-10:55 受邀報告 2:顏水成,首席科學家/人工智能研究院院長/副總裁,奇虎 360
10:55-11:10 口頭報告 2:多人解析競賽冠軍團隊
11:10-11:25 口頭報告 3:單人姿態(tài)估計競賽冠軍團隊
11:25-14:00 午餐
14:00-14:30 受邀報告 3:Trevor Darrell, 教授,加利福尼亞大學伯克利分校
14:30-14:45 口頭報告 4:細粒度多人解析競賽冠軍團隊
14:45-15:00 口頭報告 5:多人姿態(tài)估計競賽
15:00-15:30 海報展示與茶歇
15:30-16:00 受邀報告 4:Alan Yuille, 教授,約翰·霍普金斯大學
16:00-16:30 頒獎典禮與總結展望
主辦成員:
梁小丹,博士后,卡內(nèi)基梅隆大學,xiaodan1@cs.cmu.edu/xdliang328@gmail.com
趙健,博士 (在讀),新加坡國立大學,zhaojian90@u.nus.edu
李建樹,博士 (在讀),新加坡國立大學,jianshu@u.nus.edu
林倞,教授,中山大學,linliang@ieee.org
馮佳時,助理教授,新加坡國立大學,elefjia@nus.edu.sg
Eric Xing,教授,卡內(nèi)基梅隆大學,epxing@cs.cmu.edu
程序委員會:
馮佳時 (助理教授,新加坡國立大學),Xiaohui Shen (高級研究員,Adobe),魏云超 (博士后,伊利諾伊大學厄巴納-香檳分校),Jianchao Yang (研究員,Snap)。
附:關于新加坡國立大學 LV 組
新加坡國立大學 LV 組 (http://www.lv-nus.org/) 由顏水成教授創(chuàng)建、由馮佳時教授領軍,是目前各大學術機構在深度學習與計算機視覺領域的頂級團隊之一。其「人臉與人物視覺理解」團隊一直是 LV 組中不可或缺的頂梁柱,屢創(chuàng)佳績——在 LFW 人臉識別數(shù)據(jù)集首次達到 99.7% 的識別精度、在 NIST 2017 IJB-A 人臉驗證與辨認兩項競賽中與新加坡松下研究院合作一起奪得冠軍、在 CVPR 2017 LIP 人物解析與人物姿態(tài)估計兩項競賽中奪得亞軍、在 ICCV 2017 MS-Celeb-1M 大規(guī)模人臉識別 Hard Set、Random Set 與小樣本人臉識別三項競賽中與新加坡松下研究院合作一起奪得冠軍。此外,其首次提出多人解析 (Multi-Human Parsing: MHP) 任務,對傳統(tǒng)的人物解析進行了拓展與延伸,從而更好地匹配現(xiàn)實應用場景。其構建并發(fā)布了首個全新的大規(guī)模多人解析數(shù)據(jù)集 (MHP v1.0 [1]),并給出了相應的評測標準與參考方法,并在此基礎上進行不斷擴充與優(yōu)化,構建并發(fā)布了更大規(guī)模與細粒度的「增強版」多人解析數(shù)據(jù)集 (MHP v2.0),并給出了更加合理的評測標準與性能更優(yōu)的參考方法 (相關論文將于近期公布),極大地推進了深度學習與計算機視覺領域相關技術的發(fā)展。
圖:MHP v2.0 與 MHP v1.0 樣例對比
參考文獻
[1] "Multi-Human Parsing in the Wild", Jianshu Li*, Jian Zhao*, Yunchao Wei, Congyan Lang, Yidong Li, Terence Sim, Shuicheng Yan, and Jiashi Feng. arXiv:1705.07206 (* indicates equal contribution)
[2] "Generative Partition Networks for Multi-Person Pose Estimation", Xuecheng Nie, Jiashi Feng, Junliang Xing, and Shuicheng Yan. arXiv:1705.07422
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉載。詳情見轉載須知。