200位學(xué)術(shù)青年齊聚HIT，GAIR大講堂CVPR哈工大深圳專場(chǎng)總結(jié)回顧

本文作者：楊文

2017-08-29 23:36

導(dǎo)語(yǔ)：200位學(xué)術(shù)青年齊聚哈工大，GAIR大講堂CVPR哈工大深圳專場(chǎng)干貨內(nèi)容詳細(xì)整理！

雷鋒網(wǎng)AI科技評(píng)論按：8月26日下午，由雷鋒網(wǎng)主辦的“GAIR大講堂CVPR 哈工大深圳專場(chǎng)”在哈爾濱工業(yè)大學(xué)深圳校區(qū)正式開幕。作為雷鋒網(wǎng)旗下高端學(xué)術(shù)分享品牌，「GAIR大講堂」的使命是通過舉辦高頻次的線下校園學(xué)術(shù)分享活動(dòng)，實(shí)現(xiàn)學(xué)術(shù)專家、AI業(yè)者與學(xué)校同學(xué)們之間的深度交流。CVPR哈工大深圳專場(chǎng)是GAIR大講堂在8月份的第三場(chǎng)也是最后一場(chǎng)線下學(xué)術(shù)分享活動(dòng)。本活動(dòng)在哈工大深圳計(jì)算機(jī)學(xué)院王軒院長(zhǎng)和何震宇老師的支持下，雷鋒網(wǎng)特地邀請(qǐng)了5位CVPR 2017前方論文講者來講解各自的論文，同時(shí)分享CVPR 的參會(huì)心得。AI科技評(píng)論作為GAIR大講堂活動(dòng)的獨(dú)家合作媒體，全程參與了現(xiàn)場(chǎng)報(bào)道。

活動(dòng)現(xiàn)場(chǎng)

活動(dòng)現(xiàn)場(chǎng)座無虛席

同學(xué)踴躍提問

活動(dòng)承辦方哈工大(深圳)研究生院計(jì)算機(jī)學(xué)院王軒院長(zhǎng)致辭

分享嘉賓介紹

哈爾濱工業(yè)大學(xué)計(jì)算機(jī)學(xué)院教授、博士生導(dǎo)師左旺孟
碼隆科技首席科學(xué)家黃偉林
碼隆科技聯(lián)合創(chuàng)始人兼CTO Matt Scott
清華大學(xué)博士陳曉智
浙江大學(xué)工學(xué)博士李琛

嘉賓分享環(huán)節(jié)

200位學(xué)術(shù)青年齊聚HIT，GAIR大講堂CVPR哈工大深圳專場(chǎng)總結(jié)回顧

第一位分享嘉賓是左旺孟教授，左旺孟老師是IEEE會(huì)員，中國(guó)計(jì)算機(jī)學(xué)會(huì)會(huì)員，國(guó)際期刊《ISRN Signal Processing》編委。主要從事圖像增強(qiáng)與復(fù)原、稀疏表達(dá)和深度學(xué)習(xí)等方面的研究。在ACM CSUR、IEEE TIP等重要國(guó)際期刊和CVPR、ICCV、ICPR、ICIP等重要國(guó)際會(huì)議上發(fā)表學(xué)術(shù)論文40余篇。他分享的論文題目是：Deep learning models for image restoration and depth enhancement (面向圖像復(fù)原和深度圖增強(qiáng)的深度學(xué)習(xí)模型)

論文分為四部分：圖像還原與圖像去噪；用深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)去噪之前圖像進(jìn)行圖像還原；用于深度圖像增強(qiáng)的動(dòng)態(tài)引導(dǎo)學(xué)習(xí)；論文總結(jié)。

200位學(xué)術(shù)青年齊聚HIT，GAIR大講堂CVPR哈工大深圳專場(chǎng)總結(jié)回顧

圖像增強(qiáng)和復(fù)原是底層視覺的一個(gè)重要內(nèi)容。近年來，以卷積神經(jīng)網(wǎng)絡(luò)為代表的深度學(xué)習(xí)模型在圖像超分辨與去噪領(lǐng)域獲得了巨大的成功。然而，如何將其推廣應(yīng)用至更多的底層視覺視覺問題，是近年來關(guān)注的一個(gè)重要方向。左旺孟老師的分享就是圍繞這一問題，介紹他們?cè)诮衲闏VPR上的兩個(gè)工作：

一、設(shè)計(jì)了一種新的去噪CNN網(wǎng)絡(luò)，并結(jié)合半二次分裂方法將其推廣應(yīng)用于廣義的圖像復(fù)原問題的求解；
二、針對(duì)有引導(dǎo)圖的深度圖增強(qiáng)問題，設(shè)計(jì)了一種特殊的深度網(wǎng)絡(luò)結(jié)構(gòu)并利用任務(wù)驅(qū)動(dòng)策略學(xué)習(xí)動(dòng)態(tài)引導(dǎo)與增強(qiáng)模型。

實(shí)驗(yàn)結(jié)果 200位學(xué)術(shù)青年齊聚HIT，GAIR大講堂CVPR哈工大深圳專場(chǎng)總結(jié)回顧

200位學(xué)術(shù)青年齊聚HIT，GAIR大講堂CVPR哈工大深圳專場(chǎng)總結(jié)回顧

接下來是來自碼隆科技的兩位科學(xué)家，黃偉林博士和Matt Scott 。

左：黃偉林博士；右：Matt Scott

黃偉林博士來自牛津大學(xué) Visual Geometry Group（VGG），是首位從該實(shí)驗(yàn)室回國(guó)工作的研究員。博士后期間師從 Andrew Zisserman和 AlisonNoble。研究方向主要集中在場(chǎng)景文本識(shí)別,場(chǎng)景分類和醫(yī)學(xué)視頻分析等領(lǐng)域。同時(shí)，他還擔(dān)任計(jì)算機(jī)視覺 / 人工智能領(lǐng)域主要會(huì)議的 PC member 或者 Reviewer，包括： ICCV、 CVPR、 ECCV、 AAAI 等。黃偉林博士曾任中國(guó)科學(xué)院助理教授。

Matt Scott 擁有十年微軟研發(fā)經(jīng)驗(yàn)，曾任微軟亞洲研究院高級(jí)研發(fā)主管。 Matt 多年均為微軟績(jī)效排名前 1%的杰出員工與管理者，擁有國(guó)際頂級(jí)學(xué)術(shù)會(huì)議論文 13 篇，超過 40 個(gè)中美專利技術(shù)， 18 個(gè)微軟技術(shù)商業(yè)轉(zhuǎn)化成果。其熟悉研發(fā)領(lǐng)域包括軟件工程、視覺計(jì)算，機(jī)器學(xué)習(xí)，尤其擅長(zhǎng)把最前沿計(jì)算機(jī)科學(xué)成果轉(zhuǎn)化為服務(wù)大眾的互聯(lián)網(wǎng)產(chǎn)品。

他們分享的主題為： CVPR WebVision 挑戰(zhàn)賽分享與展望

200位學(xué)術(shù)青年齊聚HIT，GAIR大講堂CVPR哈工大深圳專場(chǎng)總結(jié)回顧

分享內(nèi)容： CVPR 期間，WebVision 大規(guī)模視覺理解全球挑戰(zhàn)賽宣布賽果，碼隆科技團(tuán)隊(duì)在全球超過 100 支參賽隊(duì)伍中脫穎而出，榮獲冠軍。

200位學(xué)術(shù)青年齊聚HIT，GAIR大講堂CVPR哈工大深圳專場(chǎng)總結(jié)回顧

WebVision 競(jìng)賽的主要挑戰(zhàn)是數(shù)據(jù)來源于網(wǎng)絡(luò)抓取，未經(jīng)過任何人工標(biāo)注，因此含有大量的錯(cuò)誤類別標(biāo)簽。碼隆算法團(tuán)隊(duì)利用課程學(xué)習(xí)（Curriculum Learning）的思路，設(shè)計(jì)更加高效的訓(xùn)練策略，有效地抑制錯(cuò)誤標(biāo)簽和數(shù)據(jù)不平衡的負(fù)面作用。在演講中，碼隆科技黃博士將分享了競(jìng)賽的算法思路和方法方面的相關(guān)經(jīng)驗(yàn)，以及針對(duì)現(xiàn)實(shí)場(chǎng)景中非人工標(biāo)注數(shù)據(jù)的訓(xùn)練和學(xué)習(xí)技術(shù)的探索。除此之外，Matt 還重點(diǎn)介紹 ImageNet 與 Webvision 兩大學(xué)術(shù)比賽之間的區(qū)別，深入介紹了WebVision 比賽的主要挑戰(zhàn)，以及由WebVision 比賽引發(fā)的對(duì)智能視覺現(xiàn)實(shí)場(chǎng)景應(yīng)用的探索。希望帶領(lǐng)廣大同學(xué)們更深入的了解和認(rèn)識(shí) WebVision 挑戰(zhàn)賽。

200位學(xué)術(shù)青年齊聚HIT，GAIR大講堂CVPR哈工大深圳專場(chǎng)總結(jié)回顧

第四位分享嘉賓是清華大學(xué)博士陳曉智，分享主題為： Multi-View 3D Object Detection Network for Autonomous Driving （面向自動(dòng)駕駛的多視角三維物體檢測(cè)網(wǎng)絡(luò)）

陳曉智博士畢業(yè)于清華大學(xué)電子工程系。他的研究興趣為深度學(xué)習(xí)及其在三維感知中的應(yīng)用。他曾在多倫多大學(xué)、百度自動(dòng)駕駛事業(yè)部進(jìn)行訪問和實(shí)習(xí)，曾獲清華大學(xué)優(yōu)秀博士論文、博士生國(guó)家獎(jiǎng)學(xué)金。

200位學(xué)術(shù)青年齊聚HIT，GAIR大講堂CVPR哈工大深圳專場(chǎng)總結(jié)回顧

陳曉智博士從四個(gè)方面解讀這篇論文。

200位學(xué)術(shù)青年齊聚HIT，GAIR大講堂CVPR哈工大深圳專場(chǎng)總結(jié)回顧

分享內(nèi)容：三維物體檢測(cè)是自動(dòng)駕駛感知系統(tǒng)的關(guān)鍵問題。本文提出了一種多視角三維物體檢測(cè)網(wǎng)絡(luò)（MV3D)，通過融合激光點(diǎn)云和 RGB 圖像來實(shí)現(xiàn)物體的三維定位與檢測(cè)。該模型將三維點(diǎn)云編碼成多視角的表示，通過三維似物性網(wǎng)絡(luò)來提取三維候選區(qū)域，并設(shè)計(jì)了一種深度融合網(wǎng)絡(luò)來學(xué)習(xí)物體的多模態(tài)特征。該方法在 KITTI 評(píng)測(cè)集上取了領(lǐng)先的三維物體檢測(cè)性能。

實(shí)驗(yàn)結(jié)果圖：

200位學(xué)術(shù)青年齊聚HIT，GAIR大講堂CVPR哈工大深圳專場(chǎng)總結(jié)回顧第五位分享嘉賓是浙江大學(xué)工學(xué)博士李琛，分享主題是主題： Biological Human Skin Color Model: from Theory toApplications (膚色生物學(xué)模型：從原理到應(yīng)用)

李琛于 2017 年 6 月獲得浙江大學(xué)工學(xué)博士學(xué)位，師從周昆教授和微軟亞洲研究院 Steve Lin 博士。他的研究方向?yàn)槿S重建、計(jì)算攝影學(xué)、觀建模等計(jì)算機(jī)視覺、計(jì)算機(jī)圖形學(xué)的交叉領(lǐng)域。 2012 年至 2016 年期間曾在微軟亞洲研究院網(wǎng)絡(luò)圖形組實(shí)習(xí)。

200位學(xué)術(shù)青年齊聚HIT，GAIR大講堂CVPR哈工大深圳專場(chǎng)總結(jié)回顧

他的分享內(nèi)容主要分為以下六部分：

200位學(xué)術(shù)青年齊聚HIT，GAIR大講堂CVPR哈工大深圳專場(chǎng)總結(jié)回顧

分享內(nèi)容：人臉一直以來都是圖像和視頻中的最重要的呈現(xiàn)內(nèi)容。目前市面上也有很多人臉識(shí)別APP。

200位學(xué)術(shù)青年齊聚HIT，GAIR大講堂CVPR哈工大深圳專場(chǎng)總結(jié)回顧

因此，針對(duì)人臉的圖像處理技術(shù)變得十分重要，并獲得越來越廣泛的學(xué)術(shù)和工業(yè)界關(guān)注。由于人類生理結(jié)構(gòu)的相似性，使得人臉具有更多區(qū)別于一般物體的特征和約束可以被利用——膚色就是其中之一。李琛博士和團(tuán)隊(duì)其他人在CVPR 2017 發(fā)表的兩篇論文《Radiometric Calibration from Faces in Images》和《Specular Highlight Removal in Facial Images》，正是利用人臉膚色的生物學(xué)模型作為先驗(yàn)知識(shí)，與當(dāng)今主流算法相比較，在高光分離、相機(jī)響應(yīng)函數(shù)校準(zhǔn)，這兩個(gè)傳統(tǒng)圖像處理的重要問題上，效果獲得顯著提升。

200位學(xué)術(shù)青年齊聚HIT，GAIR大講堂CVPR哈工大深圳專場(chǎng)總結(jié)回顧

內(nèi)容分享結(jié)束后，幾位嘉賓還同時(shí)分享了他們?cè)趯W(xué)術(shù)界與工業(yè)界做研究的工作經(jīng)驗(yàn)。在最后的問答環(huán)節(jié)中，現(xiàn)場(chǎng)同學(xué)們就學(xué)習(xí)、招聘、工作等方面遇到的問題請(qǐng)教了幾位嘉賓，他們都耐心給出了解答，廣大在場(chǎng)的同學(xué)們都收獲良多。以上就是GAIR大講堂CVPR哈工大（深圳）專場(chǎng) 5位嘉賓分享的全部?jī)?nèi)容。AI科技評(píng)論為大家整理了本次活動(dòng)現(xiàn)場(chǎng)PPT（可關(guān)注AI科技評(píng)論公眾號(hào)，后臺(tái)回復(fù)“哈工大PPT”即可獲取下載地址和密碼。）