CV學術(shù)與工業(yè)的深度碰撞，“GAIR大講堂CVPR哈工大深圳專場”你絕不能錯過！

本文作者：陳留

2017-08-23 09:48

導(dǎo)語：GAIR大講堂-CVPR哈工大深圳專場，這個暑假你絕對不能錯過的學術(shù)分享活動！

在成功結(jié)束上海交大站、清華站活動之后，“GAIR大講堂”第三期學術(shù)分享活動將馬不停蹄地于本周六（8月26日）在哈工大深圳研究生院開幕。

上周六在清華的活動，得到了北京地區(qū)各大高校同學們的踴躍支持，100人的會議室被廣大到場的觀眾們擠得爆滿，下圖為活動現(xiàn)場圖：

CV學術(shù)與工業(yè)的深度碰撞，“GAIR大講堂CVPR哈工大深圳專場”你絕不能錯過！

(清華站現(xiàn)場照片）

4位嘉賓從CVPR 2017的學術(shù)成果到參會心得分享，為在場的同學們和企業(yè)觀眾做了專業(yè)而又精彩的介紹，同學們也積極參與了現(xiàn)場提問。嘉賓的耐心回答讓同學們收獲良多，以至于有同學在活動結(jié)束之后對主辦方雷鋒網(wǎng)表達了真誠地感謝，有微信截圖為證：

CV學術(shù)與工業(yè)的深度碰撞，“GAIR大講堂CVPR哈工大深圳專場”你絕不能錯過！

從現(xiàn)場情況和同學們的反饋來看，想必對即將開始的哈工大站活動，你也會非常期待吧！要知道哈工大深圳站，主辦方雷鋒網(wǎng)以及承辦方哈工大（深圳）計算機學院一同邀請了更多來自企業(yè)界的重磅嘉賓來分享他們在CVPR 上學術(shù)成果，這其中就包括AI明星企業(yè)的資深A(yù)I工程師們，相信企業(yè)嘉賓的分享也能讓大家收獲更多易于落地的研究思考。嘉賓介紹：

左旺孟哈爾濱工業(yè)大學計算機學院教授、博士生導(dǎo)師

CV學術(shù)與工業(yè)的深度碰撞，“GAIR大講堂CVPR哈工大深圳專場”你絕不能錯過！

左旺孟老師，IEEE會員，中國計算機學會會員，國際期刊《ISRN Signal Processing》編委。主要從事圖像增強與復(fù)原、稀疏表達和深度學習等方面的研究。在ACM CSUR、IEEE TIP等重要國際期刊和CVPR、ICCV、ICPR、ICIP等重要國際會議上發(fā)表學術(shù)論文40余篇。曾獲得全國優(yōu)秀博士論文提名獎、哈爾濱工業(yè)大學優(yōu) 秀博士論文獎和國際會議優(yōu)秀論文獎。

主題：Deep learning models for image restoration and depth enhancement (面向圖像復(fù)原和深度圖增強的深度學習模型)

分享內(nèi)容：圖像增強和復(fù)原是底層視覺的一個重要內(nèi)容。近年來，以卷積神經(jīng)網(wǎng)絡(luò)為代表的深度學習模型在圖像超分辨與去噪領(lǐng)域獲得了巨大的成功。然而，如何將其推廣應(yīng)用至更多的底層視覺視覺問題，是我們近年來關(guān)注的一個重要方向。本次分享將圍繞這一問題，介紹我們今年CVPR上的兩個工作：

(1) 設(shè)計了一種新的去噪CNN網(wǎng)絡(luò)，并結(jié)合半二次分裂方法將其推廣應(yīng)用于廣義的圖像復(fù)原問題的求解；
(2) 針對有引導(dǎo)圖的深度圖增強問題，設(shè)計了一種特殊的深度網(wǎng)絡(luò)結(jié)構(gòu)并利用任務(wù)驅(qū)動策略學習動態(tài)引導(dǎo)與增強模型。

黃偉林碼隆科技首席科學家

黃偉林博士來自牛津大學Visual Geometry Group（VGG），是首位從該實驗室回國工作的研究員。博士后期間師從Andrew Zisserman和Alison Noble。研究方向主要集中在場景文本識別,場景分類和醫(yī)學視頻分析等領(lǐng)域。同時，他還擔任計算機視覺/人工智能領(lǐng)域主要會議的PC member或者Reviewer，包括：ICCV、CVPR、ECCV、AAAI 等。黃偉林博士曾任中國科學院助理教授。

Matt Scott 碼隆科技聯(lián)合創(chuàng)始人兼CTO

CV學術(shù)與工業(yè)的深度碰撞，“GAIR大講堂CVPR哈工大深圳專場”你絕不能錯過！

Matt Scott 擁有十年微軟研發(fā)經(jīng)驗，曾任微軟亞洲研究院高級研發(fā)主管。Matt多年均為微軟績效排名前1%的杰出員工與管理者，擁有國際頂級學術(shù)會議論文13篇，超過40個中美專利技術(shù)，18個微軟技術(shù)商業(yè)轉(zhuǎn)化成果。其熟悉研發(fā)領(lǐng)域包括軟件工程、視覺計算，機器學習，尤其擅長把最前沿計算機科學成果轉(zhuǎn)化為服務(wù)大眾的互聯(lián)網(wǎng)產(chǎn)品。

分享題目：CVPR WebVision挑戰(zhàn)賽分享與展望（論文分享）

分享摘要：CVPR期間WebVision大規(guī)模視覺理解全球挑戰(zhàn)賽宣布賽果，碼隆科技團隊在全球超過100支參賽隊伍中脫穎而出，榮獲冠軍。WebVision競賽的主要挑戰(zhàn)是數(shù)據(jù)來源于網(wǎng)絡(luò)抓取，未經(jīng)過任何人工標注，因此含有大量的錯誤類別標簽。碼隆算法團隊利用課程學習（Curriculum Learning）的思路，設(shè)計更加高效的訓(xùn)練策略，有效地抑制錯誤標簽和數(shù)據(jù)不平衡的負面作用。在演講中，碼隆科技黃博士將分享此次競賽的算法思路和方法方面的相關(guān)經(jīng)驗，以及針對現(xiàn)實場景中非人工標注數(shù)據(jù)的訓(xùn)練和學習技術(shù)的探索。

除此之外，Matt還將重點介紹ImageNet 與 Webvision兩大學術(shù)比賽之間的區(qū)別，除此之外，將深入介紹WebVision 比賽的主要挑戰(zhàn)，以及由WebVision 比賽引發(fā)的對智能視覺現(xiàn)實場景應(yīng)用的探索。希望帶領(lǐng)廣大同學們更深入的了解和認識WebVision挑戰(zhàn)賽。

陳曉智，清華大學博士

陳曉智博士畢業(yè)于清華大學電子工程系。他的研究興趣為深度學習及其在三維感知中的應(yīng)用。他曾在多倫多大學、百度自動駕駛事業(yè)部進行訪問和實習，曾獲清華大學優(yōu)秀博士論文、博士生國家獎學金。

主題：Multi-View 3D Object Detection Network for Autonomous Driving （面向自動駕駛的多視角三維物體檢測網(wǎng)絡(luò)）

分享內(nèi)容：三維物體檢測是自動駕駛感知系統(tǒng)的關(guān)鍵問題。本文提出了一種多視角三維物體檢測網(wǎng)絡(luò)（MV3D)，通過融合激光點云和RGB圖像來實現(xiàn)物體的三維定位與檢測。該模型將三維點云編碼成多視角的表示，通過三維似物性網(wǎng)絡(luò)來提取三維候選區(qū)域，并設(shè)計了一種深度融合網(wǎng)絡(luò)來學習物體的多模態(tài)特征。該方法在KITTI評測集上取了領(lǐng)先的三維物體檢測性能。

李琛浙江大學工學博士

CV學術(shù)與工業(yè)的深度碰撞，“GAIR大講堂CVPR哈工大深圳專場”你絕不能錯過！

李琛于2017年6月獲得浙江大學工學博士學位，師從周昆教授和微軟亞洲研究院Steve Lin博士。他的研究方向為三維重建、計算攝影學、表觀建模等計算機視覺、計算機圖形學的交叉領(lǐng)域。2012年至2016年期間曾在微軟亞洲研究院網(wǎng)絡(luò)圖形組實習。

主題：Biological Human Skin Color Model: from Theory to Applications (膚色生物學模型：從原理到應(yīng)用)

摘要：人臉一直以來都是圖像和視頻中的最重要的呈現(xiàn)內(nèi)容。因此，針對人臉的圖像處理技術(shù)變得十分重要，并獲得越來越廣泛的學術(shù)和工業(yè)界關(guān)注。由于人類生理結(jié)構(gòu)的相似性，使得人臉具有更多區(qū)別于一般物體的特征和約束可以被利用——膚色就是其中之一。李琛博士等人在CVPR 2017發(fā)表的兩篇論文《Radiometric Calibration from Faces in Images》和《Specular Highlight Removal in Facial Images》，正是利用人臉膚色的生物學模型作為先驗知識，與當今主流算法相比較，在高光分離、相機響應(yīng)函數(shù)校準，這兩個傳統(tǒng)圖像處理的重要問題上，效果獲得顯著提升。

活動時間地點：