0
雷鋒網(wǎng) AI 科技評論按:機器學習、人工智能領域的研究人員,以及任何學術研究人員,都關心這兩件事:分享、傳播自己的研究成果讓更多人知道,以及了解自己研究方向的最新進展、結識更多的研究人員。雷鋒網(wǎng) AI 研習社大講堂就是一個供研究人員們分享自己成果、促進廣泛溝通互動的直播平臺。
自 AI 大講堂去年 7 月上線以來, 已經(jīng)有來自清華大學、北京大學、上海交通大學、香港科技大學、 MIT、UC Berkeley、悉尼科技大學等知名國內外高校的嘉賓進行直播分享,甚至還舉辦了線下論文分享會,迄今已完成了 68 期,覆蓋影響讀者過萬人。不僅嘉賓自己的研究成果被直播觀眾以及讀者們了解,也讓科技愛好者們、學生們、其它研究人員們增進了對人工智能相關思維、知識、應用的認識,為國內人工智能長期持續(xù)發(fā)展的氛圍出一份力。
人工智能相關的各個研究方向中,最為豐富也最為熱門的當屬計算機視覺(CV)了,其中的熱門任務包括圖像分類、對象檢測、圖像分割、圖像生成、圖像描述生成等等。下面我們匯總了近期(2018 年以來)9 期精彩的計算機視覺方向分享回顧。
分享嘉賓:劉漢唐,浙江大學計算機系博士生。
圖像分割是計算機視覺中一個經(jīng)典并且基礎的問題,對于理解圖像非常關鍵。圖像分割有很多應用場景,比如無人駕駛、地圖重建、圖像美化等等。深度學習使得圖像分割有了巨大的發(fā)展,本次分享會介紹深度學習中圖像分割的經(jīng)典算法。
分享嘉賓:黃靖佳,北京大學深圳研究生院信息工程學院二年級博士生。
視頻中的行為檢測是當下的熱點研究任務,該任務要求從一段未經(jīng)修剪的(untrimmed)視頻中找出目標行為發(fā)生的時間區(qū)間。由于目標行為可能發(fā)生的時間點以及目標行為的持續(xù)時間均是不確定的,使得在完成這項任務時往往需要花費大量的計算資源對不同時間尺度(長度),不同起點的視頻片段進行判斷。為了避免這種低效的檢測方法,我們提出了一種可以自適應調整檢測窗口大小及位置的方法,對視頻進行高效的檢測。
分享嘉賓:何詩怡,北京大學計算機視覺碩士,優(yōu)必選悉尼AI研究院學生。
與單標簽圖像分類相比,多標簽圖像分類是一種更符合真實世界客觀規(guī)律的方法,尤其在圖像和視頻的語義標注,基于內容的圖像檢索等領域有著廣泛的應用。因此,本次公開課,何詩怡將分享她用強化學習解決多標簽圖像分類問題的方法和經(jīng)驗
分享嘉賓:王薇月,南加州大學計算機系在讀博士。
隨著激光雷達,RGBD相機等3D傳感器在機器人,無人駕駛領域的廣泛應用,深度學習在三維點云數(shù)據(jù)的研究在近兩年取得了廣泛關注。點云分割、識別、檢測成為學術界、工業(yè)界的熱門話題之一。是在本次公開課中,講者將分享其關于點云分割的最新工作。
分享嘉賓:張宇倫,美國東北大學計算機工程在讀博士,Adobe 公司深度學習研究實習生
圖像超分辨率技術作為底層計算機視覺任務,有著廣泛的應用場景,比如:手機圖像增強,視頻監(jiān)控,醫(yī)療影像,衛(wèi)星圖像,低分辨率人臉識別。因此,圖像超分辨率技術吸引了眾多來自學術界與工業(yè)界的研究興趣。但是,當前圖像超分辨率技術仍然面臨一些難題,比如,對高放大倍數(shù)的圖像超分辨,難以恢復丟失的細節(jié);對已經(jīng)恢復出的細節(jié),也有著模糊等效應,其質量有待提升。因此,本次公開課,張宇倫同學設計一種新的網(wǎng)絡結構,得到更強的表達能力,不僅將之前方法難以恢復的細節(jié)恢復出來了,而且,結果更清晰。最終,在不同圖像退化模型下都達到了當前較好的結果。
分享嘉賓:姜仲石,紐約大學科朗數(shù)學研究所(NYU Courant) 二年級博士生。
網(wǎng)格是幾何數(shù)據(jù)的常用高效表示, 在幾何曲面構建的機器學習方法對計算機圖形學,3D計算機視覺以及幾何分析和處理有著重要的意義。
分享嘉賓:任中正,現(xiàn)UIUC攻讀計算機博士。
現(xiàn)在的神經(jīng)網(wǎng)絡可以通過監(jiān)督學習學到很好的遷移學習本領,然而卻需要百萬級別的手工標注數(shù)據(jù)。自監(jiān)督(self-supervised)任務就是一種為了取代標注數(shù)據(jù)的方式。 然而已有的自監(jiān)督方法大部分是單任務,導致模型容易在這個任務上過擬合。任博士分享了用合成數(shù)據(jù)做多任務特征學習的工作,以及如何使用domain adaptation來讓學到的特征更好的遷移到真實世界的視覺任務上。
分享嘉賓:胡梟瑋,香港中文大學二年級博士生。
陰影檢測是計算機視覺中基礎并富有挑戰(zhàn)性的問題。檢測陰影區(qū)域,為進一步獲取圖像中的光照情況、物體的形狀與位置,以及攝像機的參數(shù)提供了可能,同時陰影的存在為目標的檢測與跟蹤帶來了障礙。檢測陰影區(qū)域需要理解圖像全局的語義信息,本文提出通過方向性地分析圖像空間上下文信息來理解陰影,同時設計了DSC模型用于檢測、去除陰影,并在兩個陰影檢測數(shù)據(jù)集以及兩個陰影去除數(shù)據(jù)集上都達到了頂尖的性能。這篇論文已被CVPR 2018收錄,并做口頭報告(Oral)。
分享嘉賓:劉晨,圣路易斯華盛頓大學計算機系在讀博士。
隨著增強現(xiàn)實,家務機器人等應用的普及,室內場景重建研究正在得到越來越廣泛的關注。與傳統(tǒng)底層密集重建方法不同,講者的研究集中在分析重建場景中的高層結構化信息。在本次公開課中,講者將分享其結構化重建的最新工作。
大講堂系列直播分享持續(xù)進行中。更多精彩研究成果分享、更多往期內容匯總,請繼續(xù)關注雷鋒網(wǎng)相關內容。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉載。詳情見轉載須知。