0
本文作者: 汪思穎 | 2018-09-11 19:25 |
雷鋒網(wǎng) AI 科技評論消息,9 月 8 日-14 日,2018 歐洲計算機視覺大會(ECCV 2018)在德國慕尼黑召開,ECCV 每兩年舉辦一次,與 CVPR、ICCV 共稱為計算機視覺領(lǐng)域三大頂級學術(shù)會議,每年錄用論文約 300 篇。根據(jù) ECCV 2018 宣布的最終結(jié)果,商湯科技及聯(lián)合實驗室共有 37 篇論文入選,主要集中在以下領(lǐng)域:大規(guī)模人臉與人體識別、物體檢測與跟蹤、自動駕駛場景理解與分析、視頻分析、3D 視覺、底層視覺算法、視覺與自然語言的綜合理解等。此外,商湯科技在 2018 年 COCO 比賽物體檢測(Detection)項目中奪得冠軍,開源 mm-detection 檢測庫。憑借以上事項,商湯科技在雷鋒網(wǎng)旗下學術(shù)頻道 AI 科技評論數(shù)據(jù)庫產(chǎn)品「AI 影響因子」中有相應加分。
在商湯入選 ECCV 2018 論文《人臉識別的瓶頸在于數(shù)據(jù)集噪聲(The Devil of Face Recognition is in the Noise)》中,對于現(xiàn)有人臉數(shù)據(jù)集中的標簽噪聲問題進行了深入研究,對 MegaFace 和 MS-Celeb-1M 數(shù)據(jù)集中的噪聲特性和來源做了全面的分析,發(fā)現(xiàn)干凈子集對于提高人臉識別精度效果顯著。
在入選論文《量化模仿-訓練面向物體檢測的極小 CNN 模型(Quantization Mimic: Towards Very Tiny CNN for Object Detection)》中,提出了一種簡單而通用的框架—量化模仿,來訓練面向物體檢測任務(wù)的極小 CNN 模型。作者提出聯(lián)合模仿與量化的方法來減小物體檢測 CNN 模型的參數(shù)量實現(xiàn)加速。在有限計算量的限制下,該框架在 Pascal VOC 和 WIDER Face 數(shù)據(jù)集的物體檢測性能均超越了當前物體檢測的先進水平。
在 2018 年的 COCO 比賽中,商湯科技研究員和香港中文大學-商湯聯(lián)合實驗室同學組成的團隊在物體檢測(Detection)項目中奪得冠軍。在此次競賽中,商湯團隊開發(fā)了如下三項全新技術(shù),獲得了大幅度的性能提升:
(1)新的多任務(wù)混合級聯(lián)架構(gòu)(hybrid cascade)。通過把不同子任務(wù)進行逐級混合,這種新架構(gòu)有效地改善了整個檢測過程中的信息流動。
(2)通過特征導引產(chǎn)生稀疏錨點,而不是使用傳統(tǒng)的規(guī)則分布的密集錨點。這種特征導引的方案使得錨點的投放更為精準,平均召回率提升了超過10個百分點。
(3)采用一種新型的FishNet網(wǎng)絡(luò)結(jié)構(gòu),它有效地保留和修正多個尺度的信息,能更有效地用于圖像級,區(qū)域級,以及像素級預測任務(wù)。
在 test-dev 上,商湯團隊對上述框架進行了全面測試,其中單模型和多模型(最終提交的結(jié)果來自于五個模型混合的框架)的 mask AP 分別達到了 47.4% 和 49.0%,比去年冠軍(也是商湯團隊獲得)的結(jié)果(44.0% 和 46.3%)有約 3 個百分點的明顯提高。在傳統(tǒng)的基于檢測框的指標 bbox AP 上,這個新的框架也分別達到了單模型 54.1% 和多模型的 56.0% 的性能,比去年冠軍的結(jié)果(50.5% 和 52.6%)也有較大的提升。
此外,在 ECCV 期間,香港中文大學-商湯聯(lián)合實驗室還開源了檢測庫 mm-detection(https://github.com/open-mmlab/mmdetection),這個開源庫提供了已公開發(fā)表的多種視覺檢測核心模塊,通過這些模塊的組合,可以迅速搭建出各種著名的檢測框架,比如 Faster RCNN,Mask RCNN 和 R-FCN 等,以及各種新型框架,從而大大加快檢測技術(shù)研究的效率。
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。