亮風臺2D AR算法新突破，奪冠世界權(quán)威評測 | ICRA 2018

本文作者：李詩

2018-10-09 17:54

專題：ICRA 2018

導語：亮風臺提出的基于約束置信度的魯棒跟蹤算法（CCM），提高了在局部遮擋、光照變化和運動模糊等各種因素干擾情況下的魯棒性。

亮風臺

AI影響因子

論文

名稱：ICRA

時間：

企業(yè)：

在目前的AR應用中，2D AR跟蹤，如海報、卡牌等平面物體的跟蹤已經(jīng)成為核心技術(shù)之一，在營銷、教育、游戲、展示展覽等方面都很常見。然而，盡管近年來2D AR跟蹤算法已經(jīng)取得了很大的進步，但在一些外部條件、環(huán)境因素影響下的效果仍然有很大提升空間，如何處理光照變化、運動模糊等因素帶來的挑戰(zhàn)，也是目前進行底層算法研發(fā)的AR公司以及學者的研發(fā)熱點。

雷鋒網(wǎng)近日消息，AR公司亮風臺在2D AR跟蹤方面取得了新突破，其研發(fā)人員提出的基于約束置信度的魯棒跟蹤算法（CCM），提高了在局部遮擋、光照變化和運動模糊等各種因素干擾情況下的魯棒性，并在UCSB和TMT兩個國際評測集中刷新了最好成績。目前，這一成果已經(jīng)在機器人領(lǐng)域頂級會議ICRA 2018上發(fā)表。ICRA 是機器人領(lǐng)域三大頂級會議之一（其它兩個為IROS和RSS），AR跟蹤的很多經(jīng)典工作（例如ESM跟蹤算法）都曾在ICRA和IROS上發(fā)表。

亮風臺2D AR算法新突破，奪冠世界權(quán)威評測 | ICRA 2018

在局部遮擋、運動模糊和照明改變條件下的CCM算法效果示例（只顯示在目標周圍放大的區(qū)域以便展示）

據(jù)了解，這兩年亮風臺依然有不少工作在針對2D AR的算法優(yōu)化，在2017年的ICRA上發(fā)表了針對光照變化的基于梯度方向的AR跟蹤算法；同年提出的基于圖匹配的跟蹤算法利用圖結(jié)構(gòu)來處理目標物體內(nèi)部的空間關(guān)聯(lián)，從而實現(xiàn)在強干擾的準確平面物體跟蹤，該工作已被人工智能領(lǐng)域國際頂級期刊《PAMI》（IEEE模式分析和機器智能匯刊）錄用。其它在CVPR、ICCV、ECCV、ICRA、ISMAR、PAMI 等AI、CV、AR相關(guān)領(lǐng)域頂級期刊會議上公開發(fā)表的研究成果涉及圖像語義識別、人臉圖像分析、手勢識別、AR場景建模定位、超圖匹配，視覺顯著性等方面。

基于約束置信度的魯棒跟蹤算法（CCM）

跟蹤平面物體，例如2D標記，通常是相機定位和場景配準的重要步驟。在過去的幾十年中，大量的研究致力于視覺跟蹤問題，平面目標跟蹤的流行方法可以大致分為基于關(guān)鍵點的方法和基于模板的方法。基于模板的方法直接利用像素的外觀而不提取特征，并基于牛頓法或其變體優(yōu)化模板與捕獲圖像之間的相似性度量，以確定平面的姿態(tài)。

不同與傳統(tǒng)的基于模板的跟蹤方法，CCM（ Constrained Confidence Matching）根據(jù)測量噪聲對每個像素分配不同的匹配系數(shù)，而不是在計算運動參數(shù)時對模板中的每個像素進行相同的處理。在此基礎(chǔ)上，為了進一步提高對光照變化和重運動模糊的魯棒性，亮風臺研發(fā)人員還提出了一種魯棒卡爾曼濾波器，它采用新的控制輸入模型來處理物體的外觀變化。

給定目標的初始圖像或位置，新方法（即CCM）自動從視頻中跟蹤定位目標所在位置。

第一步：從視頻第一幀中提取目標區(qū)域作為模板T；

第二步：從視頻讀取下一幀圖像It；

第三步：在圖像It中跟蹤匹配目標；

第四步：根據(jù)第三步的跟蹤結(jié)果更新模板T。

第五步：跳轉(zhuǎn)到步驟二處理下一幀圖像。

測試結(jié)果

為了徹底評估，CCM算法在兩個公共數(shù)據(jù)集上進行了測試：加利福尼亞大學提出的UCSB基準和加拿大阿爾伯塔大學提出的操作任務跟蹤（TMT）基準。UCSB數(shù)據(jù)集包括96個視頻流，顯示6個不同紋理的平面目標，總共6889幀，具有幾何失真（搖攝、縮放、傾斜、旋轉(zhuǎn)）、九個運動模糊等級以及不同的照明條件，所有幀都受到不同程度的噪音影響。TMT數(shù)據(jù)集由人為和機器記錄的操作任務的圖像序列組成，它包含109個圖像序列，共70592幀。

對應于每個視頻類別的平均跟蹤精度匯總在表I（UCSB）和II（TMT）中，如下：

亮風臺2D AR算法新突破，奪冠世界權(quán)威評測 | ICRA 2018

從實驗結(jié)果可以看出，所提出的CCM算法在兩個數(shù)據(jù)集上顯著地優(yōu)于所有基線。事實上，CCM在幾乎所有視頻類別中都獲得了最佳或幾乎最佳的跟蹤性能，明顯優(yōu)于現(xiàn)有的主流跟蹤算法，如基于關(guān)鍵點的跟蹤（keypoint-based tracker）,基于模板的跟蹤（ template-based tracker）以及概率跟蹤（probabilistic tracker），并且它對于極端姿態(tài)變化以及嚴重的環(huán)境擾動都表現(xiàn)出很高的魯棒性。

CCM算法與其他算法相比，在各類內(nèi)在和外在變化的幾個典型示例如下，包括具有重復圖案的圖像傾斜；劇烈而動態(tài)的日落畫面引起照明變化，紋理非常弱；存在部分遮擋；運動模糊，在這種情況下檢測不到可靠的關(guān)鍵點。

亮風臺2D AR算法新突破，奪冠世界權(quán)威評測 | ICRA 2018

AR的研究仍需持續(xù)努力

盡管計算機對于“常規(guī)”平面物體的認識已經(jīng)能達到很高的速度、精度，以及穩(wěn)定性，但這明顯還不夠，研究人員希望計算機能夠盡可能“模擬”人的視覺效果，甚至在一定條件下超過人眼，這樣，在算法工程化之后面向普通用戶時，才能保障優(yōu)質(zhì)的用戶體驗，如在傳統(tǒng)的平面物體跟蹤中，容易出現(xiàn)快速運動丟失或漂移等現(xiàn)象，反映到用戶體驗上，車窗外的廣告牌就容易識別不到，在走動過程中玩AR游戲發(fā)現(xiàn)地面上的家具會“飄”起來等。

這就需要相關(guān)的學術(shù)人員以及企業(yè)研發(fā)人員不斷的優(yōu)化算法、提出新方法，如此才能結(jié)合不斷升級的硬件環(huán)境實現(xiàn)高度的市場化。對于目前的2D AR甚至整個AR行業(yè)來說，需要從業(yè)人員把現(xiàn)有技術(shù)應用化市場化，但同樣需要大量真正的創(chuàng)新人員向前推進底層技術(shù)邊界，讓AR走向成熟。

相關(guān)文章：

AR技術(shù)新突破：亮風臺研發(fā)基于圖的平面物體跟蹤算法

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

8人收藏

相關(guān)文章