丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
人工智能學(xué)術(shù) 正文
發(fā)私信給楊曉凡
發(fā)送

0

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

本文作者: 楊曉凡 2019-02-02 19:48
導(dǎo)語:走出二維圖像,走向三維世界

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

雷鋒網(wǎng) AI 科技評論按:我們生活在一個三維立體的世界,三維信息的感知也就總是一件有趣的事,三維感知也能帶來比平面感知帶來更多信息。全民 AR / VR /立體視覺的熱潮雖然暫時過去了,但這個領(lǐng)域的學(xué)術(shù)研究和學(xué)術(shù)交流還在持續(xù)進行著。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

1 月 23 日,學(xué)術(shù)交流活動「AI 之眼,智見未來——3D 傳感&人工智能前沿科技論壇」在深圳南山舉行。論壇由奧比中光承辦,中國自動化學(xué)會模式識別與機器智能專委會、中國人工智能學(xué)會模式識別專委會主辦,指導(dǎo)單位是深圳市南山區(qū)科技創(chuàng)新局。論壇邀請了清華大學(xué)、浙江大學(xué)、國防科技大學(xué)、上海交通大學(xué)、廈門大學(xué)、四川大學(xué)、北京航空航天大學(xué)等知名大學(xué)的7位頂尖專家學(xué)者發(fā)表主題演講,分享他們在三維計算機視覺領(lǐng)域的最新科研成果,也給參會的各知名 AI 企業(yè)的技術(shù)骨干、科研機構(gòu)重要研發(fā)人員、相關(guān)專業(yè)的高校學(xué)生等提供了一個交流討論的機會。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

參會專家合影留念

論壇承辦方奧比中光是深圳的 3D 感知技術(shù)企業(yè),提供軟件、硬件的全套解決方案。OPPO Find X 手機上使用的三維人臉識別模組就來自奧比中光。借著承辦論壇的機會,奧比中光的許多研發(fā)技術(shù)人員在座聆聽并參與討論。多位演講嘉賓在論壇間隙參觀了奧比中光的展廳,而后在演講中提到不同企業(yè)的 3D 感知解決方案間的對比時也對奧比中光表示了認可。

雷鋒網(wǎng) AI 科技評論記者現(xiàn)場參與了全天的學(xué)術(shù)交流活動,我們把七個論壇報告的梗概內(nèi)容介紹如下。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇從左至右:肖振中,張漢國,賈偉

奧比中光聯(lián)合創(chuàng)始人 & CTO 肖振中,深圳市南山區(qū)科協(xié)常務(wù)副主席張漢國,中國自動化學(xué)會模式識別與機器智能專委會副秘書長、合肥工業(yè)大學(xué)計算機與信息學(xué)院副研究員賈偉發(fā)表開幕致辭,預(yù)祝論壇成功。


劉燁斌 - 「人體動態(tài)重建技術(shù)前沿」

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

論壇第一個學(xué)術(shù)報告來自清華大學(xué)自動化系副教授、博導(dǎo)劉燁斌。他的報告題目是「人體動態(tài)重建技術(shù)前沿」。報告對人體動態(tài)重建這一研究課題,圍繞便捷性和實時性兩大目標的學(xué)術(shù)界相關(guān)研究成果回顧了技術(shù)發(fā)展歷程,做了全方位的技術(shù)介紹。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

劉燁斌副教授首先介紹了人體動態(tài)重建課題中的一些基本概念。在人體動態(tài)重建中,需要捕捉的信息有三維的幾何+紋理,還有它們的運動;運動包括幾何體表面的運動和內(nèi)部骨架的運動。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

人體動態(tài)重建技術(shù)的應(yīng)用包括:全息通信與全息直播,三維虛擬試衣,智能便捷娛樂(信息采集重建、便攜發(fā)布),自由視角視頻,實時三維運動捕捉,高精度數(shù)字內(nèi)容記錄與制作等。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

人體建模需要的核心技術(shù)是實時深度數(shù)據(jù)采集以及深度數(shù)據(jù)處理。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

根據(jù)輸入數(shù)據(jù)不同,可以分為單視點人體建模和多視點人體建模兩大共性技術(shù),對應(yīng)六大基礎(chǔ)應(yīng)用。劉燁斌副教授從十幾年前開始做這方面的研究,單視點、多視點技術(shù)都有涉及。

人體動態(tài)重建技術(shù)可以分成幾類:

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

早期的做法是不做先驗約束,基于多視角數(shù)據(jù)求取點云;

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

然后發(fā)展出了基于三維模版的方法,這類方法需要先人工建立骨架模版或非剛性形變模版(作為先驗),三維點云的求解可以依托模版,降低了求解的難度、提高了穩(wěn)定性;

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

基于統(tǒng)計模版的方法無需提前由人工建模,系統(tǒng)根據(jù)數(shù)據(jù)學(xué)習統(tǒng)計模版然后應(yīng)用。這種方法的問題是難以重建復(fù)雜幾何拓撲形狀的表面,比如裙子等。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

最后還有表面動態(tài)融合的方法,用深度相機采集點云并進行融合。

劉燁斌副教授介紹了重建技術(shù)中的六大目標:精準重建、規(guī)模采集(多人,大采集范圍)、便捷獲取、實時計算、語義建模(以便建模后結(jié)果的遷移)、真實生成。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

精準重建需要復(fù)雜的相機陣列+多光照,需要采集大量的高精度數(shù)據(jù)。劉燁斌副教授的早期研究就是在精準重建方面,他們設(shè)計了包含 40 個相機、680 個光源的采集裝置。精準重建對采集設(shè)備體系的高要求也限制了它的實際應(yīng)用。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

規(guī)模采集的難點在于處理多視角交疊的區(qū)域,也就是緊密交互的人體動作,比如左圖中三人腿部交叉。有更多視角、更高精度的采集系統(tǒng)自然可以更好地處理交疊區(qū)域,但這同時又限制了系統(tǒng)采集的規(guī)模(人數(shù)以及空間大?。?。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

多紅外相機(多視角)的動態(tài)三維重建可以進行實時的點云融合,解決拓撲變化難題;單深度相機則無法支持拓撲變化與快速運動。圖中研究動態(tài)融合重建的論文《DynamicFusion: Reconstruction and Tracking of Non-rigid Scenes in Real-Time》獲得了 CVPR 2015 的最佳論文獎。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

劉燁斌副教授團隊在此基礎(chǔ)上進行了改進,他們用單深度相機實現(xiàn)實時動態(tài)融合重建,不使用模版,可以支持和物體交互,可以任意視點重建。最新成果可以魯棒地進行復(fù)雜人體動態(tài)重建,3x3米采集空間,5%到10%測量精度。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

下一個技術(shù)目標是便捷獲取,其中一種是從單個相機視角進行動態(tài)三維重建。這時需要先掃描獲得靜態(tài)人體模版(具體做法可以是在鏡頭前以指定動作原地轉(zhuǎn)一圈),計算得到人體模型,之后用單個相機的視頻輸入就可以追蹤動作并進行重建。不過這有較高的計算復(fù)雜度,精度也有限。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

另一種便捷獲取任務(wù)是從單圖像恢復(fù)體態(tài)模型,通過對圖像深度的學(xué)習重建體態(tài)模型以及同步恢復(fù)紋理。劉燁斌副教授團隊的近期工作 DeepHuman 有著不錯的效果。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

語義建模是對人體與服裝分離建模,這樣可以進行轉(zhuǎn)移(把一個人的衣服轉(zhuǎn)移到另一個人身上),但同時還要保留高度的真實感。這樣,對象建模的內(nèi)容就包括了紋理、幾何、材質(zhì)、物理動力學(xué)屬性等等。衣物的物理動力學(xué)建模始終是一大挑戰(zhàn)。在劉燁斌副教授團隊的研究成果中,他們先采集人體模型,經(jīng)過計算后以單視角輸入,服裝可以獨立解析,然后為服裝加入動力學(xué)仿真,服裝背側(cè)使用動力學(xué)計算生成;光影也可以重新重新布置。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

最后,劉燁斌副教授介紹了自己對這項課題的展望。


盧策吾 - 「Behavior Understanding meets 3D Representation」

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

上午的第二個學(xué)術(shù)報告來自上海交通大學(xué)研究員、博導(dǎo)盧策吾。他演講的主題是三維表征以及行為理解(Behavior Understanding meets 3D Representation),主要介紹了自己團隊在這兩個方向上的幾項近期工作。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

盧策吾的演講內(nèi)容主要分為兩個部分,介紹了自己團隊對三維表征以及對行為感知的一些研究成果。

三維表征部分

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

首先對于三維表征,一種基礎(chǔ)的框架是取點的表征,PointNet 就是一種常用的方法,但它無法編碼不同的點之間的關(guān)系。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

對于臨近的點表征問題,PointNet 和 PointCNN 有各自的處理思路,但也有各自的不足。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

對于點的結(jié)構(gòu)的表征,有一些特點是我們希望它具備的,比如尺度不變性,比如空間方向編碼(從而可以在不同方向進行卷積)。SIFT 算子的引入就可以保留這些信息。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

盧策吾團隊提出的 PointSIFT 就是利用了 SIFT 算子的一種多尺度表征方式,克服了 PointNet++ 只取最近鄰的問題。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

對于網(wǎng)絡(luò)架構(gòu)的設(shè)計,他們使用了一個類似 U-Net 的結(jié)構(gòu),尺度先減小后增加。網(wǎng)絡(luò)有自動尺度選擇能力,其中也可以使用不同的模塊設(shè)計。PointSIFT 在多種測試中都取得了優(yōu)秀的表現(xiàn)。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

下一個問題是點的表示在空間旋轉(zhuǎn)不變性方面的表現(xiàn)。在基于點云的物體部件分割任務(wù)中,PointNet++ 一般能取得不錯的效果,但是由于方法的設(shè)計沒有考慮空間旋轉(zhuǎn)不變性,對于旋轉(zhuǎn)/未見過的角度就效果不好。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

PointNet 中的處理思想是尋找點到點之間的對應(yīng)關(guān)系,但對應(yīng)關(guān)系并不具有旋轉(zhuǎn)不變性;另一種思路是把點云映射到球面上,這樣具有了旋轉(zhuǎn)不變性,但點與點之間的對應(yīng)關(guān)系就無法保留,這是球面 CNN 的做法。

盧策吾團隊提出的 Pointwise Rotation-Invariant Network 就結(jié)合了點對點方法和球 CNN 的優(yōu)點,在有空間旋轉(zhuǎn)的情況下也取得了良好表現(xiàn)。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

盧策吾還介紹了基于三維點云的端到端自動駕駛學(xué)習方面的計劃。他和其他研究人員合作采集了一個包含視頻、激光雷達點云、駕駛員行為的駕駛數(shù)據(jù)集 DBNet,對應(yīng)的論文《LiDAR-Video Driving Dataset: Learning Driving Policies Effectively》也被 CVPR 2018 收錄。在這個數(shù)據(jù)集上訓(xùn)練端到端自動駕駛系統(tǒng),就是把三維點云(或者二維錄像)作為輸入,通過模型預(yù)測人類駕駛員會有怎樣的駕駛行為。

目前這個數(shù)據(jù)集已經(jīng)被 Facebook、谷歌、NVIDIA 等企業(yè)以及 MIT、斯坦福、CMU 等學(xué)校使用,盧策吾未來還計劃依托這個數(shù)據(jù)集在 ICCV 2019 舉辦大規(guī)模 SLAM 比賽以及在 CVPR 2020 舉辦大規(guī)模駕駛數(shù)據(jù)分割比賽。

行為識別部分

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

報告的第二部分是關(guān)于行為識別。此前他們的實時姿態(tài)估計系統(tǒng) AlphaPose 兼具高表現(xiàn)和高運行速度,在學(xué)術(shù)研究和應(yīng)用實踐中都非?;馃?,許多工業(yè)界企業(yè)都向他們購買了使用許可。不僅如此,AlphaPose 還可以作為許多不同領(lǐng)域、面向多類不同物體的通用型關(guān)鍵點檢測器。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

提出 AlphaPose 之后,盧策吾團隊關(guān)注的下一個難題是密集姿態(tài)檢測。相比于稀疏分布的物體的姿態(tài)檢測(比如 COCO 數(shù)據(jù)集中的圖像),密集人體識別實際上已經(jīng)是另一種問題,它的難點在于不同目標的互相遮擋形成同構(gòu)噪聲,所以人密集時各種算法的表現(xiàn)都有明顯的下降。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

盧策吾團隊提出一個新的 CrowdPose 數(shù)據(jù)集,其中有大量密集人體場景,帶來很大的挑戰(zhàn)。傳統(tǒng)物體檢測方法此時就誤報率高,關(guān)節(jié)檢測容易錯誤。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

根據(jù)盧策吾介紹,同樣是基于熱力圖辨別人體,傳統(tǒng)方法中對于主體和障礙物的置信度取值是二值化的,這樣的后果就是臨近主體的障礙物在辨別時容易取而代之。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

他們提出的新方法中不再使用二值化的取值,并且用競爭式的框選擇整體優(yōu)化,從而得到更好的表現(xiàn)。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

運動識別的下一個問題是時間序列圖像作為輸入的識別。序列輸入我們很容易想到使用 RNN,但它難以直接用于圖像輸入的檢測。盧策吾團隊提出的方法是深度 RNN 架構(gòu)的時序模型:RBM,它可以看作是一種通用型的 LSTM/RNN,根據(jù)一定條件簡化后就得到了我們熟悉的 LSTM。這種方案可以做到 15 層甚至更深的 RNN 疊加。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

他們的改進思路是:時序信息和特征分別學(xué)習;先學(xué)習空間表征,再讓表征在時間上流動(兩個方向的流動在圖中用兩個方向的連線表示)。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

為了便于網(wǎng)絡(luò)的訓(xùn)練,他們提出了 Temporal Dropout 等訓(xùn)練加速技巧。在實驗中也取得了表現(xiàn)的明顯提升。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

物體間的交互關(guān)系也是運動識別中需要關(guān)注的重要方面。盧策吾團隊提出的一種思路是把「是否有交互」的二值信息利用起來,輔助判斷交互類型,起到用先驗信息提高整體性能的效果。這也是一種通用可遷移到 Inter-Actioness Prior。

總結(jié)

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

盧策吾認為,目前雖然在運動理解和三維表征方面都各自有不少的研究成果,但它們之間的結(jié)合還很少,還沒有產(chǎn)生有潛力的成果,這是未來的一個可能的方向。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

目前的技術(shù)可以做交互判斷,而學(xué)習到的交互關(guān)系可以發(fā)展推理引擎。在這里盧策吾展示了一個視頻,一個機械臂可以在與三維物體的互動(嘗試抓?。┲袑W(xué)習先驗。對三維世界的理解可以輔助機器人工作,機器人與世界的交互也可以增進視覺理解。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

對于整個 AI 范圍的總體看法,盧策吾認為目前我們?nèi)〉昧嗣黠@成果的都屬于 Physical AI(視覺、語音、圖像、機器人),這些技術(shù)確實可以解決大多數(shù)問題;而未來更大的挑戰(zhàn)在于對抽象概念的理解和運用。


章國鋒 - 「視覺 SLAM 技術(shù)及應(yīng)用」

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

浙江大學(xué) CAD&CG 國家重點實驗室教授、博導(dǎo)章國鋒的報告主題是「視覺 SLAM 技術(shù)及應(yīng)用」。報告中綜述介紹了視覺定位地圖重建跟蹤技術(shù)及應(yīng)用的各方面研究工作。

基礎(chǔ)知識與技術(shù)

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

SLAM,同時定位與地圖構(gòu)架,是機器人和計算機視覺領(lǐng)域的基本問題。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

SLAM 技術(shù)的運行結(jié)果要計算設(shè)備自身在空間中的位置和朝向,同時還要構(gòu)建周圍環(huán)境的地圖。根據(jù)構(gòu)建的環(huán)境地圖包含的信息不同,可以分為稀疏 SLAM 和稠密 SLAM,前者只包含三維點云,后者同時也要采集重建幾何和紋理。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

經(jīng)過幾十年的發(fā)展,SLAM 系統(tǒng)常用的技術(shù)框架已經(jīng)基本成熟,主要可以分為輸入、前臺線程、后臺線程、輸出四個組成部分。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

視覺 SLAM 自然是以視覺輸入為主,單目、雙目、多目攝像頭方案都有。如今也可以結(jié)合其他的輔助傳感器的信號,進一步提高解算精度。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

視覺 SLAM 從視覺信號輸入,重建場景三維信息的基本原理是多視圖幾何方程求解。不過,高效、穩(wěn)定的求解有一定難度,尤其在動態(tài) SLAM 中,場景在變化,有outliner,甚至場景有遮擋。章國鋒教授介紹了幾個關(guān)鍵思路。

視覺 SLAM 研究工作

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

章國鋒教授設(shè)計的視覺 SLAM 解決方案是 RDSLAM。這個系統(tǒng)可以根據(jù)實時視頻信號輸入檢測、追蹤場景中的動態(tài)變化。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

相比于更傳統(tǒng)的基于濾波器的 SLAM 方法,基于關(guān)鍵幀的方法有較多優(yōu)點,但對強旋轉(zhuǎn)很敏感。RDSLAM 就是一種基于關(guān)鍵幀的方法。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

機器人領(lǐng)域的應(yīng)用中大量使用視覺慣性 SLAM,就是結(jié)合機器人 IMU (慣性測量單元)采集的數(shù)據(jù)計算視角運動,在它的幫助下提高魯棒性。那么沒有搭載 IMU 的設(shè)備能否借鑒這種思路呢?由于絕大多數(shù)情況下攝像頭的移動線速度較低(米/秒 級),影響不大,重點計算角速度即可,章國鋒教授認為這種思路是可行的。也就是在沒有真實 IMU 數(shù)據(jù)時,通過采集的數(shù)據(jù)數(shù)據(jù)模擬計算 IMU 數(shù)據(jù)。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

根據(jù)這個思路,他們針對移動場景提出 RKSLAM。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

而后還衍生出基于 RGB-D 輸入系統(tǒng)的視覺 SLAM 系統(tǒng) RKD-SLAM,除 RGB 視覺信息之外增加的深度信息可以大幅提高魯棒性,得以實現(xiàn)非常快速的增量集束調(diào)整;基于關(guān)鍵幀的重融合,消除累積誤差;其中還使用了多種降低計算復(fù)雜度的方法,速度可以快一個數(shù)量級。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

章國鋒教授著重介紹了系統(tǒng)中使用的集束調(diào)整方法,把長序列分成多個短序列,分段優(yōu)化,收斂快。在演示視頻中,章國鋒教授在自家小區(qū)中一邊行走,一邊隨意用手機拍攝視頻,他們的方法就能很好地重建出周圍環(huán)境的三維模型,效果優(yōu)于此前的方法。

視覺 SLAM 技術(shù)應(yīng)用

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

視覺 SLAM 技術(shù)的應(yīng)用有很多。對于視頻剪輯,可以移動、復(fù)制畫面中的對象,隱藏或者添加對象,還可以增加時間停止特效,進行景深變換等。(上圖視頻中,在桌面上復(fù)制了一個同樣的魔方)。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

增強現(xiàn)實應(yīng)用也是大家喜聞樂見的應(yīng)用形式。圖中演示的是王者榮耀 AR 人物,可以讓游戲中的英雄在真是桌面上做出各種動作;高德地圖有 AR 導(dǎo)航,可以在路面上顯示一個助手帶著你行走。AR 尺子也已經(jīng)具備了一定的實用性,基于 RGB-D 慣性 SLAM 的 AR 測量,平均測量誤差只有 2.6%?;?TOF (飛行時間)的技術(shù)還可以具有遮擋處理的能力。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

最后,章國鋒教授展望了視覺 SLAM 的技術(shù)發(fā)展趨勢。一方面,我們需要更先進的方法緩解視覺 SLAM 中的特征依賴,提高穩(wěn)定性;另一方面,稠密 SLAM、TOF 做得還不夠好、應(yīng)用還不多。最后,多傳感器融合也是一大發(fā)展方向。


黃迪 - 「基于三維人臉數(shù)據(jù)的身份識別與表情分類」

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

北京航空航天大學(xué)計算機學(xué)院院長聘副教授、博導(dǎo)黃迪的報告主題是「基于三維人臉數(shù)據(jù)的身份識別與表情分類」。報告從背景、三維人臉識別、三維表情識別、三維人臉分析的新挑戰(zhàn)幾個方面綜述介紹了這個領(lǐng)域的主要研究和應(yīng)用脈絡(luò)。

背景

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

三維人臉分析的處理流程可以分為數(shù)據(jù)采集、預(yù)處理(移除尖點、填充孔洞等)、形狀表示、測量與匹配幾步。如今進入深度學(xué)習時代,傳統(tǒng)三維分析流程四步中的后兩步可以合二為一。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

三維人臉分析的應(yīng)用場景不外乎身份驗證、4D 表情分析,還可以分析身份和表情之外的額外信息,比如人種、性別、年齡等。一個典型應(yīng)用是 iPhone FaceID,它采集人臉的三維數(shù)據(jù)進行記錄和比對。FaceID 的出現(xiàn)表明三維人臉已經(jīng)可以在一些定制化的產(chǎn)品上進行應(yīng)用,回應(yīng)了一些對三維技術(shù)質(zhì)疑的聲音。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

二維、三維人臉分析技術(shù)的表現(xiàn)有較大不同。二維人臉分析解決不了光照問題;二維人臉識別無法很好解決姿態(tài)變化的問題(對于不同表情的人臉,做身份識別之前需要嘗試恢復(fù)到中性的表情,但信息的重加工可能會破壞身份信息);三維人臉分析對化妝的容忍度更高。以及,對于照片、視頻、仿真面具三類攻擊的容忍程度上,三維對前兩種有天然的免疫(采集不到深度信息),而且對面具的抵抗性也要比二維方法好很多。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

三維人臉分析起始于 1989年,2005年是三維人臉分析快速發(fā)展的一年。領(lǐng)域內(nèi)的大牛 Kevin Bowyer 在 2006 年提出,三維人臉分析技術(shù)的發(fā)展面臨的三大挑戰(zhàn)是:更好的三維傳感器、更好的算法以及更好的實驗方法。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

三維人臉分析的數(shù)據(jù)集有不少,常用數(shù)據(jù)集 FRGC、BU3DFE、BU-4DFE。不過所有這些數(shù)據(jù)集的數(shù)據(jù)量都不大,所以深度學(xué)習模型的表現(xiàn)并不突出。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

三維人臉識別使用場景:純?nèi)S形狀對比,多模態(tài)人臉對比,以及二維三維不對稱識別

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

黃迪副教授說道,三維人臉識別的挑戰(zhàn)是,所有的人臉都很像!人臉這個大類的相似度很高,所有的臉人臉都有相同的結(jié)構(gòu)??紤]不同身份的人構(gòu)成的小類的話,類內(nèi)有一定的變化,來自表情變化、姿態(tài)(收集時的不同姿態(tài)可能導(dǎo)致三維點云不完整)、遮蓋、雙胞胎、低質(zhì)量數(shù)據(jù)等。而類內(nèi)的差異無法保證小于類間(不同的人之間)的差異。如今,表情變化的處理已經(jīng)比較成熟穩(wěn)定,其他的挑戰(zhàn)仍然等待解決。

三維人臉識別技術(shù)

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

三維人臉識別中的關(guān)鍵問題:要找到比較好的形狀表示。理想的表示要對不同的個體有區(qū)分度,也要能減少其他因素的干擾。形狀表示有基于模版、等高線、剛體、不變區(qū)域等多種方法。后來公認使用 MeshSIFT 類等基于特征的方法。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

由于更早之前人臉數(shù)據(jù)集的樣本太小(數(shù)據(jù)庫中默認每張臉只有一個樣本),所以基于深度學(xué)習的研究工作 2018 年才出現(xiàn)。這項工作微小地改動了已有的 VGG-Face 模型,而創(chuàng)新點在于數(shù)據(jù)擴增,作者們創(chuàng)造了更多的虛擬 ID、更多的姿態(tài),保證有足夠的數(shù)據(jù),然后用二維卷積的方法得到比較好的結(jié)果。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

根據(jù)黃迪副教授介紹,三維人臉識別的難點,早期一般在于采集,高精度的采集設(shè)備過于昂貴,能采集的數(shù)據(jù)規(guī)模??;后來才有低成本的采集設(shè)備,而消費級的采集設(shè)備一般還是有比較多的噪聲。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

黃迪副教授利用消費級的 Kinect v2 采集大規(guī)模數(shù)據(jù),提出 Lock3DFace 數(shù)據(jù)集,包含了 500 個人、每人 20 個視頻,其中有 200 人的數(shù)據(jù)采集時間間隔 7 個月。這個數(shù)據(jù)集的目的除了為每個身份提供充足的數(shù)據(jù)之外,也包含了豐富的表情、姿態(tài)、遮擋,尤其時間間隔造成的變化是任何此前的數(shù)據(jù)集都不包括的。Kinect v2 雖然只能采集到低精度的原始數(shù)據(jù),但可以用多幀數(shù)據(jù)聯(lián)合重建,同樣得到可靠的結(jié)果。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

最新研究中,他們提出了一套采集系統(tǒng) Led3DFR,用移動級硬件,利用前端計算、小模型,達到高準確率、高識別速度。

三維表情識別技術(shù)

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

三維方法研究表情有天然優(yōu)勢。傳統(tǒng)表情方法中的一種是肌肉分割。目前還解決的不好的案例是一些近似表情的分割,強度小,混淆性高。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

另一種思路是在流形上做卷積,但對內(nèi)存大小和計算復(fù)雜度要求很高。黃迪副教授團隊提出一種快速、輕計算量的新流形卷積方法,直接在 mesh 上計算,使用定制化的算法,手工定制的池化步驟,計算過程高效,得到的下采樣結(jié)果準確。

對于各種基于深度學(xué)習的方法,黃迪副教授的感受是,受限于訓(xùn)練數(shù)據(jù)集大小,還是需要結(jié)合一些手工優(yōu)化,但深度學(xué)習的方法仍有優(yōu)勢。

三維人臉分析的挑戰(zhàn)

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

最后總結(jié)了三維人臉分析技術(shù)發(fā)展中遇到的挑戰(zhàn):首先,三維重建、特征計算都有高計算量,在移動設(shè)備上有計算時間的問題;點云數(shù)據(jù)是不規(guī)則分布的,空間中不同區(qū)域的點密度有很大區(qū)別,同時三維人臉數(shù)據(jù)集的數(shù)據(jù)量也不大,深度學(xué)習的應(yīng)用就受到一定限制。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

對于三維人臉識別,真實場景應(yīng)用中也許多變異點,比如如何適應(yīng)商業(yè)化的(低精度)深度傳感器、如何在移動設(shè)備上運行、如何克服噪聲和遮擋等問題,以及如何與二維RGB數(shù)據(jù)有更好的融合,高效地發(fā)揮各自的優(yōu)勢。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

對于三維表情識別,也有表情的不確定性的問題,可以是不同的表情看起來很類似,也可以是不同的人對同樣的表情有不同的理解。嘗試其他表達形式,結(jié)合上下文、肢體語言判斷是一種思路。


趙啟軍 - 「三維人臉建模:由圖到形的人臉識別」

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

四川大學(xué)計算機學(xué)院副教授趙啟軍的報告主題是「三維人臉建模:由圖到形的人臉識別」。這個報告也是關(guān)于三維人臉的,不過趙啟軍副教授關(guān)注的重點是從二維圖像重建三維人臉,這不僅是二維三維信息之間的橋梁,也拓展了三維人臉技術(shù)的應(yīng)用范圍。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

二維圖像可以由三維實體生成,其中有很多因素影響;二維圖像除了紋理之外也有很多三維信息,尤其是在結(jié)合了物體的常識模型之后。二維和三維相比之下,全視角的三維面部模型含有更多的信息,也更加魯棒。

三維人臉一直不火熱的原因,趙啟軍副教授認為是高成本。專業(yè)的三維采集設(shè)備自然非常昂貴、使用不便,即便現(xiàn)在出現(xiàn)了低價的消費級 RGB-D 傳感器,但測量精度有限;其他原因還有,受限的應(yīng)用場景(絕大部分三維應(yīng)用在短距離測量和識別),帶來的額外收益受限(二維圖像在多數(shù)場景中都有足夠好的效果,占據(jù)支配地位,不過實際上二維圖像方法也需要使用環(huán)境中有一些約束,才能達到滿意的性能)

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

趙啟軍副教授的科研路線圍繞的就是三維數(shù)據(jù)的重建和應(yīng)用:在采集新的三維數(shù)據(jù)的同時,也要利用已有的二維數(shù)據(jù)。從二維數(shù)據(jù)重建三維數(shù)據(jù),可以輔助無限定的二維人臉識別(角度、光照、姿態(tài)不做嚴格要求)。這也是本次報告的主要內(nèi)容。

單張圖像人臉重建

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

從一張到多張圖像恢復(fù)完整的三維模型。這可以看作一個回歸問題。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

解決這個問題的經(jīng)典方法是 3DMM,這是一種統(tǒng)計方法,做法是收集許多人臉模型,用 PCA (降維)求出統(tǒng)計模型,然后把統(tǒng)計模型擬合到待求人臉。如今的深度學(xué)習方法也是用的同樣的核心思路,只是改變了求參過程。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

對于這項方法的后續(xù)改進,研究人員們希望可以避免求解統(tǒng)計模型,直接在三維空間中求回歸,得到保留個性化特性的、而且有助于識別的人臉形狀。簡單直接的人臉重建有許多思路可以完成,但是我們希望重建結(jié)果能對人臉識別起到幫助,也就是保留有辨別性的細節(jié)。另外還希望這個過程可以是實時的。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

趙啟軍副教授介紹了自己團隊的一項后續(xù)研究工作,從單張圖像重建三維人臉,同時目標讓重建結(jié)果幫助人臉識別,排除表情之類的對識別無幫助的信息。他們的思路是把每個面部三維模型看作平均模型+身份信息+表情信息的組合。他們把面部對齊(獲得更準確的特征點)和面部重建(獲得更準確的三維模型)作為聯(lián)合任務(wù),交替進行,多次迭代;最終輸出的三維重建結(jié)果不包含表情信息,也就是一個表情中性的人臉。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

研究中他們也嘗試了基于深度學(xué)習的非線性模型,效果并不突出。他們猜測原因也是測試數(shù)據(jù)集規(guī)模較小,不足以發(fā)揮出深度學(xué)習方法的優(yōu)勢。

經(jīng)過三維重建得到了正面、表情中性的人臉模型之后,一種應(yīng)用方式是輔助提升二維人臉識別的效果。重建后的三維模型與原始二維圖像補充成為融合模型后,可以提升較大角度下識別的性能,減小了姿態(tài)和光照對純二維方法人臉識別的影響。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

趙啟軍副教授還做了其他思路的進一步研究,他們嘗試三維面部形狀特征解耦,聯(lián)合人臉重建任務(wù)和識別任務(wù),希望可以強化識別人臉需要的身份信息;根據(jù)他們的想法,這些信息可以在隱空間進行分解建模。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

經(jīng)過端到端聯(lián)合訓(xùn)練后實現(xiàn)了預(yù)想的引導(dǎo)結(jié)果,達到了身份信息和表情信息的分離,不同人的身份信息有足夠的區(qū)分度。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

他們也做了許多驗證研究,表明形狀重建的精度也達到了較好水平;Alabation study 表明,多層感知機學(xué)習到的基向量之間也有很高的區(qū)分度(單個基向量表示的面部特征已經(jīng)不可能在真實人臉上出現(xiàn)了,見上圖左側(cè)部分),說明了學(xué)習的有效性。

多圖人臉重建

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

單張圖像的人臉重建問題得到較好解決之后,多張圖像帶紋理重建也就是在單圖任務(wù)基礎(chǔ)上的自然延伸。一個典型的應(yīng)用是,公安系統(tǒng)的罪犯存檔照片包含正面、左、右三種視圖,可以利用這些照片重建帶有紋理的三維人臉模型,與現(xiàn)有的二維圖像采集系統(tǒng)結(jié)合以后可以極大提升目標的前 n 位識別成功率,即便二維圖像采集系統(tǒng)的圖像可以是任意角度的人臉。趙啟軍副教授還介紹了一個三維人臉重建帶來目標犯罪嫌疑人的識別排序大幅提升的真實案例。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

多張圖像的人臉重建也有一種令人十分頭疼的應(yīng)用場景,就是長時間跨度的多張無限制圖像重建。如圖,六張不同年齡的萊昂納多,幾乎可以認為是好幾個不同的人了。這時我們希望重建出的人臉是一個平均形狀,能夠代表不同時期的面部特點。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

這個問題目前還無法完美地解決,畢竟類內(nèi)就有很大差異。不過相比以往的方法,趙啟軍副教授團隊提出的方法,減小了同類、類間區(qū)別的重疊(圖中黃色和藍色交疊部分)。

總結(jié)

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

趙啟軍副教授最后做了總結(jié):三維人臉在許多任務(wù)中會有幫助,他們也提出了多種方法進行重建并應(yīng)用重建成果。這個領(lǐng)域的挑戰(zhàn)是:缺乏大規(guī)模的 benchmark;數(shù)據(jù)采集精度需要更高,重建時希望可以有更多的紋理細節(jié)(甚至到可以捕捉皮膚缺陷的程度);另外不同多種來源的數(shù)據(jù)可以用于多種不同的目的。


郭裕蘭  -  「三維場景智能感知與理解」

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

國防科技大學(xué)電子科學(xué)學(xué)院講師郭裕蘭的報告「三維場景智能感知與理解」介紹了他所在的研究小組在雙目深度估計、三維目標識別以及三維場景標注等方向的研究進展。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

郭裕蘭首先介紹了三維數(shù)據(jù)獲取與處理的基本知識,介紹了雙目視覺深度計算的基本技術(shù),以及這個任務(wù)中傳統(tǒng)算法的流程。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

郭裕蘭所在的研究小組有一些新的嘗試,他們借助深度學(xué)習,用一個網(wǎng)絡(luò)解決視差估計中的多個步驟。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

在 CVPR 2018 的 ROB 挑戰(zhàn)賽中,他們的方法在不同的數(shù)據(jù)集中取得了均衡的表現(xiàn),由此獲得了總成績第一名。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

他們也對視差超分辨率任務(wù)做了一些研究。視差超分辨率是要利用雙目視覺兩個輸入之間的微小差異。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

郭裕蘭還介紹了多種基于三維數(shù)據(jù)的深度學(xué)習場景理解(對象識別)方法。


紀榮嶸 - 「基于學(xué)習的場景信息重構(gòu)」

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

論壇的壓軸報告嘉賓是來自廈門大學(xué)的“閩江學(xué)者”特聘教授、博導(dǎo)紀榮嶸。報告中介紹了課題組圍繞場景信息重構(gòu)的一些研究工作以及技術(shù)應(yīng)用。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

報告一開始,紀榮嶸教授就感慨道,「雖然現(xiàn)在是深度學(xué)習時代,但是只會深度學(xué)習是不行的」。報告的第一項內(nèi)容也就是一種非深度學(xué)習的方法。

基于搜索的單圖深度估計

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

單目視覺深度估計本身是一項比較簡單、如今也被深度學(xué)習解決得比較好的問題,傳統(tǒng)方法先估計初始深度圖,再用 CRF 優(yōu)化、端到端,以及繼續(xù)加入各種技巧,也可以得到比較好的結(jié)果。

不過在這項研究中,紀榮嶸教授指導(dǎo)學(xué)生選擇了一種基于搜索的方法:把深度估計問題作為搜索問題,把圖片分為許多 patch(小塊),每個patch在現(xiàn)有的圖像-深度數(shù)據(jù)庫中搜索,得到的結(jié)果做上下文平滑。

這種做法的難點在于:1,跨模態(tài)檢索,2,大邊緣結(jié)構(gòu)分析。由于這是一種非深度學(xué)習方法,它不需要訓(xùn)練,只需要預(yù)先編碼一個字典即可(用于快速搜索)。這篇論文時間較早,但也被 ECCV 錄用。

基于序列預(yù)測的實時語義分割

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

下面就進入了深度學(xué)習時代,在各種任務(wù)中大家都開始嘗試基于深度學(xué)習的方法。紀榮嶸教授介紹的這項研究是針對視頻語義分割的(也就是時間序列語義分割)。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

一般來說序列分割中都要考慮前后幀之間的聯(lián)系,才能讓分割結(jié)果更穩(wěn)定、魯棒,他們的思路是把編碼器先前的輸出用來預(yù)測,也嘗試了級聯(lián)、相加、Attention、Attention+級聯(lián)等多種融合策略,編碼器也使用了上下文殘差卷積。最后配合一些提速技巧,取得了性能和速度的很好均衡(在 TITAN Xp 上,2048x1024 的圖像分辨率輸入,達到 18.5 幀/秒的運行速度;同時在精度上甚至優(yōu)于一些不考慮速度的方法)。 這篇論文 CVPR2019 在投。

基于語義信息和生成對抗的視覺里程計

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

下一項研究是關(guān)于視覺里程計的。這是首次把生成式對抗引入視覺里程計的設(shè)計,但取得了不錯的效果。

方法的總體流程是,用一個特征生成模塊 FGN 生成特征,用一個 Discriminator 判別數(shù)據(jù)分布。這個 Discriminator 有三路輸入,分別是圖像、生成器輸出的特征、語義圖,然后把用 SIFT 方法生成的特征點和特征描述作為 Ground Truth。這樣的做法解決了特征點檢測和描述的問題。取特征部分比直接使用 SIFT 和 ORB 快,精度也更高。而且也解決了 SIFT 作為里程計時容易中斷的問題。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

他們的方法在許多場景下都取得了不錯的表現(xiàn),甚至最終的精度超過了作為監(jiān)督信息的 SIFT 的精度。不過,由于方法中沒有加入閉環(huán)檢測,在高速、長路段的后期誤差會升高。

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

最后,紀榮嶸教授還簡單介紹了實驗室在視覺場景理解方面的多個項目,包括頭戴式顯示裝備、AR 快速定位、基于神經(jīng)網(wǎng)絡(luò)壓縮的人工智能芯片設(shè)計、端到端實時室內(nèi)物體語義分割等,也是產(chǎn)學(xué)研結(jié)合的范例。


結(jié)束語

七場學(xué)術(shù)報告下來,這些在三維數(shù)據(jù)分析、場景感知、人工智能技術(shù)方面有諸多經(jīng)驗的專家學(xué)者們之間就一些觀點達成了共識,為臺下聽眾講解了重要的發(fā)展脈絡(luò)、關(guān)鍵技術(shù)體系和最新進展;借著聽眾提問的機會,嘉賓們也在一些問題上更具體深入地表達了自己的觀點。

三維數(shù)據(jù)的采集和表示、三維數(shù)據(jù)的分析和理解還有許多難點遺留,不過這同時也是巨大的空間,等待技術(shù)不斷發(fā)展去填補。奧比中光在三維數(shù)據(jù)采集設(shè)備的普及化、小型化方面做出的探索得到了專家們的關(guān)注和認可,也將成為這個領(lǐng)域的學(xué)術(shù)研究和應(yīng)用普及的一股推動力量。

未來更豐富的三維信息、對三維信息的更充分利用,也會像現(xiàn)階段的人工智能技術(shù)一樣帶來更多機會和生活便利。雷鋒網(wǎng) AI 科技評論也會持續(xù)關(guān)注相關(guān)學(xué)術(shù)研究和技術(shù)普及應(yīng)用,期待下一次的專家學(xué)者聚首以及最新學(xué)術(shù)成果討論。

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知

三維感知與三維數(shù)據(jù)分析最新進展 - 3D傳感&人工智能前沿科技論壇

分享:
相關(guān)文章

讀論文為生

日常笑點滴,學(xué)術(shù)死腦筋
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說