0
雷鋒網(wǎng)消息,2017年10月10日,3DV 2017國際會議在青島香格里拉酒店正式召開,來自20多個多家的300多位計算機視覺界的研究人員齊聚一堂,開啟了三維視覺研究一年一度的盛會。
(陳寶權(quán)教授開幕致辭)
開幕式中,山東大學(xué)計算機學(xué)院和軟件學(xué)院院長陳寶權(quán)教授作為大會主席致辭。據(jù)陳寶權(quán)教授介紹,3DV國際會議此前由東京大學(xué)、斯坦福大學(xué)等舉辦,已經(jīng)成為匯集三維視覺研究、原型系統(tǒng)、商業(yè)產(chǎn)品和人力資源等的盛會。
本屆3DV會議首次在中國由山東大學(xué)主辦,北京電影學(xué)院未來影像高精尖創(chuàng)新中心協(xié)辦,共有來自20多個國家的300多位計算機視覺界的大咖們來此參會,論文投稿171篇,收錄oral 論文12篇, spotlight 25篇, poster36篇。
(微軟雷德蒙研究院首席研究員張正友做特邀報告)
開幕式之后,首先由微軟雷德蒙研究院首席研究員、ACM/IEEE Fellow張正友博士做了第一個特邀報告,報告主題為“三維計算機視覺在沉浸式交互和遠程協(xié)作”。在報告中張正友博士介紹說,為了使人機交互以及人與人之間的遠程協(xié)作更加自然,報告提出了沉浸式交互。張正友博士介紹了他的團隊最新的研發(fā)成果,ViiBoard,這項技術(shù)集合了識別身體姿態(tài)、手勢、面部表情、人體特征的技術(shù)于一身。ViiBoard主要包括ImmerseBoard與VTouch兩個部分。他們通過Kinect采集信息,隨后通過ImmerseBoard屏幕投影兩位使用者實時書寫與繪畫的人像與內(nèi)容。另外,該產(chǎn)品VTouch部分提供了特有的手勢控制功能,使用戶能夠進行人性化的書寫與繪畫,同時記錄不同的使用者手勢習(xí)慣。最后,張正友講述了融合三維重建,追蹤人眼方向等技術(shù)的沉浸式交互技術(shù)的持續(xù)研發(fā)現(xiàn)狀以及在三人遠程協(xié)作技術(shù)中的應(yīng)用。
(謎之微笑)
在下午場,由蘇黎世大學(xué)的Davide Scaramuzza教授分享了基于事件相機的最新研究,報告主題為“從基于框架相機到基于事件相機,魯棒性更高且能夠進行視覺慣性狀態(tài)評估”。傳統(tǒng)的基于框架的相機在低光照和快速移動的情況下會嚴重地失真或模糊。相比來說,基于事件的相機,由于其輸出為像素級亮度變化而不是傳統(tǒng)的標(biāo)準(zhǔn)的強度幀,所以在高速運動場景下仍然能夠提供非常可靠的視覺信息。不過基于事件的相機在低運動情況下可能僅輸出少量信息。Davide教授在報告中提出了“hybrid pipeline”的方法,并將該方法應(yīng)用到公開的事件相機數(shù)據(jù)集中,精度相比只使用事件pipeline提高了130%,相比于標(biāo)準(zhǔn)的框架視覺-慣性系統(tǒng)提高了85%。隨后Davide教授展示了將該研究應(yīng)用到四翼無人機上,效果非常完美,解鎖了傳統(tǒng)視覺-慣性測距儀無法達到的飛行情景,例如低光環(huán)境和高速動態(tài)場景。
(口頭報告之一)
除了兩場精彩的特邀報告外,四場口頭報告也非常值得關(guān)注。它們分別為:(內(nèi)容來自:山東大學(xué)交叉研究中心公眾號「IRC」)
上午場:
1、DepthSynth: Real-Time Realistic Synthetic Data Generation from CAD Modelsfor 2.5D Recognition
作者來自:西門子公司、西門子醫(yī)療、帕騷大學(xué)
作者提出了一個具有創(chuàng)新性的完全端對端的框架DepthSynth,模擬這些設(shè)備的工作原理,通過建模一些關(guān)鍵的因素例如傳感器噪聲,材料反射率,表面幾何信息等等,進而生成逼真的深度數(shù)據(jù)。
2、Sparsity Invariant CNNs
作者來自:戴姆勒股份公司、弗萊堡大學(xué)和馬克斯·普朗克研究所
對于傳統(tǒng)的卷積網(wǎng)絡(luò)在應(yīng)用到稀疏數(shù)據(jù)時表現(xiàn)不佳的問題,研究人員提出了一個簡單而有效的稀疏卷積層,它考慮了卷積過程中缺失數(shù)據(jù)的位置,能很好地推廣到新的數(shù)據(jù)集,并且與數(shù)據(jù)稀疏程度保持不變,這無疑是機器學(xué)習(xí)與計算機視覺交叉方向的又一大創(chuàng)新。
下午場:
3、OctNetFusion: Learning Depth Fusion from Data
作者來自:格拉茨技術(shù)大學(xué)、微軟、馬克斯·普朗克研究所
將多個深度圖進行融合,進行3D模型重建。常見的方法是基于平均截斷的帶符號距離函數(shù),但是它不能有效地處理遮擋問題,并且需要大量幀來過濾噪聲。隨著3D模型庫的增大,以及深度學(xué)習(xí)的發(fā)展,本文章提出了一種3DCNN方法將多深度的圖像進行融合,重建3D模型,該方法解決了遮擋部位重建等問題,其結(jié)果明顯優(yōu)于TSDF和TV-L1等方法。
4、3D Shape Reconstruction from Sketches via Multi-view Convolutional Networks
作者來自:麻省大學(xué)阿默斯特校區(qū)
本文章提出了一種編碼和解碼的網(wǎng)絡(luò),結(jié)合優(yōu)化方法,可以根據(jù)2D線圖重建3D形狀。首先將單個或者多個2D線圖進行編碼得到形狀信息,然后解碼得到多個視圖下的深度和法線圖,最后結(jié)合優(yōu)化問題將多個視圖進行融合得到3D點云,進而得到3D形狀的拓撲網(wǎng)格。
(短報告之一)
除此之外,10日當(dāng)天還有4場短報告、9個海報展示以及論壇“The challenges and opportunities in 3D sensing”。
(海報展示之一)
(論壇嘉賓,暢談了3D感官的挑戰(zhàn)和機遇)
本屆大會由百度、光珀智能科技、縱目科技、商湯科技、阿丘科技、華為、銀河水滴科技、圖漾科技、先臨三維科技、清影機器視覺技術(shù)、地平線、大勢智慧科技、通甲優(yōu)博等眾多業(yè)界巨頭和創(chuàng)業(yè)新星贊助。在海報展示的會場,各贊助商也同時向參會人員展示了他們在計算機視覺和圖形學(xué)在三維領(lǐng)域的最新研究成果。
(參展商之一商湯科技在向陳寶權(quán)教授和高文院士介紹其手機端3D重建特效)
據(jù)雷鋒網(wǎng)了解,此次會議雖然在中國本土舉辦,但是參會人員中有大約一半都是國外學(xué)者,而投稿及錄取文章則有90%以上來自國外大學(xué)和研究單位。這一點,想想讓人挺揪心的。
雷鋒網(wǎng)注:本文照片皆為山東大學(xué)新聞組同學(xué)提供,特此感謝!
相關(guān)文章:
三維視覺國際會議首度在中國舉辦,和雷鋒網(wǎng)一起了解3DV 2017
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。