4
本文作者: 宗仁 | 2016-04-20 18:06 | 專題:雷峰網(wǎng)公開(kāi)課 |
嘉賓介紹: 聶崇嶺,進(jìn)化動(dòng)力CTO。曾任職于瑞士Enclustra設(shè)計(jì)咨詢公司,專注于機(jī)器學(xué)習(xí)、高性能異構(gòu)計(jì)算系統(tǒng),曾參與多項(xiàng)Credit Suisse、ABB、Siemens、Roche等跨國(guó)公司技術(shù)研發(fā)項(xiàng)目;碩士畢業(yè)于瑞士蘇黎世聯(lián)邦理工大學(xué)(ETH Zurich),師從ACM和IEEE Fellow, Gustavo Alonso教授。雷鋒網(wǎng)
今天Magic Leap發(fā)布全新“水母版”Demo 演示,讓一些AR癌患者又開(kāi)始欲罷不能了,這么“黑”的黑科技,會(huì)成為下一個(gè)Google Glass還是全新的AR涅槃?wù)?,任我們?cè)趺打}擾Rony Abovitz他也不告訴我,但不能阻止我大天朝人民的好奇心啊, 所以聶崇嶺大牛隆重登場(chǎng),為我們解讀他眼里的Magic Leap,下面開(kāi)始進(jìn)入干貨時(shí)間(此處應(yīng)有掌聲~)雷鋒網(wǎng)雷鋒網(wǎng)
這個(gè)問(wèn)題我們和團(tuán)隊(duì)成員討論過(guò),我們認(rèn)為可能有以下幾個(gè)點(diǎn):
其一,Demo演示機(jī)器體積過(guò)大,這個(gè)通過(guò)外媒拍攝的照片也一定程度上得到了驗(yàn)證;
其二,原型機(jī)必定操作繁瑣;
其三,拍攝Demo視頻,對(duì)周圍環(huán)境要求嚴(yán)格;
其四,效果不穩(wěn)定和系統(tǒng)魯棒性上 可能還有不足,導(dǎo)致不能直接進(jìn)入;
最后沒(méi)有做過(guò)產(chǎn)品化的準(zhǔn)備,如果放出操作機(jī)器演示的Demo,無(wú)疑會(huì)透露出以上各種弊端,極大的降低用戶的預(yù)期,這可能不是Magic Leap想看到的。
(系統(tǒng)魯棒性?)
是的。我們通過(guò)網(wǎng)上一些公開(kāi)的信息和投資人的渠道了解過(guò),Magic Leap的Demo是對(duì)拍攝房間提前做過(guò)建模的,但是依然有可能不能一次成功拍攝出理想效果的Demo視頻,對(duì)視頻中 Magic Leap設(shè)備定位的精度,房間3D模型構(gòu)建的精度 都是影響系統(tǒng)魯棒性的因素,系統(tǒng)能否適應(yīng)各種不同的應(yīng)用場(chǎng)景都是系統(tǒng)魯棒性的體現(xiàn),具體到現(xiàn)在ML的兩次Demo視頻來(lái)看,場(chǎng)景主要是室內(nèi),光線溫和不明亮的場(chǎng)景。
(從Magic Leap的技術(shù)演示視頻中,除了演示收到信息后,在桌子上加載珠穆朗瑪峰的全息信息圖,還展示了如何購(gòu)物,水母漂浮等效果。這些效果相比之前的demo哪里驚艷了?)
這個(gè)是ML的第一個(gè)Demo視頻,我先討論這個(gè)視頻有哪些驚艷之處,之后對(duì)比第二個(gè)Demo視頻來(lái)看有哪些進(jìn)步。
第一個(gè)Demo視頻中,一個(gè)小機(jī)器人從辦公桌下面彈跳亮相,之后隨著攝影機(jī)視角的變化,機(jī)器人被辦公桌腿所遮擋,這里已經(jīng)有了一個(gè)關(guān)鍵技術(shù),就是對(duì)物體(機(jī)器人)在空間的定位和空間周圍深度信息(桌子腿)的感知。
這是第二個(gè)Demo視頻,在這個(gè)Demo視頻中, 我們看到ML在桌子上加載了珠穆朗瑪峰的全息信息圖,在這里,我認(rèn)為ML做了相對(duì)于第一個(gè)Demo更復(fù)雜的處理,就是要檢測(cè)出桌子的整個(gè)平面,之后把珠峰的全息圖放在這個(gè)桌面上。
(如何比第一個(gè)Demo更復(fù)雜?)
雖然它們都是提取深度,珠峰的全息圖像有個(gè)更動(dòng)態(tài)的變化,這里要時(shí)刻保持全息圖像和桌子平面的相對(duì)關(guān)系。
最后一個(gè)水母漂浮的場(chǎng)景,我認(rèn)為這是一個(gè)比較大的突破,這里攝影機(jī)的視角(ML的設(shè)備)和 水母本身都在移動(dòng),ML的算法能夠在計(jì)算自身位置的同時(shí),計(jì)算水母群在空間中的位置,同時(shí)計(jì)算出兩者直接的關(guān)系,再把水母群投影回?cái)z影機(jī)(ML設(shè)備)視角,這個(gè)相對(duì)于之前只有攝影機(jī)移動(dòng)的Demo更近了一大步。
“AR的真正核心競(jìng)爭(zhēng)力并不在于其顯示方式,而在于計(jì)算機(jī)視覺(jué)上?!边@點(diǎn)我是同意的。
計(jì)算機(jī)視覺(jué)的創(chuàng)新點(diǎn),說(shuō)實(shí)話,我并沒(méi)有找到ML在CV領(lǐng)域的重大創(chuàng)新。它更像是一個(gè)顯示技術(shù)創(chuàng)新公司,這種創(chuàng)新的顯示技術(shù)可能可以把AR的用戶體驗(yàn)帶上一個(gè)新的層次,Magic Leap Demo視頻中所展示的出的CV技術(shù),在Microsoft RESEARCH, Google等公司,已經(jīng)SIGGRAPH等頂級(jí)會(huì)議上都可以看到,Magic Leap做的好是 把這個(gè)前沿的CV技術(shù)和自家創(chuàng)新的顯示技術(shù)融合進(jìn)了AR的應(yīng)用,給大家展示出了Demo。
是說(shuō)它的進(jìn)步 在計(jì)算機(jī)視覺(jué)上還停留在光場(chǎng)技術(shù)階段(非數(shù)字全息技術(shù)階段);上面所提的demo各種具體的牛掰技術(shù)主要是自家創(chuàng)新的顯示技術(shù)的進(jìn)步?
技術(shù)本事很牛是真的,包括CV和顯示技術(shù),CV上的也就是計(jì)算機(jī)視覺(jué)上的 重大創(chuàng)新點(diǎn)沒(méi)有看到,(因?yàn)椋〤V的技術(shù)進(jìn)步一向是整個(gè)行業(yè)的共同進(jìn)步。
恩,這里我們看到的“芯片”跟我們所說(shuō)的芯片不太一樣,它是一種基于MEMS微機(jī)電的鏡片或者叫顯示器,里面有許多可以被控制的開(kāi)關(guān),控制鏡片上每個(gè)像素點(diǎn)的光路,整合起來(lái)就是一個(gè)光路組成的3D Array,類似于下面的這張圖:
每一個(gè)點(diǎn)的光路都可以被單獨(dú)控制,這也就是這個(gè)“芯片”的功能。
(那除了這個(gè), 剩下的還要搭配什么別的芯片一起工作?)
鏡片/芯片上的圖像可以是透過(guò)鏡片來(lái)自于真實(shí)世界,也可以是通過(guò)鏡片/芯片邊緣的接口來(lái)自ML的projector,這個(gè)芯片負(fù)責(zé)的主要是顯示,AR中的計(jì)算機(jī)視覺(jué)計(jì)算工作 并不在這個(gè)片上完成。
我并不認(rèn)為這個(gè)是一個(gè)騙局,首先我們要說(shuō)的是AR本身肯定不是一個(gè)騙局,如Microsoft Google FB等大公司在這方面都有技術(shù)研究。從ML放出的各個(gè)Demo來(lái)看,這家公司也是有著深厚的技術(shù)積累在的,ML在一些早期的Demo中加入了需要酷炫CG效果,ML在一些早期的Demo中加入了需要酷炫CG效果,后續(xù)正式設(shè)備所拍攝的效果沒(méi)有CG版本的更黑科技,大家心理上有個(gè)期望的落差,這個(gè)可以理解,AR的相關(guān)技術(shù)現(xiàn)在處于一個(gè)相對(duì)早期的階段,肯定還有不盡如人意的地方在,這也正是為什么我們看到ML的最新Demo沒(méi)有最早CG版本的炫酷了,不過(guò)這更能體現(xiàn)出ML技術(shù)的真實(shí),不是一個(gè)CG騙局。
(恩,如果有人說(shuō)因?yàn)橛辛薌oogle Glass的前車之鑒,所以大家對(duì)這個(gè)有了騙局的擔(dān)憂,怎么看這個(gè)問(wèn)題?)
技術(shù)的進(jìn)步和迭代就是這樣,我們不可能要求一個(gè)新興領(lǐng)域在早期能夠直接產(chǎn)出完美的產(chǎn)品,比如在膠片照片機(jī)盛行的年代,誰(shuí)也無(wú)法通過(guò)第一代CCD Sensor的規(guī)格想到 數(shù)碼相機(jī)會(huì)成為主流。
我認(rèn)為現(xiàn)在提及Magic Leap的FOV,以及和Microsoft的Hololens對(duì)比FOV,還為時(shí)尚早; 一款原型機(jī)在便攜性上還沒(méi)解決,F(xiàn)OV可能沒(méi)有用武之地,但是根據(jù)Magic Leap的顯示原理,理論上是可以克服這個(gè)問(wèn)題,實(shí)現(xiàn)更大的FOV,甚至光場(chǎng)的顯示,這不是Magic Leap產(chǎn)品化路上的最大障礙,大家如果對(duì)Magic Leap的顯示技術(shù)原理感興趣,可以是參考一下Magic Leap Inc.最近幾年申請(qǐng)的專利_US20140003762 Patent 有興趣的朋友 可以看看,上面有細(xì)致的描述,ML在顯示技術(shù)上做了哪些嘗試有哪些突破。
大家都是AR的設(shè)備,Hololens已經(jīng)放出了開(kāi)發(fā)者套件,接近大規(guī)模量產(chǎn)。而Magic Leap還是處于一個(gè)原型機(jī)都很神秘的階段,從他們背后使用的計(jì)算機(jī)視覺(jué)技術(shù)來(lái)看,是相通的,大家使用了類似的技術(shù),深度提取,SLAM, 3D重構(gòu),Object Tracking等等。
不同點(diǎn)在 大家的顯示技術(shù)不同, Hololens使用的是類似于Google Glasses的顯示技術(shù),而ML,前面已經(jīng)提到,使用的是一種全新的顯示技術(shù)。
Hololens著重的是當(dāng)下,ML更像是在為未來(lái)打造一款設(shè)備,當(dāng)時(shí)Hololens里面也是有很多高科技在的,我們知道Hololens的硬件是使用了Intel Atom的CPU,是微軟最熟悉的X86構(gòu)架,和一個(gè)定制 holographic processing unit (HPU)。操作系統(tǒng)的還是使用Windows的Kernel,基于Hololens和Microsoft Research的CV預(yù)研技術(shù),也有發(fā)布出“黑科技”Demo,Holoportation。
Meta Glass這款產(chǎn)品 我不是特別了解,只是看了TED上的介紹和Demo演示,它和Hololens是形態(tài)及其相似的設(shè)備,Demo上也體現(xiàn)出了SLAM,tracking等CV技術(shù),但是并沒(méi)有體現(xiàn)出Meta的方案是否有3D重構(gòu)技術(shù),這里打一個(gè)問(wèn)號(hào),我把它理解成一個(gè)功能和配置都縮減了的Hololens。
(好的,分享已完,謝謝各位?。?/p>
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。