Magic Leap整個(gè)AR項(xiàng)目都可能是個(gè)騙局？聽(tīng)大牛怎么說(shuō) | 雷鋒網(wǎng)公開(kāi)課

本文作者：宗仁

2016-04-20 18:06

導(dǎo)語(yǔ)：這么“黑”的黑科技，會(huì)成為下一個(gè)Google Glass還是全新的AR涅槃?wù)撸?

嘉賓介紹: 聶崇嶺，進(jìn)化動(dòng)力CTO。曾任職于瑞士Enclustra設(shè)計(jì)咨詢公司，專注于機(jī)器學(xué)習(xí)、高性能異構(gòu)計(jì)算系統(tǒng)，曾參與多項(xiàng)Credit Suisse、ABB、Siemens、Roche等跨國(guó)公司技術(shù)研發(fā)項(xiàng)目；碩士畢業(yè)于瑞士蘇黎世聯(lián)邦理工大學(xué)（ETH Zurich），師從ACM和IEEE Fellow, Gustavo Alonso教授。雷鋒網(wǎng)

今天Magic Leap發(fā)布全新“水母版”Demo 演示，讓一些AR癌患者又開(kāi)始欲罷不能了，這么“黑”的黑科技，會(huì)成為下一個(gè)Google Glass還是全新的AR涅槃?wù)?，任我們?cè)趺打}擾Rony Abovitz他也不告訴我，但不能阻止我大天朝人民的好奇心啊，所以聶崇嶺大牛隆重登場(chǎng)，為我們解讀他眼里的Magic Leap，下面開(kāi)始進(jìn)入干貨時(shí)間（此處應(yīng)有掌聲~）雷鋒網(wǎng)雷鋒網(wǎng)

天啦嚕！為何總發(fā)demo視頻

這個(gè)問(wèn)題我們和團(tuán)隊(duì)成員討論過(guò)，我們認(rèn)為可能有以下幾個(gè)點(diǎn)：

其一，Demo演示機(jī)器體積過(guò)大，這個(gè)通過(guò)外媒拍攝的照片也一定程度上得到了驗(yàn)證；
其二，原型機(jī)必定操作繁瑣；
其三，拍攝Demo視頻，對(duì)周圍環(huán)境要求嚴(yán)格；
其四，效果不穩(wěn)定和系統(tǒng)魯棒性上可能還有不足，導(dǎo)致不能直接進(jìn)入；

最后沒(méi)有做過(guò)產(chǎn)品化的準(zhǔn)備，如果放出操作機(jī)器演示的Demo，無(wú)疑會(huì)透露出以上各種弊端，極大的降低用戶的預(yù)期，這可能不是Magic Leap想看到的。

（系統(tǒng)魯棒性？）

是的。我們通過(guò)網(wǎng)上一些公開(kāi)的信息和投資人的渠道了解過(guò)，Magic Leap的Demo是對(duì)拍攝房間提前做過(guò)建模的，但是依然有可能不能一次成功拍攝出理想效果的Demo視頻，對(duì)視頻中 Magic Leap設(shè)備定位的精度，房間3D模型構(gòu)建的精度都是影響系統(tǒng)魯棒性的因素，系統(tǒng)能否適應(yīng)各種不同的應(yīng)用場(chǎng)景都是系統(tǒng)魯棒性的體現(xiàn)，具體到現(xiàn)在ML的兩次Demo視頻來(lái)看，場(chǎng)景主要是室內(nèi)，光線溫和不明亮的場(chǎng)景。

在技術(shù)上有何創(chuàng)新

首先談顯示技術(shù)上的創(chuàng)新

（從Magic Leap的技術(shù)演示視頻中，除了演示收到信息后，在桌子上加載珠穆朗瑪峰的全息信息圖，還展示了如何購(gòu)物,水母漂浮等效果。這些效果相比之前的demo哪里驚艷了？）

這個(gè)是ML的第一個(gè)Demo視頻，我先討論這個(gè)視頻有哪些驚艷之處，之后對(duì)比第二個(gè)Demo視頻來(lái)看有哪些進(jìn)步。

第一個(gè)Demo視頻中，一個(gè)小機(jī)器人從辦公桌下面彈跳亮相，之后隨著攝影機(jī)視角的變化，機(jī)器人被辦公桌腿所遮擋，這里已經(jīng)有了一個(gè)關(guān)鍵技術(shù)，就是對(duì)物體（機(jī)器人）在空間的定位和空間周圍深度信息（桌子腿）的感知。

Magic Leap整個(gè)AR項(xiàng)目都可能是個(gè)騙局？聽(tīng)大牛怎么說(shuō) | 雷鋒網(wǎng)公開(kāi)課

這是第二個(gè)Demo視頻，在這個(gè)Demo視頻中，我們看到ML在桌子上加載了珠穆朗瑪峰的全息信息圖，在這里，我認(rèn)為ML做了相對(duì)于第一個(gè)Demo更復(fù)雜的處理，就是要檢測(cè)出桌子的整個(gè)平面，之后把珠峰的全息圖放在這個(gè)桌面上。

Magic Leap整個(gè)AR項(xiàng)目都可能是個(gè)騙局？聽(tīng)大牛怎么說(shuō) | 雷鋒網(wǎng)公開(kāi)課

（如何比第一個(gè)Demo更復(fù)雜？）

雖然它們都是提取深度，珠峰的全息圖像有個(gè)更動(dòng)態(tài)的變化，這里要時(shí)刻保持全息圖像和桌子平面的相對(duì)關(guān)系。

最后一個(gè)水母漂浮的場(chǎng)景，我認(rèn)為這是一個(gè)比較大的突破，這里攝影機(jī)的視角（ML的設(shè)備）和水母本身都在移動(dòng)，ML的算法能夠在計(jì)算自身位置的同時(shí)，計(jì)算水母群在空間中的位置，同時(shí)計(jì)算出兩者直接的關(guān)系，再把水母群投影回?cái)z影機(jī)（ML設(shè)備）視角，這個(gè)相對(duì)于之前只有攝影機(jī)移動(dòng)的Demo更近了一大步。

Magic Leap整個(gè)AR項(xiàng)目都可能是個(gè)騙局？聽(tīng)大牛怎么說(shuō) | 雷鋒網(wǎng)公開(kāi)課

然后是計(jì)算機(jī)視覺(jué)的創(chuàng)新

“AR的真正核心競(jìng)爭(zhēng)力并不在于其顯示方式，而在于計(jì)算機(jī)視覺(jué)上?！边@點(diǎn)我是同意的。

計(jì)算機(jī)視覺(jué)的創(chuàng)新點(diǎn)，說(shuō)實(shí)話，我并沒(méi)有找到ML在CV領(lǐng)域的重大創(chuàng)新。它更像是一個(gè)顯示技術(shù)創(chuàng)新公司，這種創(chuàng)新的顯示技術(shù)可能可以把AR的用戶體驗(yàn)帶上一個(gè)新的層次，Magic Leap Demo視頻中所展示的出的CV技術(shù)，在Microsoft RESEARCH, Google等公司，已經(jīng)SIGGRAPH等頂級(jí)會(huì)議上都可以看到，Magic Leap做的好是把這個(gè)前沿的CV技術(shù)和自家創(chuàng)新的顯示技術(shù)融合進(jìn)了AR的應(yīng)用，給大家展示出了Demo。

是說(shuō)它的進(jìn)步在計(jì)算機(jī)視覺(jué)上還停留在光場(chǎng)技術(shù)階段（非數(shù)字全息技術(shù)階段）；上面所提的demo各種具體的牛掰技術(shù)主要是自家創(chuàng)新的顯示技術(shù)的進(jìn)步？

技術(shù)本事很牛是真的，包括CV和顯示技術(shù)，CV上的也就是計(jì)算機(jī)視覺(jué)上的重大創(chuàng)新點(diǎn)沒(méi)有看到，（因?yàn)椋〤V的技術(shù)進(jìn)步一向是整個(gè)行業(yè)的共同進(jìn)步。

那張光場(chǎng)光子芯片為什么是透明的？

Magic Leap整個(gè)AR項(xiàng)目都可能是個(gè)騙局？聽(tīng)大牛怎么說(shuō) | 雷鋒網(wǎng)公開(kāi)課

恩，這里我們看到的“芯片”跟我們所說(shuō)的芯片不太一樣，它是一種基于MEMS微機(jī)電的鏡片或者叫顯示器，里面有許多可以被控制的開(kāi)關(guān)，控制鏡片上每個(gè)像素點(diǎn)的光路，整合起來(lái)就是一個(gè)光路組成的3D Array，類似于下面的這張圖：

Magic Leap整個(gè)AR項(xiàng)目都可能是個(gè)騙局？聽(tīng)大牛怎么說(shuō) | 雷鋒網(wǎng)公開(kāi)課

每一個(gè)點(diǎn)的光路都可以被單獨(dú)控制，這也就是這個(gè)“芯片”的功能。

Magic Leap整個(gè)AR項(xiàng)目都可能是個(gè)騙局？聽(tīng)大牛怎么說(shuō) | 雷鋒網(wǎng)公開(kāi)課

（那除了這個(gè)，剩下的還要搭配什么別的芯片一起工作？）

鏡片/芯片上的圖像可以是透過(guò)鏡片來(lái)自于真實(shí)世界，也可以是通過(guò)鏡片/芯片邊緣的接口來(lái)自ML的projector，這個(gè)芯片負(fù)責(zé)的主要是顯示，AR中的計(jì)算機(jī)視覺(jué)計(jì)算工作并不在這個(gè)片上完成。

整個(gè)AR項(xiàng)目都可能是個(gè)騙局？

我并不認(rèn)為這個(gè)是一個(gè)騙局，首先我們要說(shuō)的是AR本身肯定不是一個(gè)騙局，如Microsoft Google FB等大公司在這方面都有技術(shù)研究。從ML放出的各個(gè)Demo來(lái)看，這家公司也是有著深厚的技術(shù)積累在的，ML在一些早期的Demo中加入了需要酷炫CG效果，ML在一些早期的Demo中加入了需要酷炫CG效果，后續(xù)正式設(shè)備所拍攝的效果沒(méi)有CG版本的更黑科技，大家心理上有個(gè)期望的落差，這個(gè)可以理解，AR的相關(guān)技術(shù)現(xiàn)在處于一個(gè)相對(duì)早期的階段，肯定還有不盡如人意的地方在，這也正是為什么我們看到ML的最新Demo沒(méi)有最早CG版本的炫酷了，不過(guò)這更能體現(xiàn)出ML技術(shù)的真實(shí)，不是一個(gè)CG騙局。

（恩，如果有人說(shuō)因?yàn)橛辛薌oogle Glass的前車之鑒，所以大家對(duì)這個(gè)有了騙局的擔(dān)憂，怎么看這個(gè)問(wèn)題？）

技術(shù)的進(jìn)步和迭代就是這樣，我們不可能要求一個(gè)新興領(lǐng)域在早期能夠直接產(chǎn)出完美的產(chǎn)品，比如在膠片照片機(jī)盛行的年代，誰(shuí)也無(wú)法通過(guò)第一代CCD Sensor的規(guī)格想到數(shù)碼相機(jī)會(huì)成為主流。

跟其它產(chǎn)品的區(qū)別

首先，解決HoloLens視野太小的問(wèn)題沒(méi)？

我認(rèn)為現(xiàn)在提及Magic Leap的FOV，以及和Microsoft的Hololens對(duì)比FOV，還為時(shí)尚早；一款原型機(jī)在便攜性上還沒(méi)解決，F(xiàn)OV可能沒(méi)有用武之地，但是根據(jù)Magic Leap的顯示原理，理論上是可以克服這個(gè)問(wèn)題，實(shí)現(xiàn)更大的FOV，甚至光場(chǎng)的顯示，這不是Magic Leap產(chǎn)品化路上的最大障礙，大家如果對(duì)Magic Leap的顯示技術(shù)原理感興趣，可以是參考一下Magic Leap Inc.最近幾年申請(qǐng)的專利_US20140003762 Patent 有興趣的朋友可以看看，上面有細(xì)致的描述，ML在顯示技術(shù)上做了哪些嘗試有哪些突破。

Magic Leap與HoloLens的區(qū)別在哪里？

大家都是AR的設(shè)備，Hololens已經(jīng)放出了開(kāi)發(fā)者套件，接近大規(guī)模量產(chǎn)。而Magic Leap還是處于一個(gè)原型機(jī)都很神秘的階段，從他們背后使用的計(jì)算機(jī)視覺(jué)技術(shù)來(lái)看，是相通的，大家使用了類似的技術(shù)，深度提取，SLAM, 3D重構(gòu)，Object Tracking等等。

不同點(diǎn)在大家的顯示技術(shù)不同， Hololens使用的是類似于Google Glasses的顯示技術(shù)，而ML，前面已經(jīng)提到，使用的是一種全新的顯示技術(shù)。

Hololens著重的是當(dāng)下，ML更像是在為未來(lái)打造一款設(shè)備，當(dāng)時(shí)Hololens里面也是有很多高科技在的，我們知道Hololens的硬件是使用了Intel Atom的CPU，是微軟最熟悉的X86構(gòu)架，和一個(gè)定制 holographic processing unit (HPU)。操作系統(tǒng)的還是使用Windows的Kernel，基于Hololens和Microsoft Research的CV預(yù)研技術(shù)，也有發(fā)布出“黑科技”Demo，Holoportation。

Magic Leap與Meta Glass的區(qū)別在哪里？

Meta Glass這款產(chǎn)品我不是特別了解，只是看了TED上的介紹和Demo演示，它和Hololens是形態(tài)及其相似的設(shè)備，Demo上也體現(xiàn)出了SLAM，tracking等CV技術(shù)，但是并沒(méi)有體現(xiàn)出Meta的方案是否有3D重構(gòu)技術(shù)，這里打一個(gè)問(wèn)號(hào)，我把它理解成一個(gè)功能和配置都縮減了的Hololens。

（好的，分享已完，謝謝各位?。?/p>

Magic Leap整個(gè)AR項(xiàng)目都可能是個(gè)騙局？聽(tīng)大牛怎么說(shuō) | 雷鋒網(wǎng)公開(kāi)課