丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

<label id="qtdnu"></label>

<li id="qtdnu"><legend id="qtdnu"></legend></li>

<span id="qtdnu"></span>

<fieldset id="0qww8"><samp id="0qww8"></samp></fieldset>

<strike id="0qww8"><dd id="0qww8"></dd></strike>

<cite id="0qww8"></cite>

<button id="0qww8"></button>

<fieldset id="0qww8"><dd id="0qww8"></dd></fieldset>

<bdo id="0qww8"><rt id="0qww8"></rt></bdo>

您正在使用IE低版瀏覽器，為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn)，強(qiáng)烈建議使用更快更安全的瀏覽器

此為臨時(shí)鏈接，僅用于文章預(yù)覽，將在時(shí)失效

專欄正文

發(fā)私信給ArkinAi

發(fā)送

2

我為什么選擇開源這款視頻透視MR眼鏡？

本文作者： ArkinAi

2016-08-31 19:55

導(dǎo)語：這款視頻透視的MR眼鏡，我為什么選擇了開源？

雷鋒網(wǎng)按：作者艾韜，易瞳科技CTO，多倫多大學(xué)計(jì)算機(jī)工程專業(yè)畢業(yè)。多年跟隨“世界穿戴電腦之父”Steve Mann教授，專注于智能眼鏡的基礎(chǔ)研究。最近，易瞳的核心產(chǎn)品VMG-PROV宣布對(duì)極客們開源，這款視頻透視的介導(dǎo)現(xiàn)實(shí)眼鏡，為何還沒有正式面世就開源？又為何選擇了視頻透視？作者以他做產(chǎn)品的親身經(jīng)歷來回答這個(gè)問題——“當(dāng)我們把VMG-PROV開源后，我們希望盡快地暴露出現(xiàn)有產(chǎn)品的所有問題?！背齾s談及產(chǎn)品本身的優(yōu)劣，這是一篇認(rèn)真探討的文章。

以下為作者自述，雷鋒網(wǎng)做了不調(diào)整原意的編輯。

我今天寫一篇小文章說明一下VMG-PROV（所謂開源極客版）到底是一個(gè)什么東西，希望看完這篇東西的朋友們對(duì)自己即將要拿在手里的“玩具”有一定認(rèn)識(shí)。當(dāng)然，土豪隨意，我覺得VMG-RPOV擱家里放著也蠻帥的。

| 一身開源的血液

記得我到導(dǎo)師Steve Mann的實(shí)驗(yàn)室時(shí)，看到一個(gè)個(gè)裝束的怪異的工程師們（包括一個(gè)不穿上衣的長(zhǎng)發(fā)男子）被一堆堆“破舊”的電子儀器、顯示器和各種電子元器件團(tuán)團(tuán)包圍住，而此時(shí)的他們正用著界面相當(dāng)另類的程序做著一些不明覺厲的事情。那一剎那感到莫名興奮的同時(shí)，也為自己的無知而感到有些尷尬。

我為什么選擇開源這款視頻透視MR眼鏡？

“Hi Steve, what software are they using?”我懷著好奇不禁問道，感覺這個(gè)問題弱爆了。

“Oh Arkin, I can't answer that if it's not the right question.”教授沒穿鞋，手里拿著個(gè)烙鐵，頭也沒有回地對(duì)我說道。也許他不知道此刻的我早已石化。

“You know, Arkin, we don't use any software in this Lab.”教授放下烙鐵，朝我這邊看過來。

“Software are programs that you need to pay. Paying for software that you can't hack or share is ridiculous.”教授突然嚴(yán)肅了起來。而我也明白了為什么這些程序都長(zhǎng)得這么奇怪。

我點(diǎn)了點(diǎn)頭，若有所思地說：“So everything here is open-source? Like everything?”

教授笑了，也點(diǎn)了點(diǎn)頭說，“Yes，Everything.”

我為什么選擇開源這款視頻透視MR眼鏡？

在實(shí)驗(yàn)室做事的這段時(shí)間，我接觸到了各種各樣的開源工具。教授說的是真的，在實(shí)驗(yàn)室里，我們的操作系統(tǒng)是Ubuntu而不是Windows或MacOS；圖像編輯也不用Photoshop而是用GIMP；就連Word和Excel這樣的程序，我們都用LibreOffice來代替。更夸張的是，作為研究人員，我們連Matlab都不用，而是用一個(gè)叫Octave的東西。

Steve曾經(jīng)做過一件藝術(shù)品，現(xiàn)在收藏在奧斯汀藝術(shù)博物館中。下圖中的Installation叫“License To Sit”，是一個(gè)需要付費(fèi)買License才可以使用的椅子。就像付費(fèi)軟件一樣，這個(gè)椅子會(huì)在快到期時(shí)提醒你付費(fèi)，否則，一旦過期，彈出鋼針，強(qiáng)行終止椅子能提供給你的“坐”的服務(wù)。這個(gè)藝術(shù)品很好玩，可以使我們思考當(dāng)數(shù)字世界里的規(guī)則被運(yùn)用到物理世界時(shí)的一些搞笑的情況。

我為什么選擇開源這款視頻透視MR眼鏡？

看著這把椅子，回憶起第一次遇見教授的那段對(duì)話，我突然意識(shí)到自己一個(gè)考量已久的決定其實(shí)早有淵源，潛移默化中渾身已經(jīng)淌滿了開源的血液。

| 送到極客手中

最近，我們決定把自己還不完善的工程機(jī)VMG-PROV作為一款開源硬件投到市場(chǎng)中來。

這一舉動(dòng)，我認(rèn)為，有奉獻(xiàn)性的因素也有自私的原因。

我們確實(shí)解決了一些智能眼鏡上的問題。開源的目的在于，希望同行和有志向的極客通過對(duì)VMG-PROV的拆解和研究，可以不再重復(fù)地去解決這些問題。輪子就在這里，不需要重新發(fā)明它了。另外，我們做的智能眼鏡不同于VR/AR，稍微超前了一點(diǎn)。為了盡快做出理想的產(chǎn)品，我們這個(gè)二十人的小團(tuán)隊(duì)還需要更多能人的幫助。當(dāng)我們把VMG-PROV開源后，我們希望盡快地暴露出現(xiàn)有產(chǎn)品的所有問題。同時(shí)讓有共同指向的極客們可以一起和我們站在同一起跑線完善這個(gè)產(chǎn)品。開源一定是未來科技的發(fā)展方向，一個(gè)小有成就的極客不應(yīng)該總想著如何用那不完善的“小秘密”去賺錢，而應(yīng)該思考怎樣讓大家參與進(jìn)來盡快把東西做好。

我為什么選擇開源這款視頻透視MR眼鏡？

我們希望把VMG-PROV交付到正確的極客手中，這意味著這代產(chǎn)品不是消費(fèi)者級(jí)的，甚至不是開發(fā)者級(jí)的，我們把它稱之為“極客版”。我們希望把他賣給有開源血液，想探索數(shù)字視覺，并且具備相應(yīng)能力的極客?？吹竭@里，我想各位讀者對(duì)于該不該買VMG-PROV已經(jīng)有了一些小小的判斷了。

| 為什么選擇視頻透視？

VMG（包括預(yù)售中的PROV和研發(fā)中的MARK兩個(gè)版本）是一款開源的頭顯，是一個(gè)探索介導(dǎo)現(xiàn)實(shí)（和數(shù)字視覺）的工具。我們認(rèn)為虛擬現(xiàn)實(shí)（VR）和增強(qiáng)現(xiàn)實(shí)（AR）都是數(shù)字視覺的一種體現(xiàn)。因此，VMG首先要能將VR/AR通過視頻透視技術(shù)同時(shí)兼容在一個(gè)頭顯上。之前寫了一篇關(guān)于智能眼鏡的小文章里面也提到，從AR往后發(fā)展，到混合現(xiàn)實(shí)（Mixed Reality）或是介導(dǎo)現(xiàn)實(shí)（Mediated Reality），視頻透視是必須跨過的一個(gè)坎。

常常有人問我，市面上光學(xué)透視方案這么多，而且大家都在做光學(xué)透視，為什么你們要選擇視頻透視？我說，不是我選擇了視頻透視，是視頻透視選擇了我。

在進(jìn)實(shí)驗(yàn)室之前我是學(xué)FPGA的，因?yàn)檫@個(gè)，Steve讓我用FPGA去攻克智能眼鏡上一些GPU跑不動(dòng)的算法，出成果后，我和一個(gè)學(xué)長(zhǎng)去SIGGRAPH展會(huì)上展示我們的研究成果。在這個(gè)讓人腦洞爆炸的展會(huì)上，我和學(xué)長(zhǎng)在聊天中各自認(rèn)定了今后的研究方向?；氐綄?shí)驗(yàn)室后，我主要搞視頻透視和相關(guān)的軟件，而他就開始研究光學(xué)透視的東西了。視頻透視（Video See-Through，或VST）和像HoloLens這樣的光學(xué)透視（Optical See-Through，或OST）各有優(yōu)缺點(diǎn)。下面，我以AR應(yīng)用為例，大概歸納一下兩者主要問題的比較。（學(xué)術(shù)界里關(guān)于兩者的比較很透徹，大家有興趣可以去查閱相關(guān)論文。）

我為什么選擇開源這款視頻透視MR眼鏡？

視頻透視（Video See-Through，或VST）和像HoloLens這樣的光學(xué)透視（Optical See-Through，或OST）的比較——

1、關(guān)于疊加效果和顯示視角（VST完勝）

光學(xué)透視通過特殊的設(shè)計(jì)將數(shù)字畫面投射到半透明的顯示裝置上，因此呈現(xiàn)出來的遮擋效果（Occlusion）不夠完美。看過Magic Leap年初發(fā)出的眼鏡大專利的各位知道，他們花了至少7大頁的內(nèi)容來描述他們復(fù)雜的光路設(shè)計(jì)來減緩這個(gè)遮擋問題。光學(xué)透視的光路設(shè)計(jì)很復(fù)雜，想做出小型的大視角效果基本沒戲。試過HoloLens的人（約40度）就能感受到我說的視角小是一種什么感覺。

同時(shí)，由于設(shè)計(jì)復(fù)雜加工困難，OST的成本會(huì)很高。然而，半透明就是半透明，任你減緩，也不可能解決。在這一點(diǎn)上，VST完勝OST。由于現(xiàn)實(shí)畫面是通過攝像頭采集的，在顯示到屏幕之前已被數(shù)字化，遮擋的效果可以輕輕松松以低成本做到完美。在這方面，VST可以通過算法做到實(shí)時(shí)P圖，讓現(xiàn)實(shí)變成你的畫板。

2、關(guān)于現(xiàn)實(shí)畫面延時(shí)和畸變（OST完勝）

由于使用到了攝像頭，加上電腦需要同時(shí)處理顯示畫面和數(shù)字內(nèi)容，VST的延時(shí)比OST要大很多。

VST頭顯硬件上更像VR，攝像頭和顯示器的刷新延時(shí)是先天性的。在OST頭顯上，現(xiàn)實(shí)畫面是外部世界的光是通過光學(xué)設(shè)備穿透進(jìn)來的，先天零延時(shí)零畸變。而視頻透視除了刷新延時(shí)，還需要矯正因?yàn)閿z像頭的位置和光學(xué)與人眼不一樣而產(chǎn)生的畫面差距，先天會(huì)有延時(shí)。我們花很多時(shí)間，通過硬件和軟件的優(yōu)化去降低延時(shí)。但這個(gè)延時(shí)不可能為零，在這一點(diǎn)上，OST完爆VST。

3、關(guān)于VAC問題（平手）

不管是OST和VST，都存在VAC問題。這是我們?cè)谑褂妙^顯時(shí)，深度感知機(jī)制在雙眼（Vergence）和單眼（Accommodation）上有沖突時(shí)造成暈眩的問題。

有興趣的讀者可以自行查閱Vergence Accommodation Conflict或“輻輳沖突”。

（雷鋒網(wǎng)注：關(guān)于VAC現(xiàn)象，可查看這篇解析文《一直困擾虛擬現(xiàn)實(shí)的VAC現(xiàn)象，真的無解么？》）

Magic Leap的大專利里，也有大量描述過通過光場(chǎng)減緩這個(gè)問題的技術(shù)。在他們出貨前，在這個(gè)問題上，目前OST和VST，打成平手。

| 極客們請(qǐng)繼續(xù)閱讀

VMG-PROV作為一款視頻透視的探索工具，性能有限。我希望通過接下來的描述讓各位極客認(rèn)識(shí)到購(gòu)買PROV的風(fēng)險(xiǎn)。

延時(shí)問題在VMG-MARK的架構(gòu)上有大幅度提升，文末我會(huì)把細(xì)節(jié)告訴大家。下圖是從我們將要開源放出的Demo工程截圖的，可以將一個(gè)數(shù)字模型疊加到?jīng)]有預(yù)設(shè)Marker的桌面上。

我為什么選擇開源這款視頻透視MR眼鏡？

在這個(gè)開源的Demo中，VMG-PROV通過雙目攝像頭將現(xiàn)實(shí)畫面捕獲進(jìn)來，經(jīng)過頭顯上FPGA的處理后，通過USB3. 0接口傳輸?shù)剿B接的PC上?，F(xiàn)實(shí)畫面通過軟件校準(zhǔn)后，Visual SLAM算法開始運(yùn)算，將預(yù)設(shè)的數(shù)字模型疊加到正確的位置。之后，再通過HDMI將畫面?zhèn)鬏數(shù)筋^顯上的屏幕中。這個(gè)開源的工程中包含：

1.VMG-PROV的硬件細(xì)節(jié)和原理圖

如下圖所示，VMG-PROV的硬件參數(shù)已標(biāo)注并在下表列出。攝像頭采集到的視頻畫面經(jīng)過FPGA的處理再傳入所連接的PC中，最后通過SLAM把疊加了數(shù)字模型的畫面在傳回人眼。所以在用于AR上，VMG-PROV需要PC完成較大的視頻吞吐，因此建議使用高配臺(tái)式機(jī)。

我為什么選擇開源這款視頻透視MR眼鏡？

作為一個(gè)MR頭顯，VMG-PROV的參數(shù)只能達(dá)到VR的入門水平。我覺得要在MR上做出驚艷的應(yīng)用，這一代是遠(yuǎn)遠(yuǎn)不夠的。這也是為什么我希望大家把這個(gè)產(chǎn)品作為一個(gè)學(xué)習(xí)與探索的工具，同時(shí)也通過大家給我們反饋更多的改進(jìn)意見。為了讓這一切成為可能，我們會(huì)提供VMG-PROV的硬件原理圖。

2. FPGA上處理圖像的硬件描述語言

VST優(yōu)于OST的關(guān)鍵一點(diǎn)是對(duì)現(xiàn)實(shí)畫面的修改，簡(jiǎn)單來說，就是通過算法實(shí)時(shí)P圖。

在軟件上測(cè)試出來的算法如果能通過FPGA實(shí)現(xiàn)或加速，對(duì)于延時(shí)的減少是有很大幫助的。在我們開源的工程中，包含了一個(gè)MR的Demo，即實(shí)時(shí)高動(dòng)態(tài)范圍圖像合成和映射（Real-Time HDR Composition & Tonal Mapping），完全通過邏輯寫進(jìn)FPGA里面了。

如下圖，F(xiàn)PGA控制Sensor高速變換曝光，然后通過合成電路選擇出由暗到亮每張圖中最好的部分。

我為什么選擇開源這款視頻透視MR眼鏡？

FPGA是一種很神奇的芯片，是芯片中的變形金剛。做過FPGA的工程師都知道，F(xiàn)PGA不是普通人搞得定的。

下圖給出了我們將要開源的工程中FPGA內(nèi)硬件描述語言的部分。從Sensor進(jìn)來的原始數(shù)據(jù)將完全在FPGA上進(jìn)行ISP處理，之后合成的HDR將通過USB3.0傳到PC中。我相信把上述工程的Verilog HDL開源，可以吸引到各位有勇氣的高手加入到芯片級(jí)的MR探索中來。通過FPGA配合PC端的需求，進(jìn)一步減少VST的延時(shí)問題。

我為什么選擇開源這款視頻透視MR眼鏡？

3. 基于PTAM的雙目SLAM源代碼

VMG-PROV所用的SLAM是基于雙目RGB攝像頭的，是由大名鼎鼎的PTAM改成的。這個(gè)工程就將上文視頻中的Miku疊加到了我們的眼鏡畫面中。PTAM之后，我們還將把傳感器數(shù)據(jù)融合進(jìn)來，并使用不同的方法（像ORB-SLAM，或LSD-SLAM）實(shí)現(xiàn)更穩(wěn)定的疊加。SLAM這一塊我就不畫圖了，大致的開源內(nèi)容包括，雙目相機(jī)的標(biāo)定矯正，F(xiàn)AST特征點(diǎn)提取，RANSAC & Bundle Adjustment，和Miku的模型。需要用到Unity3D的各位朋友，工程中也有將這套SLAM導(dǎo)入的方法。同時(shí)，大家去看源代碼的時(shí)候可以參照PTAM的相關(guān)資料對(duì)其進(jìn)行修改。

我為什么選擇開源這款視頻透視MR眼鏡？

| 普通開發(fā)者請(qǐng)?jiān)俚鹊?/span>

講到這里，我覺得大家對(duì)需不需要購(gòu)買這個(gè)“極客版”有了一定的判斷。由于VMG-PROV還沒有達(dá)到應(yīng)用級(jí)別，想在VMG做應(yīng)用的各位需要等待一下VMG-MARK（開發(fā)者版本）。按照目前的進(jìn)度來說，我們的研發(fā)團(tuán)隊(duì)已經(jīng)解決了VMG-MARK的大部分技術(shù)問題。我們把VMG-MARK的軟硬件架構(gòu)稱為VLLV（Very Low Latency Video See-Through），它將把視頻透視的延時(shí)難題大幅度的減緩（是減緩不是解決，解決就是Zero Latency了）。所以，希望有落地應(yīng)用的開發(fā)者們最好使用MARK這一款產(chǎn)品，而不是VMG-PROV極客版。

下圖是VMG-MARK的架構(gòu)，起初的設(shè)計(jì)是為了減少視頻吞吐對(duì)PC的計(jì)算量需求，將高清高幀的現(xiàn)實(shí)畫面視頻流直接從Sensor傳入屏幕中，不經(jīng)過電腦。之后，慢慢演化成了四個(gè)模式。

我為什么選擇開源這款視頻透視MR眼鏡？

我們把這個(gè)架構(gòu)叫做VT Architecture，它的四個(gè)運(yùn)行模式分別是：

1.Hard模式

現(xiàn)實(shí)畫面的視頻信號(hào)只通過FPGA和ASIC進(jìn)行處理，然后馬上打到屏幕中。這條路徑延時(shí)最低，但開發(fā)難度最大。寫FPGA不難，要的是勇氣。

2.Hybrid模式

這條路徑最適合用于AR應(yīng)用的開發(fā)。

如圖所示，頭顯上的FPGA將根據(jù)需求把視頻分流到連接的PC上，然后，再通過FPGA把有姿態(tài)信息的數(shù)字模型融合到原始高清畫面中。這樣，我們能大幅度減少現(xiàn)實(shí)畫面的延時(shí)，同時(shí)也可以把原本需要的大部分運(yùn)算資源節(jié)省下來，從而減小電腦的配置需求。

3.Soft模式

有心的讀者已經(jīng)發(fā)現(xiàn)，這條路徑就是VMG-PROV的路徑。這條路徑功能最強(qiáng)大，但延時(shí)最高。視頻流經(jīng)過FPGA/ASIC然后傳入電腦，最后經(jīng)過屏幕顯示出來。Soft模式適用于早期驗(yàn)證和實(shí)驗(yàn)，通過Soft寫出來的工程要按照應(yīng)用需求進(jìn)行優(yōu)化，并在其他模式上來實(shí)現(xiàn)。

4.Light模式

Light模式很好理解，就是帶Visual SLAM的VR頭顯。前端的相機(jī)雖然不成像，但是在無時(shí)無刻地檢測(cè)頭顯的平移運(yùn)動(dòng)，這和Lighthouse由外至內(nèi)的檢測(cè)方法不一樣。我們后續(xù)開發(fā)出更好的SLAM，也會(huì)開源，希望大家再等待一下。

寫到這，也差不多了。作為一個(gè)小團(tuán)隊(duì)，我們希望成為自己理想中的極客。我相信我們的身邊有很多有分享精神，探索精神，有心靈，有能力，并且會(huì)支持我們的人。我們希望把自己的成果分享給這樣的人，這也是我們打算開源的最重要的原因。

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

3人收藏

分享：

相關(guān)文章

ArkinAi

專欄特約作者

易瞳科技CTO，多倫多大學(xué)計(jì)算機(jī)工程專業(yè)畢業(yè)。多年跟隨“世界穿戴電腦之父”Steve Mann教授，專注于智能眼鏡的基礎(chǔ)研究。

發(fā)私信

當(dāng)月熱門文章

最新文章

熱門搜索

亞馬遜智能手環(huán) 賈躍亭 saas 黃仁勛微信支付半導(dǎo)體邊緣計(jì)算 HUD 供應(yīng)鏈 api

為了您的賬戶安全，請(qǐng)驗(yàn)證郵箱

您的郵箱還未驗(yàn)證,完成可獲20積分喲！

重發(fā)郵箱修改郵箱

請(qǐng)驗(yàn)證您的郵箱

立即驗(yàn)證

完善賬號(hào)信息

您的賬號(hào)已經(jīng)綁定，現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄

立即設(shè)置 以后再說

<strike id="c2oim"></strike>

<strike id="c2oim"><kbd id="c2oim"></kbd></strike>