0
雷峰網(wǎng)(公眾號:雷峰網(wǎng))按:始于2016年的“全球人工智能與機(jī)器人大會”(GAIR),歷經(jīng)五年,見證數(shù)次潮水的轉(zhuǎn)向,成為目前為止粵港澳大灣區(qū)人工智能領(lǐng)域規(guī)模最大、規(guī)格最高的學(xué)術(shù)、工業(yè)和投資領(lǐng)域跨界盛會。
在12月10日舉辦的第六屆GAIR全球人工智能與機(jī)器人大會上,紫為云CEO顧友良分享了《共建AR交互真實世界,共創(chuàng)“和諧元宇宙 ” 新未來》的主題演講。
簡介:顧友良從事智能視頻和人工智能行業(yè)22年,曾任??低晣鴥?nèi)營銷中心副總經(jīng)理、佳都科技董事高級副總裁,提出“立體安防”、“云腦使能”、“數(shù)據(jù)量子態(tài)”、“Zee引擎”等研究觀點,獲評“改革開放40年中國安防卓越人物”。
顧友良指出,元宇宙的核心內(nèi)涵是“互”,即“互、互相、互聯(lián)網(wǎng)、互聯(lián)互通、互交超鏈接、互動虛實融合、互生互補(bǔ)生態(tài)圈、互惠互利市場循環(huán)、互敬互愛人類共同體”。
同時,紫為云有兩個主要的設(shè)計抓手:“數(shù)”與“人”。
“數(shù)”,就是紫為云自研的Zee引擎。顧友良說,在Zee引擎的加持下,紫為云可以在三個方面賦能人在元宇宙中的體驗:一是多模態(tài)算法,對圖象、聲音、文字等各類算法結(jié)構(gòu)化的技術(shù);二是沉浸式計算,保持元宇宙里的低延時,從網(wǎng)絡(luò)、數(shù)據(jù)、通訊各個方面進(jìn)行算力的優(yōu)化;三是AR交互技術(shù),我們現(xiàn)在已經(jīng)做到通過單目的攝像頭實現(xiàn)對人體姿態(tài)、表情的精準(zhǔn)采集。
而在“人”的部分上,紫為云也致力于用產(chǎn)品設(shè)計來優(yōu)化元宇宙交互體驗,為用戶提供AR增強(qiáng)現(xiàn)實產(chǎn)品、交互智能平臺產(chǎn)品、沉浸式場景解決方案和智能硬件等主要產(chǎn)品。
同時,顧友良堅信元宇宙未來的市場空間會存在一個大的增長。紫為云也希望基于Zee引擎技術(shù),全力向最實用、最廣泛、最經(jīng)濟(jì)、最接地氣的市場進(jìn)軍,將Zee引擎應(yīng)用到更廣泛的產(chǎn)業(yè)數(shù)字化場景中。
以下是顧友良現(xiàn)場演講的全部內(nèi)容,雷峰網(wǎng)作了不改變原意的編輯與整理:
顧友良:1991年1月7日,我來到了深圳。圍繞監(jiān)控這個領(lǐng)域我已經(jīng)做了20年,2019年1月7日,我獲評“改革開放40年中國安防卓越人物”。說起來我有個特長,和我打了電話五六次的人,過了一年左右,我接到電話的聲音都能夠判斷出對方是誰。所以圈子里的朋友都說,我做視頻監(jiān)控是基因的選擇。我本人也是中南大學(xué)的“秀才當(dāng)成兵”,特別喜歡寫文章和書法,參加學(xué)生會競選時被選為保衛(wèi)部部長,專門保衛(wèi)學(xué)生安全。所以,人生的經(jīng)歷就是這樣的巧合。
2019年我離開佳都科技,2020年北上北京,清華的咖啡館和周邊的火鍋店被我吃個遍,與清華的人工智能博士聊人生、趨勢、選擇、奮斗、奉獻(xiàn)。于是有近十個清華的奮斗者,也有北大的奮斗者,跟著我一起南下廣州,開始了我們的元宇宙之旅。
元宇宙的核心內(nèi)涵是“互”
我今天講的主題是“共建AR交互真實世界,共創(chuàng)和諧元宇宙新未來”。元宇宙是什么?元宇宙在西方的觀念里面是虛擬空間,我認(rèn)為在中國還是要強(qiáng)調(diào)一點,就是實干興邦。我們要有國家的情懷、社會的責(zé)任和企業(yè)的使命,要真真實實的把科技和產(chǎn)品服務(wù)于人,要共創(chuàng)和諧元宇宙未來。
當(dāng)前元宇宙的“玩家”,突然間撲面而來,排山倒海,我們周邊的同事很多朋友對我講:友良,你是搞監(jiān)控的,是否對元宇宙也比較了解?剛開始,我真不了解,小說《雪崩》我也是剛剛看。我把清華大學(xué)沈陽教授的PPT研究了兩天,不懂的詞就去搜索,一點點進(jìn)入了元宇宙的世界里,去積極的擁抱它,去認(rèn)知它,去思考它。所以我在想,元宇宙只是屬于頭部企業(yè)的嗎?元宇宙只是一些技術(shù)大咖的嗎?我相信不應(yīng)該是這樣的。我的感覺是什么呢?元宇宙屬于每一個人,更屬于一些有思想、有情懷,有自我的平臺、企業(yè)和個人。
元宇宙究竟是什么?其實就一個字——互。也很巧合,這也是我們公司的一個商標(biāo)。從1到9,我把里面的關(guān)鍵字定為:“互、互相、互聯(lián)網(wǎng)、互聯(lián)互通、互交超鏈接、互動虛實融合、互生互補(bǔ)生態(tài)圈、互惠互利市場循環(huán)、互敬互愛人類共同體”,形成一個句型,尤如燕子叫的聲音,叫做“燕嘰體”。這也是我對元宇宙里面最關(guān)鍵的“互”的理解,它是普遍聯(lián)系的,不是虛實對立的,而是虛實融合的。
這是我們紫為云的宇宙觀,也是我經(jīng)過學(xué)習(xí)之后的認(rèn)知結(jié)果。我認(rèn)為在現(xiàn)實的世界里面,我們通過人工智能技術(shù)不斷對現(xiàn)實世界進(jìn)行結(jié)構(gòu)化,進(jìn)行孿生,離不開的是數(shù)據(jù)。類似于陰陽太極,有虛實兩面?,F(xiàn)實里面有個虛的點就是數(shù)據(jù),在虛擬里面最實的是人。我們不能成為虛幻飄渺的,我們時刻不能忘記在虛擬的世界以人為中心,以人為本。坦白講,虛的部分怎么是“火”呢?現(xiàn)在元宇宙在虛的層面上虛火太盛,某些方面是在炒,所以我們更要冷靜地去看這一點。紫為云的宇宙觀是辯證統(tǒng)一的宇宙觀,是和平共處的宇宙觀,是和諧開放的宇宙觀,是和美共享的宇宙觀。
“以人為本”,真實互動
這是我們紫為云宇宙觀“數(shù)”和“人”的體現(xiàn)。先是“數(shù)”,就是紫為云的Zee引擎,它包含幾部分:一是多模態(tài)算法,對圖象、聲音、文字等各類算法結(jié)構(gòu)化的技術(shù);二是沉浸式計算,保持元宇宙里的低延時,從網(wǎng)絡(luò)、數(shù)據(jù)、通訊各個方面進(jìn)行算力的優(yōu)化;三是AR交互技術(shù),我們現(xiàn)在已經(jīng)做到通過單目的攝像頭實現(xiàn)對人體姿態(tài)、表情的精準(zhǔn)采集。大家可能都聽說過微軟的Kinect攝像頭,我們的單目RGB高清攝像機(jī)“AI+AR”技術(shù)處于世界領(lǐng)先地位,實現(xiàn)了真實世界與虛擬視界的無縫鏈接和互動。
下面是我們的技術(shù)示例。例如,我們可以用單目對場景進(jìn)行三維建模,也可以通過單目攝像機(jī)對平面2D人和3D數(shù)字人進(jìn)行驅(qū)動?,F(xiàn)在,很多虛擬主播,是用重算力模型來做支撐的,我們可以用輕算力模型做到。大家想一想,你手機(jī)放在邊上,用支架一架,把優(yōu)美的姿態(tài)、美妙的聲音映射到一個虛擬的沉浸式場景里面去,這是多么沉浸的體驗。我們還可以做投影交互、動態(tài)手勢的識別。
此外,我們還可以用手勢精準(zhǔn)識別;也可以做職業(yè)教育培訓(xùn),將一些傳統(tǒng)的老師傅很精準(zhǔn)的操作手法演繹成數(shù)字模型,通過這個幫助新手對照,當(dāng)新手產(chǎn)生不恰當(dāng)動作的時候會被系統(tǒng)識別,并及時提醒;還可以用到健身場景,現(xiàn)在健身很多是在健身館里面,是私教一對一或者一對少數(shù)人的健身。未來有精準(zhǔn)的姿勢識別,線上可以有十幾個教練對著下面一百個、兩百個健身館的學(xué)員,都是有可能的。
我們紫為云“以人為中心”的產(chǎn)品界面,一個是App端,一個是Web端。這款產(chǎn)品叫做“把視互動”,理念是“把視頻互動起來”。我做視頻監(jiān)控22年,以前做視頻都是通過監(jiān)控采集,把現(xiàn)實的世界復(fù)現(xiàn)并存儲起來。而現(xiàn)在是通過多模態(tài)算法、沉浸式計算、AR交互等技術(shù),實現(xiàn)把識別的內(nèi)容進(jìn)行創(chuàng)新??梢韵胂螅鼞?yīng)用的場景不再只是安防、可視化管理,而是可能應(yīng)用在生活的每一個領(lǐng)域。
從產(chǎn)品演示視頻中可以看到:有的是翻書工具,包括隔空手勢控制翻頁,在里面畫圈、劃重點;有的是幼兒園的產(chǎn)品,可以不斷的蹦跳;還有通過消病毒,消的姿勢如果錄下來也有可能就是一個舞蹈,可能是在練八段錦,也可能是在練太極拳;還可以是健身開合跳或者練習(xí)天鵝頸,讓自己的身體更加婀娜多姿。通過這些簡單的動作融合,我們把它放到手機(jī)里面就能實現(xiàn)以上的功能,我們現(xiàn)在使用的硬件就是市面上最普通的個人手機(jī),能夠?qū)崿F(xiàn)全實時的體感交互。
在AR方面我們還在做什么?基于人的各種行業(yè)應(yīng)用,包括教育、體育、童趣、健身外,還有培訓(xùn)、舞蹈、游戲。更加刺激的是什么呢?還有在廣告場景。我們經(jīng)??措娨暎赐炅藦V告如何去觸發(fā)?我們通過手機(jī)可以用觸摸屏觸發(fā),我們看電腦的時候用無線鼠標(biāo)觸摸。但是在看電視、進(jìn)入游樂場的時候,很多屏的交互因為手不具備即時的接觸式控制器,怎么辦?如果我們用這樣的一個前端的攝像采集,每個人都可以用手勢去觸發(fā)。這里我們Zee引擎剛剛突破了一項核心技術(shù),單目攝像機(jī)里面可以同時容納10-20個人同時觸發(fā)。意味著什么?突然出了10-20個氣球,上來10個人去抓去搶,我們通過姿態(tài)的識別,去抓的時候能夠識別準(zhǔn)。這樣想一想,大場景的娛樂互動是否更加有意思?這都是Zee引擎技術(shù)帶來的元宇宙超現(xiàn)實沉浸式體驗。
在解決方案方面,我們可以將多項產(chǎn)品進(jìn)行整合,在特定場景里應(yīng)用。例如社區(qū)場景,社區(qū)的資訊宣傳欄、廣告處、電梯廣告、文化驛站等等。
云宇宙,是片廣闊市場
講了這么多的技術(shù)和產(chǎn)品解決方案,那么紫為云的市場是什么?當(dāng)下元宇宙火了之后,有多少人真正體驗到元宇宙VR產(chǎn)品?還有多少人去體驗過AR產(chǎn)品呢?很多人體驗過,可能還不知道那個是AR。從當(dāng)前的市場份額上來講,我個人認(rèn)為,在被認(rèn)知的市場里面,元宇宙VR產(chǎn)品的比例可能會高一點,但從體驗人數(shù)來看,更多人是沒有體驗過VR的。
未來會怎么樣?我做了對比。可能VR和AR市場都在快速的發(fā)展,剛才沈陽教授講是40%,學(xué)者往往在市場判斷上比較謹(jǐn)慎,我個人來講,至少是倍數(shù)級的增長。我堅信元宇宙市場將會有一個大的增長,尤其是AR市場,基于增強(qiáng)現(xiàn)實的元宇宙市場。紫為云基于Zee引擎技術(shù),全力向最實用、最廣泛、最經(jīng)濟(jì)、最接地氣的市場進(jìn)軍,我們要在很多場景用上我們的Zee引擎,變成數(shù)字化場景,即產(chǎn)業(yè)數(shù)字化。我們還要把數(shù)字內(nèi)容化,把內(nèi)容到一線去應(yīng)用起來,讓更多企業(yè)或個人能夠做出自己特色的AR元宇宙。
我們希望和合作伙伴一起,更多的企業(yè)和個人建立和諧的宇宙,不是自己獨家做到所有。信息技術(shù)革命時期變化太快,我們在變化的快里面怎么樣才能夠有更緊密的合作伙伴?就在于你是否夠透明、開放、真誠。是否愿意主動擔(dān)當(dāng)那個最后分粥的人,這取決于你能夠做多大、多廣、多深。紫為云通過Zee引擎與生態(tài)合作伙伴聯(lián)合共建和諧的元宇宙,包括軟件開發(fā)、門戶平臺、行業(yè)解決方案等各領(lǐng)域提供商甚至個人。我們也可以幫個人做自己的2D人或者3D數(shù)字人,在個人專業(yè)場景里面打造個人的元宇宙。
我們把紫為云定義為做未來事情的平臺。本人有一個習(xí)慣是做一年看三年,不代表看得對,但是一直努力的在看。本人在十幾年的職場里面注重“十看”,我姓顧,也叫“顧十看”。第一是看到變化,第二是看清趨勢,第三是看準(zhǔn)機(jī)會,第四是看透競爭,第五是看好未來。這是外部的因素。第六是看明自己,包括看自己的團(tuán)隊,第七是看榜樣??辞遄约褐笙蚰膫€榜樣去學(xué)習(xí),去豐富自己,變強(qiáng)自己。第八是看準(zhǔn)執(zhí)行,第九是看重激勵,第十就是看遠(yuǎn)人生。基于以人為本,基于對現(xiàn)實看到的變化,我們要做未來的事情,要有這種心態(tài)。
我經(jīng)常和做戰(zhàn)略、學(xué)術(shù)研究的人交流,特別希望和宏觀規(guī)劃的、能夠接地氣的人合作,要有仙氣,還要能接地氣,這樣才能踏踏實實去享受現(xiàn)實的生活。所以我把紫為云定位為一個“做未來事情”的平臺,核心基于三點:一是AI+AR,二是真交互;三是正能量。人做一件事情,成功都是別人來定義的,不是自己來定義的,失敗是自己定義的。面對未來的不確定性,要堅守當(dāng)下的確定性,只要能夠確定活著就應(yīng)該去為不確定的未來做事,而不是安于現(xiàn)狀。
尤其在我們現(xiàn)在看,社會變化太快,習(xí)總書記講過,百年不遇之大變局。技術(shù)變化、產(chǎn)業(yè)重構(gòu)這么快,我們面對變化的時候關(guān)鍵是心態(tài),給團(tuán)隊定目標(biāo)的時候把態(tài)度放在第一位,什么樣的態(tài)度匹配什么樣的目標(biāo)。紫為云就有這樣的理念,要基于看到變化,總結(jié)、合作、開放,一起做未來的事情。
最后是紫為云對“互”字的理解闡釋。紫為云(zeewain)是源于清華人工智能產(chǎn)業(yè)孵化項目,“zee”諧音“紫”,表示清華紫,以清華大學(xué)校訓(xùn)校風(fēng)為企業(yè)文化內(nèi)核; “wain”諧音“為”,表示企業(yè)奮斗的方向,像北斗七星,引領(lǐng)人工智能技術(shù)發(fā)展,將清華AI技術(shù)應(yīng)用到“田間地頭”,就是恪守“為人民服務(wù)”的宗旨;“3”指三生萬物;“∞”是無窮大。大家看我們的商標(biāo),“互”是兩個“Z”,也是兩個“W”,下面是現(xiàn)實世界,上面是虛擬世界?!癢”變換一下就是“3”,三生萬物,兩個“3”合在一起,就是“∞”,就是Metaverse,即元宇宙的無窮大。
所以,我希望紫為云和我們的合作伙伴一起共建中國特色的元宇宙,堅守一個“互”字,互惠互利,互贏互敬。有這樣的理念,我們更能以開放的胸懷,團(tuán)結(jié)可以團(tuán)結(jié)的力量,整合可以整合的資源,打造一個接地氣的元宇宙,成為中國的“meta”。為國內(nèi)的大循環(huán),新經(jīng)濟(jì)的增量,人工智能和數(shù)字經(jīng)濟(jì)的發(fā)展做出自己應(yīng)有的貢獻(xiàn)。
謝謝!
(雷峰網(wǎng))
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。
本專題其他文章