0
雷峰網(wǎng)按:始于2016年的“全球人工智能與機(jī)器人大會(huì)”(GAIR),歷經(jīng)五年,見證數(shù)次潮水的轉(zhuǎn)向,成為目前為止粵港澳大灣區(qū)人工智能領(lǐng)域規(guī)模最大、規(guī)格最高的學(xué)術(shù)、工業(yè)和投資領(lǐng)域跨界盛會(huì)。
在12月10日舉辦的第六屆GAIR全球人工智能與機(jī)器人大會(huì)上,紫為云CEO顧友良分享了《共建AR交互真實(shí)世界,共創(chuàng)“和諧元宇宙 ” 新未來》的主題演講。
簡(jiǎn)介:顧友良從事智能視頻和人工智能行業(yè)22年,曾任海康威視國(guó)內(nèi)營(yíng)銷中心副總經(jīng)理、佳都科技董事高級(jí)副總裁,提出“立體安防”、“云腦使能”、“數(shù)據(jù)量子態(tài)”、“Zee引擎”等研究觀點(diǎn),獲評(píng)“改革開放40年中國(guó)安防卓越人物”。
顧友良指出,元宇宙的核心內(nèi)涵是“互”,即“互、互相、互聯(lián)網(wǎng)、互聯(lián)互通、互交超鏈接、互動(dòng)虛實(shí)融合、互生互補(bǔ)生態(tài)圈、互惠互利市場(chǎng)循環(huán)、互敬互愛人類共同體”。
同時(shí),紫為云有兩個(gè)主要的設(shè)計(jì)抓手:“數(shù)”與“人”。
“數(shù)”,就是紫為云自研的Zee引擎。顧友良說,在Zee引擎的加持下,紫為云可以在三個(gè)方面賦能人在元宇宙中的體驗(yàn):一是多模態(tài)算法,對(duì)圖象、聲音、文字等各類算法結(jié)構(gòu)化的技術(shù);二是沉浸式計(jì)算,保持元宇宙里的低延時(shí),從網(wǎng)絡(luò)、數(shù)據(jù)、通訊各個(gè)方面進(jìn)行算力的優(yōu)化;三是AR交互技術(shù),我們現(xiàn)在已經(jīng)做到通過單目的攝像頭實(shí)現(xiàn)對(duì)人體姿態(tài)、表情的精準(zhǔn)采集。
而在“人”的部分上,紫為云也致力于用產(chǎn)品設(shè)計(jì)來優(yōu)化元宇宙交互體驗(yàn),為用戶提供AR增強(qiáng)現(xiàn)實(shí)產(chǎn)品、交互智能平臺(tái)產(chǎn)品、沉浸式場(chǎng)景解決方案和智能硬件等主要產(chǎn)品。
同時(shí),顧友良堅(jiān)信元宇宙未來的市場(chǎng)空間會(huì)存在一個(gè)大的增長(zhǎng)。紫為云也希望基于Zee引擎技術(shù),全力向最實(shí)用、最廣泛、最經(jīng)濟(jì)、最接地氣的市場(chǎng)進(jìn)軍,將Zee引擎應(yīng)用到更廣泛的產(chǎn)業(yè)數(shù)字化場(chǎng)景中。
以下是顧友良現(xiàn)場(chǎng)演講的全部?jī)?nèi)容,雷峰網(wǎng)作了不改變?cè)獾木庉嬇c整理:
顧友良:1991年1月7日,我來到了深圳。圍繞監(jiān)控這個(gè)領(lǐng)域我已經(jīng)做了20年,2019年1月7日,我獲評(píng)“改革開放40年中國(guó)安防卓越人物”。說起來我有個(gè)特長(zhǎng),和我打了電話五六次的人,過了一年左右,我接到電話的聲音都能夠判斷出對(duì)方是誰。所以圈子里的朋友都說,我做視頻監(jiān)控是基因的選擇。我本人也是中南大學(xué)的“秀才當(dāng)成兵”,特別喜歡寫文章和書法,參加學(xué)生會(huì)競(jìng)選時(shí)被選為保衛(wèi)部部長(zhǎng),專門保衛(wèi)學(xué)生安全。所以,人生的經(jīng)歷就是這樣的巧合。
2019年我離開佳都科技,2020年北上北京,清華的咖啡館和周邊的火鍋店被我吃個(gè)遍,與清華的人工智能博士聊人生、趨勢(shì)、選擇、奮斗、奉獻(xiàn)。于是有近十個(gè)清華的奮斗者,也有北大的奮斗者,跟著我一起南下廣州,開始了我們的元宇宙之旅。
元宇宙的核心內(nèi)涵是“互”
我今天講的主題是“共建AR交互真實(shí)世界,共創(chuàng)和諧元宇宙新未來”。元宇宙是什么?元宇宙在西方的觀念里面是虛擬空間,我認(rèn)為在中國(guó)還是要強(qiáng)調(diào)一點(diǎn),就是實(shí)干興邦。我們要有國(guó)家的情懷、社會(huì)的責(zé)任和企業(yè)的使命,要真真實(shí)實(shí)的把科技和產(chǎn)品服務(wù)于人,要共創(chuàng)和諧元宇宙未來。
當(dāng)前元宇宙的“玩家”,突然間撲面而來,排山倒海,我們周邊的同事很多朋友對(duì)我講:友良,你是搞監(jiān)控的,是否對(duì)元宇宙也比較了解?剛開始,我真不了解,小說《雪崩》我也是剛剛看。我把清華大學(xué)沈陽教授的PPT研究了兩天,不懂的詞就去搜索,一點(diǎn)點(diǎn)進(jìn)入了元宇宙的世界里,去積極的擁抱它,去認(rèn)知它,去思考它。所以我在想,元宇宙只是屬于頭部企業(yè)的嗎?元宇宙只是一些技術(shù)大咖的嗎?我相信不應(yīng)該是這樣的。我的感覺是什么呢?元宇宙屬于每一個(gè)人,更屬于一些有思想、有情懷,有自我的平臺(tái)、企業(yè)和個(gè)人。
元宇宙究竟是什么?其實(shí)就一個(gè)字——互。也很巧合,這也是我們公司的一個(gè)商標(biāo)。從1到9,我把里面的關(guān)鍵字定為:“互、互相、互聯(lián)網(wǎng)、互聯(lián)互通、互交超鏈接、互動(dòng)虛實(shí)融合、互生互補(bǔ)生態(tài)圈、互惠互利市場(chǎng)循環(huán)、互敬互愛人類共同體”,形成一個(gè)句型,尤如燕子叫的聲音,叫做“燕嘰體”。這也是我對(duì)元宇宙里面最關(guān)鍵的“互”的理解,它是普遍聯(lián)系的,不是虛實(shí)對(duì)立的,而是虛實(shí)融合的。
這是我們紫為云的宇宙觀,也是我經(jīng)過學(xué)習(xí)之后的認(rèn)知結(jié)果。我認(rèn)為在現(xiàn)實(shí)的世界里面,我們通過人工智能技術(shù)不斷對(duì)現(xiàn)實(shí)世界進(jìn)行結(jié)構(gòu)化,進(jìn)行孿生,離不開的是數(shù)據(jù)。類似于陰陽太極,有虛實(shí)兩面?,F(xiàn)實(shí)里面有個(gè)虛的點(diǎn)就是數(shù)據(jù),在虛擬里面最實(shí)的是人。我們不能成為虛幻飄渺的,我們時(shí)刻不能忘記在虛擬的世界以人為中心,以人為本。坦白講,虛的部分怎么是“火”呢?現(xiàn)在元宇宙在虛的層面上虛火太盛,某些方面是在炒,所以我們更要冷靜地去看這一點(diǎn)。紫為云的宇宙觀是辯證統(tǒng)一的宇宙觀,是和平共處的宇宙觀,是和諧開放的宇宙觀,是和美共享的宇宙觀。
“以人為本”,真實(shí)互動(dòng)
這是我們紫為云宇宙觀“數(shù)”和“人”的體現(xiàn)。先是“數(shù)”,就是紫為云的Zee引擎,它包含幾部分:一是多模態(tài)算法,對(duì)圖象、聲音、文字等各類算法結(jié)構(gòu)化的技術(shù);二是沉浸式計(jì)算,保持元宇宙里的低延時(shí),從網(wǎng)絡(luò)、數(shù)據(jù)、通訊各個(gè)方面進(jìn)行算力的優(yōu)化;三是AR交互技術(shù),我們現(xiàn)在已經(jīng)做到通過單目的攝像頭實(shí)現(xiàn)對(duì)人體姿態(tài)、表情的精準(zhǔn)采集。大家可能都聽說過微軟的Kinect攝像頭,我們的單目RGB高清攝像機(jī)“AI+AR”技術(shù)處于世界領(lǐng)先地位,實(shí)現(xiàn)了真實(shí)世界與虛擬視界的無縫鏈接和互動(dòng)。
下面是我們的技術(shù)示例。例如,我們可以用單目對(duì)場(chǎng)景進(jìn)行三維建模,也可以通過單目攝像機(jī)對(duì)平面2D人和3D數(shù)字人進(jìn)行驅(qū)動(dòng)。現(xiàn)在,很多虛擬主播,是用重算力模型來做支撐的,我們可以用輕算力模型做到。大家想一想,你手機(jī)放在邊上,用支架一架,把優(yōu)美的姿態(tài)、美妙的聲音映射到一個(gè)虛擬的沉浸式場(chǎng)景里面去,這是多么沉浸的體驗(yàn)。我們還可以做投影交互、動(dòng)態(tài)手勢(shì)的識(shí)別。
此外,我們還可以用手勢(shì)精準(zhǔn)識(shí)別;也可以做職業(yè)教育培訓(xùn),將一些傳統(tǒng)的老師傅很精準(zhǔn)的操作手法演繹成數(shù)字模型,通過這個(gè)幫助新手對(duì)照,當(dāng)新手產(chǎn)生不恰當(dāng)動(dòng)作的時(shí)候會(huì)被系統(tǒng)識(shí)別,并及時(shí)提醒;還可以用到健身場(chǎng)景,現(xiàn)在健身很多是在健身館里面,是私教一對(duì)一或者一對(duì)少數(shù)人的健身。未來有精準(zhǔn)的姿勢(shì)識(shí)別,線上可以有十幾個(gè)教練對(duì)著下面一百個(gè)、兩百個(gè)健身館的學(xué)員,都是有可能的。
我們紫為云“以人為中心”的產(chǎn)品界面,一個(gè)是App端,一個(gè)是Web端。這款產(chǎn)品叫做“把視互動(dòng)”,理念是“把視頻互動(dòng)起來”。我做視頻監(jiān)控22年,以前做視頻都是通過監(jiān)控采集,把現(xiàn)實(shí)的世界復(fù)現(xiàn)并存儲(chǔ)起來。而現(xiàn)在是通過多模態(tài)算法、沉浸式計(jì)算、AR交互等技術(shù),實(shí)現(xiàn)把識(shí)別的內(nèi)容進(jìn)行創(chuàng)新??梢韵胂?,它應(yīng)用的場(chǎng)景不再只是安防、可視化管理,而是可能應(yīng)用在生活的每一個(gè)領(lǐng)域。
從產(chǎn)品演示視頻中可以看到:有的是翻書工具,包括隔空手勢(shì)控制翻頁(yè),在里面畫圈、劃重點(diǎn);有的是幼兒園的產(chǎn)品,可以不斷的蹦跳;還有通過消病毒,消的姿勢(shì)如果錄下來也有可能就是一個(gè)舞蹈,可能是在練八段錦,也可能是在練太極拳;還可以是健身開合跳或者練習(xí)天鵝頸,讓自己的身體更加婀娜多姿。通過這些簡(jiǎn)單的動(dòng)作融合,我們把它放到手機(jī)里面就能實(shí)現(xiàn)以上的功能,我們現(xiàn)在使用的硬件就是市面上最普通的個(gè)人手機(jī),能夠?qū)崿F(xiàn)全實(shí)時(shí)的體感交互。
在AR方面我們還在做什么?基于人的各種行業(yè)應(yīng)用,包括教育、體育、童趣、健身外,還有培訓(xùn)、舞蹈、游戲。更加刺激的是什么呢?還有在廣告場(chǎng)景。我們經(jīng)常看電視,看完了廣告如何去觸發(fā)?我們通過手機(jī)可以用觸摸屏觸發(fā),我們看電腦的時(shí)候用無線鼠標(biāo)觸摸。但是在看電視、進(jìn)入游樂場(chǎng)的時(shí)候,很多屏的交互因?yàn)槭植痪邆浼磿r(shí)的接觸式控制器,怎么辦?如果我們用這樣的一個(gè)前端的攝像采集,每個(gè)人都可以用手勢(shì)去觸發(fā)。這里我們Zee引擎剛剛突破了一項(xiàng)核心技術(shù),單目攝像機(jī)里面可以同時(shí)容納10-20個(gè)人同時(shí)觸發(fā)。意味著什么?突然出了10-20個(gè)氣球,上來10個(gè)人去抓去搶,我們通過姿態(tài)的識(shí)別,去抓的時(shí)候能夠識(shí)別準(zhǔn)。這樣想一想,大場(chǎng)景的娛樂互動(dòng)是否更加有意思?這都是Zee引擎技術(shù)帶來的元宇宙超現(xiàn)實(shí)沉浸式體驗(yàn)。
在解決方案方面,我們可以將多項(xiàng)產(chǎn)品進(jìn)行整合,在特定場(chǎng)景里應(yīng)用。例如社區(qū)場(chǎng)景,社區(qū)的資訊宣傳欄、廣告處、電梯廣告、文化驛站等等。
云宇宙,是片廣闊市場(chǎng)
講了這么多的技術(shù)和產(chǎn)品解決方案,那么紫為云的市場(chǎng)是什么?當(dāng)下元宇宙火了之后,有多少人真正體驗(yàn)到元宇宙VR產(chǎn)品?還有多少人去體驗(yàn)過AR產(chǎn)品呢?很多人體驗(yàn)過,可能還不知道那個(gè)是AR。從當(dāng)前的市場(chǎng)份額上來講,我個(gè)人認(rèn)為,在被認(rèn)知的市場(chǎng)里面,元宇宙VR產(chǎn)品的比例可能會(huì)高一點(diǎn),但從體驗(yàn)人數(shù)來看,更多人是沒有體驗(yàn)過VR的。
未來會(huì)怎么樣?我做了對(duì)比??赡躒R和AR市場(chǎng)都在快速的發(fā)展,剛才沈陽教授講是40%,學(xué)者往往在市場(chǎng)判斷上比較謹(jǐn)慎,我個(gè)人來講,至少是倍數(shù)級(jí)的增長(zhǎng)。我堅(jiān)信元宇宙市場(chǎng)將會(huì)有一個(gè)大的增長(zhǎng),尤其是AR市場(chǎng),基于增強(qiáng)現(xiàn)實(shí)的元宇宙市場(chǎng)。紫為云基于Zee引擎技術(shù),全力向最實(shí)用、最廣泛、最經(jīng)濟(jì)、最接地氣的市場(chǎng)進(jìn)軍,我們要在很多場(chǎng)景用上我們的Zee引擎,變成數(shù)字化場(chǎng)景,即產(chǎn)業(yè)數(shù)字化。我們還要把數(shù)字內(nèi)容化,把內(nèi)容到一線去應(yīng)用起來,讓更多企業(yè)或個(gè)人能夠做出自己特色的AR元宇宙。
我們希望和合作伙伴一起,更多的企業(yè)和個(gè)人建立和諧的宇宙,不是自己獨(dú)家做到所有。信息技術(shù)革命時(shí)期變化太快,我們?cè)谧兓目炖锩嬖趺礃硬拍軌蛴懈o密的合作伙伴?就在于你是否夠透明、開放、真誠(chéng)。是否愿意主動(dòng)擔(dān)當(dāng)那個(gè)最后分粥的人,這取決于你能夠做多大、多廣、多深。紫為云通過Zee引擎與生態(tài)合作伙伴聯(lián)合共建和諧的元宇宙,包括軟件開發(fā)、門戶平臺(tái)、行業(yè)解決方案等各領(lǐng)域提供商甚至個(gè)人。我們也可以幫個(gè)人做自己的2D人或者3D數(shù)字人,在個(gè)人專業(yè)場(chǎng)景里面打造個(gè)人的元宇宙。
我們把紫為云定義為做未來事情的平臺(tái)。本人有一個(gè)習(xí)慣是做一年看三年,不代表看得對(duì),但是一直努力的在看。本人在十幾年的職場(chǎng)里面注重“十看”,我姓顧,也叫“顧十看”。第一是看到變化,第二是看清趨勢(shì),第三是看準(zhǔn)機(jī)會(huì),第四是看透競(jìng)爭(zhēng),第五是看好未來。這是外部的因素。第六是看明自己,包括看自己的團(tuán)隊(duì),第七是看榜樣??辞遄约褐笙蚰膫€(gè)榜樣去學(xué)習(xí),去豐富自己,變強(qiáng)自己。第八是看準(zhǔn)執(zhí)行,第九是看重激勵(lì),第十就是看遠(yuǎn)人生。基于以人為本,基于對(duì)現(xiàn)實(shí)看到的變化,我們要做未來的事情,要有這種心態(tài)。
我經(jīng)常和做戰(zhàn)略、學(xué)術(shù)研究的人交流,特別希望和宏觀規(guī)劃的、能夠接地氣的人合作,要有仙氣,還要能接地氣,這樣才能踏踏實(shí)實(shí)去享受現(xiàn)實(shí)的生活。所以我把紫為云定位為一個(gè)“做未來事情”的平臺(tái),核心基于三點(diǎn):一是AI+AR,二是真交互;三是正能量。人做一件事情,成功都是別人來定義的,不是自己來定義的,失敗是自己定義的。面對(duì)未來的不確定性,要堅(jiān)守當(dāng)下的確定性,只要能夠確定活著就應(yīng)該去為不確定的未來做事,而不是安于現(xiàn)狀。
尤其在我們現(xiàn)在看,社會(huì)變化太快,習(xí)總書記講過,百年不遇之大變局。技術(shù)變化、產(chǎn)業(yè)重構(gòu)這么快,我們面對(duì)變化的時(shí)候關(guān)鍵是心態(tài),給團(tuán)隊(duì)定目標(biāo)的時(shí)候把態(tài)度放在第一位,什么樣的態(tài)度匹配什么樣的目標(biāo)。紫為云就有這樣的理念,要基于看到變化,總結(jié)、合作、開放,一起做未來的事情。
最后是紫為云對(duì)“互”字的理解闡釋。紫為云(zeewain)是源于清華人工智能產(chǎn)業(yè)孵化項(xiàng)目,“zee”諧音“紫”,表示清華紫,以清華大學(xué)校訓(xùn)校風(fēng)為企業(yè)文化內(nèi)核; “wain”諧音“為”,表示企業(yè)奮斗的方向,像北斗七星,引領(lǐng)人工智能技術(shù)發(fā)展,將清華AI技術(shù)應(yīng)用到“田間地頭”,就是恪守“為人民服務(wù)”的宗旨;“3”指三生萬物;“∞”是無窮大。大家看我們的商標(biāo),“互”是兩個(gè)“Z”,也是兩個(gè)“W”,下面是現(xiàn)實(shí)世界,上面是虛擬世界。“W”變換一下就是“3”,三生萬物,兩個(gè)“3”合在一起,就是“∞”,就是Metaverse,即元宇宙的無窮大。
所以,我希望紫為云和我們的合作伙伴一起共建中國(guó)特色的元宇宙,堅(jiān)守一個(gè)“互”字,互惠互利,互贏互敬。有這樣的理念,我們更能以開放的胸懷,團(tuán)結(jié)可以團(tuán)結(jié)的力量,整合可以整合的資源,打造一個(gè)接地氣的元宇宙,成為中國(guó)的“meta”。為國(guó)內(nèi)的大循環(huán),新經(jīng)濟(jì)的增量,人工智能和數(shù)字經(jīng)濟(jì)的發(fā)展做出自己應(yīng)有的貢獻(xiàn)。
謝謝!
(雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng)))
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。
本專題其他文章