0
2021年12月11日,由雷峰網(wǎng) & AI 掘金志主辦的第四屆中國人工智能安防峰會,在深圳正式召開。
本屆峰會以「數(shù)字城市的時代突圍」為主題,會上代表城市AIoT的14家標(biāo)桿企業(yè),為現(xiàn)場和線上觀眾,分享迎接數(shù)字城市的經(jīng)營理念與技術(shù)應(yīng)用方法論。
在上午場的演講環(huán)節(jié)上,華為機(jī)器視覺副總裁張愛軍為峰會帶來了精彩演講。
張愛軍提到,從2016年,華為就把整個企業(yè)的愿景從豐富人們的溝通與生活變成把數(shù)字世界帶入每個人,每個家庭,每個組織,構(gòu)建萬物互聯(lián)的智能世界。
華為從技術(shù)角度進(jìn)行了“智能世界”的定義:一是萬物感知,二是萬物互聯(lián),三是萬物智能。
張愛軍指出,隨著交互方式將發(fā)生巨大變化,催生新型移動物聯(lián)網(wǎng)蓬勃發(fā)展,未來整個智能世界最核心的數(shù)據(jù)交互主體將不再是人與人的交互,而是物與物的交互。機(jī)器視覺將成為5G時代的“智能手機(jī)”,行業(yè)數(shù)字化感知入口。
對于當(dāng)前產(chǎn)業(yè)發(fā)展歷程,張愛軍提出兩個觀點:
1、智能感知的進(jìn)程進(jìn)入第二波增長曲線,未來感知系統(tǒng)會擁有主動的感知能力。
2、純粹的、被動的感知產(chǎn)業(yè)生態(tài),可能會快速進(jìn)入以企業(yè)生產(chǎn)業(yè)務(wù)流程為主導(dǎo)的感知體系,智能感知進(jìn)入千行百業(yè)將變成非常重要的模式。
張愛軍還分享了華為機(jī)器視覺的戰(zhàn)略:加速視覺感知進(jìn)入企業(yè)生產(chǎn)流程,助力“智慧管理和運營”,支撐戰(zhàn)略落地上,華為有四個核心點。
一是關(guān)鍵技術(shù)。華為在計算機(jī)視覺賦能上的鏡頭、圖像傳感等都在進(jìn)行關(guān)鍵技術(shù)研究。
二是標(biāo)準(zhǔn)規(guī)范。標(biāo)準(zhǔn)規(guī)范最核心的是通過更加客觀數(shù)字化的模式來衡量一幅圖片、一段視頻是不是真正有效的為未來的人工智能和機(jī)器視覺來使用。
三是評價體系。手機(jī)行業(yè)的評測模式讓整個產(chǎn)業(yè)界非常有序發(fā)展。新的機(jī)器視覺產(chǎn)業(yè)需要類似的評價體系,讓智能時代的圖像質(zhì)量評價更為客觀。
四是開放生態(tài)。提供一套生態(tài)架構(gòu),讓開發(fā)者便捷開發(fā)、一站式交易,自由的溝通和交流。
以下是張愛軍演講全文,雷峰網(wǎng)(公眾號:雷峰網(wǎng))AI掘金志作了不改變原意的整理與編輯:
機(jī)器視覺和未來智能世界/數(shù)字化轉(zhuǎn)型的關(guān)系是什么?大家可能對此有各種各樣的理解,我想談?wù)勅A為近期的思考。
華為的愿景是“把數(shù)字世界帶入每個人、每個家庭、每個組織,構(gòu)建萬物互聯(lián)的智能世界”。
從技術(shù)角度,我們對智能世界進(jìn)行了三個萬物的定義: 一是萬物互聯(lián),二是萬物智能,三是萬物感知。
有人問信息社會和智能社會到底有什么區(qū)別?我們在疊加人工智能算法過程中,很多時候沒有注意到,其實參與信息社會和智能社會的主體在發(fā)生巨大變化。
信息社會是人和機(jī)器的交互,通常是人找到更多數(shù)據(jù),無論是PC互聯(lián)網(wǎng)還是移動互聯(lián)網(wǎng)時代,都是如此。
未來在智能世界里最核心的數(shù)據(jù)交互的主體變成物和物的交互。當(dāng)交互方式發(fā)生巨大變化,催生新型移動物聯(lián)網(wǎng)產(chǎn)業(yè)蓬勃發(fā)展。未來數(shù)據(jù)將基于不同的場景找到更多為人服務(wù)的模式。
所以,4G時代,智能手機(jī)是移動互聯(lián)網(wǎng)的體驗入口、應(yīng)用載體、讓人與人聯(lián)接。
我們認(rèn)為未來在5G時代、真正的人工智能時代,機(jī)器視覺將成為5G時代的“智能手機(jī)”,行業(yè)數(shù)字化入口,成為數(shù)據(jù)載體,也成為承載物和物之間交互的主體。
在此背景下,我們需要構(gòu)建應(yīng)對未來智能世界的感知平臺。為匹配未來智能世界里面對不同場景、不同業(yè)務(wù)能力的變化,構(gòu)建更加靈活、多樣的全息感知平臺體系,好望提出了“軟件定義”架構(gòu),并明確了三個關(guān)鍵要素:
1. 專業(yè)的AI芯,為實現(xiàn)智能化與數(shù)字化提供強(qiáng)力的算力引擎。
2. 開放的操作系統(tǒng),才能真正融入到智能世界的端云協(xié)同業(yè)務(wù)體系中。
3. 豐富的生態(tài),構(gòu)建智能世界我們需要與眾多合作伙伴共同攜手。
對于當(dāng)前產(chǎn)業(yè)發(fā)展的歷程,我們有兩個觀點:
1、智能感知進(jìn)入了第二波增長曲線。
過去十年,隨著智慧城市、平安城市的建設(shè),安防攝像頭已經(jīng)被廣泛普及,這些攝像機(jī)更多給我們提供了被動感知的能力,提供的是事后查看的能力。未來這些感知體系會擁有主動感知的能力。
2、從整個產(chǎn)業(yè)看,未來被動感知的產(chǎn)業(yè)生態(tài)可能會快速進(jìn)入到以企業(yè)的生產(chǎn)業(yè)務(wù)流程為主導(dǎo)的感知體系,智能感知進(jìn)入千行百業(yè)將變成非常重要的模式。
我們知道,一家公司不可能適配所有企業(yè)場景。人工智能最關(guān)鍵的數(shù)據(jù)的選擇不應(yīng)該是由做算法模型的科學(xué)家來實現(xiàn),更多是由懂得場景和業(yè)務(wù)的工程師來實現(xiàn)的,但往往現(xiàn)實很殘酷,懂得場景和業(yè)務(wù)的工程師在算法的快速開發(fā)上缺乏經(jīng)驗。
因此如何讓懂行業(yè)know-how的人的想法快速變成算法非常關(guān)鍵。
人工智能時代新興低代碼模式,已經(jīng)極大提升了開發(fā)者的效率,但是對業(yè)務(wù)專家來講依然是很復(fù)雜的過程。
我們有一個樸素的想法,我們在這個過程中采用端云協(xié)同的模式,提供從訓(xùn)練到開發(fā)、部署的業(yè)務(wù)模型,真正實現(xiàn)業(yè)務(wù)閉環(huán)。
講一個我們與企業(yè)合作的故事,這個企業(yè)做的算法精度大概在75%左右。他們找到華為,問能不能讓工程師自己開發(fā),讓算法的精度提升到85%或者90%。
這是個很簡單的問題,我們可以解決。我們基于華為的好望開發(fā)平臺,同時也給他們提供了人工智能領(lǐng)域8個基礎(chǔ)模型,這是任何做視覺的人工智能算法模型都需要用到的模型,比如目標(biāo)的跟蹤、目標(biāo)的切割等等一系列的基礎(chǔ)能力,有了這些基礎(chǔ)能力,他們就可以通過數(shù)據(jù)有效訓(xùn)練來快速構(gòu)建場景需要的能力。
我們希望未來機(jī)器視覺加速視覺感知進(jìn)入生產(chǎn)環(huán)節(jié),能讓大型企業(yè)、店鋪等小微企業(yè)都能享受AI的能力。
目前很多需求在發(fā)生根本性的變化,以前只需要被動的感知能力,今天需要為企業(yè)生產(chǎn)提效提供決策的依據(jù),我們認(rèn)為感知能力變化最大的本質(zhì)就是從“給人看”到“給機(jī)器看”。在這個過程中,所有技術(shù)要素、技術(shù)體系都需要圍繞給機(jī)器看來構(gòu)建。
回顧產(chǎn)業(yè)發(fā)展歷程,行業(yè)客戶需求從安全防范上升到經(jīng)營決策,華為從機(jī)器視覺四層需求理論出發(fā),圍繞“1+3+N”的產(chǎn)業(yè)框架,持續(xù)打造創(chuàng)新產(chǎn)品,以“平臺+生態(tài)”重新定義商業(yè)模式、生態(tài)模式和解決方案架構(gòu)。
好望以軟件定義攝像機(jī)、為核心構(gòu)建了完整的業(yè)務(wù)閉環(huán)的端云協(xié)同的產(chǎn)品能力,基于此產(chǎn)品能力,華為構(gòu)建了完全開放的生態(tài)。我們并不希望一家包攬所有事情,希望的是在AI的時代與能力型伙伴一起,把你們的行業(yè)know-how變成你們的產(chǎn)品能力,在你們所熟知的行業(yè)進(jìn)行銷售的模式。
這個產(chǎn)品體系如何支撐戰(zhàn)略落地?
一、關(guān)鍵的技術(shù)。這和虞晶怡教授今天講的未來談感知一定會談計算視覺一樣。計算視覺是很龐大的故事,華為在計算視覺有多年研究。為什么華為的手機(jī)晚上照出來的照片比別人的好?這是計算視覺賦能。在一系列的鏡頭、Sensor、圖像傳感領(lǐng)域,我們都有關(guān)鍵技術(shù)的研究和積累,希望未來面向機(jī)器視覺、面向機(jī)器來構(gòu)建機(jī)器能識別的技術(shù)要素。
二、標(biāo)準(zhǔn)規(guī)范。視頻編解碼技術(shù)發(fā)展了近30年,當(dāng)我們評價視頻好壞時還是用主觀體驗來作為最重要的評判標(biāo)準(zhǔn)。但我們面向機(jī)器視覺,如果用同樣的模式評價圖像標(biāo)準(zhǔn)是很困難的事情。
有一次我和中國圖形圖像學(xué)會王院士交流,他提到,如果未來不能通過客觀的方式來評價視覺圖像,對機(jī)器構(gòu)建整個智能世界有非常重大的影響。
圍繞給機(jī)器看的 “看、存、用”,華為機(jī)器視覺提出 SuperColor、SuperCoding、AI Turbo三大根技術(shù),貫穿視頻數(shù)據(jù)的全生命周期管理和使用。
同時,華為在聯(lián)合學(xué)界和業(yè)界伙伴共同提出面向機(jī)器的Machine Vision Benchmark標(biāo)準(zhǔn)規(guī)范。標(biāo)準(zhǔn)規(guī)范的核心是通過更加客觀、數(shù)字化的模式來衡量一幅圖片、一段視頻是否有效為人工智能和機(jī)器視覺所使用。圍繞標(biāo)準(zhǔn)的評價體系,好望攜手伙伴不斷探索自動化的測評流程,構(gòu)建標(biāo)準(zhǔn)化的實驗室。
三、評價體系。圍繞這套標(biāo)準(zhǔn)體系,華為在和業(yè)界一起探索自動化的評測流程,華為墨子光學(xué)圖像實驗室支持MVB自動化評測打分,可以自動化評測產(chǎn)品與標(biāo)準(zhǔn)要求的符合度,且能快速得出結(jié)果。
這套模式的啟發(fā)來自手機(jī)行業(yè),我們發(fā)現(xiàn)手機(jī)行業(yè)的評測模式讓整個產(chǎn)業(yè)界非常有序發(fā)展。我們認(rèn)為在新的機(jī)器視覺產(chǎn)業(yè)里需要這樣的體系來幫助整個行業(yè)繁榮。
前面更多是從華為自身出發(fā),往后我們要讓合作伙伴一起共創(chuàng)數(shù)字的未來,其中最關(guān)鍵的是要提供一套生態(tài)的框架,這個生態(tài)框架有三個核心能力。
一是提供一站式好望開發(fā)平臺,讓所有開發(fā)者的想法和行業(yè)know-how變成算法;二是為伙伴提供一站式交易的平臺,華為把你開發(fā)出來的算法帶貨到全球世界各地的項目,我們也希望伙伴在生態(tài)中形成網(wǎng)絡(luò),可以自行溝通和交流。三是形成端到端的產(chǎn)品體系。
在這個過程中我們構(gòu)建了云上開發(fā)一鍵式部署、協(xié)同推理,同時能夠在云上進(jìn)行端側(cè)遠(yuǎn)程升級和遠(yuǎn)程運維,是一套自動化的運維管理體系。
華為開源了深度學(xué)習(xí)框架MindSpore,它的能力在端側(cè),無論是性能的要求,對資源的要求,還是整體上的能力相比其他框架更優(yōu)。我們把開發(fā)的大量優(yōu)秀的基礎(chǔ)模型貢獻(xiàn)出來,在產(chǎn)品能力上構(gòu)建端邊云協(xié)同的能力。
華為機(jī)器視覺致力于用智能賦予機(jī)器“看”的能力,開啟“機(jī)器看世界”新時代,推動智能社會快速到來,張愛軍表示:“好望希望在各個方面與伙伴們持續(xù)深化合作,在標(biāo)準(zhǔn)、認(rèn)證、算法開發(fā)等多個領(lǐng)域我們與伙伴攜起手來,共同構(gòu)建智能世界,一起共贏未來”。雷峰網(wǎng)雷峰網(wǎng)雷峰網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。