0
本文作者: 張棟 | 2019-07-16 17:18 | 專題:CCF-GAIR 2019 |
7月12日-7月14日,2019第四屆全球人工智能與機(jī)器人峰會(huì)(CCF-GAIR 2019)于深圳正式召開。峰會(huì)由中國(guó)計(jì)算機(jī)學(xué)會(huì)(CCF)主辦,雷鋒網(wǎng)、香港中文大學(xué)(深圳)承辦,深圳市人工智能與機(jī)器人研究院協(xié)辦,得到了深圳市政府的大力指導(dǎo),是國(guó)內(nèi)人工智能和機(jī)器人學(xué)術(shù)界、工業(yè)界及投資界三大領(lǐng)域的頂級(jí)交流博覽盛會(huì),旨在打造國(guó)內(nèi)人工智能領(lǐng)域極具實(shí)力的跨界交流合作平臺(tái)。
7月14日下午,在「智慧城市·視覺智能」專場(chǎng)上,云從聯(lián)合創(chuàng)始人溫浩帶來了題為《泛在智能城市下的人機(jī)協(xié)同平臺(tái)》的主題分享。
溫浩提出,在AI大規(guī)模落地過程中,一定要構(gòu)建感知、認(rèn)知、決策的智能經(jīng)濟(jì)的AI閉環(huán),創(chuàng)業(yè)公司也必須在感知、認(rèn)知、決策環(huán)節(jié)均有涉及。
而場(chǎng)景上,可分為邊緣場(chǎng)景和云端場(chǎng)景,但邊緣場(chǎng)景和云端要根據(jù)場(chǎng)景進(jìn)行智能的分配。
邊緣端和終端承載需要本地實(shí)時(shí)響應(yīng)的推理任務(wù),并獨(dú)立完成數(shù)據(jù)收集、環(huán)境感知、人機(jī)交互以及部分決策控制。
邊緣端如自動(dòng)駕駛場(chǎng)景中,斷網(wǎng)下進(jìn)行獨(dú)立的本地處理;智能安防中,要對(duì)超大數(shù)據(jù)量本地處理;移動(dòng)互聯(lián)網(wǎng)場(chǎng)景,要保證低功耗和數(shù)據(jù)安全;智能家居和智能制造場(chǎng)景,要求異構(gòu)和實(shí)時(shí)響應(yīng)。
云端則負(fù)責(zé)承載智能數(shù)據(jù)分析、模型訓(xùn)練和部分對(duì)傳輸帶寬要求不高的推理任務(wù)。
溫浩認(rèn)為,目前AI還并不成熟,很多產(chǎn)業(yè)中的需求也很多樣,AI企業(yè)發(fā)展到后期,一定要聚焦、一定要做重、一定要控制好成本、一定要深入行業(yè)。如果還靠著不斷招人、發(fā)論文,也許估值會(huì)越來越高,但后期也一定會(huì)跌得越慘。
目前行業(yè)有個(gè)通?。簩?duì)于學(xué)術(shù)的看重好像勝于一切。
如果AI公司能夠靠著科學(xué)家團(tuán)隊(duì)走出來,當(dāng)年微軟亞研基本覆蓋了中國(guó)AI圈的大半壁江山,后面的結(jié)果大家也看到了;再比如Google X部門 ,全球技術(shù)大牛云集,后面的產(chǎn)品做得好嗎?銷售了幾臺(tái)?
通過微軟亞研和GoogleX的例子可以表明:技術(shù)不是一切,通過大批學(xué)術(shù)人才去落地產(chǎn)品根本行不通,技術(shù)好不代表產(chǎn)品好,但產(chǎn)品好一定要求技術(shù)好。
在今天這一節(jié)點(diǎn)上,包括云從在內(nèi),或許并不應(yīng)該太過關(guān)心技術(shù)的領(lǐng)先性,也非利用技術(shù)賺取多大的利潤(rùn),而是在業(yè)務(wù)線和技術(shù)體系無限擴(kuò)大、無限縱深時(shí),如何管理好N個(gè)愈加獨(dú)立的行業(yè)事業(yè)部和數(shù)千人團(tuán)隊(duì),是我們需要過的第一道難關(guān)。
在這一塊,云從會(huì)學(xué)習(xí)華為,去打造一個(gè)IPD(Integrated Product Development)管理系統(tǒng) ,華為當(dāng)年也花了20億元從IBM引進(jìn)了一套類似系統(tǒng)。
引入IPD體系被認(rèn)為是成就華為最重要的變革,它集中了若干工具、流程與方法,其核心思想包括:研發(fā)是一種投資行為、基于需求進(jìn)行研發(fā)、跨部門協(xié)同、結(jié)構(gòu)化流程等等。
它能夠?qū)κ袌?chǎng)迅速反應(yīng),縮短開發(fā)周期,減少報(bào)廢項(xiàng)目,減少開發(fā)成本,提高產(chǎn)品的穩(wěn)定性、可生產(chǎn)性、可維護(hù)性。
就像車企造車,每年十幾款新車型,不可能做到每一款新車的每一個(gè)部件都單獨(dú)研發(fā),所以需要一個(gè)平臺(tái),去模塊化組裝。如此,有利于用最低的成本、用快的速度交接出質(zhì)量最好的產(chǎn)品。
管理也可以成為產(chǎn)品,要幫助部門工作流程化,不斷可以迭代改進(jìn),要不得的是沒有總結(jié),沒有升華,總是在重新開始,最終整個(gè)部門都困在原地。
與此同時(shí),還應(yīng)該實(shí)現(xiàn)“人機(jī)協(xié)同”。
人機(jī)協(xié)同有幾個(gè)階段,第一是要做人機(jī)交互,首先讓機(jī)器知道你是誰,這也就是為什么要先做人臉識(shí)別的原因。
第二步做人機(jī)融合,如銀行的產(chǎn)品經(jīng)理,只能設(shè)計(jì)十幾種產(chǎn)品,但基于大數(shù)據(jù)和AI,他可以針對(duì)每個(gè)小微企業(yè)設(shè)計(jì)成百上千種AI的金融產(chǎn)品。
然后是人機(jī)共創(chuàng),未來就可以創(chuàng)造一些新的場(chǎng)景、新的業(yè)務(wù),新的服務(wù)、新的流程。如零售門店可以進(jìn)行二次陳列,和精準(zhǔn)引流,這就是人機(jī)共創(chuàng)。
以下是云從聯(lián)合創(chuàng)始人溫浩大會(huì)現(xiàn)場(chǎng)全部演講內(nèi)容,雷鋒網(wǎng)作了不改變?cè)獾恼砑熬庉嫞?/strong>
今天看到這么多參與大會(huì)的同學(xué)、觀眾們,大家的熱情讓我挺驚訝的,這個(gè)大會(huì)辦得很好,邀請(qǐng)了很多平時(shí)都難以見到的大咖。
前面幾位大咖都是講學(xué)術(shù)內(nèi)容,我今天從產(chǎn)業(yè)視角跟大家分享一下云從在人工智能產(chǎn)業(yè)落地方面的心得,希望能給大家?guī)硪恍┧伎肌?/p>
首先解釋一下人工智能,其實(shí)中國(guó)的先賢們?cè)谶@方面已經(jīng)有過很多思考、總結(jié)了,2000多年前荀子已經(jīng)提出來“智能”這個(gè)概念。
他說“知之在人者謂之知”,這句話的意思是說我們能夠感受事物、認(rèn)識(shí)事物的能力叫做知覺;“知有所合謂之智”,如果和客觀規(guī)律符合,能夠推而廣之,把事物認(rèn)知清楚,這就是智的概念。
還有一個(gè)是“能之在人者謂之能”,人生來都有很多本能,我們都知道天冷了要加衣服,渴了要喝水,“能有所合者謂之能”,如果這個(gè)能力能夠高效地形成一個(gè)方法,這時(shí)候就是一個(gè)穩(wěn)定的能力,這就是處理事物的能力,可以推而廣之,讓所有人都能學(xué)習(xí)。
所以,我們既要認(rèn)識(shí)事物,也要處理事物,這是人的智能的概念。
那么,我們?cè)撊绾巫屓斯ぶ悄苈涞啬兀?/p>
從傳統(tǒng)經(jīng)濟(jì)到數(shù)字經(jīng)濟(jì)再到互聯(lián)網(wǎng)+,我們有了電商、娛樂、游戲、虛擬貨幣,20年時(shí)間里,數(shù)字經(jīng)濟(jì)為我們的生活帶來了非常大的改變。
人們現(xiàn)在叫車方便了、網(wǎng)上購(gòu)物方便了,很多信息都可以實(shí)時(shí)、便利獲得,但是做到這里夠不夠?明顯是不夠的。
這么多數(shù)據(jù)匯集在一起,我們需要做更加智能的東西。譬如,叫車方便,但車還需要人開,所以要做自動(dòng)駕駛,所以今天,我們提出了智能+經(jīng)濟(jì)。
智能+經(jīng)濟(jì)通過什么來改變呢?
處理事物之前首先需要認(rèn)識(shí)事物,我們的人臉、人體、語音、文字,都是可以通過感知去收集的,將這些信息提取之后,可以借助語言理解去知曉其中內(nèi)涵。
之后,知識(shí)圖譜可以將這些知識(shí)歸納起來,通過機(jī)器學(xué)習(xí)把模型訓(xùn)練出來,從而做到認(rèn)知。當(dāng)然,這個(gè)認(rèn)知過程可以是線下的,也可以是線上的,只要有規(guī)模數(shù)據(jù)就可以運(yùn)行。
最后,系統(tǒng)需要做決策,也就是說不僅要認(rèn)識(shí)事物,還要處理事物。處理事物就要把相關(guān)信息反饋回去,比如說給商家,以提升促銷;給銀行,以降低風(fēng)險(xiǎn);給汽車導(dǎo)航,以把人安全、快捷地送到目的地。
以上這些步驟的組合便是AI落地的閉環(huán)。所以說,AI創(chuàng)業(yè)公司,如果要想真正落地,感知、認(rèn)知、決策三個(gè)階段都要涉及,否則場(chǎng)景價(jià)值很小。
現(xiàn)在我們都在講云、邊、端,其實(shí)它就是整個(gè)智慧城市的基本架構(gòu)。
每個(gè)城市都會(huì)有一個(gè)城市大腦,它在云端,會(huì)將數(shù)據(jù)融合、集中處理,然后進(jìn)行算法訓(xùn)練;端上就會(huì)有各種各樣的智能設(shè)備做萬物感知、萬物計(jì)算。
隨著5G時(shí)代的到來、IoT的成熟,得益于算力的可動(dòng)態(tài)分配,云邊端的協(xié)同是可以期待的。
目前云從在很多場(chǎng)景里面都會(huì)做基于類似智能的服務(wù)。
在金融領(lǐng)域,我們提供VIP的識(shí)別、刷臉支付、刷臉取款、刷臉購(gòu)物,這些智能服務(wù)目前都可以在銀行里體驗(yàn)到。
再來就是銀行里面對(duì)機(jī)房或者是ATM機(jī)的管控、運(yùn)維,這些屬于認(rèn)知層面、決策層面的。
在機(jī)場(chǎng),所有的安檢通道都可以進(jìn)行人臉比對(duì),當(dāng)用戶進(jìn)入候機(jī)樓之后,系統(tǒng)可以把相關(guān)人的登機(jī)口信息推送到他的手機(jī)上。
在學(xué)?;蛘呤情_放場(chǎng)景中,利用行人的軌跡分析、行人的識(shí)別技術(shù),可以實(shí)現(xiàn)實(shí)時(shí)、在線追蹤。
在開放道路上,可以實(shí)現(xiàn)車牌、車型、車標(biāo)、顏色的區(qū)分,可以為公安民警精準(zhǔn)地追蹤到每一輛車的軌跡。
在自然場(chǎng)景下的OCR,可以對(duì)包括零售店廣告、文字進(jìn)行識(shí)別;除了室內(nèi),還可以做室外比較密集的場(chǎng)景識(shí)別、人體追蹤等等。
在零售店,我們還做了一些基于AR的體驗(yàn),比如說基于二維視頻的3D人體建模,我們做到了200幀每秒,40多毫米的誤差,達(dá)到世界第一,利用這個(gè)技術(shù)可以做虛擬試衣。
另外,還有智慧能源行業(yè)的安全管理,比如說安全帽、工作服、防火等等方面的管理。
除此之外,還包括人員的精細(xì)管理、場(chǎng)站周界入侵、車輛監(jiān)控、異響檢測(cè)、設(shè)備狀態(tài)檢測(cè)等等,這些都是智慧城市里各行各業(yè)都可以用得上的視覺認(rèn)知和決策場(chǎng)景。
找到了這些場(chǎng)景之后,我們需要做些什么呢?
首先需要將計(jì)算做分配,每個(gè)場(chǎng)景里的計(jì)算要求是不一樣的,比如說在自動(dòng)駕駛場(chǎng)景下,需要斷網(wǎng)下獨(dú)立本地處理;比如說智能安防場(chǎng)景下,需要超大數(shù)據(jù)量本地處理;而在移動(dòng)互聯(lián)網(wǎng)方面,實(shí)時(shí)性要高、功耗要低。
所以,面對(duì)不對(duì)的場(chǎng)景,需要不同的算法、不同的芯片,也就是說:芯片與算法的結(jié)合肯定是未來的一個(gè)大趨勢(shì)。
比如說AI安防市場(chǎng),最早的攝像機(jī)只是做一些ISP、圖像處理;后面升級(jí)為網(wǎng)絡(luò)攝像機(jī),做一些網(wǎng)絡(luò)編解碼、數(shù)字傳輸;今天的AI安防攝像頭,需要做本地結(jié)構(gòu)化,由于它一天會(huì)產(chǎn)生20GB的數(shù)據(jù),這對(duì)于帶寬和存儲(chǔ)都是很大挑戰(zhàn),也就是說必須要做結(jié)構(gòu)化提取。
上圖是我們的一個(gè)800萬像素的全功能AI相機(jī),它可以做到同時(shí)檢測(cè)200個(gè)以上人臉,最大支持30萬人臉庫(kù)。
現(xiàn)在來說,其實(shí)AI發(fā)展還不是太成熟,很多產(chǎn)業(yè)的需求是非常多樣的,這時(shí)候該怎么辦呢?
在未來的30年內(nèi),云從認(rèn)為技術(shù)趨勢(shì)應(yīng)該是人機(jī)協(xié)同。
人有人的優(yōu)勢(shì),人有創(chuàng)造力、有抽象力,我們可以從書本上學(xué)習(xí)知識(shí)、推而廣之;而機(jī)器的計(jì)算力、大數(shù)據(jù)分析能力明顯高于人類。
人機(jī)協(xié)同發(fā)展可以分為幾個(gè)階段,第一個(gè)是要做人機(jī)交互,首先要讓機(jī)器知道你是誰,這也是為什么我們要先做人臉識(shí)別的原因。
除了它有比較成熟的算法,更關(guān)鍵的是它有一個(gè)視覺入口?;ヂ?lián)網(wǎng)世界,每個(gè)產(chǎn)業(yè)都需要找到正確的入口,APP是一個(gè)入口,手機(jī)也是一個(gè)入口,而視覺技術(shù)就是AI的入口,它可以知道你是誰,后面才可以做一系列交互動(dòng)作。
第二步需要做人機(jī)融合,我們現(xiàn)在有很多事情可以讓機(jī)器和人一起去做,比如說銀行的產(chǎn)品經(jīng)理,他可以根據(jù)他的經(jīng)驗(yàn)、能力,設(shè)計(jì)一個(gè)產(chǎn)品的風(fēng)控,但他最多只能設(shè)計(jì)十幾種產(chǎn)品;基于AI,可以針對(duì)每個(gè)小微企業(yè)設(shè)計(jì)成百上千種AI金融產(chǎn)品,這就是人機(jī)融合。
如此,便可以做得更高效、更精準(zhǔn)、更有價(jià)值,這是在未來10年中,大家可以看到的應(yīng)用,目前很多工作都可以與機(jī)器協(xié)同完成。
再來就是人機(jī)共創(chuàng),AI落地之后,未來我們可以創(chuàng)造一些新的場(chǎng)景、新的業(yè)務(wù)、新的服務(wù)、新的流程,這叫人機(jī)共創(chuàng)。
那么,做到這三步是不是就夠了呢?還需要做到“三化”:行業(yè)化、場(chǎng)景化、個(gè)性化。
行業(yè)化方面我們剛才舉了很多例子,每個(gè)行業(yè)的需求都是不一樣的,人臉識(shí)別在金融和安防里面的應(yīng)用是完全不一樣的。安防要求的是開放場(chǎng)景、快速搜索;金融要求的是百萬分之一甚至千萬分之一的誤識(shí)率及及活體檢測(cè)。
第二是要場(chǎng)景化,每個(gè)場(chǎng)景都要有具體的解決方案;第三是個(gè)性化,這是大數(shù)據(jù)時(shí)代最大的利處,每個(gè)人都可以得到精準(zhǔn)的服務(wù)。
接下來談多模態(tài)應(yīng)用,我們做人機(jī)交互,為什么要提多模態(tài)?
舉個(gè)例子,現(xiàn)在大熱的新零售,以后肯定是個(gè)技術(shù)落地趨勢(shì)。(雖然現(xiàn)在做稍微早了一些,目前的技術(shù)貨損率比雇一個(gè)店員更高,還不如不做。)
但就技術(shù)層面來看,AI未來可以做些什么?
其實(shí)新零售可以分為人、貨、場(chǎng)三個(gè)方面,貨有一套供應(yīng)鏈,場(chǎng)就是現(xiàn)在的電商一直在做的事,比如說把信息流提到線上去它會(huì)更高效,但線下做也有它的好處,可以在真實(shí)場(chǎng)景中體驗(yàn)產(chǎn)品。
還有就是資金,在線上更便捷,但是在線下更安全、可靠;還有一個(gè)就是延時(shí),線上是有延時(shí)的,線下是沒有的。
所以,我們認(rèn)為AI應(yīng)該圍繞人去建設(shè)的,我們有很多與人相關(guān)的技術(shù),可以將流量變成轉(zhuǎn)化率,然后變成客單價(jià),再來提高復(fù)購(gòu)率。
在人的方面,我們可以做很多事情,比如做前端感應(yīng)、廣告推薦,它會(huì)根據(jù)用戶的年齡、屬性、會(huì)員,分析你可能愛好的東西,或者你上次買過什么東西,之后把信息推薦出來,后臺(tái)會(huì)做一個(gè)數(shù)據(jù)建模。
再比如做游戲引流,可以在用戶玩游戲的過程中,送打折劵的形式去采集數(shù)據(jù),之后做產(chǎn)品推薦。
后臺(tái)用戶的特征建模,可以從5個(gè)維度,幾十個(gè)特征去分析,我們通過雙塔稀疏神經(jīng)網(wǎng)絡(luò)做深度學(xué)習(xí),從200個(gè)廣告里面提取用戶感興趣的100個(gè)廣告,這100個(gè)廣告在線下就可以完成,等用戶到店后就可以推送10個(gè)精準(zhǔn)廣告。
回到店里的時(shí)候,當(dāng)用戶從進(jìn)店那一刻開始,系統(tǒng)就開始關(guān)注你:是不是熟客、是不是VIP、是男是女,把這些信息都推送過去,廣告推薦就通過神經(jīng)網(wǎng)絡(luò)做這樣一些推薦,如果此前有購(gòu)物信息就會(huì)更加精準(zhǔn)。
傳統(tǒng)的線上電商,都有一套跟蹤模型,從用戶瀏覽、點(diǎn)擊、放到購(gòu)物籃,最后生成訂單、支付,它是有一套轉(zhuǎn)化模型的,叫漏斗模型;而線下是沒有的,線下都是靠經(jīng)營(yíng)主自己的腦袋,靠自己的經(jīng)驗(yàn)去決定的,而這種方式的效率是非常不高的。
剛才我講的銀行融合是一個(gè)人機(jī)共創(chuàng)的例子,現(xiàn)在還可以做二次陳列。
我們可以通過一些購(gòu)物小票去做一些引流動(dòng)作:通過對(duì)購(gòu)物小票的分析去重新擺設(shè)商品,計(jì)算出單坪空間的更多價(jià)值。
現(xiàn)在AI主流的玩法不外于B端或者C端,這些都不重要,重要的是云和端的產(chǎn)品和服務(wù)如何更好結(jié)合在一起,最終達(dá)到人機(jī)協(xié)同。
所以,云從現(xiàn)在全力打造一個(gè)人機(jī)協(xié)同平臺(tái),面向包括金融、安防、零售、電力等各個(gè)行業(yè)。目前已經(jīng)有400多家銀行、70%的樞紐機(jī)場(chǎng)、一萬多路公安視頻都與云從有深度合作。
今天我的分享就到這里,謝謝大家。雷鋒網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。
本專題其他文章