0
本文作者: 老王 | 2016-08-12 09:27 | 專題:CCF-GAIR | 全球人工智能與機器人峰會 |
雷鋒網(wǎng)按:本文整理自CCF - GAIR 全球人工智能與機器人峰會上,金山軟件CEO兼金山云CEO 張宏江的演講。
為什么過去幾年人工智能有著這么快速的進步,張宏江認為,這最終歸結(jié)到大數(shù)據(jù)的進步和云計算的發(fā)展。
AI的支撐:數(shù)據(jù)爆炸
人工智能的進展很大程度歸功于數(shù)據(jù)的進展,全球產(chǎn)生消費的數(shù)據(jù),2013年2020年將增長10倍,年增長率40%,微信一天在朋友圈里交換的圖片是10億。
張宏江舉例:如果把小米的用戶已經(jīng)存到小米云上的照片,5億多張的話,就需要120萬核,需要100P的存儲空間,而今天中國的存量照片,這是2014年的數(shù)據(jù),3000億張的時候,需要的存儲空間和計算量是多么地巨大。
20年前的夢想
手機上的應(yīng)用,可以對人臉做一系列的處理,人臉識別以及年齡判斷等。這不是手機做的,而是在手機后端的云中運行,當(dāng)手機拍了一張照片以后,在云上處理,再把結(jié)果拿回來,這個就是張宏江他們團隊20那年前的夢想。
1997年張宏江團隊在惠普實驗室申請的一個專利,這是一個分布式的架構(gòu),數(shù)據(jù)從客戶端拿到,然后再傳到后端的系統(tǒng)上,做的一系列的處理,把結(jié)果推送到前端來。20年以后的今天,這件事情在一個手機上終于可以實現(xiàn),更重要的是,它可在云和端上終于實現(xiàn)了。手機成為一個數(shù)據(jù)的獲取終端,云作為整個的運算載體,整個數(shù)據(jù)的載體。
人臉識技術(shù)史是人臉數(shù)據(jù)庫的擴張史,是人臉數(shù)據(jù)庫+就算能力的擴張史
學(xué)術(shù)年代,90年代初做人臉的時候,所有學(xué)術(shù)時代用的數(shù)據(jù)庫只有幾百個人的人臉圖片,即便在這種情況下機器人的識別能力依然非常低于人的識別能力,而且對光線要求非常高,需要正面圖象。而在工業(yè)時代,2014年,大批量人臉識別率達97.35%,而在2015年達到99.63%。目前國內(nèi)的公司在7000多萬張標準照片再加上億的其他照片,人們用的深層網(wǎng)絡(luò)已經(jīng)超過30層,訓(xùn)練20塊NVIDIA,精度已經(jīng)遠遠超過人類。
AI+大數(shù)據(jù)+云:正在成為企業(yè)的標配
現(xiàn)在的企業(yè)沒有大數(shù)據(jù)很難活下去,而大數(shù)據(jù)要靠云來支撐。大數(shù)據(jù)包括高質(zhì)量數(shù)據(jù)的獲取和分析,和它整個在應(yīng)用中的解析已經(jīng)越來越成為公司的標配。當(dāng)然這一切其實必須靠云來支撐,沒有云就談不上大數(shù)據(jù),也談不上大數(shù)據(jù)地獲取、處理和大數(shù)據(jù)地運營。
云計算的應(yīng)用場景
之后,張宏江講述了云計算和大數(shù)據(jù)在已在以下領(lǐng)域的應(yīng)用相對成熟:醫(yī)療、政務(wù)、游戲、視頻云,只能硬件云,混合云。
云計算趨勢
張宏江講到云計算已車成為主流IT技術(shù),互聯(lián)網(wǎng)行業(yè)成熟最快的公司,在迅速達到100億美元銷售額的公司,C端的是Google、Facebook,B端的是亞馬遜AWS大部分。當(dāng)B端達到這么高的銷售額,說明這個市場已成熟。
人工智能威脅與人工智能2.0
現(xiàn)場提問環(huán)節(jié)針對人工智能未來是否會對人類造成威脅的問題,以及人工智能2.0。
第一個問題,張宏江說到,這里有一個曲線,沒有到奇點的時候人們是看不到的,無法判斷。而針對人工智能2.0的問題,他認為也許人工智能2.0不一定為人來驅(qū)動,強人工智能的標志在能不能做問題的推理。未來人類可能不需要等待對人腦已經(jīng)很了解之后再做人工智能,或者是再談2.0。
最后張宏江總結(jié)到:
我們做人工智能的,當(dāng)我們看到人工智能作為一個現(xiàn)象突飛猛進突破的時候,我們更應(yīng)該注意到的是它后端的,不光是算法本身的突飛猛進,更重要的是支撐這個算法突飛猛進的大數(shù)據(jù)和云計算,所以我們看到的未來是前端一系列的智能設(shè)備,而它的大腦實際上在云里面。
我今天想講的是從工業(yè)界的角度談一下對AI的看法,為什么過去幾年人工智能進步這么快。最終我會歸結(jié)到大數(shù)據(jù)的進步和云計算的發(fā)展。
我們在座的大部分人都很清楚,我相信有些人可能第一次注意到人工智能也是今年三月份的阿爾法狗和李世石的精彩,比賽第一局的時候,我曾經(jīng)和一些做研究的朋友打過一個賭,就是誰贏誰輸,最后我很幸運地我賭在機器人上,所以最后在阿爾法狗贏了不少錢。
我們看到人工智能50多年歷史,我們看到當(dāng)The Buzz戰(zhàn)勝了俄國大師以后沒有進展,突然有一天我們看到阿爾法狗把全世界最好的大師以4比1的成績大獲全勝,大家可能會說算法進步很多,但我認為更重要的是大數(shù)據(jù)的進步,超級計算,云計算的進步。
我今天不想討論阿爾法狗利用什么算法,我想分享的是它背后的數(shù)據(jù)和背后高性能的計算資源,它在進行比賽之前已經(jīng)用人類的6到9段棋手的對局中獲得了3000個數(shù)據(jù)進行訓(xùn)練,這些訓(xùn)練已經(jīng)相當(dāng)大了,而且它能毫無感情的自己跟自己下棋,中間又獲得了3000多萬的布點數(shù)據(jù),這些人類棋手是很難做到的。真正下棋的時候,在系統(tǒng)本身所需要的計算資源,1900多個CPU、280多個GPU,耗費的能量是人的300多倍。這是在阿爾法狗跟人類對局之前,人們對于阿爾法狗的判斷,最高設(shè)置這一塊,它的段位已經(jīng)達到了3168這樣一個數(shù)字,但如果我們看人類大師的話,當(dāng)時給它的數(shù)字是,李世石是3520多,在對比之前你會覺得大師可能還會贏,但人們沒有想到的是,在過程中機器人學(xué)的是如此之快。
人工智能的進展很大程度歸功于計算的進展,我們看一下這些年互聯(lián)網(wǎng)突飛猛進的發(fā)展,全球產(chǎn)生消費的數(shù)據(jù),2013年2020年將增長10倍,年增長率40%?;ヂ?lián)網(wǎng)突飛猛進的時候,尤其移動設(shè)備的突飛猛進,我們看到照片的數(shù)據(jù)增長是如此迅猛,前面用的是美國的一些比較著名的網(wǎng)站,很遺憾,我拿不到國內(nèi)大部分網(wǎng)站的數(shù)據(jù)。你可以看到,每天上傳和分享的圖片,圖片已經(jīng)超過了10幾個億,2014年我開始注意小米手機的數(shù)據(jù),到2015年年初的時候,它的每日上傳圖片數(shù)據(jù)已經(jīng)超過一億張。前段時間馬化騰談到,今天微信一天在朋友圈里交換的圖片是10億,大家可能不會特別在乎10億這個數(shù)字,但20年前,中國一年德膠卷消耗量是40億,一年最多拍40億張照片,今天也就是微信上四天的交換量。這從一個簡單的量變帶來的質(zhì)變,尤其我們在做神經(jīng)網(wǎng)絡(luò)的時候,碰到的第一個問題,得到一個非常好的解決。我們再看一個具體情況,因為這數(shù)據(jù)是我自己從系統(tǒng)里拿出來的。把這些數(shù)據(jù)簡單做成數(shù)列圖,下次再往下看的時候不至于一開始就把整個照片蕩下來,這就需要2400核2.6G的CPU,需要200T的存儲空間。如果把小米的用戶已經(jīng)存到小米云上的照片,5億多張的話,就需要120萬核,需要100P的存儲空間,而今天中國的存量照片,這是2014年的數(shù)據(jù),3000億張的時候,需要的存儲空間和計算量是多么地巨大。
正是因為有了如此龐大數(shù)量的圖片,使得我們以前認為,我們做神經(jīng)網(wǎng)絡(luò)的以前認為不可能完成的訓(xùn)練任務(wù)今天相對容易的完成。右邊用的圖是2011年紐約時報報道的一個工作,就是怎么讓一個計算機自動識別出貓的臉,它用的數(shù)據(jù)基本上按我們以前AR里面談的,就是一個蠻荒之力。16000個處理器做了1000萬張照片,今天這個數(shù)字,這是2011年的數(shù)字,今天的數(shù)字對我們來說已經(jīng)小菜一碟了。
今天手機上的應(yīng)用,大家用手機的時候,手機可以對人臉做一系列的處理,一開始的時候,人們總是希望在手機上做一些比較酷的東西,比如拿照片猜年齡,這是小兒科的,20年前的時候我們就有這個想法了,但是今天我們在手機上終于實現(xiàn)了。以前我們拍了如此多的照片,我們只能按時間順序和地點進行搜索,今天有了人臉檢測,我打開面孔,這是我的照片,所有的跟我有通訊錄的人的照片就全出來了,我點一下雷軍的照片,所有跟雷軍相關(guān)的照片都出來了。我們再看另外一個更多人的場合,當(dāng)他第一次見到一些人的時候,這些人我以前沒有做過任何標注,沒有在我的朋友圈出現(xiàn)過的時候,它會問你這些人是誰,整個一套系統(tǒng),今天不光是小米手機,只要有云功能的這些東西,只要背后有云支持的手機,今天做這件事情已經(jīng)不困難了。
到底是什么樣的力量,什么樣的一種進度,讓今天這種事情做起來顯得如此簡單,或者人覺得手機的功能如此強大,但我要告訴你,這不是手機做的,這是手機后端的云在做的,因為當(dāng)手機拍了一張照片以后,云上做了處理,很快把結(jié)果拿回來,這個就我們20多年的夢想,我有一個數(shù)字為證,這是1997年在惠普實驗室申請的一個專利,工作是1996年做的,最后專利是2000年批的。我們看兩張圖,第一張圖是人臉識別對比圖,第二年是我們在20年前提的架構(gòu),就是這是一個分布式的架構(gòu),數(shù)據(jù)從客戶端拿到,然后再傳到后端的系統(tǒng)上,做的一系列的處理,把結(jié)果推送到前端來。今天20年以后,這件事情在一個手機上終于可以實現(xiàn)了,或者更重要的是,在云和端上終于實現(xiàn)了。手機作為一個數(shù)據(jù)的獲取終端,云作為整個的運算載體,整個數(shù)據(jù)的載體,終于把我們20年前的夢想實現(xiàn)了,很可惜,這個專利因為是1997年申請的,再有一天就作廢了,所以我也沒法管他們要專利費了。
我剛才講這么多,再從學(xué)術(shù)角度來看,我認為過去這20多年人工智能的發(fā)展,特別是在人臉識別領(lǐng)域的20多年的進步,其實可以歸結(jié)成是一個數(shù)據(jù)庫的擴張,我們在90年代初的時候,做人臉的時候,所有學(xué)術(shù)時代用的數(shù)據(jù)庫都是幾百個人,因為數(shù)據(jù)積很小,你可以說它的識別率是95%到99%,但即使這樣,機器人的識別能力依然非常低于人的識別能力,而且對光線要求非常高,而且一定要正面圖象。當(dāng)我們看到,隨著數(shù)據(jù)的增加,再過十年,我們看到這些照片已經(jīng)是上千人的,到了近萬張照片,這時候識別的能力有了進一步的提高,而且對于表情、光線等的要求就沒那么嚴格了。再進入2000年以后,數(shù)據(jù)量爆炸,這時候互聯(lián)網(wǎng)的普及,數(shù)量如此多,到了LFW這個數(shù)據(jù)積的時候,已經(jīng)差不多5000人的數(shù)據(jù)積,從而使得識別率更進一步提高,到了95%以上,時候工業(yè)界加入進來,學(xué)術(shù)界真正的有開始突破的時候,它的訓(xùn)練數(shù)據(jù)已經(jīng)找到了更多的訓(xùn)練。
真正的人臉識別時代還是工業(yè)界的人認為這個問題可以開始實用了,工業(yè)界開始進入的時候,這時候的數(shù)據(jù)量跟學(xué)術(shù)界的數(shù)據(jù)量完全不是一個數(shù)量級,F(xiàn)acebook和Deepface它已經(jīng)到了4.4M張圖,4030個人,每人800至1200張圖,到了谷歌、FaceNet的時候,已經(jīng)到了2億張圖像,800萬人,參數(shù)已經(jīng)超過了14000萬參數(shù)。我們看一下這個工作的話,在這塊也看得非常明顯,當(dāng)我們的訓(xùn)練數(shù)量開始增加的時候,對于同一個模型精度的增加是非常相關(guān)的。當(dāng)然,當(dāng)數(shù)據(jù)量比較小,增加一個數(shù)量級的時候,改善也比較小。只有呈數(shù)量級的增加,才能獲得小數(shù)點一位數(shù)的增加。我們看算法也同樣,當(dāng)算法變得越來越精確的時候,你所需要的計算能力,也是一個快速的增加。我們也可以看到,當(dāng)計算的復(fù)雜度超過了十億浮點的時候,可以看到檢測精度的增加。
我們再看真正的工業(yè)界,以人臉識別為生的公司,最近幾年的進展,我用了兩個例子,商湯科技和依圖,從他們那拿到的數(shù)據(jù)基本上是中國人口的數(shù)據(jù),7000多萬張標準照片再加上億張其他照片,人們用的深層網(wǎng)絡(luò)已經(jīng)超過30層,訓(xùn)練20塊NVIDIA,今天的精度已經(jīng)遠遠超過人類,今天你要做任何壞事,只要留下一張照片,基本上就插翅難逃了,這就是今天商業(yè)解決方案已經(jīng)達到的精度。
我還是想強調(diào),如果沒有如此多的照片,尤其中國的環(huán)境里面,所有網(wǎng)上行為連到一起的時候,你會發(fā)現(xiàn)判斷的精度將有大大的增加。
我們再看一下,當(dāng)我們的數(shù)據(jù)和識別精度和算法變得如此龐大的時候,從四年前的八成網(wǎng)絡(luò)到今年的152層的識別的話,我專門拿到這個數(shù)據(jù),今天神經(jīng)元的元數(shù)已經(jīng)到了2200萬,最后降到5700萬,當(dāng)我們有數(shù)字大的蠻荒之力的時候,我們給人工智能帶來了什么。所以我說數(shù)據(jù)是我們進步的核心,而且我們有一個說法,就是從來不會有太多的數(shù)據(jù),數(shù)據(jù)從此不夠。特斯拉號稱有17萬輛車每天在路上行駛幫它搜集數(shù)據(jù),當(dāng)依然出現(xiàn)當(dāng)強光打過來的時候會造成誤判,所以我們談大數(shù)據(jù)的時候,永遠談的是解決的問題是什么。只有你比較簡單的情況下,少量的數(shù)據(jù)才能滿足你的要求,當(dāng)你用復(fù)雜的模型的時候你的數(shù)據(jù)量一定是要遠遠超過你的訓(xùn)練所需,數(shù)據(jù)越多,覆蓋精度越高,對于模型的依賴就會越少。
在大數(shù)據(jù)這件事情上,微軟看得非常早,我們非常受人尊敬的Michael Wooldridge先生,在十年前就提出可學(xué)范式的概念,到了幾百年前從牛頓力學(xué)還是,我們用理論的方式來解釋,到今天我們用數(shù)據(jù)來驅(qū)動。
這本書是2009年出版的,我確實認為,今天我們到了進入第四范示的時候,數(shù)據(jù)在我們?nèi)粘9ぷ髦衅鸬淖饔煤脱芯恐衅鸬淖饔檬且郧巴耆豢梢员葦M的。大數(shù)據(jù)包括高質(zhì)量數(shù)據(jù)的獲取和分析,和它整個在應(yīng)用中的解析已經(jīng)越來越成為公司的標配,如果你作為一家體量大的公司,沒有大數(shù)據(jù)的分析,或者沒有辦法獲得大數(shù)據(jù),或者是你沒有把這些大數(shù)據(jù)轉(zhuǎn)換成專家的話,其實你在你的行業(yè)里已經(jīng)很難生存。當(dāng)然這一切其實必須靠云來支撐,沒有云我們也談不上大數(shù)據(jù),談不上大數(shù)據(jù)的獲取、處理和大數(shù)據(jù)的運營。這是為什么看到今天一系列的云公司,尤其大規(guī)模云公司今天越來越強調(diào)數(shù)據(jù)的存儲和處理,金山已經(jīng)早進入云存儲和云數(shù)據(jù)分析,無論是原始數(shù)據(jù)圖片還是視頻,每天大量的產(chǎn)生者,然后大量存儲到云里面,然后被云處理和解析,這需要大量資源才能真正地做到我剛才說到的數(shù)據(jù)的消費,像人臉識別這些我們20多年前夢想能解決的問題。今天看到的智能平臺,無論消費者的智能平臺還是工業(yè)智能設(shè)備,大部分今天能做到的智能本身非常非常少,它的智能是藏在后端云里面。同樣大家在座的知道,人工智能現(xiàn)象同時發(fā)生在過去幾個月的網(wǎng)紅視頻直播,為什么這些公司一夜之間能冒出來,是它后面的支持技術(shù),做了很多年的采接、編解碼等等都已經(jīng)由視頻云計算公司給它提供了,所以你做網(wǎng)紅直播,只需要找網(wǎng)紅,只需要搭一個網(wǎng)站寫一個APP,后端所有事情由云來提供了。
同樣,醫(yī)療,今天中國醫(yī)療問題如此之多,談不上精準醫(yī)療、精準康復(fù),只有基于大數(shù)據(jù)云平臺把這一系列連起來的時候,我們談到的精準醫(yī)療和精準康復(fù)和社區(qū)醫(yī)療才能實現(xiàn)。同樣在城市這塊,我們今天有大華公司的代表在,大家都知道,在里約的奧運會上,絕大部分的攝像頭都是大華,每天采集這么多數(shù)據(jù),本身這就是智慧城市核心的一部分,當(dāng)你把這些數(shù)據(jù)賦予運用,來進行利用的時候,才能真正感受到這些數(shù)據(jù)的價值。
同樣,游戲這塊更是如此,手游玩得那么爽,所有的智能分析都在背后,從而使得一款游戲什么時候上線,什么時候開新的服務(wù)等等,這一切都由背后的數(shù)據(jù)來驅(qū)動。
我說這么多,大家還是有疑問,就是云計算是不是還在云里霧里,我告訴大家,今天云計算已經(jīng)真正落地了,這是Gaslnes每年一次的技術(shù)成熟度的分析。
同樣市場上對于云計算公司的看法也非常非常樂觀,如果我們看一下,回顧過去30年,在互聯(lián)網(wǎng)里成長最快的公司,我們用一個數(shù)據(jù)來衡量,哪些公司最快的時間達到100億美金,顯然互聯(lián)網(wǎng)公司快。一家叫做Facebook,一家叫做谷歌,只有一家2B的公司在十年內(nèi)銷售額達到了100億美金,就是亞馬遜云,當(dāng)一個2B的業(yè)務(wù)趕上2C業(yè)務(wù)的時候,你就知道,人們對于這個需求是多么地龐大,當(dāng)然,我就不再具體多講。實際上市場給出的反應(yīng)也很清楚,當(dāng)你快速地在云里面進行投資,快速地在云里面進行成長的股票,你可以看到,市場給予的回報是最好的。
同樣,對于我們在中國做人工智能的人來看,這個數(shù)字非常令人鼓舞,今天中國的互聯(lián)網(wǎng)產(chǎn)值是美國的百分之幾,我們想的是在今后幾年,云計算產(chǎn)業(yè)的空間和增速是如此之快,這也是為什么金山在過去幾年投入如此龐大的資源,使我們成為中國金山云計算的服務(wù)商,游戲云、視頻云、智能硬件等等方面成為國內(nèi)領(lǐng)軍的企業(yè)。很重要的實際上市場的成長速度比我們想象的還要快。
我的結(jié)論是說,我們做人工智能的,當(dāng)我們看到人工智能作為一個現(xiàn)象突飛猛進突破的時候,我們更應(yīng)該注意到的是它后端的,不光是算法本身的突飛猛進,更重要的是支撐這個算法突飛猛進的大數(shù)據(jù)和云計算,所以我們看到的未來是前端一系列的智能設(shè)備,而它的大腦實際上在云里面,謝謝大家!
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。