0
| 本文作者: 李詩(shī) | 2018-07-02 12:16 | 專(zhuān)題:2018 CCF-GAIR 全球人工智能與機(jī)器人峰會(huì) |
雷鋒網(wǎng)按:2018 全球人工智能與機(jī)器人峰會(huì)(CCF-GAIR)在深圳召開(kāi),峰會(huì)由中國(guó)計(jì)算機(jī)學(xué)會(huì)(CCF)主辦,雷鋒網(wǎng)、香港中文大學(xué)(深圳)承辦,得到了深圳市寶安區(qū)政府的大力指導(dǎo),是國(guó)內(nèi)人工智能和機(jī)器人學(xué)術(shù)界、工業(yè)界及投資界三大領(lǐng)域的頂級(jí)交流盛會(huì),旨在打造國(guó)內(nèi)人工智能領(lǐng)域最具實(shí)力的跨界交流合作平臺(tái)。

在大會(huì)第一天的“AI前沿”主會(huì)場(chǎng),英特爾高級(jí)首席工程師、大數(shù)據(jù)技術(shù)全球CTO戴金權(quán)帶來(lái)了題為“大數(shù)據(jù)分析+人工智能”的演講。

戴金權(quán)負(fù)責(zé)領(lǐng)導(dǎo)英特爾全球(位于硅谷和上海)的工程團(tuán)隊(duì)在高級(jí)大數(shù)據(jù)分析(包括分布式機(jī)器學(xué)習(xí)和深度學(xué)習(xí))上的研發(fā)工作,他帶領(lǐng)團(tuán)隊(duì)一手研發(fā)了基于Apache Spark 框架的分布式深度學(xué)習(xí)庫(kù) BigDL,在這次演講中,他還著重介紹了一個(gè)新產(chǎn)品:Analytics Zoo。會(huì)后,雷鋒網(wǎng)就BigDL和Analytics Zoo對(duì)戴金權(quán)進(jìn)行了專(zhuān)訪。
近一年來(lái),英特爾反復(fù)提到的“人工智能全棧解決方案”是其人工智能戰(zhàn)略布局的最好詮釋。

戴金權(quán)介紹到,英特爾一直致力于提供一個(gè)完整的端到端的全棧人工智能解決方案,從終端設(shè)備端到網(wǎng)絡(luò),再到數(shù)據(jù)中心的云端。
這一套解決方案的底層技術(shù)包括了至強(qiáng)可擴(kuò)展處理器、NNP芯片、FPGA、網(wǎng)絡(luò)以及存儲(chǔ)技術(shù),其上則是各種數(shù)據(jù)庫(kù)、人工智能平臺(tái)和具體的體驗(yàn)。
此次,戴金權(quán)更為詳細(xì)地解釋了英特爾的人工智能軟件層。

在基礎(chǔ)層,有英特爾針對(duì)機(jī)器學(xué)習(xí)優(yōu)化的英特爾發(fā)行版Python、優(yōu)化的DAAL的發(fā)行版、MKL-DNN和clDNN神經(jīng)網(wǎng)絡(luò)函數(shù)的優(yōu)化庫(kù)、開(kāi)源的nGraph編譯器等;在庫(kù)這一層,有機(jī)器學(xué)習(xí)庫(kù)的優(yōu)化、TensorFlow/MXNet/Caffe/BigDL等的優(yōu)化,再到工具包這一層,有開(kāi)源視覺(jué)推斷和神經(jīng)網(wǎng)絡(luò)優(yōu)化工具包OpenVINO、VPU上的優(yōu)化推斷開(kāi)發(fā)的英特爾Movidius SDK、CPU上的認(rèn)知解決方案英特爾Saffron AI。這些端到端的解決方案可以幫助開(kāi)發(fā)者更快速地開(kāi)發(fā)AI應(yīng)用。

戴金權(quán)一直致力于大數(shù)據(jù)分析,開(kāi)發(fā)出基于Spark的分布式深度學(xué)習(xí)框架BigDL和Analytics Zoo,讓更多的大數(shù)據(jù)用戶(hù)、數(shù)據(jù)工程師、數(shù)據(jù)科學(xué)家、數(shù)據(jù)分析師能夠更好地在大數(shù)據(jù)的平臺(tái)上使用人工智能技術(shù)。
BigDL是將英特爾大數(shù)據(jù)平臺(tái)與人工智能結(jié)合的產(chǎn)物,為什么要做這樣的結(jié)合呢?
戴金權(quán)介紹了三個(gè)趨勢(shì)。

第一個(gè)趨勢(shì),今天深度學(xué)習(xí)的發(fā)展很大程度上是由于數(shù)據(jù)規(guī)模來(lái)推動(dòng)的。由下圖可見(jiàn),隨著橫坐標(biāo)數(shù)據(jù)規(guī)模的增長(zhǎng),縱坐標(biāo)顯示的神經(jīng)網(wǎng)絡(luò)模型就越有效,越準(zhǔn)確。任何深度學(xué)習(xí)的系統(tǒng)、框架、應(yīng)用都要能夠處理大規(guī)模的數(shù)據(jù)。

第二個(gè)趨勢(shì)是業(yè)界大數(shù)據(jù)的發(fā)展,不管是互聯(lián)網(wǎng)公司還是傳統(tǒng)企業(yè),大家都以Apache Hadoop建立起數(shù)據(jù)平臺(tái),這個(gè)平臺(tái)聚集大家處理過(guò)的和未處理的數(shù)據(jù),從而你能夠?qū)⒏鞣N數(shù)據(jù)的處理、分析和應(yīng)用,應(yīng)用到這個(gè)平臺(tái)上。從這個(gè)意義上說(shuō),任何數(shù)據(jù)處理和分析的框架、應(yīng)用,包括深度學(xué)習(xí)的應(yīng)用,都要能夠非常好地和Apache Hadoop為標(biāo)準(zhǔn)的數(shù)據(jù)平臺(tái)交互。

第三個(gè)趨勢(shì),深度學(xué)習(xí)的模型只是整個(gè)流程的一部分,要構(gòu)建和應(yīng)用深度學(xué)習(xí)模型,還有數(shù)據(jù)的導(dǎo)入、數(shù)據(jù)清洗、特征提取、對(duì)整個(gè)集群的資源的管理和各個(gè)應(yīng)用之間對(duì)這個(gè)資源的共享等,這些工作事實(shí)上占據(jù)了機(jī)器學(xué)習(xí)或者深度學(xué)習(xí)這樣一個(gè)工業(yè)級(jí)應(yīng)用開(kāi)發(fā)的大部分的時(shí)間和資源。所以,數(shù)據(jù)處理、機(jī)器學(xué)習(xí),以及算法必須很好地和現(xiàn)有的大數(shù)據(jù)處理的工作流整合在一起。

戴金權(quán)深刻感覺(jué)到,在大數(shù)據(jù)處理工作和深度學(xué)習(xí)模型算法之間有很大的斷層。深度學(xué)習(xí)頂尖研究人員不斷在突破模型,但是數(shù)據(jù)科學(xué)家、分析師、普通用戶(hù)卻很難將模型應(yīng)用到現(xiàn)實(shí)的生產(chǎn)環(huán)境當(dāng)中去。深度學(xué)習(xí)處理的一大瓶頸就是數(shù)據(jù),特別是生產(chǎn)數(shù)據(jù),都是采用分布式存儲(chǔ),很難將其拷貝到另一個(gè)環(huán)境再來(lái)進(jìn)行處理。

在戴金權(quán)看來(lái),Apache Spark是業(yè)界最廣泛應(yīng)用的分布式集群計(jì)算引擎,它里面有大量的對(duì)數(shù)據(jù)分析處理的組件,比如說(shuō)SQL的處理、實(shí)時(shí)流的處理,還有進(jìn)行圖分析的庫(kù)。
基于Spark推出的BigDL是Spark上標(biāo)準(zhǔn)的庫(kù)、標(biāo)準(zhǔn)的組件,能夠和這些大數(shù)據(jù)、生態(tài)系統(tǒng)里面的不同的分析、處理的組件非常好地整合在一起。BigDL與目前主流的深度學(xué)習(xí)框架Caffe、Torch、TensorFlow所能實(shí)現(xiàn)的功能相同。雖然市面上已經(jīng)有主流的深度學(xué)習(xí)框架,英特爾推出BigDL則是因?yàn)榭吹搅藢⒋髷?shù)據(jù)分析與人工智能結(jié)合起來(lái)的一個(gè)空白點(diǎn)。BigDL可以直接在現(xiàn)有的Hadoop和Spark的集群上運(yùn)行,不需要對(duì)集群做任何修改。
戴金權(quán)告訴雷鋒網(wǎng):“我們看到有另外一個(gè)很重要的應(yīng)用場(chǎng)景,沒(méi)有被這些現(xiàn)有的框架所覆蓋到,我們有大量spark用戶(hù),從2007年開(kāi)始開(kāi)源開(kāi)發(fā),十年間已經(jīng)成為了業(yè)內(nèi)數(shù)據(jù)存儲(chǔ)處理分析的標(biāo)準(zhǔn),大家都已經(jīng)建立了大數(shù)據(jù)集群,上面有大量的數(shù)據(jù),集群可能幾千臺(tái),互聯(lián)網(wǎng)公司可能幾萬(wàn)臺(tái)這樣的規(guī)模。
為了深度學(xué)習(xí)和人工智能應(yīng)用,難道是要把這套大數(shù)據(jù)集群完全拋棄,再另外建一套新的系統(tǒng)嗎?我覺(jué)得其實(shí)并不是一個(gè)最合理的路徑,從某種意義上來(lái)說(shuō),應(yīng)該在你現(xiàn)有的大數(shù)據(jù)的平臺(tái),大數(shù)據(jù)的集群上面,能夠?qū)⑿碌纳疃葘W(xué)習(xí)、人工智能的技術(shù),能夠加進(jìn)來(lái)?!?nbsp;

自2017年1月英特爾開(kāi)源BigDL起,已經(jīng)有廣泛的合作案例。在去年年中,戴金權(quán)的團(tuán)隊(duì)在Apache Spark和BigDL的基礎(chǔ)上又構(gòu)建了Analytics Zoo大數(shù)據(jù)分析和人工智能的平臺(tái)。
差不多是在BigDL開(kāi)源半年后,戴金權(quán)開(kāi)始著手Analytics Zoo的構(gòu)建。他談到,在跟很多客戶(hù)合作BigDL時(shí),他感到,BigDL、Tensorflow這些框架里最終的AI應(yīng)用還是有很長(zhǎng)的距離。
應(yīng)用開(kāi)發(fā)本身是非常復(fù)雜的工作流水線,戴金權(quán)思考如何才能提供像Spark上的Streaming這樣很方便地對(duì)特征進(jìn)行處理的流水線,提供內(nèi)置的模型、特征工程操作、遷移學(xué)習(xí)的流水線的支持。Analytics Zoo正是這樣一個(gè)更高級(jí)別的數(shù)據(jù)分析+AI平臺(tái),能夠利用Spark的各種流水線、內(nèi)置模型、特征操作等,方便用戶(hù)構(gòu)建深度學(xué)習(xí)端到端應(yīng)用。
某種意義上它是Spark和BigDL的擴(kuò)充,它的目的是方便用戶(hù)開(kāi)發(fā)基于大數(shù)據(jù)端到端學(xué)習(xí)的應(yīng)用,除了內(nèi)置的模型、內(nèi)置的一些非常簡(jiǎn)單的操作之外,它里面還提供了大量的高級(jí)的流水線的支持,能夠使用Spark DataFrames、ML Pipelines的深度學(xué)習(xí)流水線,能夠通過(guò)遷移學(xué)習(xí)的API構(gòu)建API模型的定義,在這個(gè)基礎(chǔ)上就可以很方便地將我們提供的Model Zoo的模型甚至端到端的參考應(yīng)用,比如說(shuō)異常檢測(cè)等等,可以通過(guò)非常少的代碼,使用這些高級(jí)的API,并且使用內(nèi)置的模型,很方便地就能將一個(gè)端到端的大數(shù)據(jù)分析加上深度學(xué)習(xí)的應(yīng)用構(gòu)建起來(lái)。
戴金權(quán)介紹了用戶(hù)如何使用Analytics Zoo for BigDL在他們現(xiàn)有的大數(shù)據(jù)集群,通常是有非常大規(guī)模的至強(qiáng)的處理器上應(yīng)用大數(shù)據(jù)的集群或者平臺(tái)上,構(gòu)建新的深度學(xué)習(xí)的應(yīng)用。
目前,BigDL和Analytics Zoo的技術(shù)能在包括AWS、阿里云、百度云等幾乎所有的公有云平臺(tái)上使用。

第一個(gè)例子是英特爾與京東展開(kāi)的合作。京東有大概幾億張的圖片存儲(chǔ)在分布式存儲(chǔ)系統(tǒng)當(dāng)中,他們想要把這幾億張圖片從大數(shù)據(jù)系統(tǒng)里面讀出來(lái),然后對(duì)它進(jìn)行處理。在這個(gè)案例中,用了SSD的模型來(lái)試圖識(shí)別圖片里面有什么物品,探后再用DeepBit的模型,將物品的特征提取出來(lái)。原來(lái)京東已經(jīng)在GPU卡上做了一些應(yīng)用,但是這里面有一些問(wèn)題,包括如何處理端到端數(shù)據(jù)的流水線,包括如何提高端到端處理的效率。戴金權(quán)介紹到,“當(dāng)我們把整個(gè)處理的應(yīng)用遷移到Spark和BigDL平臺(tái)上,可以看到它提升了很多的運(yùn)維的效率,使用BigDL/Spark在Intel Xeon(英特爾至強(qiáng)可擴(kuò)展處理器)集群有效擴(kuò)展,取得相對(duì)于GPU集群3.8倍性能提升?!?nbsp;
AI的三個(gè)核心點(diǎn)在大數(shù)據(jù)、算法、算力,現(xiàn)在很多人認(rèn)為要有足夠的AI算力,非GPU不可。京東的這個(gè)案例體現(xiàn)了BigDL與英特爾至強(qiáng)可擴(kuò)展處理器配合,對(duì)整體深度學(xué)習(xí)表現(xiàn)的提升。戴金權(quán)告訴雷鋒網(wǎng),京東這個(gè)案例一開(kāi)始是建立在多個(gè)GPU之上的,他們的團(tuán)隊(duì)在Caffe上訓(xùn)練,在開(kāi)發(fā)、部署、性能方面都碰到問(wèn)題。英特爾將京東方面遷移到Spark上面,跑在1200個(gè)邏輯的核,一臺(tái)服務(wù)器支持50個(gè)邏輯,大致用了24臺(tái)服務(wù)器,利用Spark這樣的端到端流水線處理,與之前用GPU的方案相比可以達(dá)到差不多3.8倍的性能提升。

第二個(gè)案例是英特爾和MLSListings合作的案例,他們是加州的不動(dòng)產(chǎn)交易商,他們可以識(shí)別用戶(hù)瀏覽的房屋圖片,為用戶(hù)推薦相似的房屋。這套系統(tǒng)構(gòu)建在Microsoft Azure上。

第三個(gè)案例是和世界銀行在AWS上合作。世界銀行通過(guò)志愿者上傳的世界各地的食物圖片,幫助大家來(lái)分析在世界各地的物價(jià)水平。其中如何通過(guò)大數(shù)據(jù)處理對(duì)圖片進(jìn)行清洗、處理,再用遷移學(xué)習(xí)來(lái)構(gòu)建圖片分類(lèi)模型是值得關(guān)注的問(wèn)題。

第四個(gè)案例是與UCSF的合作,通過(guò)3D的模型對(duì)醫(yī)療圖象進(jìn)行分類(lèi),首先對(duì)3D的MRI照片進(jìn)行識(shí)別,然后對(duì)它進(jìn)行分類(lèi),可以試圖診斷膝蓋上面的一些病癥。

第五個(gè)案例是們和Cray公司(美國(guó)做超級(jí)電腦的公司)合作。合作內(nèi)容是做近期的降水云圖的預(yù)測(cè),通過(guò)Seq2Seq的模型,把過(guò)去一小時(shí)的衛(wèi)星云圖做了一個(gè)序列,輸入到模型里面,能幫預(yù)測(cè)下一個(gè)小時(shí)每10分鐘這個(gè)衛(wèi)星云圖的變化,通過(guò)這個(gè)來(lái)進(jìn)行一些降水的分析。

第六個(gè)案例是和GigaSpaces合作的通過(guò)基于自然語(yǔ)言處理對(duì)呼叫中心進(jìn)行管理。當(dāng)有用戶(hù)打電話進(jìn)來(lái),把其語(yǔ)音轉(zhuǎn)成文本以后,導(dǎo)入到BigDL系統(tǒng)里面,然后對(duì)它進(jìn)行實(shí)時(shí)的流式處理,使用BigDL上的文本分類(lèi)模型可以知道用戶(hù)打電話進(jìn)來(lái)是為什么,他是Windows出了問(wèn)題還是Mac出了問(wèn)題,自動(dòng)就會(huì)把呼叫中心的電話錄入到不同的部門(mén)。

最后,戴金權(quán)總結(jié)到,英特爾致力于端到端全棧人工智能解決方案。BigDL和Anaylitics Zoo致力于架起大數(shù)據(jù)和人工智能之間的橋梁,當(dāng)用戶(hù)已有基于Apache的大數(shù)據(jù)集群,就可以很方便地進(jìn)行大數(shù)據(jù)分析和上人工智能應(yīng)用,不僅能夠有更高的資源利用率,還可以提升端到端的開(kāi)發(fā)效率,以及提升部署效率。
相關(guān)文章:
英特爾AI事業(yè)部三位負(fù)責(zé)人講解:AI技術(shù)如何落地應(yīng)用
發(fā)布新一代NNP芯片外,英特爾AI軟件和應(yīng)用更透露其AI野心
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。
本專(zhuān)題其他文章