0
本文作者: 劉偉 | 2018-07-25 17:04 | 專題:2018 CCF-GAIR 全球人工智能與機(jī)器人峰會 |
雷鋒網(wǎng)按:2018 全球人工智能與機(jī)器人峰會(CCF-GAIR)在深圳召開,峰會由中國計算機(jī)學(xué)會(CCF)主辦,雷鋒網(wǎng)、香港中文大學(xué)(深圳)承辦。
本次大會共吸引超過2500余位 AI 業(yè)界人士參會,其中包含來自全球的 140 位在人工智能領(lǐng)域享有盛譽的演講與圓桌嘉賓。
大會第三天的【AI+專場】中,美國德州農(nóng)工大學(xué)數(shù)據(jù)挖掘?qū)嶒炇抑魅魏鷤b,永輝云計算聯(lián)合創(chuàng)始人兼CTO、前華為美研首席架構(gòu)師兼CTO胡魯輝,乂學(xué)教育首席科學(xué)家崔煒,中興力維首席技術(shù)官曹友盛等重磅嘉賓先后發(fā)表精彩演講,分享AI在各自領(lǐng)域的落地實踐經(jīng)驗。
其中永輝云計算聯(lián)合創(chuàng)始人兼CTO胡魯輝作為第二位出場的嘉賓,發(fā)表了題為《機(jī)器學(xué)習(xí)融合大數(shù)據(jù)》的主題演講。
胡魯輝老師在演講中指出,這一次人工智能浪潮的興起與大數(shù)據(jù)密切相關(guān)。過去大家覺得大數(shù)據(jù)很火但價值不大,是因為沒有形成閉環(huán)。他認(rèn)為,未來大數(shù)據(jù)會朝著實時智能數(shù)據(jù)的方向發(fā)展。所謂實時智能數(shù)據(jù)應(yīng)當(dāng)從用戶的角度從發(fā),包含實時批流計算、隨時可得、數(shù)據(jù)智能化、實時決策和安全共享五大特點。
胡魯輝老師還特別強(qiáng)調(diào),未來應(yīng)該加強(qiáng)數(shù)據(jù)安全共享,因為數(shù)據(jù)雖然重要,但它不是黃金,如果現(xiàn)在不用、不分享就會不斷貶值。
隨后,他從微軟大數(shù)據(jù)平臺和永輝云計算兩個案例從發(fā),分享了自己在促進(jìn)機(jī)器學(xué)習(xí)與大數(shù)據(jù)融合方面的實踐經(jīng)驗。
以下是胡魯輝老師的全部演講內(nèi)容,雷鋒網(wǎng)做了不改變原意的整理與編輯:
大家下午好!剛才胡俠教授從學(xué)術(shù)角度做了精彩的分享。我來自工業(yè)界,所以跟大家分享一下人工智能在工業(yè)界的應(yīng)用。今天的分享主要包括兩個方面:一是機(jī)器學(xué)習(xí)和大數(shù)據(jù)怎么融合,二是融合之后怎么應(yīng)用到工業(yè)中。我會列舉兩個例子:一個是微軟的場景,另一個是智慧零售的場景。
首先回顧一下科技的發(fā)展歷程。過去幾十年,基本每十年就會有一個大的技術(shù)突變。85年微軟發(fā)布第一個操作系統(tǒng)Windows開啟了PC時代,94、95年Amazon.com、Yahoo先后發(fā)布,宣告進(jìn)入互聯(lián)網(wǎng)時代;07年蘋果手機(jī)發(fā)布,又開啟了移動時代,直到2015年人工智能時代開啟。這些突變的價值一次比一次大,基本每一次突變的價值都是上一次的10倍。人工智能有些例外,它的價值是上一次技術(shù)突變的2倍左右。
今天人工智能概念非?;馃?,也已經(jīng)在一些領(lǐng)域落地應(yīng)用了,但規(guī)模不大,所以大家可能感受不到它的巨大價值。但大家不妨回想下98年的互聯(lián)網(wǎng)是什么樣的,當(dāng)時的互聯(lián)網(wǎng)和今天的人工智能很像——雖然很熱,但規(guī)模不大。所以大家要對未來充滿信心。
人工智能在朝兩個方向發(fā)展:一是學(xué)術(shù)研究,包括TensorFlow、Torch等很多工具和平臺;二是行業(yè)應(yīng)用,包含IaaS和AI Edge兩個方面,IaaS即Intelligence as a Service,AI Edge則擁有很多應(yīng)用場景。學(xué)術(shù)研究和工業(yè)應(yīng)用中間是Cloud AI,通過云化或平臺化的方式來提升人工智能的能力。
這一次人工智能浪潮的興起和大數(shù)據(jù)密不可分,沒有大數(shù)據(jù),這一次人工智能浪潮就不會到來。例如Fraud Detection、Content Recommendation、Cognitive Assistance等的應(yīng)用都和大數(shù)據(jù)密切相關(guān)。
大數(shù)據(jù)的演變經(jīng)歷了Batch Processing、Stream Processing兩個階段,其中Batch Processing主要應(yīng)用在報表上,Stream Processing則主要應(yīng)用于報警。
大家或許會有這樣一種感覺——大數(shù)據(jù)很火,但價值卻不大。這是為什么呢?因為在許多場景中,它還沒有形成閉環(huán)。只有讓它成為業(yè)務(wù)的關(guān)鍵,才能體現(xiàn)更大的價值。
大數(shù)據(jù)未來會如何發(fā)展呢?我認(rèn)為大數(shù)據(jù)的下一個階段是實時智能數(shù)據(jù)(Real-time Intelligent Data),不是以技術(shù)角度定義大數(shù)據(jù),而是從用戶體驗的角度來定義。具體包含五個方面:
1.實時批流計算。所謂實時不是從數(shù)據(jù)或技術(shù)層面,而是從用戶的角度來定義,即用戶什么時候想用,數(shù)據(jù)就能產(chǎn)生結(jié)果。
2.數(shù)據(jù)結(jié)果隨時可得。如果數(shù)據(jù)量很大,如何也能快速得到結(jié)果?
3.數(shù)據(jù)和智能完全融合。
4.如何讓數(shù)據(jù)做到閉環(huán),也就是實時決策。
5.數(shù)據(jù)安全共享,這一點非常重要。我在國內(nèi)發(fā)現(xiàn)一個很有意思的現(xiàn)象:大家都認(rèn)為數(shù)據(jù)很重要,所以握在手里不分享。數(shù)據(jù)確實很重要,但它不是黃金,如果現(xiàn)在不用、不分享就會不斷快速貶值,因為每年產(chǎn)生的數(shù)據(jù)無論量還是豐富性都在快速增長。
下面列舉兩個機(jī)器學(xué)習(xí)和大數(shù)據(jù)融合的案例。
下圖展示了微軟的實時大數(shù)據(jù)平臺。在這個平臺上我們主要實現(xiàn)了兩點功能:一是可配置,即在數(shù)據(jù)采集、展示、存儲、計算方面都是可配置的;二是實時性。這里的“實時”指的不是流處理,關(guān)鍵的是實時搜索能力。站在用戶的角度,如果你需要什么結(jié)果,搜索是更好的方法。
我們在這個大數(shù)據(jù)平臺里結(jié)合了許多人工智能的算法。我們知道,微軟有很多的產(chǎn)品和服務(wù),那么如何維護(hù)它們呢?微軟有System Center,下面的圖表列舉了微軟所有的產(chǎn)品部門。
微軟的產(chǎn)品出了問題怎么辦?微軟常常用Knowledge Base來解決。這對微軟來說是很大的市場,規(guī)模每年差不多有50億美元。而且這件事相當(dāng)復(fù)雜,Knowledge Base有20萬個。我們利用人工智能,根據(jù)用戶信息,有效地把解決方案和問題自動聯(lián)系起來了,這是一件非常了不起的事情。
微軟的產(chǎn)品、服務(wù)器、企業(yè)服務(wù)軟件都會產(chǎn)生很多的機(jī)器數(shù)據(jù),另外也有一些人為配置數(shù)據(jù)。根據(jù)這些機(jī)器數(shù)據(jù)和配置數(shù)據(jù),把問題和解決方案自動聯(lián)系起來,這就是我們做到的事情。
我們具體是怎么做的呢?我們把大數(shù)據(jù)平臺和客戶數(shù)據(jù)中心(服務(wù)和設(shè)備都在客戶數(shù)據(jù)中心)通過混合云的方式鏈接起來,然后在平臺上運用人工智能的方法。
前面提到,微軟有20萬個Knowledge Base,這個東西是文檔,處理起來有很大的挑戰(zhàn)。我們是如何把這些文檔或解決方案的文字轉(zhuǎn)化成對應(yīng)特定場景的問題,一步步解析出來,幫助用戶解決問題的呢?
我們主要做了兩步工作:第一步是做線下NLP的Index,將20萬個Knowledge Base進(jìn)行分類處理,放在大數(shù)據(jù)平臺;第二步是數(shù)據(jù)采集和實時分析,這一步的算法和第一步差不多,也應(yīng)用了類似的NLP技術(shù)。但二者針對的數(shù)據(jù)不同,第一步處理的Knowledge Base是文檔式的;第二步處理的是客戶數(shù)據(jù),是另一方面的數(shù)據(jù)。我們用類似的NLP算法處理實時數(shù)據(jù),產(chǎn)生一個fingerprint,然后把這個fingerprint與index里的Knowledge Base進(jìn)行匹配。
比如,機(jī)器出現(xiàn)問題時會產(chǎn)生一堆logging,這些logging可以反映出某種特定的場景。于是我們根據(jù)這些logging生成一個fingerprint,再到Knowledge Base的index平臺搜索匹配。有時候我們會搜索出很多個結(jié)果,這時候就需要特定的ranking來優(yōu)化。
這件事看似簡單,其實蘊含著很多挑戰(zhàn),下圖列舉了四個方面。比如對KB articles的NLP:微軟的產(chǎn)品相當(dāng)之多,有Windows Server, Exchange Server等至少七八種Servers,每個Server都相當(dāng)復(fù)雜,處理起來比較困難。
再跟大家分享一個大數(shù)據(jù)和人工智能融合應(yīng)用于零售領(lǐng)域的案例。
隨著消費升級、消費者行為變化,零售行業(yè)已經(jīng)發(fā)生了巨變。早期60、70后是消費主力,現(xiàn)在消費主力漸漸成了80、90后。
如果說傳統(tǒng)零售是零售的1.0模式,那么新興大賣場和互聯(lián)網(wǎng)電商就分別是2.0和3.0模式。1.0模式以貨為中心,只要有好的貨就能賣得很好;2.0和3.0模式?jīng)]有本質(zhì)區(qū)別,主要是靠渠道和流量,只要有流量就能賣得很好?,F(xiàn)在我們進(jìn)入了零售4.0模式,也就是以人為本、以服務(wù)為中心的零售模式。
這個模式有很大的不同,因為消費者更加追求個性化、社交化、口碑化,更加在乎服務(wù)品質(zhì),不再是什么便宜買什么。
過去線上有電商,線下有門店,如果把線上、線下融合起來,就能給消費者帶來更大的便利。比如我去一家門店買東西,我想買很多東西,又嫌?xùn)|西太重不想拿,怎么辦?現(xiàn)在只要在APP上下單,門店就可以把商品配送到家,這就是典型的線上、線下融合。
過去電商解決了信息不對稱的問題,但用戶體驗商品還是比較困難。假如我有一個體驗店,消費者可以先到體驗店試用,再到線上下單購買,就解決了這個問題。這些是線上、線下融合的例子。
不管怎么說,零售行業(yè)應(yīng)該回歸到了本質(zhì)——以人為本。如何做好服務(wù)、讓消費者滿意成為了零售行業(yè)的重點。
再來看一下永輝云計算是怎么做的。
永輝云計算是在永輝和騰訊平臺上搭建的面向零售的智慧云。它的使命是運用云計算、大數(shù)據(jù)和人工智能賦能零售行業(yè),以人為本,以服務(wù)為中心,讓消費者更滿意。
門店和電商在很多方面有著本質(zhì)區(qū)別。首先,對電商來說數(shù)據(jù)是天生的,采集也比較容易。但對門店和超市來說,數(shù)據(jù)雖然很多,但形式各不相同,如何全面數(shù)據(jù)化是一個巨大的挑戰(zhàn)。
不過凡事都有兩面性,線上數(shù)據(jù)采集雖然容易,但數(shù)據(jù)的真實性不一定可靠。比如你幫朋友買東西,雖然是你下的單,但你朋友才是最后使用商品的人。門店的數(shù)據(jù)則相對真實,人工智能可以精準(zhǔn)識別到你的行為。
大數(shù)據(jù)和人工智能在零售行業(yè)有很多的應(yīng)用場景。
比如,合伙制是零售行業(yè)一種比較創(chuàng)新,也比較能激發(fā)員工動力的管理方法。如果能夠有效利用大數(shù)據(jù),通過信息聯(lián)通、透明化,進(jìn)行智能化的管理,將比人工管理更加有效。
另外,大數(shù)據(jù)可以加深對用戶的理解,實現(xiàn)更加精準(zhǔn)化的營銷。我們經(jīng)常把商品簡單理解成SKU,但其實并沒有這么簡單,它還涉及很多東西,比如商品從何而來、怎么庫存和哪些因素相關(guān)。這是一個生命周期的管理,過程中的數(shù)據(jù)非常富有挑戰(zhàn),而且意義重大。
物流也是大數(shù)據(jù)和人工智能非常好的應(yīng)用場景,它的數(shù)據(jù)化也比較重要。
還有前端的線上、線下融合。消費者進(jìn)店的時候手里還有一個端口,比如小程序、APP。如何把這個端口有效的數(shù)據(jù)化,也是我們正在探索的。
數(shù)據(jù)化之后,下一步是數(shù)據(jù)智能,把數(shù)據(jù)和人工智能融合起來,讓比較復(fù)雜的場景可預(yù)測。
最后一步是智慧賦能,即通過數(shù)據(jù)和智能的融合,賦能真實的應(yīng)用場景。比如智慧選址,假如你要開一千家店,選址是一個非常龐大的工作量,用大數(shù)據(jù)和人工智能選址,既有效又能節(jié)省成本。再比如,以前需要在POS機(jī)上刷卡支付,現(xiàn)在通過刷臉就能支付,登記一下就可以拿著東西走人。諸如此類,很多場景都可以將數(shù)據(jù)化和人工智能有效結(jié)合起來。
我今天的分享就到這里,謝謝大家。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。
本專題其他文章