丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
金融科技 正文
發(fā)私信給溫曉樺
發(fā)送

0

數(shù)據(jù)驅(qū)動(dòng)人工智能的實(shí)踐 | 雷鋒網(wǎng)公開課

本文作者: 溫曉樺 2017-02-18 00:49 專題:雷峰網(wǎng)公開課
導(dǎo)語(yǔ):金融、醫(yī)療、營(yíng)銷……數(shù)據(jù)驅(qū)動(dòng)的AI框架,可以帶來哪些作用?AI如何在這些應(yīng)用領(lǐng)域落地?

隨著時(shí)間的推移,人工智能(AI)技術(shù)已經(jīng)形成學(xué)術(shù)與產(chǎn)業(yè)聯(lián)動(dòng)發(fā)展、向前推進(jìn)的態(tài)勢(shì)。不管是說風(fēng)口還是機(jī)遇,AI對(duì)科技產(chǎn)業(yè)創(chuàng)新的力量不言而喻,而在該領(lǐng)域積累了相關(guān)技術(shù)實(shí)力的研究者、企業(yè)創(chuàng)新者也希望趕上時(shí)代的列車。本次雷鋒網(wǎng)AI金融專場(chǎng)硬創(chuàng)公開課第一期,我們邀請(qǐng)到百度金融首席數(shù)據(jù)科學(xué)家丁磊博士,來分享他關(guān)于人工智能技術(shù)在商業(yè)領(lǐng)域的深度思考。

嘉賓簡(jiǎn)介

丁磊博士是百度金融首席數(shù)據(jù)科學(xué)家,曾任職匯百川征信CTO,及PayPal全球消費(fèi)者數(shù)據(jù)科學(xué)部負(fù)責(zé)人。丁博士曾在斯坦福大學(xué)學(xué)習(xí)管理,先后在哥倫比亞大學(xué)和IBM Watson研究院工作,具有在大數(shù)據(jù)、金融等領(lǐng)域十多年的從業(yè)經(jīng)驗(yàn),在人工智能和大規(guī)模機(jī)器學(xué)習(xí)等領(lǐng)域有豐富的成果。

數(shù)據(jù)驅(qū)動(dòng)人工智能的實(shí)踐 | 雷鋒網(wǎng)公開課

右一為丁磊博士

以下是雷鋒網(wǎng)對(duì)演講進(jìn)行了不改變?cè)獾木庉嫞?/p>

晚上好,感謝大家在周五的晚上和我們一起探討人工智能這個(gè)話題。我在國(guó)內(nèi)外從事AI有十來年,涉及了AI在多媒體理解、社交、廣告、營(yíng)銷、金融等領(lǐng)域的產(chǎn)品與研發(fā)工作。在這兒,我想跟大家分享一些自己的從業(yè)思考。

數(shù)據(jù)驅(qū)動(dòng)的AI框架,可以帶來哪些作用?

說到數(shù)據(jù),毋庸置疑,是咱們這個(gè)時(shí)代很重要的資產(chǎn)。大家常說大數(shù)據(jù)有“3V”:volume,數(shù)據(jù)量,從TB到PB甚至更大的數(shù)據(jù)。variety,多樣性,包括結(jié)構(gòu)化,半結(jié)構(gòu)化,非結(jié)構(gòu)化的數(shù)據(jù)。velocity,速度方面,包括批處理,準(zhǔn)實(shí)時(shí),實(shí)時(shí)的數(shù)據(jù)。

如果說數(shù)據(jù)是原油,那么我想,AI就是從原油中提煉各種高價(jià)值產(chǎn)品的加工廠。從數(shù)據(jù)中發(fā)現(xiàn)知識(shí)、洞察、和規(guī)律,這本身并不是一個(gè)新的概念,從開普勒的時(shí)代就有,那就是開普勒從幾百頁(yè)的天體位置數(shù)據(jù),在當(dāng)時(shí)算是大數(shù)據(jù)中,提煉、總結(jié)出了天體運(yùn)動(dòng)的三定律,現(xiàn)在還在被使用,也就是我們熟知的開普勒三定律?,F(xiàn)在,AI幫助我們實(shí)現(xiàn)了的是,借助大規(guī)模云計(jì)算的方法,從海量數(shù)據(jù)中自動(dòng)學(xué)習(xí)知識(shí)和規(guī)律。做好AI并不容易,接下里我會(huì)跟大家詳細(xì)探討一些經(jīng)驗(yàn)。

作為數(shù)據(jù)驅(qū)動(dòng)的AI框架,可以給我們帶來哪些作用?總的來說:

  • 首先,它可以帶來個(gè)性化的體驗(yàn)。例如當(dāng)我們進(jìn)入到一些網(wǎng)站,可能會(huì)發(fā)現(xiàn)許多個(gè)性化的針對(duì)每個(gè)人的體驗(yàn),這些體驗(yàn)讓網(wǎng)站不再是千人一面,通過數(shù)據(jù)驅(qū)動(dòng)的AI框架可以為每一位訪客做出優(yōu)化。

  • 其次,作為一個(gè)數(shù)據(jù)驅(qū)動(dòng)的AI框架,可以帶來細(xì)粒度的行業(yè)策略,企業(yè)可以采用精細(xì)化的運(yùn)營(yíng)方法。相對(duì)于個(gè)性化的體驗(yàn)來說,細(xì)粒度的行業(yè)策略更側(cè)重于企業(yè)端。例如,過去做營(yíng)銷,一個(gè)產(chǎn)品的適用人群可能是一定范圍內(nèi)的男性或者女性,這是一個(gè)比較粗的描述。用數(shù)據(jù)驅(qū)動(dòng)的AI框架以后,我們可以得到一個(gè)比較細(xì)的描述,比如我們可以理解基于年齡、興趣愛好、行為等因素的目標(biāo)客戶群,從而得到細(xì)粒度的營(yíng)銷策略。

  • 第三,作為一個(gè)數(shù)據(jù)驅(qū)動(dòng)的AI框架,可以帶來知識(shí)和洞察。我們?nèi)W(xué)校或者在經(jīng)驗(yàn)中都可以學(xué)習(xí)到知識(shí)。那么,數(shù)據(jù)驅(qū)動(dòng)的AI框架帶給我們的核心價(jià)值是持續(xù)地運(yùn)營(yíng)化地從大數(shù)據(jù)中挖掘知識(shí)、學(xué)習(xí)知識(shí)的能力。這個(gè)知識(shí)未必是寫在教科書上的,而從數(shù)據(jù)中可以實(shí)時(shí)地、最大體量地、同時(shí)也是有效地獲得知識(shí),用于生產(chǎn)和業(yè)務(wù)實(shí)踐中。類似地,從數(shù)據(jù)中獲得的洞察也可以帶來同樣的價(jià)值。   

說完這三點(diǎn),接下來談?wù)劥罱≒ayPal AI平臺(tái)的經(jīng)驗(yàn)。從2012年到2015年底,我?guī)ьI(lǐng)團(tuán)隊(duì)構(gòu)建了AI平臺(tái)并服務(wù)于全球數(shù)億的用戶和百萬(wàn)級(jí)的商家,優(yōu)化了他們的購(gòu)物體驗(yàn)。通過AI平臺(tái),作為商家可以運(yùn)營(yíng)化地預(yù)測(cè)用戶的行為從而精準(zhǔn)的和他們對(duì)話。

具體而言,AI平臺(tái)包括:動(dòng)機(jī)引擎、推薦引擎、以及優(yōu)化客戶生命周期的NBA(Next Best Action)引擎。這幾個(gè)引擎部署在基于Hadoop和Spark的大數(shù)據(jù)平臺(tái)之上,跟海量的底層數(shù)據(jù)無縫銜接。其中,

動(dòng)機(jī)引擎通過AI技術(shù),預(yù)測(cè)用戶在某一個(gè)時(shí)間點(diǎn)的行為,包括點(diǎn)擊廣告、兌現(xiàn)優(yōu)惠卷、購(gòu)買商品等。


推薦引擎連接用戶和他可能感興趣的商家或商品,做出恰當(dāng)?shù)耐扑]。


NBA引擎則通過AI技術(shù)優(yōu)化在每一個(gè)時(shí)間點(diǎn),商家采用什么樣的策略,能夠最有效的與用戶互動(dòng)。

那么這個(gè)AI平臺(tái)如何發(fā)展起來的呢?首先,需要理解業(yè)務(wù)的需求和KPI,整合相關(guān)數(shù)據(jù)集,然后建立基于回測(cè)的概念驗(yàn)證,運(yùn)營(yíng)化生產(chǎn)和迭代整個(gè)體系。經(jīng)歷了幾年的歷程,團(tuán)隊(duì)逐漸構(gòu)建了比較完善的AI平臺(tái),為各方帶來了顯著而持續(xù)的收益,也提升的用戶的體驗(yàn)。從效果上來說,AI平臺(tái)使大部分營(yíng)銷活動(dòng)的有效增益提升了2倍以上,有些達(dá)到了數(shù)倍之多。

從DIKW金字塔和人類感官的演化談AI:去平均化的應(yīng)用領(lǐng)域

所謂DIKW金字塔包括四層,即“D-數(shù)據(jù)”,“I-信息”,“K-知識(shí)”,“W-智慧”——每一層代表人類對(duì)客觀世界認(rèn)識(shí)的一個(gè)層面。最底層的是數(shù)據(jù)、上面依次是信息、知識(shí)和智慧,構(gòu)成了金字塔形的結(jié)構(gòu)。

從數(shù)據(jù)到信息是傳統(tǒng)IT比較專注的領(lǐng)域,通過數(shù)據(jù)庫(kù)系統(tǒng)和ETL引擎,主要把相對(duì)粗糙、未經(jīng)整理的數(shù)據(jù)轉(zhuǎn)化為信息。所謂信息即結(jié)構(gòu)化的產(chǎn)物,可以理解為數(shù)據(jù)庫(kù)中的表等實(shí)體的總和。

而信息到知識(shí)是AI所做的事情,這個(gè)轉(zhuǎn)化過程與數(shù)據(jù)庫(kù)運(yùn)算不同,因?yàn)樗皇菣C(jī)械的數(shù)據(jù)處理和整合,而是從信息升華到知識(shí)的過程。

其核心之一是去平均化,這是人工智能幫我們做的很重要的一件事。例如,在營(yíng)銷領(lǐng)域,對(duì)于一個(gè)公司來說,平均客戶價(jià)值是一百元,去平均化的過程告訴我們,不同客戶對(duì)應(yīng)的價(jià)值是不同的。這個(gè)可以通過AI,從過去的客戶行為數(shù)據(jù)等屬性中學(xué)習(xí)出來,建立自學(xué)習(xí)模型,預(yù)測(cè)每個(gè)客戶的價(jià)值是多少。這些都非常有價(jià)值的信息??蛻舻膶?shí)際價(jià)值,可能和與平均值差很遠(yuǎn)。

不光客戶的價(jià)值,客戶是否會(huì)購(gòu)買一件商品,喜歡什么樣的商品,以及如何促成一次購(gòu)買,等等這些問題,都可以通過AI技術(shù)來幫助回答。

去平均化的應(yīng)用領(lǐng)域不僅局限于營(yíng)銷領(lǐng)域,在其他商業(yè)相關(guān)或者醫(yī)學(xué)相關(guān)的其他很多領(lǐng)域,都有很多去平均化的應(yīng)用。好比醫(yī)療領(lǐng)域,基于醫(yī)療病例預(yù)測(cè)得壞血病的概率和再入院的概率,能夠幫助醫(yī)院挽救病人和降低醫(yī)療成本,這些應(yīng)用已經(jīng)在美國(guó)的一些大醫(yī)院里開始使用。

人類感官的演化歷程,如何定義AI系統(tǒng)模擬人腦的復(fù)雜性?

換一個(gè)視角,我們可以看看人類感官的演化歷程,如何定義了AI系統(tǒng)模擬人腦的復(fù)雜性。

眾所周知,計(jì)算機(jī)視覺,包括圖像和視頻識(shí)別等,其難度在感知類別的AI里是比較高的。我想其中一個(gè)原因是,人類視覺系統(tǒng)源自原始動(dòng)物的視覺系統(tǒng),這個(gè)演化時(shí)間最長(zhǎng),超過了2億年。

相比而言,交流用的有聲語(yǔ)言演化了有10萬(wàn)年左右,而文字只演化了5千年左右。這樣的演化歷史,也符合AI處理語(yǔ)音和文本的難易程度。文本理解已經(jīng)相當(dāng)普及,而語(yǔ)音識(shí)別逐漸開始進(jìn)入千家萬(wàn)戶。我想,人工智能的難易程度是符合人類感官演化的。

如此類比,現(xiàn)代的專業(yè)知識(shí),好比金融和醫(yī)療這些領(lǐng)域,它們的演化的時(shí)間不超過幾百年。盡管有種種挑戰(zhàn),這些知識(shí)的演化歷史印證著AI在這些行業(yè)的應(yīng)用,可以取得比較顯著的效果。

數(shù)據(jù)+AI帶來的核心能力:海量數(shù)據(jù)支持下AI決策可以超越人腦

這里引用著名的科技思想家Kevin Kelly的一句話,說“AI是認(rèn)知化”。如果說電力化帶來了人工動(dòng)力,那么認(rèn)知化帶來了人工智能。結(jié)合前面討論的演化觀點(diǎn),我認(rèn)為:感知方面,包括AI的視覺、聽覺等,AI可以接近人腦。在支持專業(yè)決策的方面,在海量數(shù)據(jù)的支持下,甚至可以超越人腦。

舉兩個(gè)例子,分別是圖像識(shí)別和金融風(fēng)險(xiǎn)控制來說明這點(diǎn)。圖像識(shí)別方面,在權(quán)威的ImageNet圖像識(shí)別競(jìng)賽的評(píng)測(cè)里,2010到2015這五年內(nèi),通過深度學(xué)習(xí)一系列的算法,計(jì)算機(jī)對(duì)1000多類物體的識(shí)別——就是讓計(jì)算機(jī)給每張圖片標(biāo)注1000類中的一個(gè)類別,錯(cuò)誤率從30%下降到5%,識(shí)別效果有了非常大的提升。

金融風(fēng)控領(lǐng)域中通過AI輸出模型的KS值,通常用來衡量風(fēng)險(xiǎn)識(shí)別有效性的一個(gè)指標(biāo),也可做到40%-50%甚至更高,有效的控制住風(fēng)險(xiǎn),效果可以超越傳統(tǒng)的人工方法。

數(shù)據(jù),本身反映了事物的原理和規(guī)律。當(dāng)你找到它的規(guī)律后,它可以去預(yù)測(cè)未知或未來的事情。因此,“數(shù)據(jù)+AI”的核心能力為我們構(gòu)建了一個(gè)發(fā)展中的產(chǎn)業(yè)生態(tài)。這個(gè)生態(tài)分為兩層:

  • 底層是應(yīng)用技術(shù),包括機(jī)器學(xué)習(xí)、圖像語(yǔ)音處理、自然語(yǔ)言及一系列相關(guān)的硬件技術(shù)。

  • 而上面一層是和場(chǎng)景相結(jié)合的應(yīng)用,包括兩大類:第一大類面向企業(yè),包括行業(yè)應(yīng)用,例如金融、醫(yī)療、教育等;另外在每個(gè)行業(yè)都有交叉的維度,也就是職能應(yīng)用,例如營(yíng)銷、BI、CRM、安全等相關(guān)的職能。職能應(yīng)用和行業(yè)應(yīng)用構(gòu)成二維的矩陣,AI在其中有很多的應(yīng)用場(chǎng)景。第二大類是消費(fèi)類應(yīng)用,例如智能家居,輔助駕駛,智能機(jī)器人等,在其中AI也開始嶄露頭角。

說了這么多行業(yè)、職能和應(yīng)用領(lǐng)域,其實(shí)不是所有領(lǐng)域都適合大范圍使用AI。滿足大規(guī)模商業(yè)應(yīng)用的AI,應(yīng)具備兩個(gè)必要條件:

  • 其一是數(shù)據(jù)的質(zhì)量和數(shù)量必須達(dá)到一定的要求,尤其是整個(gè)數(shù)據(jù)流程的打通和定期的數(shù)據(jù)更新。這決定了AI發(fā)展的基礎(chǔ)是否牢固;

  • 其二,所在領(lǐng)域有沒有對(duì)問題的相對(duì)清晰的定義。如果領(lǐng)域本身沒有明晰的問題定義,則很難通過AI來解決問題??傮w來說,金融行業(yè)已經(jīng)比較接近這兩點(diǎn)要求;職能來說,營(yíng)銷、BI、CRM和安全等在一些行業(yè)比較接近人工智能大規(guī)模使用的先決條件。

AI落地的挑戰(zhàn)和思路

過去一段時(shí)間,我接觸過很多公司,也發(fā)現(xiàn)其中存在的一些存在共性的挑戰(zhàn)和思路:

第一,數(shù)據(jù)方面,有價(jià)值的數(shù)據(jù)已經(jīng)在你的數(shù)據(jù)庫(kù)里,很多時(shí)候是因?yàn)椴欢萌ネ诰驍?shù)據(jù)價(jià)值,容易錯(cuò)失了利用AI的機(jī)會(huì)。舉個(gè)例子,通過AI預(yù)測(cè)電商網(wǎng)站的訪客價(jià)值。此前我任職的一個(gè)創(chuàng)業(yè)公司,通過AI算法優(yōu)化了全球出行網(wǎng)站每月上億UV的用戶體驗(yàn)。

具體來說,通過一些實(shí)時(shí)抓取的行為數(shù)據(jù),預(yù)測(cè)訪客的購(gòu)買意愿和購(gòu)買價(jià)值。對(duì)不太可能在本站上購(gòu)買的訪客,這個(gè)其實(shí)占的比例非常高,有時(shí)候達(dá)到97%,那么這個(gè)時(shí)候,我們可以推薦給他們其他的可能感興趣的出行產(chǎn)品。這個(gè)產(chǎn)品的結(jié)果是大幅提升了出行網(wǎng)站的收益,并優(yōu)化了用戶的體驗(yàn)??偨Y(jié)一下,如果不能挖掘這些現(xiàn)有數(shù)據(jù)的價(jià)值,就沒法產(chǎn)生這樣的創(chuàng)新模式。

第二,人才方面,我覺得業(yè)界最缺的是AI產(chǎn)品經(jīng)理。跟國(guó)內(nèi)不少公司交流過,AI問題的復(fù)雜性之一在于結(jié)果的不確定性,而具備AI背景的產(chǎn)品經(jīng)理少之又少,不能夠很好地判斷價(jià)值與方向,進(jìn)而會(huì)導(dǎo)致相關(guān)產(chǎn)品或項(xiàng)目的擱置。當(dāng)然這里面也有人才培養(yǎng)的問題,例如可以嘗試鼓勵(lì)優(yōu)秀的AI工程師和科學(xué)家去主導(dǎo)相關(guān)產(chǎn)品的開發(fā),在業(yè)務(wù)的指引下,充分發(fā)揮專業(yè)人才的積極性,探索可行的方向。

第三,跨領(lǐng)域和團(tuán)隊(duì)的交融與整合,打通數(shù)據(jù)的閉環(huán),產(chǎn)品、工程、AI的緊密結(jié)合。這個(gè)需要比較長(zhǎng)時(shí)間的磨合。在我們之前構(gòu)建AI平臺(tái)的經(jīng)歷中,涉及大量跨團(tuán)隊(duì)溝通、配合、相互支持的工作。AI得以有效實(shí)現(xiàn),工程能力的建設(shè)尤為重要。AI不光是算法問題,由于大數(shù)據(jù)的體量、種類和實(shí)時(shí)性要求,如果沒有強(qiáng)大的數(shù)據(jù)處理基礎(chǔ)設(shè)施,很難在大數(shù)據(jù)上進(jìn)行持續(xù)和大規(guī)模的AI應(yīng)用。

舉個(gè)例子,基于實(shí)際的需求,我們常用一種比較受到推崇的“l(fā)ambda”架構(gòu),這個(gè)架構(gòu)包括以下組成部分:

  • 批處理層,支持批處理讀寫和分析處理;

  • 服務(wù)層,支持批處理寫入和實(shí)時(shí)讀取;

  • 速度層,支持實(shí)時(shí)讀寫,把時(shí)效性非常高的數(shù)據(jù)在很短的時(shí)間內(nèi)反應(yīng)給用戶。

  • 這些層整合起來構(gòu)成了一個(gè)可以支撐大規(guī)模AI的基礎(chǔ)設(shè)施。

第四,AI落地中信任的問題。我覺得在解決行業(yè)實(shí)際問題里,很多瓶頸來自于信任的缺乏。信任本身是個(gè)很大的話題,在技術(shù)的層面上,這包括了對(duì)數(shù)據(jù)和對(duì)算法的信任。因此,一定范圍內(nèi)的數(shù)據(jù)共享可以增加信任,并可以帶來全新的知識(shí)和洞察。一個(gè)相關(guān)的技術(shù)——區(qū)塊鏈技術(shù)大家可能有聽說過,簡(jiǎn)單來說是一個(gè)分布式的可信任的數(shù)據(jù)基礎(chǔ)設(shè)施?;谶@項(xiàng)技術(shù)的一個(gè)例子,最近荷蘭16家公司組成的物流區(qū)塊鏈聯(lián)盟,通過這種形式的物流數(shù)據(jù)共享和打通,能夠增加他們彼此間的信任,從中長(zhǎng)期來看更有利于AI的落地。

綜上所述,如果解決了這些問題,我相信企業(yè)會(huì)有比較大的空間利用AI來升級(jí),不僅是行業(yè)中的大企業(yè),中小企業(yè)也有很多的機(jī)會(huì)。運(yùn)用AI領(lǐng)域的最佳實(shí)踐,快速概念驗(yàn)證,風(fēng)險(xiǎn)可控的前提下落地生產(chǎn),我相信將帶來廣闊的空間。

雷鋒網(wǎng)注:本次活動(dòng)為丁博士個(gè)人經(jīng)驗(yàn)分享,觀點(diǎn)不代表百度。

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

分享:
相關(guān)文章
最新文章
請(qǐng)?zhí)顚懮暾?qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說