3
本文作者: 陳伊莉 | 2018-05-29 16:23 |
雷鋒網(wǎng)AI金融評論報道,5月26日,阿里云創(chuàng)始人王堅博士與科技圈11位志愿發(fā)起人共同組織了年度科技創(chuàng)新活動2050大會。在下午由氪信科技CEO朱明杰出品的“人工智能重構(gòu)智能金融”專題論壇上,微軟全球執(zhí)行副總裁、美國工程院院士、前微軟亞洲研究院院長沈向洋,前IDG榮譽合伙人、火山石資本創(chuàng)始人章蘇陽,招商局集團(tuán)創(chuàng)投總經(jīng)理呂克儉等皆受邀出席。
上海交通大學(xué)安泰經(jīng)管學(xué)院助理教授李春曉
期間,上海交通大學(xué)安泰經(jīng)管學(xué)院助理教授李春曉進(jìn)行了“時空序列如何影響營銷和反欺詐”演講。她主要介紹了AI在商業(yè)中的應(yīng)用。比如AI是如何影響商家營銷的,并給出了如何更好地管理公司的建議。據(jù)雷鋒網(wǎng)了解,她的研究領(lǐng)域在于數(shù)據(jù)科學(xué)和行為經(jīng)濟(jì)學(xué)的交叉領(lǐng)域,聚焦于研究數(shù)字技術(shù)下的平臺戰(zhàn)略、用戶行為、財務(wù)激勵和數(shù)據(jù)安全等。
以下是雷鋒網(wǎng)編輯的演講原文,經(jīng)過李春曉確認(rèn):
用三個典型的哲學(xué)問題先開始話題:你是誰?從哪兒來?到哪兒去?
這三個問題很難回答。我們在生活中會接觸到形形色色的人——用戶、客戶、雇員、合作伙伴,這三個問題時時刻刻地縈繞在我們心頭,這也是 People Analytics,即人員分析一直孜孜不倦探討的問題。
再問幾個接地氣的問題:你知道234天以后的下午2點30分你會在哪里做什么嗎?你知道下一次職業(yè)變換在什么時候,是跳槽還是升職?雖然我們可能都不知道,但是AI知道。
之所以會談到這幾個問題,是因為我最近做了研究:不管你自以為的行動有多少自發(fā)性,我們都能夠找出線索并預(yù)測你的路徑。絕大多數(shù)人都是非??深A(yù)測的,因為我們是習(xí)慣的生物。我們的行為,模式和習(xí)慣受到很大因素的影響,挑戰(zhàn)在于它跨越了多個學(xué)科,比如心理學(xué)、腦科學(xué)、人類學(xué),社會學(xué),基因?qū)W,教育學(xué)等。
所以 People Analytics 做的就是把所有這些學(xué)科的研究成果放在一起,結(jié)合大數(shù)據(jù)和分析,利用這些行為和習(xí)慣創(chuàng)造線索,為公司決策、營銷和品牌做出真正有趣的見解。
我們生活在數(shù)據(jù)的社會里,我們遞交的簡歷、合作過的伙伴、就讀的高校、是誰的孩子、誰是我們的孩子,這一條條都集中地記錄在數(shù)字設(shè)備上,同時構(gòu)建成了一條條關(guān)于你、我、他的數(shù)字線索,再由people analytics將這些整合還原出獨一無二的畫像,但看過的人卻比你的朋友更懂你,都會跟你說:對過眼神,就是你。
我們做的很多用戶分析是根據(jù)人們的基礎(chǔ)數(shù)據(jù)、社交數(shù)據(jù)和歷史消費,讓公司確定用戶的已知需求和已知模式。過去十幾年來我們一直在這個戰(zhàn)場上,已經(jīng)碩果累累。
我認(rèn)為下一個戰(zhàn)場在于探求用戶的未知需求,探求用戶的隱藏模式和偏好。這是因為我們想在更合適的時機(jī)、地點、方式去接觸、營銷用戶,創(chuàng)造更大的價值。
“天時、地利、人和”不只是藝術(shù),更是一門科學(xué),這就是People analytics要做的——在大量的人員數(shù)據(jù)的基礎(chǔ)上添加時間序列,空間軌跡,結(jié)合人工智能的技術(shù),去觸碰用戶隱藏的認(rèn)知和思維,你會意識到這是一個巨大的機(jī)會。
接下來我將用四個案例給大家簡化一下流程,深入地分析一下如何利用AI來增強(qiáng)零售界、金融界、服務(wù)界的營銷能力。
“從哪里來,到哪里去”這兩個問題已經(jīng)強(qiáng)調(diào)了地點的重要性,GPS相關(guān)技術(shù)重新定義了地點,而精確的位置數(shù)據(jù)開啟了即時營銷的大門。大家下飛機(jī)下高鐵到杭州時,很多APP會推送“杭州歡迎您”,或者推薦吃喝玩樂的地方。但很多人都沒有去。因為信息太有限,僅僅靠位置信息的推送是不夠完整不夠精確。所以關(guān)聯(lián)內(nèi)容是很重要的。
當(dāng)我們把時間維度加到位置上的時候,視野里會呈現(xiàn)出更清晰的上下文環(huán)境。比如說你在星期一的下午2點走在大街上,這個時候你的左手邊一個音樂酒吧,你的右手邊是星巴克咖啡,這個時候手機(jī)上推送了兩條優(yōu)惠券,你打開一看發(fā)現(xiàn)是酒吧啤酒半價和一杯星巴克星冰樂的半價。這個時候如果你不想把周一下午浪費的話你會選擇什么?星巴克。那換一個時間呢?如果是晚上8點半你同樣收到兩條推送,你們就很有可能兌換酒吧的優(yōu)惠券,和同事們喝上幾杯。
所以在這種情況下時間非常關(guān)鍵,它不僅僅是位置。我們的商家已經(jīng)做了很多基于位置的廣告,但這不夠,用戶有不同的人格,即使同一個地點不同時段的需求也是不同的,你需要把時間和地點結(jié)合起來,然后看人的行為!
天普大學(xué)的Luo xueming教授就營銷的不同時間產(chǎn)生的不同效果做了詳細(xì)的隨機(jī)實地實驗。再比如,我們和國內(nèi)某公司也有過研究,若先增加時間因素,營銷效果會提升,再加地點地理要素,效果也會有所提升。如果同時添加時間和地點,效果提升的幅度更明顯,這就是時間維度的營銷。
更深一層考慮,僅有位置的營銷除了缺少時間概念,還只是靜態(tài)的、“守株待兔”式的營銷模式,而我們需要更加靈活。
基于空序的營銷,以購物中心為例
舉個例子,在一個大型的購物中心,你站在蘋果店門口,如果沒有地理信息位置其他,只能基于通過位置進(jìn)行營銷,可能就會認(rèn)為你要去逛蘋果店會給你推送一條蘋果店相關(guān)的信息或者優(yōu)惠券。其實這里有一個很大的問題——因為你站在蘋果店門口不代表你就想進(jìn)去,不代表你就是他的顧客,有可能是你和朋友約好在蘋果門口見。所以我們需要有不同于地理的數(shù)據(jù)和更多的信息。
另外也如Anindya Ghose教授的暢銷新書《點擊》(已譯成多國文字)里闡述的那樣,如果我們知道一個人剛?cè)チ艘患胰A為店,又去了小米店,之后路過三星,繞了一圈最后到達(dá)蘋果店。我們會更了解這個人的思維模式,更了解他究竟為什么站在蘋果店門口,以及對什么樣的品牌可能產(chǎn)生興趣。
空序營銷碾壓基于地點和隨機(jī)的營銷
為了研究這種基于軌跡的營銷策略的有效性,來自NYU的Anindya Ghose教授、CMU的Beibei Li教授一起做了隨機(jī)實地實驗,來觀測空序的營銷是否會有非常好的效果。
研究發(fā)現(xiàn)空序營銷直接碾壓了基于地點和基于隨機(jī)的營銷,更加碾壓了不營銷的效果。我們可以看到有更高的優(yōu)惠券回復(fù)率,更快的優(yōu)惠券兌換率,同時增加了每一個專賣店的流量。就是說,顧客在專賣店消費更高,在店里待的時間更短,對商場來說整體實現(xiàn)了營銷的巨大飛躍。
值得關(guān)注的是,空間軌跡數(shù)據(jù)不止是營銷利器,與投資、房地產(chǎn)、實體店規(guī)劃、城市經(jīng)濟(jì)行為也息息相關(guān)。
我和Missouri Tech的Yanjie Fu教授最新的研究是用集體學(xué)習(xí)的方法,對大規(guī)模異構(gòu)人口流動性數(shù)據(jù)進(jìn)行了建模,來捕捉住宅社區(qū),城市功能,時間效應(yīng)和用戶流動模式之間的關(guān)系。我們的研究發(fā)現(xiàn),人群的空間軌跡可以用來理解城市形態(tài)對社會經(jīng)濟(jì)行為的影響,如房地產(chǎn)和餐廳的受歡迎程度等等,這個研究可以幫助政府規(guī)劃適當(dāng)?shù)某鞘泄δ芙M合,以促進(jìn)城市發(fā)展和促進(jìn)本地業(yè)務(wù)發(fā)展。
剛才的空間軌跡是把地點延長成了一條線,我們送出優(yōu)惠券以后在現(xiàn)在這個小時和下一小時用戶的需求是非常類似的,并沒有很大的改變——他可以這個小時去逛,也可以下一個小時。但是現(xiàn)在設(shè)想另外一個可能性,用戶在不同的時段里需要的推薦是不同的,會產(chǎn)生什么樣的效果?
基于時序的營銷,以旅游度假為例
舉個例子,這是一個旅游度假的上下文,假設(shè)時間單元是天,在例子里就是5天。我們根據(jù)歷史記錄可以看到用戶去了機(jī)場,博物館,劇院,購物中心,游樂場和海灘,我們稱這些地點為POI也就是興趣點。如果我們要對第四個人進(jìn)行第四天和第五天的推薦,我們應(yīng)該推薦什么?
傳統(tǒng)的推薦系統(tǒng)會先在第四天和第五天推薦海灘,因為海灘和博物館一起出現(xiàn)的頻率更高,相關(guān)性更大。還有一些推薦系統(tǒng)會在第四天和第五天的時候都推薦游樂場,因為游樂場最可能排在劇院后面。但基于用戶的需求,我們最應(yīng)該在第四天推薦游樂場,第五天推薦沙灘。但我們原始的推薦系統(tǒng)算法就是這么傻。
用戶選擇的時間序列,體現(xiàn)了用戶的偏好,在研究里有兩個難點:
首先,要根據(jù)POI之間的時間間隔和時間序列來進(jìn)行建模。
其次,歷史上連續(xù)check-in數(shù)據(jù)是非常松散的。 松散的數(shù)據(jù)極大地降低機(jī)器學(xué)習(xí)的效率和算力。
基于時序的推薦系統(tǒng)流程結(jié)構(gòu)圖
那解決方案是怎樣呢?Rutgers的Hui Xiong教授研究了基于時序的推薦系統(tǒng)的流程結(jié)構(gòu)圖:
通過從用戶歷史check-in序列中,提取序列模式,來構(gòu)建POI過渡立方體(立方體是用于測量時序偏好)。接著根據(jù)用戶check in的頻率構(gòu)建用戶的興趣偏好。然后同時模擬和學(xué)習(xí)用戶的興趣以及序列的偏好。Low-rank graph construction model可以很好地解決,稀疏觀測來估計分布的挑戰(zhàn)。同時建立bi-weighted graph來評定用戶興趣,最后對潛在興趣點進(jìn)行排名和評估建立了POI實際系統(tǒng)。用實際數(shù)據(jù)來檢測的成果顯示,與現(xiàn)有的POI推薦系統(tǒng)不同,推薦系統(tǒng)可以通過捕獲用戶演變的順序偏好,在未來的特定時間段內(nèi)提供有效的POI推薦。
事實上,時空序列還有更多的用途,比如幫助公司控制風(fēng)險。
公司財產(chǎn)損失很大程度上來源于金融欺詐,主要由外部和內(nèi)部兩方面威脅組成。外部的威脅包括投資欺詐、信用卡欺詐、身份盜竊等;內(nèi)部威脅諸如金融偷竊,會計造假,洗錢,抵押欺詐,內(nèi)部交易和市場操縱等。目前外部風(fēng)控業(yè)內(nèi)已經(jīng)做得非常領(lǐng)先,所以我們把注意力轉(zhuǎn)向了內(nèi)部欺詐。
值得注意的是,內(nèi)部欺詐還是主流的金融威脅,75%的欺詐都來源于內(nèi)部。當(dāng)你的公司運轉(zhuǎn)很好但是營收不佳的時候,你就要警惕公司是否存在異常了,典型的異常包括密報、高員工流動率、低士氣、不尋常不合理不一致的行為等。
基于時序的報表挖掘
這里介紹兩種欺詐檢測的方法,一是基于時序的報表挖掘,二是挖掘行為軌跡。
第一個是根據(jù)持續(xù)報表和記錄挖掘,總共分為15步:
1)將支付記錄與授權(quán)供應(yīng)商列表對應(yīng);2)將供應(yīng)商與雇員對應(yīng);3)將機(jī)構(gòu)銀行賬戶序號與雇員銀行賬戶序號對應(yīng);4)將遞送地址與雇員地址對應(yīng);5)確定與往年記錄比較有較大變化的情況;6)檢測查找重復(fù)的發(fā)票;7)檢測查找重復(fù)的支付記錄;8)檢測可能缺失的支票;9)檢驗在break points或較低的金額數(shù)量;10)檢測被拆分的發(fā)票;11)檢測查找較大的折扣;12)檢查大額的支付記錄;13)分析支付日期+確定支付數(shù)額有較大方差的供應(yīng)商;14)抽取異常的交易;15)提取授權(quán)和付款記錄。
前4步將數(shù)據(jù)關(guān)聯(lián)起來,把支付記錄、供應(yīng)商、雇員、機(jī)構(gòu)銀行賬戶、地址對應(yīng)之間做關(guān)聯(lián),以方便進(jìn)行Multi-source Joint Learning聯(lián)合學(xué)習(xí)。第5步是籠統(tǒng)地用文本挖掘,篩查大的變動。第6到第10項處理發(fā)票相關(guān)的報表記錄,挖掘,重復(fù)、缺失、拆分等等。在這里我們會建立一個時序的模型,控制時間上的因素比如季節(jié)性趨勢,同時用地點作為fix effect,固定變量。第11到14步,是針對大額和異常的分析,第15步是個體抽樣。
第二個是對于行為軌跡的挖掘,比如說雇員出現(xiàn)在不該出現(xiàn)的位置,出現(xiàn)在了不該出現(xiàn)的時間。假設(shè)小張一直是非常守時的人,早上8點鐘上班,下午5點鐘下班。突然有一天我發(fā)現(xiàn)他連續(xù)3天加班加到9點,這就是一種異常情況了。我們應(yīng)該用數(shù)據(jù)分析看一下他在做什么,他是不是調(diào)用了不該調(diào)用的數(shù)據(jù)庫,或者數(shù)據(jù)庫是否被篡改,這些都是可以用行為軌跡分析挖掘到的。
另外,內(nèi)部風(fēng)控里的會計造假、或者人員的策略行為,是可以通過在公司內(nèi)建立機(jī)制來做預(yù)防和早期干預(yù)的。
我和Arizona State University的顧彬教授最近的研究發(fā)現(xiàn),社會成本會被人員考慮再造假成本里。當(dāng)員工曝露于社會網(wǎng)絡(luò)中,當(dāng)人員越是處于社交網(wǎng)絡(luò)相對中心位置、越是被關(guān)注、或者積極與他人進(jìn)行社交互動的狀況下,策略行為會有所降低。企業(yè)相應(yīng)可以采取的辦法是增加企業(yè)內(nèi)的社交網(wǎng)絡(luò)分析,加強(qiáng)員工間的溝通,報表和記錄盡量多人合作完成并相互檢查確認(rèn),同時對于欺詐報表也進(jìn)行網(wǎng)絡(luò)分析和追溯。
今天的Take away只是說我們在孜孜不倦地探索用戶已知和未知的需求,關(guān)鍵要素是時間序列和空間軌跡,把握住這兩個要點將會很大程度地提升營銷效果,同時也能很好地控制內(nèi)部風(fēng)險。
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。