3
本文作者: 陳伊莉 | 2018-05-29 16:23 |
雷鋒網(wǎng)AI金融評(píng)論報(bào)道,5月26日,阿里云創(chuàng)始人王堅(jiān)博士與科技圈11位志愿發(fā)起人共同組織了年度科技創(chuàng)新活動(dòng)2050大會(huì)。在下午由氪信科技CEO朱明杰出品的“人工智能重構(gòu)智能金融”專題論壇上,微軟全球執(zhí)行副總裁、美國(guó)工程院院士、前微軟亞洲研究院院長(zhǎng)沈向洋,前IDG榮譽(yù)合伙人、火山石資本創(chuàng)始人章蘇陽(yáng),招商局集團(tuán)創(chuàng)投總經(jīng)理呂克儉等皆受邀出席。
上海交通大學(xué)安泰經(jīng)管學(xué)院助理教授李春曉
期間,上海交通大學(xué)安泰經(jīng)管學(xué)院助理教授李春曉進(jìn)行了“時(shí)空序列如何影響營(yíng)銷和反欺詐”演講。她主要介紹了AI在商業(yè)中的應(yīng)用。比如AI是如何影響商家營(yíng)銷的,并給出了如何更好地管理公司的建議。據(jù)雷鋒網(wǎng)了解,她的研究領(lǐng)域在于數(shù)據(jù)科學(xué)和行為經(jīng)濟(jì)學(xué)的交叉領(lǐng)域,聚焦于研究數(shù)字技術(shù)下的平臺(tái)戰(zhàn)略、用戶行為、財(cái)務(wù)激勵(lì)和數(shù)據(jù)安全等。
以下是雷鋒網(wǎng)編輯的演講原文,經(jīng)過李春曉確認(rèn):
用三個(gè)典型的哲學(xué)問題先開始話題:你是誰(shuí)?從哪兒來?到哪兒去?
這三個(gè)問題很難回答。我們?cè)谏钪袝?huì)接觸到形形色色的人——用戶、客戶、雇員、合作伙伴,這三個(gè)問題時(shí)時(shí)刻刻地縈繞在我們心頭,這也是 People Analytics,即人員分析一直孜孜不倦探討的問題。
再問幾個(gè)接地氣的問題:你知道234天以后的下午2點(diǎn)30分你會(huì)在哪里做什么嗎?你知道下一次職業(yè)變換在什么時(shí)候,是跳槽還是升職?雖然我們可能都不知道,但是AI知道。
之所以會(huì)談到這幾個(gè)問題,是因?yàn)槲易罱隽搜芯浚翰还苣阕砸詾榈男袆?dòng)有多少自發(fā)性,我們都能夠找出線索并預(yù)測(cè)你的路徑。絕大多數(shù)人都是非??深A(yù)測(cè)的,因?yàn)槲覀兪橇?xí)慣的生物。我們的行為,模式和習(xí)慣受到很大因素的影響,挑戰(zhàn)在于它跨越了多個(gè)學(xué)科,比如心理學(xué)、腦科學(xué)、人類學(xué),社會(huì)學(xué),基因?qū)W,教育學(xué)等。
所以 People Analytics 做的就是把所有這些學(xué)科的研究成果放在一起,結(jié)合大數(shù)據(jù)和分析,利用這些行為和習(xí)慣創(chuàng)造線索,為公司決策、營(yíng)銷和品牌做出真正有趣的見解。
我們生活在數(shù)據(jù)的社會(huì)里,我們遞交的簡(jiǎn)歷、合作過的伙伴、就讀的高校、是誰(shuí)的孩子、誰(shuí)是我們的孩子,這一條條都集中地記錄在數(shù)字設(shè)備上,同時(shí)構(gòu)建成了一條條關(guān)于你、我、他的數(shù)字線索,再由people analytics將這些整合還原出獨(dú)一無二的畫像,但看過的人卻比你的朋友更懂你,都會(huì)跟你說:對(duì)過眼神,就是你。
我們做的很多用戶分析是根據(jù)人們的基礎(chǔ)數(shù)據(jù)、社交數(shù)據(jù)和歷史消費(fèi),讓公司確定用戶的已知需求和已知模式。過去十幾年來我們一直在這個(gè)戰(zhàn)場(chǎng)上,已經(jīng)碩果累累。
我認(rèn)為下一個(gè)戰(zhàn)場(chǎng)在于探求用戶的未知需求,探求用戶的隱藏模式和偏好。這是因?yàn)槲覀兿朐诟线m的時(shí)機(jī)、地點(diǎn)、方式去接觸、營(yíng)銷用戶,創(chuàng)造更大的價(jià)值。
“天時(shí)、地利、人和”不只是藝術(shù),更是一門科學(xué),這就是People analytics要做的——在大量的人員數(shù)據(jù)的基礎(chǔ)上添加時(shí)間序列,空間軌跡,結(jié)合人工智能的技術(shù),去觸碰用戶隱藏的認(rèn)知和思維,你會(huì)意識(shí)到這是一個(gè)巨大的機(jī)會(huì)。
接下來我將用四個(gè)案例給大家簡(jiǎn)化一下流程,深入地分析一下如何利用AI來增強(qiáng)零售界、金融界、服務(wù)界的營(yíng)銷能力。
“從哪里來,到哪里去”這兩個(gè)問題已經(jīng)強(qiáng)調(diào)了地點(diǎn)的重要性,GPS相關(guān)技術(shù)重新定義了地點(diǎn),而精確的位置數(shù)據(jù)開啟了即時(shí)營(yíng)銷的大門。大家下飛機(jī)下高鐵到杭州時(shí),很多APP會(huì)推送“杭州歡迎您”,或者推薦吃喝玩樂的地方。但很多人都沒有去。因?yàn)樾畔⑻邢?,僅僅靠位置信息的推送是不夠完整不夠精確。所以關(guān)聯(lián)內(nèi)容是很重要的。
當(dāng)我們把時(shí)間維度加到位置上的時(shí)候,視野里會(huì)呈現(xiàn)出更清晰的上下文環(huán)境。比如說你在星期一的下午2點(diǎn)走在大街上,這個(gè)時(shí)候你的左手邊一個(gè)音樂酒吧,你的右手邊是星巴克咖啡,這個(gè)時(shí)候手機(jī)上推送了兩條優(yōu)惠券,你打開一看發(fā)現(xiàn)是酒吧啤酒半價(jià)和一杯星巴克星冰樂的半價(jià)。這個(gè)時(shí)候如果你不想把周一下午浪費(fèi)的話你會(huì)選擇什么?星巴克。那換一個(gè)時(shí)間呢?如果是晚上8點(diǎn)半你同樣收到兩條推送,你們就很有可能兌換酒吧的優(yōu)惠券,和同事們喝上幾杯。
所以在這種情況下時(shí)間非常關(guān)鍵,它不僅僅是位置。我們的商家已經(jīng)做了很多基于位置的廣告,但這不夠,用戶有不同的人格,即使同一個(gè)地點(diǎn)不同時(shí)段的需求也是不同的,你需要把時(shí)間和地點(diǎn)結(jié)合起來,然后看人的行為!
天普大學(xué)的Luo xueming教授就營(yíng)銷的不同時(shí)間產(chǎn)生的不同效果做了詳細(xì)的隨機(jī)實(shí)地實(shí)驗(yàn)。再比如,我們和國(guó)內(nèi)某公司也有過研究,若先增加時(shí)間因素,營(yíng)銷效果會(huì)提升,再加地點(diǎn)地理要素,效果也會(huì)有所提升。如果同時(shí)添加時(shí)間和地點(diǎn),效果提升的幅度更明顯,這就是時(shí)間維度的營(yíng)銷。
更深一層考慮,僅有位置的營(yíng)銷除了缺少時(shí)間概念,還只是靜態(tài)的、“守株待兔”式的營(yíng)銷模式,而我們需要更加靈活。
基于空序的營(yíng)銷,以購(gòu)物中心為例
舉個(gè)例子,在一個(gè)大型的購(gòu)物中心,你站在蘋果店門口,如果沒有地理信息位置其他,只能基于通過位置進(jìn)行營(yíng)銷,可能就會(huì)認(rèn)為你要去逛蘋果店會(huì)給你推送一條蘋果店相關(guān)的信息或者優(yōu)惠券。其實(shí)這里有一個(gè)很大的問題——因?yàn)槟阏驹谔O果店門口不代表你就想進(jìn)去,不代表你就是他的顧客,有可能是你和朋友約好在蘋果門口見。所以我們需要有不同于地理的數(shù)據(jù)和更多的信息。
另外也如Anindya Ghose教授的暢銷新書《點(diǎn)擊》(已譯成多國(guó)文字)里闡述的那樣,如果我們知道一個(gè)人剛?cè)チ艘患胰A為店,又去了小米店,之后路過三星,繞了一圈最后到達(dá)蘋果店。我們會(huì)更了解這個(gè)人的思維模式,更了解他究竟為什么站在蘋果店門口,以及對(duì)什么樣的品牌可能產(chǎn)生興趣。
空序營(yíng)銷碾壓基于地點(diǎn)和隨機(jī)的營(yíng)銷
為了研究這種基于軌跡的營(yíng)銷策略的有效性,來自NYU的Anindya Ghose教授、CMU的Beibei Li教授一起做了隨機(jī)實(shí)地實(shí)驗(yàn),來觀測(cè)空序的營(yíng)銷是否會(huì)有非常好的效果。
研究發(fā)現(xiàn)空序營(yíng)銷直接碾壓了基于地點(diǎn)和基于隨機(jī)的營(yíng)銷,更加碾壓了不營(yíng)銷的效果。我們可以看到有更高的優(yōu)惠券回復(fù)率,更快的優(yōu)惠券兌換率,同時(shí)增加了每一個(gè)專賣店的流量。就是說,顧客在專賣店消費(fèi)更高,在店里待的時(shí)間更短,對(duì)商場(chǎng)來說整體實(shí)現(xiàn)了營(yíng)銷的巨大飛躍。
值得關(guān)注的是,空間軌跡數(shù)據(jù)不止是營(yíng)銷利器,與投資、房地產(chǎn)、實(shí)體店規(guī)劃、城市經(jīng)濟(jì)行為也息息相關(guān)。
我和Missouri Tech的Yanjie Fu教授最新的研究是用集體學(xué)習(xí)的方法,對(duì)大規(guī)模異構(gòu)人口流動(dòng)性數(shù)據(jù)進(jìn)行了建模,來捕捉住宅社區(qū),城市功能,時(shí)間效應(yīng)和用戶流動(dòng)模式之間的關(guān)系。我們的研究發(fā)現(xiàn),人群的空間軌跡可以用來理解城市形態(tài)對(duì)社會(huì)經(jīng)濟(jì)行為的影響,如房地產(chǎn)和餐廳的受歡迎程度等等,這個(gè)研究可以幫助政府規(guī)劃適當(dāng)?shù)某鞘泄δ芙M合,以促進(jìn)城市發(fā)展和促進(jìn)本地業(yè)務(wù)發(fā)展。
剛才的空間軌跡是把地點(diǎn)延長(zhǎng)成了一條線,我們送出優(yōu)惠券以后在現(xiàn)在這個(gè)小時(shí)和下一小時(shí)用戶的需求是非常類似的,并沒有很大的改變——他可以這個(gè)小時(shí)去逛,也可以下一個(gè)小時(shí)。但是現(xiàn)在設(shè)想另外一個(gè)可能性,用戶在不同的時(shí)段里需要的推薦是不同的,會(huì)產(chǎn)生什么樣的效果?
基于時(shí)序的營(yíng)銷,以旅游度假為例
舉個(gè)例子,這是一個(gè)旅游度假的上下文,假設(shè)時(shí)間單元是天,在例子里就是5天。我們根據(jù)歷史記錄可以看到用戶去了機(jī)場(chǎng),博物館,劇院,購(gòu)物中心,游樂場(chǎng)和海灘,我們稱這些地點(diǎn)為POI也就是興趣點(diǎn)。如果我們要對(duì)第四個(gè)人進(jìn)行第四天和第五天的推薦,我們應(yīng)該推薦什么?
傳統(tǒng)的推薦系統(tǒng)會(huì)先在第四天和第五天推薦海灘,因?yàn)楹┖筒┪镳^一起出現(xiàn)的頻率更高,相關(guān)性更大。還有一些推薦系統(tǒng)會(huì)在第四天和第五天的時(shí)候都推薦游樂場(chǎng),因?yàn)橛螛穲?chǎng)最可能排在劇院后面。但基于用戶的需求,我們最應(yīng)該在第四天推薦游樂場(chǎng),第五天推薦沙灘。但我們?cè)嫉耐扑]系統(tǒng)算法就是這么傻。
用戶選擇的時(shí)間序列,體現(xiàn)了用戶的偏好,在研究里有兩個(gè)難點(diǎn):
首先,要根據(jù)POI之間的時(shí)間間隔和時(shí)間序列來進(jìn)行建模。
其次,歷史上連續(xù)check-in數(shù)據(jù)是非常松散的。 松散的數(shù)據(jù)極大地降低機(jī)器學(xué)習(xí)的效率和算力。
基于時(shí)序的推薦系統(tǒng)流程結(jié)構(gòu)圖
那解決方案是怎樣呢?Rutgers的Hui Xiong教授研究了基于時(shí)序的推薦系統(tǒng)的流程結(jié)構(gòu)圖:
通過從用戶歷史check-in序列中,提取序列模式,來構(gòu)建POI過渡立方體(立方體是用于測(cè)量時(shí)序偏好)。接著根據(jù)用戶check in的頻率構(gòu)建用戶的興趣偏好。然后同時(shí)模擬和學(xué)習(xí)用戶的興趣以及序列的偏好。Low-rank graph construction model可以很好地解決,稀疏觀測(cè)來估計(jì)分布的挑戰(zhàn)。同時(shí)建立bi-weighted graph來評(píng)定用戶興趣,最后對(duì)潛在興趣點(diǎn)進(jìn)行排名和評(píng)估建立了POI實(shí)際系統(tǒng)。用實(shí)際數(shù)據(jù)來檢測(cè)的成果顯示,與現(xiàn)有的POI推薦系統(tǒng)不同,推薦系統(tǒng)可以通過捕獲用戶演變的順序偏好,在未來的特定時(shí)間段內(nèi)提供有效的POI推薦。
事實(shí)上,時(shí)空序列還有更多的用途,比如幫助公司控制風(fēng)險(xiǎn)。
公司財(cái)產(chǎn)損失很大程度上來源于金融欺詐,主要由外部和內(nèi)部?jī)煞矫嫱{組成。外部的威脅包括投資欺詐、信用卡欺詐、身份盜竊等;內(nèi)部威脅諸如金融偷竊,會(huì)計(jì)造假,洗錢,抵押欺詐,內(nèi)部交易和市場(chǎng)操縱等。目前外部風(fēng)控業(yè)內(nèi)已經(jīng)做得非常領(lǐng)先,所以我們把注意力轉(zhuǎn)向了內(nèi)部欺詐。
值得注意的是,內(nèi)部欺詐還是主流的金融威脅,75%的欺詐都來源于內(nèi)部。當(dāng)你的公司運(yùn)轉(zhuǎn)很好但是營(yíng)收不佳的時(shí)候,你就要警惕公司是否存在異常了,典型的異常包括密報(bào)、高員工流動(dòng)率、低士氣、不尋常不合理不一致的行為等。
基于時(shí)序的報(bào)表挖掘
這里介紹兩種欺詐檢測(cè)的方法,一是基于時(shí)序的報(bào)表挖掘,二是挖掘行為軌跡。
第一個(gè)是根據(jù)持續(xù)報(bào)表和記錄挖掘,總共分為15步:
1)將支付記錄與授權(quán)供應(yīng)商列表對(duì)應(yīng);2)將供應(yīng)商與雇員對(duì)應(yīng);3)將機(jī)構(gòu)銀行賬戶序號(hào)與雇員銀行賬戶序號(hào)對(duì)應(yīng);4)將遞送地址與雇員地址對(duì)應(yīng);5)確定與往年記錄比較有較大變化的情況;6)檢測(cè)查找重復(fù)的發(fā)票;7)檢測(cè)查找重復(fù)的支付記錄;8)檢測(cè)可能缺失的支票;9)檢驗(yàn)在break points或較低的金額數(shù)量;10)檢測(cè)被拆分的發(fā)票;11)檢測(cè)查找較大的折扣;12)檢查大額的支付記錄;13)分析支付日期+確定支付數(shù)額有較大方差的供應(yīng)商;14)抽取異常的交易;15)提取授權(quán)和付款記錄。
前4步將數(shù)據(jù)關(guān)聯(lián)起來,把支付記錄、供應(yīng)商、雇員、機(jī)構(gòu)銀行賬戶、地址對(duì)應(yīng)之間做關(guān)聯(lián),以方便進(jìn)行Multi-source Joint Learning聯(lián)合學(xué)習(xí)。第5步是籠統(tǒng)地用文本挖掘,篩查大的變動(dòng)。第6到第10項(xiàng)處理發(fā)票相關(guān)的報(bào)表記錄,挖掘,重復(fù)、缺失、拆分等等。在這里我們會(huì)建立一個(gè)時(shí)序的模型,控制時(shí)間上的因素比如季節(jié)性趨勢(shì),同時(shí)用地點(diǎn)作為fix effect,固定變量。第11到14步,是針對(duì)大額和異常的分析,第15步是個(gè)體抽樣。
第二個(gè)是對(duì)于行為軌跡的挖掘,比如說雇員出現(xiàn)在不該出現(xiàn)的位置,出現(xiàn)在了不該出現(xiàn)的時(shí)間。假設(shè)小張一直是非常守時(shí)的人,早上8點(diǎn)鐘上班,下午5點(diǎn)鐘下班。突然有一天我發(fā)現(xiàn)他連續(xù)3天加班加到9點(diǎn),這就是一種異常情況了。我們應(yīng)該用數(shù)據(jù)分析看一下他在做什么,他是不是調(diào)用了不該調(diào)用的數(shù)據(jù)庫(kù),或者數(shù)據(jù)庫(kù)是否被篡改,這些都是可以用行為軌跡分析挖掘到的。
另外,內(nèi)部風(fēng)控里的會(huì)計(jì)造假、或者人員的策略行為,是可以通過在公司內(nèi)建立機(jī)制來做預(yù)防和早期干預(yù)的。
我和Arizona State University的顧彬教授最近的研究發(fā)現(xiàn),社會(huì)成本會(huì)被人員考慮再造假成本里。當(dāng)員工曝露于社會(huì)網(wǎng)絡(luò)中,當(dāng)人員越是處于社交網(wǎng)絡(luò)相對(duì)中心位置、越是被關(guān)注、或者積極與他人進(jìn)行社交互動(dòng)的狀況下,策略行為會(huì)有所降低。企業(yè)相應(yīng)可以采取的辦法是增加企業(yè)內(nèi)的社交網(wǎng)絡(luò)分析,加強(qiáng)員工間的溝通,報(bào)表和記錄盡量多人合作完成并相互檢查確認(rèn),同時(shí)對(duì)于欺詐報(bào)表也進(jìn)行網(wǎng)絡(luò)分析和追溯。
今天的Take away只是說我們?cè)谧巫尾痪氲靥剿饔脩粢阎臀粗男枨?,關(guān)鍵要素是時(shí)間序列和空間軌跡,把握住這兩個(gè)要點(diǎn)將會(huì)很大程度地提升營(yíng)銷效果,同時(shí)也能很好地控制內(nèi)部風(fēng)險(xiǎn)。
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。