3
本文作者: 劉偉 | 2017-05-26 19:36 | 專題:雷峰網(wǎng)公開課 |
中國(guó)消費(fèi)金融市場(chǎng)的用戶大致可以劃分為四種類型:1.白領(lǐng)和自雇人群;2.藍(lán)領(lǐng);3學(xué)生;4.農(nóng)民。其中,前兩者為主力消費(fèi)人群,市場(chǎng)規(guī)模十分廣闊。白領(lǐng)和自雇人群往往擁有央行征信報(bào)告,主要使用銀行信用卡,以及BAT和京東等大型企業(yè)提供的消費(fèi)金融產(chǎn)品。而多達(dá)2.5億的藍(lán)領(lǐng)則主要為薄文件人群(央行征信報(bào)告能夠采集到的數(shù)據(jù)非常少),他們具有很強(qiáng)的消費(fèi)沖動(dòng),是互聯(lián)網(wǎng)金融產(chǎn)品的主要目標(biāo)。而由于傳統(tǒng)銀行放款周期過長(zhǎng),無(wú)法滿足他們的需求;即時(shí)高效的互聯(lián)網(wǎng)消費(fèi)金融產(chǎn)品也就成了他們的最佳選擇。
那么,互聯(lián)網(wǎng)消費(fèi)金融企業(yè)如何才能抓住這一市場(chǎng)機(jī)遇,從廣大薄文件人群中尋找優(yōu)質(zhì)客戶、提高用戶黏性,同時(shí)降低風(fēng)險(xiǎn),將收益最大化呢?本期硬創(chuàng)公開課,雷鋒網(wǎng)邀請(qǐng)到了秦蒼科技數(shù)據(jù)科學(xué)家沈赟博士,為大家分享AI在消費(fèi)金融產(chǎn)品優(yōu)化以及風(fēng)險(xiǎn)控制中的應(yīng)用。
本次公開課包含以下內(nèi)容:
1. 根據(jù)用戶多維弱變量數(shù)據(jù)的綜合信用評(píng)分
2. 社交網(wǎng)絡(luò)算法應(yīng)用于金融反欺詐
3.基于機(jī)器學(xué)習(xí)模型的額度策略
4 基于機(jī)器學(xué)習(xí)的金融產(chǎn)品設(shè)計(jì)
5.人工智能應(yīng)用的前沿探索:用戶生命周期管理
沈赟博士,秦蒼科技數(shù)據(jù)科學(xué)家,具有9年金融領(lǐng)域機(jī)器學(xué)習(xí)研究開發(fā)經(jīng)驗(yàn)。擁有德國(guó)柏林工業(yè)大學(xué)電子信息科學(xué)與技術(shù)博士學(xué)位、上海交通大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)碩士學(xué)位、德國(guó)柏林工業(yè)大學(xué)電子信息科學(xué)與技術(shù)碩士學(xué)位、上海交通大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)本科學(xué)位。
曾在Journal of Machine Learning Research, Neural Computation, SIAM Journal on Control and Optimization等機(jī)器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)以及應(yīng)用數(shù)學(xué)等領(lǐng)域的頂級(jí)期刊和會(huì)議上發(fā)表多篇學(xué)術(shù)論文。
曾任職德國(guó)LOBSTER Data 量化分析師,分析處理高頻Nasdaq數(shù)據(jù),輔助完成產(chǎn)品上線。現(xiàn)擔(dān)任秦蒼科技數(shù)據(jù)科學(xué)家,率領(lǐng)團(tuán)隊(duì)構(gòu)建基于機(jī)器學(xué)習(xí)的信用評(píng)分、額度策略、反欺詐以及用戶生命周期內(nèi)的自動(dòng)化動(dòng)態(tài)調(diào)頻系統(tǒng)等。成功打造了基于用戶數(shù)據(jù)1秒內(nèi)完成信用評(píng)分的評(píng)分機(jī)制,相比傳統(tǒng)模型提高了25%AUC。
(本期公開課完整視頻,共51分鐘)
以下為雷鋒網(wǎng)對(duì)嘉賓分享內(nèi)容的實(shí)錄精編。
風(fēng)險(xiǎn)控制是消費(fèi)金融領(lǐng)域的一大核心問題,信用評(píng)分機(jī)制則是控制風(fēng)險(xiǎn)的有效手段。信用評(píng)分機(jī)制可以簡(jiǎn)化為分類問題,即根據(jù)用戶歷史上的行為,來(lái)判斷他是“好人”還是“壞人”。假如一個(gè)用戶逾期幾個(gè)月,那么我們就認(rèn)定他是“壞人”,若沒有逾期行為,則為“好人”。
我們采用了機(jī)器監(jiān)督學(xué)習(xí)中的經(jīng)典分類算法來(lái)進(jìn)行用戶信用評(píng)分。評(píng)分過程可以分為以下幾步:
數(shù)據(jù)導(dǎo)入和清洗。因?yàn)閿?shù)據(jù)采集過程中可能會(huì)采集到臟數(shù)據(jù),此外,我們還需要剔除部分不可用、不可計(jì)算的數(shù)據(jù),以及空數(shù)據(jù)。
特征提取。采集數(shù)據(jù)時(shí),我們通常會(huì)采集多達(dá)一萬(wàn)多個(gè)數(shù)據(jù)點(diǎn),然后通過特征提取的方式提取幾百個(gè)特征點(diǎn)。
模型選擇。在模型中,我們會(huì)運(yùn)用到一些機(jī)器學(xué)習(xí)算法,比如邏輯回歸、隨機(jī)森林、AdaBoost、XgBoost、神經(jīng)網(wǎng)絡(luò)等。選擇模型時(shí),我們會(huì)采取cross validation的方式,同時(shí)運(yùn)用基于ROC的AUC來(lái)決策模型的好壞。
決策。決策過后,我們可以觀察用戶表現(xiàn),重新提取數(shù)據(jù)訓(xùn)練模型,形成正向反饋循環(huán)。也就是說(shuō),隨著收集到更多、更新的數(shù)據(jù),我們的模型將不斷迭代和進(jìn)化。
從應(yīng)用結(jié)果來(lái)看,AI決策相比傳統(tǒng)手工開發(fā)的算法決策,可以把決策時(shí)間從分鐘級(jí)別縮短至0.1秒,同時(shí)降低25%的壞賬率,每年為企業(yè)節(jié)約高達(dá)上千萬(wàn)的成本。
在大家熟知的,使用深度神經(jīng)網(wǎng)絡(luò)解決圖像識(shí)別和云識(shí)別的問題中,一般而言,采集的數(shù)據(jù)越多,訓(xùn)練出的模型就越好。但金融領(lǐng)域不同,金融數(shù)據(jù)具有非常強(qiáng)的時(shí)間效應(yīng),越靠近現(xiàn)在的數(shù)據(jù)越具備預(yù)測(cè)效力。并不是說(shuō)擁有的數(shù)據(jù)越多,模型效果就越好。因此,不斷定期更新模型至關(guān)重要。
模型是基于歷史數(shù)據(jù)訓(xùn)練出來(lái)的,在未來(lái)不發(fā)生異常事件的前提下,可以保持預(yù)測(cè)效力;一旦出現(xiàn)異常事件,模型的效力就有可能下降。為了保證系統(tǒng)預(yù)測(cè)的穩(wěn)定性,我們會(huì)同時(shí)開發(fā)多個(gè)模型彼此競(jìng)賽。
比方說(shuō),我們訓(xùn)練出了三個(gè)模型,分配給他們不同的流量:模型2流量最高,模型1次之;模型3最低。一段時(shí)間后,我們可以收集到各個(gè)模型的表現(xiàn),根據(jù)其準(zhǔn)確率動(dòng)態(tài)調(diào)節(jié)流量。如果某個(gè)模型表現(xiàn)好,就多分配一些流量,反之則減少流量。如果這個(gè)模型的效力長(zhǎng)時(shí)間內(nèi)持續(xù)下降,就將逐漸被淘汰,與此同時(shí)會(huì)有新的模型加入競(jìng)爭(zhēng)??偠灾?,多模型并行,擇優(yōu)進(jìn)化,對(duì)于保持系統(tǒng)的穩(wěn)定性十分重要。
消費(fèi)金融產(chǎn)品風(fēng)險(xiǎn)控制中,另一個(gè)非常重要的部分是反欺詐。我們反欺詐的主要手段是社交網(wǎng)絡(luò)分析。用于社交網(wǎng)絡(luò)分析的數(shù)據(jù)通常基于手機(jī)號(hào)碼,比方說(shuō)手機(jī)緊急聯(lián)系人、通聯(lián)紀(jì)錄、通訊錄等。
上面是一張社交網(wǎng)絡(luò)關(guān)系結(jié)構(gòu)示意圖,圖中每個(gè)點(diǎn)代表一個(gè)用戶,通過線段連接的兩個(gè)點(diǎn)互為手機(jī)聯(lián)系人。其中某些用戶可以通過一個(gè)共同的節(jié)點(diǎn)聯(lián)系到一起,那么我們就將其看作一個(gè)團(tuán)。以團(tuán)為單位,可以提取到一些社交網(wǎng)絡(luò)特征:
團(tuán)內(nèi)其他用戶的表現(xiàn),比方說(shuō)逾期率、通過量等。這一特征判斷的核心思想可以歸納為“近朱者赤,近墨者黑”。
團(tuán)本身的特性,比方說(shuō)節(jié)點(diǎn)數(shù)、團(tuán)內(nèi)用戶的連接緊密程度等。
團(tuán)內(nèi)用戶的屬性,比方說(shuō)團(tuán)內(nèi)的女性人數(shù)、地區(qū)分布、平均借款額度等。一般而言,團(tuán)內(nèi)女性人數(shù)占比越大,團(tuán)內(nèi)用戶是“好人”的概率就越大。
從社交網(wǎng)絡(luò)中提取的特征主要可應(yīng)用于兩大方面:
一、將特征數(shù)據(jù)加入信用評(píng)分模型,提升其準(zhǔn)確度。根據(jù)以往的經(jīng)驗(yàn),加入這些數(shù)據(jù)后,AUC值可以提升3-5%。
二、通過無(wú)監(jiān)督的聚類方法來(lái)預(yù)防欺詐。我們將某個(gè)地區(qū)的所有用戶進(jìn)行特征分析后,投影到二維平面,通??梢园l(fā)現(xiàn)兩到三個(gè)異常點(diǎn),他們距離其他用戶非常遠(yuǎn)。這時(shí)候就會(huì)觸發(fā)我們的調(diào)查機(jī)制,調(diào)查這個(gè)用戶是否真的存在欺詐行為。實(shí)踐檢驗(yàn),這種異常值檢測(cè)的方法可達(dá)到60%左右的準(zhǔn)確率,證明對(duì)于預(yù)防欺詐,社交網(wǎng)絡(luò)特征分析確實(shí)行之有效。
消費(fèi)金融產(chǎn)品主要指分期借貸,我們可以把它想象成信用卡,其主要參數(shù)有額度、利率和期數(shù)。設(shè)計(jì)這些參數(shù)時(shí),我們主要需要考慮兩個(gè)方面:
產(chǎn)品的接受度。我們向用戶推薦產(chǎn)品時(shí),用戶是否會(huì)接受?一般而言,產(chǎn)品額度越大、利率越低,用戶接受的可能性就越大。
風(fēng)險(xiǎn)控制。隨著用戶接受度提高,風(fēng)險(xiǎn)也在增加。如果我們向用戶提供的額度超出其償還能力,資金就很可能收不回來(lái)。
產(chǎn)品的接受度和風(fēng)險(xiǎn)彼此沖突,我們需要尋找折中方案。
下面介紹一個(gè)我們開發(fā)的基于貝葉斯算法的框架。在消費(fèi)金融場(chǎng)景中,簡(jiǎn)單來(lái)說(shuō),可以把用戶劃分為“好人”和“壞人”。在給定用戶表現(xiàn)和金融產(chǎn)品參數(shù)的前提下,基本可以確定這款產(chǎn)品能夠帶來(lái)的受益。但同一個(gè)用戶在不同時(shí)期的表現(xiàn)是不一樣的。比方說(shuō),用戶這段時(shí)間經(jīng)濟(jì)狀況較好,能夠及時(shí)還款;一段時(shí)間后他經(jīng)濟(jì)狀況變壞了,就很有可能還不上。用戶是“好人”還是“壞人”,是個(gè)概率性問題。
上面的公式中,p代表在給定某個(gè)金融產(chǎn)品和用戶的前提下,這個(gè)用戶是“好人”還是“壞人”的概率。統(tǒng)籌考慮所有情況后,就能得出這個(gè)用戶身上的期望收益。
我們希望通過調(diào)整產(chǎn)品參數(shù)將收益最大化,同時(shí)也需要關(guān)注用戶逾期的風(fēng)險(xiǎn)。在給定某個(gè)產(chǎn)品的前提下,我們希望用戶是“好人”的概率大于某個(gè)值,比如0.6或者0.8。這樣可以間接控制用戶可能帶來(lái)的損失。
上圖展示了我們對(duì)“用戶是‘好人’還是‘壞人’”的概率估計(jì)情況。其中x軸代表額度,y軸代表期數(shù),z軸代表用戶是“好人”的概率,每一個(gè)曲面對(duì)應(yīng)一位用戶。從圖中可以看出,有些用戶對(duì)于額度和期數(shù)不太敏感。雖然隨著額度和期數(shù)增加,他們是“好人”的概率有所下降,但始終高于某個(gè)數(shù)值。有些用戶則對(duì)額度和期數(shù)非常敏感。通過大量提取用戶特征,我們可以不斷對(duì)模型進(jìn)行優(yōu)化,為每個(gè)用戶量身打造合適的金融產(chǎn)品。
那么,這個(gè)模型的效力究竟如何呢?上圖進(jìn)行了展示。圖中x軸代表風(fēng)險(xiǎn)閾值,左端表示閾值非常低,我們可以冒巨大的風(fēng)險(xiǎn);右端表示閾值非常高,放款策略趨于保守。y軸則代表我們針對(duì)某個(gè)用戶預(yù)測(cè)的放款金額,與其歷史放款金額的比例關(guān)系。若比例大于1,就說(shuō)明預(yù)測(cè)的放款金額高于歷史放款金額,同理反推。從圖中可以看出:
在同一風(fēng)險(xiǎn)閾值下,“好人”(黑色)獲得的額度總是高于“壞人”(橙色)。
隨著風(fēng)險(xiǎn)閾值提高,用戶獲得的放款額度逐漸下降。
在給定風(fēng)險(xiǎn)閾值的前提下,“好人”獲得的預(yù)期額度總是高于歷史額度,“壞人”則恰恰相反。
結(jié)果和預(yù)期完全相符,這證明了我們基于貝葉斯算法的分析框架確實(shí)行之有效。
企業(yè)總是希望用戶能盡可能長(zhǎng)時(shí)間地使用自己的產(chǎn)品。因此新用戶借款并如期還款后,企業(yè)還會(huì)向其推薦其他金融產(chǎn)品。那么,如何最大限度地留住客戶,延長(zhǎng)其生命周期呢?
在用戶的整個(gè)還款周期中,我們可以通過用戶在每一個(gè)還款節(jié)點(diǎn)的表現(xiàn),判斷其是“好人”還是“壞人”,并作出相應(yīng)調(diào)整。如果用戶還款表現(xiàn)好,可適當(dāng)提升額度或降低利息,鼓勵(lì)其使用我們的其他產(chǎn)品。若用戶表現(xiàn)差,則可以降低額度和提高利息,以防控風(fēng)險(xiǎn)。極端情況下,將啟動(dòng)調(diào)查或催收機(jī)制。
借助這些手段,企業(yè)可以提升用戶黏性,并將收益最大化。
為實(shí)現(xiàn)這一目的,我們采用了深度學(xué)習(xí)以及運(yùn)籌學(xué)中非常經(jīng)典的馬爾科夫決策過程進(jìn)行建模。企業(yè)關(guān)注的是用戶在整個(gè)生命周期中帶來(lái)的累積收益,因此不同于前面提到產(chǎn)品參數(shù)優(yōu)化。產(chǎn)品參數(shù)優(yōu)化是單步?jīng)Q策,而收益最大化是多步?jīng)Q策問題,需要在每一步?jīng)Q策中不斷優(yōu)化我們的策略。
上圖中的公式中,r是一個(gè)reward函數(shù),它取決于st和θt兩個(gè)變量。st和θt分別代表當(dāng)前賬期下用戶的表現(xiàn)(逾期或提前還款等)以及企業(yè)的決策(提額或降息等)。π則代表企業(yè)在每個(gè)賬期中的單步策略累計(jì)而成的整體策略。通過這個(gè)公式,我們可以得到預(yù)期的最大收益。
昨天阿爾法go再次戰(zhàn)勝了中國(guó)著名棋手柯潔。阿爾法go用到的一個(gè)核心算法叫做增強(qiáng)學(xué)習(xí),增強(qiáng)學(xué)習(xí)的本質(zhì)其實(shí)也是馬爾科夫決策過程。它用到了不斷迭代的online learning算法來(lái)解決多步?jīng)Q策問題。
馬爾科夫決策應(yīng)用到消費(fèi)金融場(chǎng)景,過程大致如下:新用戶進(jìn)來(lái)后,系統(tǒng)會(huì)抽取他的個(gè)人特征,同時(shí)根據(jù)其當(dāng)前還款狀態(tài),以及在這個(gè)時(shí)間點(diǎn)上帶來(lái)的利潤(rùn)或者損失,優(yōu)化value function和state representation。value function和state representation是通過分析和學(xué)習(xí)用戶歷史數(shù)據(jù)得來(lái)的,加入新的數(shù)據(jù)后,系統(tǒng)會(huì)不斷校正value值。如果某一步?jīng)Q策對(duì)我們不利,那么其value值就會(huì)降低,反之則value值提高。如此不斷循環(huán)往復(fù)。
前面提到,AI在消費(fèi)金融風(fēng)險(xiǎn)控制以及產(chǎn)品優(yōu)化方面,能夠發(fā)揮巨大重要。但需要強(qiáng)調(diào)的是,現(xiàn)在AI概念非常熱門,大家都希望學(xué)到最新的算法;但要把AI算法落地到實(shí)際生產(chǎn)和業(yè)務(wù)中,還是應(yīng)該立足業(yè)務(wù)本身,不斷挖掘數(shù)據(jù)優(yōu)化模型。選擇什么模型不重要,模型好壞最終還是要看它是否能夠給業(yè)務(wù)帶來(lái)增長(zhǎng)。最理想的狀態(tài)是,企業(yè)能夠通過模型優(yōu)化業(yè)務(wù)流程,獲取更多數(shù)據(jù),然后利用新的數(shù)據(jù)進(jìn)一步優(yōu)化模型,形成良性循環(huán)。
1.除了風(fēng)險(xiǎn)控制,未來(lái)AI還可以應(yīng)用到消費(fèi)金融的哪些環(huán)節(jié),將給行業(yè)帶來(lái)怎樣的改變?
前面已經(jīng)提到了產(chǎn)品結(jié)構(gòu)優(yōu)化。通過優(yōu)化產(chǎn)品參數(shù)和結(jié)構(gòu),來(lái)提升用戶黏性,將收益最大化,這對(duì)于企業(yè)來(lái)說(shuō)非常重要。除此之外,AI還可以用于產(chǎn)品推廣,比如通過現(xiàn)有的社交網(wǎng)絡(luò),向其他用戶推薦適合他們的金融產(chǎn)品。
2.在目前技術(shù)條件下,AI風(fēng)控相比傳統(tǒng)風(fēng)控存在哪些不足?未來(lái)如何提高?
AI技術(shù)立足于大數(shù)據(jù)。如果我們能夠獲取足夠多、足夠新的,具有表征能力的數(shù)據(jù), AI風(fēng)控一定能夠打敗傳統(tǒng)風(fēng)控。但很多時(shí)候,企業(yè)獲取的數(shù)據(jù)往往不夠充分。這時(shí)候,基于長(zhǎng)期經(jīng)驗(yàn)積累的傳統(tǒng)風(fēng)控往往能夠提供行之有效的風(fēng)險(xiǎn)控制手段,雖然他們的方案不一定是最優(yōu)的。如果未來(lái)AI能夠進(jìn)化到擁有學(xué)習(xí)和推理能力,那么它完全能夠取代傳統(tǒng)風(fēng)控,不過短期內(nèi)還很難實(shí)現(xiàn)。
3.隨著人工智能發(fā)展趨于成熟,未來(lái)消費(fèi)金融行業(yè)必然會(huì)大規(guī)模引進(jìn)這項(xiàng)技術(shù),這是否會(huì)帶來(lái)風(fēng)險(xiǎn)評(píng)估同質(zhì)化的問題?企業(yè)該如何進(jìn)行產(chǎn)品的差異化開發(fā)?
這個(gè)問題確實(shí)存在,未來(lái)同一個(gè)行業(yè)用到的AI算法大多類似。但每個(gè)企業(yè)采集到的數(shù)據(jù)端不同。如果企業(yè)能夠采集到足夠新、足夠可靠的數(shù)據(jù),其風(fēng)險(xiǎn)控制能力將顯著提升。因此,問題的本質(zhì)在于如何獲取盡可能多的優(yōu)質(zhì)數(shù)據(jù)。
4.人工智能能否代替?zhèn)€人征信的作用?
我個(gè)人認(rèn)為是可以的。央行的征信系統(tǒng)能夠做到多好,取決于大型機(jī)構(gòu),比如銀行和BAT等大企業(yè),愿意在多大程度上貢獻(xiàn)數(shù)據(jù)。如果這些機(jī)構(gòu)愿意將數(shù)據(jù)完全共享出來(lái),那么央行的征信系統(tǒng)可以做到非常完善,但其中存在非常大的阻力。企業(yè)們還是更愿意基于自己采集到的數(shù)據(jù),盡可能把風(fēng)控模型做到最好。如果央行無(wú)法采集到足夠多的數(shù)據(jù),其征信系統(tǒng)不見得一定比企業(yè)的風(fēng)險(xiǎn)控制系統(tǒng)更好。
5.入門應(yīng)該如何學(xué)習(xí)AI
個(gè)人認(rèn)為可以分兩個(gè)層面:首先可以上網(wǎng)搜索一些教程,比如說(shuō)雷鋒網(wǎng)硬闖公開課上的教程;另外還可以通過實(shí)現(xiàn)現(xiàn)有的、開發(fā)好的AI程序,提升自己的動(dòng)手能力??傊瑢W(xué)習(xí)和實(shí)踐相結(jié)合。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。