丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
金融科技 正文
發(fā)私信給劉偉
發(fā)送

3

秦蒼科技數(shù)據(jù)科學家沈赟:AI在消費金融產品優(yōu)化以及風險控制中的應用(附PPT+視頻) | 雷鋒網(wǎng)公開課

本文作者: 劉偉 2017-05-26 19:36 專題:雷峰網(wǎng)公開課
導語:本期硬創(chuàng)公開課,雷鋒網(wǎng)邀請到了秦蒼科技數(shù)據(jù)科學家沈赟博士,為大家分享AI在消費金融產品風險控制以及產品設計中的應用。

中國消費金融市場的用戶大致可以劃分為四種類型:1.白領和自雇人群;2.藍領;3學生;4.農民。其中,前兩者為主力消費人群,市場規(guī)模十分廣闊。白領和自雇人群往往擁有央行征信報告,主要使用銀行信用卡,以及BAT和京東等大型企業(yè)提供的消費金融產品。而多達2.5億的藍領則主要為薄文件人群(央行征信報告能夠采集到的數(shù)據(jù)非常少),他們具有很強的消費沖動,是互聯(lián)網(wǎng)金融產品的主要目標。而由于傳統(tǒng)銀行放款周期過長,無法滿足他們的需求;即時高效的互聯(lián)網(wǎng)消費金融產品也就成了他們的最佳選擇。

那么,互聯(lián)網(wǎng)消費金融企業(yè)如何才能抓住這一市場機遇,從廣大薄文件人群中尋找優(yōu)質客戶、提高用戶黏性,同時降低風險,將收益最大化呢?本期硬創(chuàng)公開課,雷鋒網(wǎng)邀請到了秦蒼科技數(shù)據(jù)科學家沈赟博士,為大家分享AI在消費金融產品優(yōu)化以及風險控制中的應用。

內容介紹:

本次公開課包含以下內容:

1. 根據(jù)用戶多維弱變量數(shù)據(jù)的綜合信用評分

2. 社交網(wǎng)絡算法應用于金融反欺詐

3.基于機器學習模型的額度策略

4 基于機器學習的金融產品設計

5.人工智能應用的前沿探索:用戶生命周期管理

嘉賓介紹

秦蒼科技數(shù)據(jù)科學家沈赟:AI在消費金融產品優(yōu)化以及風險控制中的應用(附PPT+視頻) | 雷鋒網(wǎng)公開課

沈赟博士,秦蒼科技數(shù)據(jù)科學家,具有9年金融領域機器學習研究開發(fā)經(jīng)驗。擁有德國柏林工業(yè)大學電子信息科學與技術博士學位、上海交通大學計算機科學與技術碩士學位、德國柏林工業(yè)大學電子信息科學與技術碩士學位、上海交通大學計算機科學與技術本科學位。

曾在Journal of Machine Learning Research, Neural Computation, SIAM Journal on Control and Optimization等機器學習、神經(jīng)網(wǎng)絡以及應用數(shù)學等領域的頂級期刊和會議上發(fā)表多篇學術論文。

曾任職德國LOBSTER Data 量化分析師,分析處理高頻Nasdaq數(shù)據(jù),輔助完成產品上線。現(xiàn)擔任秦蒼科技數(shù)據(jù)科學家,率領團隊構建基于機器學習的信用評分、額度策略、反欺詐以及用戶生命周期內的自動化動態(tài)調頻系統(tǒng)等。成功打造了基于用戶數(shù)據(jù)1秒內完成信用評分的評分機制,相比傳統(tǒng)模型提高了25%AUC。

(本期公開課完整視頻,共51分鐘)

以下為雷鋒網(wǎng)對嘉賓分享內容的實錄精編。

風險控制

信用評分

風險控制是消費金融領域的一大核心問題,信用評分機制則是控制風險的有效手段。信用評分機制可以簡化為分類問題,即根據(jù)用戶歷史上的行為,來判斷他是“好人”還是“壞人”。假如一個用戶逾期幾個月,那么我們就認定他是“壞人”,若沒有逾期行為,則為“好人”。

秦蒼科技數(shù)據(jù)科學家沈赟:AI在消費金融產品優(yōu)化以及風險控制中的應用(附PPT+視頻) | 雷鋒網(wǎng)公開課

我們采用了機器監(jiān)督學習中的經(jīng)典分類算法來進行用戶信用評分。評分過程可以分為以下幾步:

數(shù)據(jù)導入和清洗。因為數(shù)據(jù)采集過程中可能會采集到臟數(shù)據(jù),此外,我們還需要剔除部分不可用、不可計算的數(shù)據(jù),以及空數(shù)據(jù)。

特征提取。采集數(shù)據(jù)時,我們通常會采集多達一萬多個數(shù)據(jù)點,然后通過特征提取的方式提取幾百個特征點。

模型選擇。在模型中,我們會運用到一些機器學習算法,比如邏輯回歸、隨機森林、AdaBoost、XgBoost、神經(jīng)網(wǎng)絡等。選擇模型時,我們會采取cross validation的方式,同時運用基于ROC的AUC來決策模型的好壞。

決策。決策過后,我們可以觀察用戶表現(xiàn),重新提取數(shù)據(jù)訓練模型,形成正向反饋循環(huán)。也就是說,隨著收集到更多、更新的數(shù)據(jù),我們的模型將不斷迭代和進化。

從應用結果來看,AI決策相比傳統(tǒng)手工開發(fā)的算法決策,可以把決策時間從分鐘級別縮短至0.1秒,同時降低25%的壞賬率,每年為企業(yè)節(jié)約高達上千萬的成本。

秦蒼科技數(shù)據(jù)科學家沈赟:AI在消費金融產品優(yōu)化以及風險控制中的應用(附PPT+視頻) | 雷鋒網(wǎng)公開課

在大家熟知的,使用深度神經(jīng)網(wǎng)絡解決圖像識別和云識別的問題中,一般而言,采集的數(shù)據(jù)越多,訓練出的模型就越好。但金融領域不同,金融數(shù)據(jù)具有非常強的時間效應,越靠近現(xiàn)在的數(shù)據(jù)越具備預測效力。并不是說擁有的數(shù)據(jù)越多,模型效果就越好。因此,不斷定期更新模型至關重要。

模型是基于歷史數(shù)據(jù)訓練出來的,在未來不發(fā)生異常事件的前提下,可以保持預測效力;一旦出現(xiàn)異常事件,模型的效力就有可能下降。為了保證系統(tǒng)預測的穩(wěn)定性,我們會同時開發(fā)多個模型彼此競賽。

秦蒼科技數(shù)據(jù)科學家沈赟:AI在消費金融產品優(yōu)化以及風險控制中的應用(附PPT+視頻) | 雷鋒網(wǎng)公開課

比方說,我們訓練出了三個模型,分配給他們不同的流量:模型2流量最高,模型1次之;模型3最低。一段時間后,我們可以收集到各個模型的表現(xiàn),根據(jù)其準確率動態(tài)調節(jié)流量。如果某個模型表現(xiàn)好,就多分配一些流量,反之則減少流量。如果這個模型的效力長時間內持續(xù)下降,就將逐漸被淘汰,與此同時會有新的模型加入競爭??偠灾嗄P筒⑿?,擇優(yōu)進化,對于保持系統(tǒng)的穩(wěn)定性十分重要。

通過社交網(wǎng)絡分析反欺詐

消費金融產品風險控制中,另一個非常重要的部分是反欺詐。我們反欺詐的主要手段是社交網(wǎng)絡分析。用于社交網(wǎng)絡分析的數(shù)據(jù)通常基于手機號碼,比方說手機緊急聯(lián)系人、通聯(lián)紀錄、通訊錄等。

秦蒼科技數(shù)據(jù)科學家沈赟:AI在消費金融產品優(yōu)化以及風險控制中的應用(附PPT+視頻) | 雷鋒網(wǎng)公開課

上面是一張社交網(wǎng)絡關系結構示意圖,圖中每個點代表一個用戶,通過線段連接的兩個點互為手機聯(lián)系人。其中某些用戶可以通過一個共同的節(jié)點聯(lián)系到一起,那么我們就將其看作一個團。以團為單位,可以提取到一些社交網(wǎng)絡特征:

團內其他用戶的表現(xiàn),比方說逾期率、通過量等。這一特征判斷的核心思想可以歸納為“近朱者赤,近墨者黑”。

團本身的特性,比方說節(jié)點數(shù)、團內用戶的連接緊密程度等。

團內用戶的屬性,比方說團內的女性人數(shù)、地區(qū)分布、平均借款額度等。一般而言,團內女性人數(shù)占比越大,團內用戶是“好人”的概率就越大。

秦蒼科技數(shù)據(jù)科學家沈赟:AI在消費金融產品優(yōu)化以及風險控制中的應用(附PPT+視頻) | 雷鋒網(wǎng)公開課

從社交網(wǎng)絡中提取的特征主要可應用于兩大方面:

一、將特征數(shù)據(jù)加入信用評分模型,提升其準確度。根據(jù)以往的經(jīng)驗,加入這些數(shù)據(jù)后,AUC值可以提升3-5%。

二、通過無監(jiān)督的聚類方法來預防欺詐。我們將某個地區(qū)的所有用戶進行特征分析后,投影到二維平面,通常可以發(fā)現(xiàn)兩到三個異常點,他們距離其他用戶非常遠。這時候就會觸發(fā)我們的調查機制,調查這個用戶是否真的存在欺詐行為。實踐檢驗,這種異常值檢測的方法可達到60%左右的準確率,證明對于預防欺詐,社交網(wǎng)絡特征分析確實行之有效。

產品優(yōu)化

優(yōu)化金融產品參數(shù)

消費金融產品主要指分期借貸,我們可以把它想象成信用卡,其主要參數(shù)有額度、利率和期數(shù)。設計這些參數(shù)時,我們主要需要考慮兩個方面:

產品的接受度。我們向用戶推薦產品時,用戶是否會接受?一般而言,產品額度越大、利率越低,用戶接受的可能性就越大。

風險控制。隨著用戶接受度提高,風險也在增加。如果我們向用戶提供的額度超出其償還能力,資金就很可能收不回來。

產品的接受度和風險彼此沖突,我們需要尋找折中方案。

下面介紹一個我們開發(fā)的基于貝葉斯算法的框架。在消費金融場景中,簡單來說,可以把用戶劃分為“好人”和“壞人”。在給定用戶表現(xiàn)和金融產品參數(shù)的前提下,基本可以確定這款產品能夠帶來的受益。但同一個用戶在不同時期的表現(xiàn)是不一樣的。比方說,用戶這段時間經(jīng)濟狀況較好,能夠及時還款;一段時間后他經(jīng)濟狀況變壞了,就很有可能還不上。用戶是“好人”還是“壞人”,是個概率性問題。

秦蒼科技數(shù)據(jù)科學家沈赟:AI在消費金融產品優(yōu)化以及風險控制中的應用(附PPT+視頻) | 雷鋒網(wǎng)公開課

上面的公式中,p代表在給定某個金融產品和用戶的前提下,這個用戶是“好人”還是“壞人”的概率。統(tǒng)籌考慮所有情況后,就能得出這個用戶身上的期望收益。

我們希望通過調整產品參數(shù)將收益最大化,同時也需要關注用戶逾期的風險。在給定某個產品的前提下,我們希望用戶是“好人”的概率大于某個值,比如0.6或者0.8。這樣可以間接控制用戶可能帶來的損失。

秦蒼科技數(shù)據(jù)科學家沈赟:AI在消費金融產品優(yōu)化以及風險控制中的應用(附PPT+視頻) | 雷鋒網(wǎng)公開課

上圖展示了我們對“用戶是‘好人’還是‘壞人’”的概率估計情況。其中x軸代表額度,y軸代表期數(shù),z軸代表用戶是“好人”的概率,每一個曲面對應一位用戶。從圖中可以看出,有些用戶對于額度和期數(shù)不太敏感。雖然隨著額度和期數(shù)增加,他們是“好人”的概率有所下降,但始終高于某個數(shù)值。有些用戶則對額度和期數(shù)非常敏感。通過大量提取用戶特征,我們可以不斷對模型進行優(yōu)化,為每個用戶量身打造合適的金融產品。

秦蒼科技數(shù)據(jù)科學家沈赟:AI在消費金融產品優(yōu)化以及風險控制中的應用(附PPT+視頻) | 雷鋒網(wǎng)公開課

那么,這個模型的效力究竟如何呢?上圖進行了展示。圖中x軸代表風險閾值,左端表示閾值非常低,我們可以冒巨大的風險;右端表示閾值非常高,放款策略趨于保守。y軸則代表我們針對某個用戶預測的放款金額,與其歷史放款金額的比例關系。若比例大于1,就說明預測的放款金額高于歷史放款金額,同理反推。從圖中可以看出:

在同一風險閾值下,“好人”(黑色)獲得的額度總是高于“壞人”(橙色)。

隨著風險閾值提高,用戶獲得的放款額度逐漸下降。

在給定風險閾值的前提下,“好人”獲得的預期額度總是高于歷史額度,“壞人”則恰恰相反。

結果和預期完全相符,這證明了我們基于貝葉斯算法的分析框架確實行之有效。

延長用戶生命周期

企業(yè)總是希望用戶能盡可能長時間地使用自己的產品。因此新用戶借款并如期還款后,企業(yè)還會向其推薦其他金融產品。那么,如何最大限度地留住客戶,延長其生命周期呢?

秦蒼科技數(shù)據(jù)科學家沈赟:AI在消費金融產品優(yōu)化以及風險控制中的應用(附PPT+視頻) | 雷鋒網(wǎng)公開課

在用戶的整個還款周期中,我們可以通過用戶在每一個還款節(jié)點的表現(xiàn),判斷其是“好人”還是“壞人”,并作出相應調整。如果用戶還款表現(xiàn)好,可適當提升額度或降低利息,鼓勵其使用我們的其他產品。若用戶表現(xiàn)差,則可以降低額度和提高利息,以防控風險。極端情況下,將啟動調查或催收機制。

借助這些手段,企業(yè)可以提升用戶黏性,并將收益最大化。

馬爾科夫決策過程-增強學習

為實現(xiàn)這一目的,我們采用了深度學習以及運籌學中非常經(jīng)典的馬爾科夫決策過程進行建模。企業(yè)關注的是用戶在整個生命周期中帶來的累積收益,因此不同于前面提到產品參數(shù)優(yōu)化。產品參數(shù)優(yōu)化是單步?jīng)Q策,而收益最大化是多步?jīng)Q策問題,需要在每一步?jīng)Q策中不斷優(yōu)化我們的策略。

秦蒼科技數(shù)據(jù)科學家沈赟:AI在消費金融產品優(yōu)化以及風險控制中的應用(附PPT+視頻) | 雷鋒網(wǎng)公開課

上圖中的公式中,r是一個reward函數(shù),它取決于st和θt兩個變量。st和θt分別代表當前賬期下用戶的表現(xiàn)(逾期或提前還款等)以及企業(yè)的決策(提額或降息等)。π則代表企業(yè)在每個賬期中的單步策略累計而成的整體策略。通過這個公式,我們可以得到預期的最大收益。

昨天阿爾法go再次戰(zhàn)勝了中國著名棋手柯潔。阿爾法go用到的一個核心算法叫做增強學習,增強學習的本質其實也是馬爾科夫決策過程。它用到了不斷迭代的online learning算法來解決多步?jīng)Q策問題。

馬爾科夫決策應用到消費金融場景,過程大致如下:新用戶進來后,系統(tǒng)會抽取他的個人特征,同時根據(jù)其當前還款狀態(tài),以及在這個時間點上帶來的利潤或者損失,優(yōu)化value function和state representation。value function和state representation是通過分析和學習用戶歷史數(shù)據(jù)得來的,加入新的數(shù)據(jù)后,系統(tǒng)會不斷校正value值。如果某一步?jīng)Q策對我們不利,那么其value值就會降低,反之則value值提高。如此不斷循環(huán)往復。

總結

前面提到,AI在消費金融風險控制以及產品優(yōu)化方面,能夠發(fā)揮巨大重要。但需要強調的是,現(xiàn)在AI概念非常熱門,大家都希望學到最新的算法;但要把AI算法落地到實際生產和業(yè)務中,還是應該立足業(yè)務本身,不斷挖掘數(shù)據(jù)優(yōu)化模型。選擇什么模型不重要,模型好壞最終還是要看它是否能夠給業(yè)務帶來增長。最理想的狀態(tài)是,企業(yè)能夠通過模型優(yōu)化業(yè)務流程,獲取更多數(shù)據(jù),然后利用新的數(shù)據(jù)進一步優(yōu)化模型,形成良性循環(huán)。

QA:

1.除了風險控制,未來AI還可以應用到消費金融的哪些環(huán)節(jié),將給行業(yè)帶來怎樣的改變?

前面已經(jīng)提到了產品結構優(yōu)化。通過優(yōu)化產品參數(shù)和結構,來提升用戶黏性,將收益最大化,這對于企業(yè)來說非常重要。除此之外,AI還可以用于產品推廣,比如通過現(xiàn)有的社交網(wǎng)絡,向其他用戶推薦適合他們的金融產品。

2.在目前技術條件下,AI風控相比傳統(tǒng)風控存在哪些不足?未來如何提高?

AI技術立足于大數(shù)據(jù)。如果我們能夠獲取足夠多、足夠新的,具有表征能力的數(shù)據(jù), AI風控一定能夠打敗傳統(tǒng)風控。但很多時候,企業(yè)獲取的數(shù)據(jù)往往不夠充分。這時候,基于長期經(jīng)驗積累的傳統(tǒng)風控往往能夠提供行之有效的風險控制手段,雖然他們的方案不一定是最優(yōu)的。如果未來AI能夠進化到擁有學習和推理能力,那么它完全能夠取代傳統(tǒng)風控,不過短期內還很難實現(xiàn)。

3.隨著人工智能發(fā)展趨于成熟,未來消費金融行業(yè)必然會大規(guī)模引進這項技術,這是否會帶來風險評估同質化的問題?企業(yè)該如何進行產品的差異化開發(fā)?

這個問題確實存在,未來同一個行業(yè)用到的AI算法大多類似。但每個企業(yè)采集到的數(shù)據(jù)端不同。如果企業(yè)能夠采集到足夠新、足夠可靠的數(shù)據(jù),其風險控制能力將顯著提升。因此,問題的本質在于如何獲取盡可能多的優(yōu)質數(shù)據(jù)。

4.人工智能能否代替?zhèn)€人征信的作用?

我個人認為是可以的。央行的征信系統(tǒng)能夠做到多好,取決于大型機構,比如銀行和BAT等大企業(yè),愿意在多大程度上貢獻數(shù)據(jù)。如果這些機構愿意將數(shù)據(jù)完全共享出來,那么央行的征信系統(tǒng)可以做到非常完善,但其中存在非常大的阻力。企業(yè)們還是更愿意基于自己采集到的數(shù)據(jù),盡可能把風控模型做到最好。如果央行無法采集到足夠多的數(shù)據(jù),其征信系統(tǒng)不見得一定比企業(yè)的風險控制系統(tǒng)更好。

5.入門應該如何學習AI

個人認為可以分兩個層面:首先可以上網(wǎng)搜索一些教程,比如說雷鋒網(wǎng)硬闖公開課上的教程;另外還可以通過實現(xiàn)現(xiàn)有的、開發(fā)好的AI程序,提升自己的動手能力。總之,學習和實踐相結合。

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉載。詳情見轉載須知

分享:
相關文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設置密碼以方便用郵箱登錄
立即設置 以后再說