0
本文作者: 張馳 | 2016-11-03 19:06 | 專題:雷峰網(wǎng)公開課 |
一個(gè)普遍的看法是,機(jī)器學(xué)習(xí)等人工智能技術(shù)會(huì)最先在金融領(lǐng)域落地。金融行業(yè)是最早實(shí)現(xiàn)信息化的行業(yè),有豐富的數(shù)據(jù)積累,且對(duì)于用技術(shù)提升效率有更多的需求。
現(xiàn)在也有越來(lái)越多的公司開始使用機(jī)器學(xué)習(xí)技術(shù)實(shí)現(xiàn)自動(dòng)風(fēng)險(xiǎn)管理與放貸。但機(jī)器學(xué)習(xí)在風(fēng)控中的作用究竟如何,有哪些關(guān)鍵技術(shù),其優(yōu)勢(shì)與缺點(diǎn)又有哪些呢?本期硬創(chuàng)公開課,雷鋒網(wǎng)邀請(qǐng)百融金服風(fēng)險(xiǎn)總監(jiān)鄭宏洲,來(lái)講講機(jī)器學(xué)習(xí)與大數(shù)據(jù)風(fēng)控的那些事。
鄭宏洲,百融金服風(fēng)險(xiǎn)總監(jiān)。國(guó)內(nèi)商業(yè)銀行模型團(tuán)隊(duì)多年管理經(jīng)驗(yàn),專注于大數(shù)據(jù)機(jī)器學(xué)習(xí)、信貸風(fēng)險(xiǎn)策略、模型評(píng)分管理等風(fēng)控領(lǐng)域。從事大數(shù)據(jù)分析和信貸風(fēng)險(xiǎn)管理近十年,在金融行業(yè)的數(shù)據(jù)分析、平臺(tái)架構(gòu)、模型研究和風(fēng)險(xiǎn)策略等方面有深刻的理解。帶領(lǐng)團(tuán)隊(duì)搭建多家銀行風(fēng)控體系,負(fù)責(zé)風(fēng)控量化管理和風(fēng)險(xiǎn)策略優(yōu)化多年。
雷鋒網(wǎng):今年人工智能很火,機(jī)器學(xué)習(xí)與深度學(xué)習(xí)等詞甚至被很多非業(yè)內(nèi)人熟知,那金融行業(yè)對(duì)機(jī)器學(xué)習(xí)的態(tài)度是怎么樣的?
鄭宏洲:講這個(gè)話題之前,我覺得我們需要先把一些名詞稍微界定一下。我們今天討論的金融行業(yè),主要討論的是零售信貸行業(yè)。機(jī)器學(xué)習(xí)這個(gè)概念也比較大,簡(jiǎn)單的說是利用計(jì)算機(jī)模擬或?qū)崿F(xiàn)人類的學(xué)習(xí)行為,解決實(shí)際決策問題的方法論。深度學(xué)習(xí)屬于機(jī)器學(xué)習(xí)中的一種,廣義來(lái)說,像信貸評(píng)分中的邏輯回歸等統(tǒng)計(jì)方法,也可認(rèn)為是機(jī)器學(xué)習(xí)中的一種。而我們今天談的機(jī)器學(xué)習(xí)主要是狹義的概念,即基于非統(tǒng)計(jì)原理的數(shù)據(jù)挖掘方法。
那么信貸行業(yè)對(duì)機(jī)器學(xué)習(xí)的態(tài)度可以說既擁護(hù)又謹(jǐn)慎?,F(xiàn)代成熟的信貸企業(yè),更多是依賴自動(dòng)化的方式。例如:信貸風(fēng)險(xiǎn)管理,其核心是量化風(fēng)險(xiǎn)。在量化風(fēng)險(xiǎn)過程中,實(shí)際采用了相當(dāng)多的統(tǒng)計(jì)分析技術(shù)。以信貸評(píng)分卡為例,方法論上和今天討論的機(jī)器學(xué)習(xí)有很多共通之處,它都是解決分類問題。只是金融信貸行業(yè)可能會(huì)從業(yè)務(wù)的角度去出發(fā),關(guān)鍵是尋找解決問題的方法,對(duì)新方法和理論有很多期待,因此金融信貸行業(yè)從來(lái)對(duì)機(jī)器學(xué)習(xí)是擁護(hù)的態(tài)度。另外一方面,因?yàn)榻鹑诤拓泿艗煦^,在很多關(guān)鍵技術(shù)上的使用上會(huì)比較謹(jǐn)慎,對(duì)安全性和規(guī)范性要求更高,因此從這個(gè)角度上看,會(huì)表現(xiàn)為對(duì)新技術(shù)上的謹(jǐn)慎態(tài)度。
雷鋒網(wǎng):機(jī)器學(xué)習(xí)在金融中的應(yīng)用有哪些?
鄭宏洲:機(jī)器學(xué)習(xí)在金融中的應(yīng)用很廣,例如:投資領(lǐng)域會(huì)用來(lái)做量化投資、高頻交易;保險(xiǎn)行業(yè)做營(yíng)銷獲客和精算定損;信貸信用管理做信貸評(píng)分卡、風(fēng)險(xiǎn)策略等等;信貸反欺詐用它做人臉識(shí)別和語(yǔ)音識(shí)別等等。機(jī)器學(xué)習(xí)幾乎在每一個(gè)有數(shù)據(jù)的場(chǎng)景都有應(yīng)用。它主要是區(qū)別于純粹人工經(jīng)驗(yàn)去做決策。
雷鋒網(wǎng):目前來(lái)說,機(jī)器學(xué)習(xí)在大數(shù)據(jù)風(fēng)控中是怎么樣的地位?作用多大?
鄭宏洲:我們知道,風(fēng)控是信貸管理業(yè)務(wù)中的重要組成部分。風(fēng)控按形式,可以分為傳統(tǒng)人工風(fēng)控和量化風(fēng)控。大數(shù)據(jù)風(fēng)控是量化風(fēng)控的一種新形式,出現(xiàn)主要的條件是,現(xiàn)代社會(huì)是一個(gè)信息社會(huì),在信息和數(shù)據(jù)上極大的膨脹,這給我們有更全面衡量個(gè)體風(fēng)險(xiǎn)的機(jī)會(huì)。
大數(shù)據(jù)風(fēng)控,這是依托于海量的數(shù)據(jù)去判斷借款人的信貸風(fēng)險(xiǎn),這就決定了它比傳統(tǒng)方法更依賴于技術(shù)方法去處理,同時(shí)大數(shù)據(jù)時(shí)常伴隨著高維度稀疏性等特點(diǎn),這決定了機(jī)器學(xué)習(xí)是實(shí)現(xiàn)這一場(chǎng)景的核心方法。
區(qū)別于傳統(tǒng)風(fēng)控技術(shù),大數(shù)據(jù)風(fēng)控是在方法論上做了相應(yīng)的革新。風(fēng)險(xiǎn),即不確定性。風(fēng)險(xiǎn)管理實(shí)際上就是做量化風(fēng)險(xiǎn)。大數(shù)據(jù)風(fēng)控是將貸款主體各個(gè)方面的屬性維度做全面風(fēng)險(xiǎn)的量化。它的主流技術(shù)滲透到量化風(fēng)險(xiǎn)的整個(gè)流程中去,包括貸前、貸中、貸后以及營(yíng)銷獲客等全生命周期的管理。機(jī)器學(xué)習(xí)作為大數(shù)據(jù)風(fēng)控的顯著特征出現(xiàn),充當(dāng)著重要的技術(shù)更新角色。通過它去解決傳統(tǒng)方法無(wú)法解決的問題,它是大數(shù)據(jù)價(jià)值變現(xiàn)的重要工具,機(jī)器學(xué)習(xí)的技術(shù)水平在某種程度上是一家大數(shù)據(jù)公司的核心競(jìng)爭(zhēng)力。
雷鋒網(wǎng):機(jī)器學(xué)習(xí)用于風(fēng)控,有哪些較為成熟的技術(shù)方案嗎,主流的技術(shù)途徑又有哪些?
鄭宏洲: 機(jī)器學(xué)習(xí)按大類分監(jiān)督學(xué)習(xí)和非監(jiān)督學(xué)習(xí)。用于風(fēng)控領(lǐng)域,實(shí)際上這兩種都用到了,其中監(jiān)督學(xué)習(xí)通常作為主要手段解決問題,非監(jiān)督學(xué)習(xí)主要作為輔助方法。對(duì)于監(jiān)督學(xué)習(xí)中,根據(jù)分類器選擇不同又形成不同的方法,監(jiān)督學(xué)習(xí)中目前比較成熟的,包含決策樹、支持向量機(jī)、隨機(jī)森林、adaboost、gbdt等技術(shù)方案。而主流的技術(shù),像隨機(jī)森林、gbdt,目前被業(yè)內(nèi)廣泛應(yīng)用。它們各自適用于不同的具體數(shù)據(jù)情況,在特定的業(yè)務(wù)場(chǎng)景上會(huì)發(fā)揮獨(dú)特的效果。
雷鋒網(wǎng):您個(gè)人比較看好哪些機(jī)器學(xué)習(xí)技術(shù)(用于金融領(lǐng)域)嗎?
鄭宏洲:機(jī)器學(xué)習(xí)仍在發(fā)展中,個(gè)人比較看好深度學(xué)習(xí)。目前深度學(xué)習(xí)主要還是應(yīng)用在解決非結(jié)構(gòu)數(shù)據(jù)的分類問題上。例如圖像識(shí)別、語(yǔ)音識(shí)別等領(lǐng)域,包括像我們熟悉的人工智能領(lǐng)域的AlphaGo。深度學(xué)習(xí)比其它機(jī)器學(xué)習(xí)能構(gòu)造出更多的特征層,更有效地發(fā)現(xiàn)模式和規(guī)律。
每項(xiàng)技術(shù)都伴隨業(yè)務(wù)發(fā)展需要而體現(xiàn)自身的價(jià)值。對(duì)應(yīng)到信貸領(lǐng)域,人臉識(shí)別、語(yǔ)音識(shí)別被廣泛用在反欺詐驗(yàn)真環(huán)節(jié)。在金融領(lǐng)域,反欺詐實(shí)際上有更多機(jī)器學(xué)習(xí)發(fā)揮的空間。這是因?yàn)榉雌墼p的特點(diǎn)在于行為的隱蔽性、稀釋性。群體壞樣本小量但聚集,對(duì)傳統(tǒng)方法提出了很多挑戰(zhàn),除了驗(yàn)真環(huán)節(jié),反欺詐模型上也更適合使用機(jī)器學(xué)習(xí)方法。它對(duì)模型的精準(zhǔn)度和誤判率都有相當(dāng)?shù)囊?,在穩(wěn)定性上有挑戰(zhàn)。
雷鋒網(wǎng):在考慮使用機(jī)器學(xué)習(xí)做風(fēng)控時(shí),有哪些評(píng)判指標(biāo)及技術(shù)指標(biāo)?
鄭宏洲:機(jī)器學(xué)習(xí)的方法有很多,在風(fēng)控管理上的應(yīng)用也有很多種場(chǎng)景。對(duì)于每一種機(jī)器學(xué)習(xí)技術(shù),其評(píng)判的指標(biāo)和技術(shù)標(biāo)準(zhǔn)都不一樣。我們下面來(lái)舉一個(gè)常見的應(yīng)用場(chǎng)景,風(fēng)險(xiǎn)評(píng)分,它預(yù)測(cè)一個(gè)事件在未來(lái)是否會(huì)發(fā)生。像這樣的場(chǎng)景,無(wú)論是機(jī)器學(xué)習(xí)還是傳統(tǒng)統(tǒng)計(jì)方法,評(píng)判指標(biāo)并沒有太大的差別。主要差異是分類器的差別(在分類問題上),區(qū)別的是變量,對(duì)于結(jié)果來(lái)講是類似的判斷標(biāo)準(zhǔn)。
這里要講常見的一些誤區(qū),比如凡是風(fēng)險(xiǎn)模型都看KS,AUC等指標(biāo)。經(jīng)常有人說,某模型KS達(dá)到50或60,而你的模型KS可能才40,并因此說你的模型不如別人。模型的區(qū)分度首先是和樣本很有關(guān)系,它很容易偽造效果。比如我將模型區(qū)分不準(zhǔn)的樣本做剔除,那么它可能突然可以從很低的KS提升到很高。又比如說將業(yè)務(wù)上的靜止客戶做剔除,KS也會(huì)有很大的變化。
舉這個(gè)例子是說,技術(shù)指標(biāo)首先需要在相同的樣本下比較才有意義。另外一方面,KS并不是衡量一個(gè)模型好壞的關(guān)鍵要素,只是因?yàn)樗钪庇^,可以粗略知道模型的區(qū)分度,它的意義類似于變量IV值的作用。很多時(shí)候模型的穩(wěn)定性要比KS這些指標(biāo)更為重要,同時(shí)還看你業(yè)務(wù)應(yīng)用的范圍上群體的效果。
雷鋒網(wǎng):機(jī)器學(xué)習(xí)應(yīng)用于風(fēng)控,優(yōu)勢(shì)與弊端是什么?
鄭宏洲:機(jī)器學(xué)習(xí)對(duì)于風(fēng)控來(lái)說,優(yōu)勢(shì)是帶來(lái)了新的技術(shù)革命。在自動(dòng)化審批、區(qū)分精準(zhǔn)度、開發(fā)效率等方面都比傳統(tǒng)的風(fēng)控方法有更多的可能性,這是它的優(yōu)勢(shì)。而弊端是,新技術(shù)在完備性上很多時(shí)候還不成熟,很多方法論仍處于探索階段,在解決方案上沒有形成完整的閉環(huán)。例如:風(fēng)控模型的可解釋性。傳統(tǒng)模型入選若干變量,每個(gè)要求有很好的解釋性,而機(jī)器學(xué)習(xí)會(huì)入選成百上千的變量,這些變量不是很直觀。這是任何新技術(shù)都會(huì)類似產(chǎn)生的問題,它需要時(shí)間去探索和修正,可以說道路是曲折的,前景是光明的。
雷鋒網(wǎng):您對(duì)機(jī)器學(xué)習(xí)應(yīng)用于風(fēng)控模型時(shí)缺乏可解釋性怎么看?這一問題又該如何解決?
鄭宏洲:機(jī)器學(xué)習(xí)應(yīng)用于風(fēng)控模型時(shí),缺乏可解釋性是一個(gè)普遍的問題。
首先,為什么會(huì)出現(xiàn)缺乏可解釋性?我們說了機(jī)器學(xué)習(xí)風(fēng)控模型區(qū)分度上往往有更好的表現(xiàn),然而它的問題是復(fù)雜度遠(yuǎn)要高于傳統(tǒng)方法,因?yàn)闄C(jī)器學(xué)習(xí)擬合進(jìn)去更多非線性關(guān)系,人類去理解很多非線性規(guī)律交織在一起是有難度的,這就造成了我們說的缺乏可解釋性的現(xiàn)象。
其次,這種缺乏可解釋性可不可???這里面實(shí)際可以再細(xì)分為兩種情況。非線性關(guān)系其中一種可能只是噪音,而另外一種實(shí)際的非線性規(guī)律。我們?cè)谧鰴C(jī)器學(xué)習(xí)時(shí),如果太迷信技術(shù)方法的本身,處理太粗糙可能會(huì)將更多的噪音擬合進(jìn)來(lái),這個(gè)問題也是很多統(tǒng)計(jì)學(xué)家通過很多算法不斷去調(diào)優(yōu)機(jī)器學(xué)習(xí)算法的初衷之一,并且隨著新技術(shù)的不斷更新會(huì)越來(lái)越優(yōu)化。另外一種是實(shí)際的非線性規(guī)律,這就是某些機(jī)器學(xué)習(xí)方法在特定場(chǎng)景下會(huì)比傳統(tǒng)統(tǒng)計(jì)方法效果更優(yōu)的主要原因。邏輯回歸本身是一種廣義的線性模型,它放棄了很多非線性的關(guān)系。傳統(tǒng)統(tǒng)計(jì)方法并不是不如機(jī)器學(xué)習(xí),而是對(duì)建模的人水平要求更高,一個(gè)建模大師,他也許要費(fèi)比機(jī)器學(xué)習(xí)更多的精力去做這件事情,但結(jié)果仍然可以和最好的機(jī)器學(xué)習(xí)分類方法媲美,并且具備機(jī)器學(xué)習(xí)不具備的優(yōu)點(diǎn)。
那么既然機(jī)器學(xué)習(xí)好像更容易更快的解決問題,傳統(tǒng)統(tǒng)計(jì)方法的意義又在哪里?傳統(tǒng)統(tǒng)計(jì)方法通過犧牲掉一小部分的區(qū)分度效果,換取數(shù)據(jù)的可解釋性。實(shí)際上是將復(fù)雜問題簡(jiǎn)單化,將復(fù)雜的現(xiàn)實(shí)世界分解為更為容易理解的模式,這和人理解復(fù)雜的現(xiàn)實(shí)世界方法是相符的。這種處理方式的好處是業(yè)務(wù)更容易調(diào)整和監(jiān)控,并且容易避免數(shù)據(jù)噪音干擾。
部分技術(shù)專業(yè)人士會(huì)覺得把技術(shù)做得很好就行了,但如果能把模型做得特別好,一定是技術(shù)與業(yè)務(wù)兼顧。模型實(shí)際上是整個(gè)風(fēng)險(xiǎn)應(yīng)用線條上的一個(gè)節(jié)點(diǎn),所有的規(guī)律和發(fā)現(xiàn)是服務(wù)于業(yè)務(wù)的,這導(dǎo)致不可解釋性會(huì)沒被采用,而會(huì)用更容易理解的特征去把握風(fēng)險(xiǎn)。
機(jī)器學(xué)習(xí)的不可解釋性實(shí)際上無(wú)法根本的解決,一般會(huì)有兩種變通的方式:第一種,將機(jī)器學(xué)習(xí)作為傳統(tǒng)方法的輔助,幫忙人去發(fā)現(xiàn)數(shù)據(jù)上難以發(fā)現(xiàn)的非線性規(guī)律;第二種,分解到單一維度去理解非線性關(guān)系。
雷鋒網(wǎng):機(jī)器學(xué)習(xí)做風(fēng)控中,人工的地位與作用是怎么樣的?
鄭宏洲:目前一些傳統(tǒng)的信貸企業(yè),在規(guī)模還較小的階段,仍存在很多通過人工審批和風(fēng)控經(jīng)驗(yàn)去完成整個(gè)風(fēng)控管理。然而當(dāng)信貸規(guī)模龐大的情況下,特別是額度較小的信貸業(yè)務(wù),純粹靠人工去做風(fēng)控變得很艱難。一方面是成本效率上的問題,進(jìn)件量大的時(shí)候要付出相當(dāng)多人力成本和時(shí)間成本;另外一方面是人工匹配和主觀判斷容易導(dǎo)致出錯(cuò),并且在業(yè)務(wù)優(yōu)化和積累難以傳承。
這些方面都會(huì)導(dǎo)致純?nèi)斯さ姆绞诫y以支撐現(xiàn)代的信貸管理模式。另外一個(gè)角度,人工的方式實(shí)際上也有它的優(yōu)點(diǎn),它能在業(yè)務(wù)開展過程中實(shí)現(xiàn)很多感性認(rèn)識(shí)和經(jīng)驗(yàn)積累,是很多業(yè)務(wù)特征和模式的發(fā)現(xiàn)來(lái)源。很多場(chǎng)景下,仍然需要人工去主導(dǎo)做決策。
雷鋒網(wǎng):機(jī)器學(xué)習(xí)能在多大程度上替代人工的思考,在風(fēng)控中是否會(huì)出現(xiàn)機(jī)器與人相沖突的情況?
鄭宏洲:機(jī)器學(xué)習(xí)在未來(lái)能夠在很多方面替代人工,但無(wú)法全面替代。機(jī)器學(xué)習(xí)是一種技術(shù),是對(duì)人工的一部分工作進(jìn)行優(yōu)化,這種優(yōu)化會(huì)融合和促進(jìn)很多人工搭配機(jī)器一起工作的方式。
風(fēng)控管理中可能會(huì)存在機(jī)器和人相沖突的情況,這種情況需要分開去討論。在實(shí)際業(yè)務(wù)開展中,機(jī)器做的是發(fā)現(xiàn)歷史的規(guī)律,它有很多的適用范圍和噪音處理等問題,這時(shí)候就需要人去干預(yù),不斷優(yōu)化機(jī)器學(xué)習(xí)的方法和彌補(bǔ)其不足,所以說我們要求做風(fēng)控的人才既要懂技術(shù)又要懂業(yè)務(wù),是一種綜合的人才。
而另外一方面,人的行為本身有很多主觀的判斷,會(huì)受情緒等非理性的因素影響,使決策結(jié)果失真,這時(shí)候機(jī)器又能理性地協(xié)助人的決策。所以這兩者是相輔相成的作用,而不是簡(jiǎn)單的沖突。當(dāng)機(jī)器和人不一致的情況發(fā)生時(shí),往往是發(fā)現(xiàn)業(yè)務(wù)價(jià)值的時(shí)刻。因此要求風(fēng)控專家對(duì)數(shù)據(jù)和特征有敏感度。
雷鋒網(wǎng):從機(jī)器學(xué)習(xí)算法到真正應(yīng)用到產(chǎn)品中,其中需要跨越的挑戰(zhàn)會(huì)是什么?
鄭宏洲:實(shí)際上目前很多機(jī)器學(xué)習(xí)已經(jīng)應(yīng)用到真正的產(chǎn)品中,而且被大家廣泛的使用。比如說人臉識(shí)別,比如說推薦算法。而在信貸風(fēng)控領(lǐng)域,非統(tǒng)計(jì)方法的機(jī)器學(xué)習(xí)真正深入人心和被人所接收,則還需要時(shí)間。主要的挑戰(zhàn)有以下幾點(diǎn):
1、傳統(tǒng)統(tǒng)計(jì)方法仍然是主流的風(fēng)控方法,業(yè)務(wù)應(yīng)用模式適應(yīng)業(yè)務(wù)發(fā)展,變更意愿不強(qiáng)。
2、新技術(shù)的不成熟性,新方法可能帶來(lái)的新問題需要完整的體系去解決。
推動(dòng)技術(shù)更新和應(yīng)用永遠(yuǎn)是業(yè)務(wù)發(fā)展,傳統(tǒng)的很多方式可能無(wú)法滿足業(yè)務(wù)發(fā)展,就自然而然會(huì)被新方法所代替。例如像傳統(tǒng)方法建模時(shí)間長(zhǎng),對(duì)經(jīng)驗(yàn)依賴更多等問題,可能會(huì)被更高效的機(jī)器學(xué)習(xí)所替代。
雷鋒網(wǎng):百融金服在機(jī)器學(xué)習(xí)的應(yīng)用上,有哪些實(shí)踐經(jīng)驗(yàn)可以分享?
鄭宏洲:百融是一家金融大數(shù)據(jù)信息服務(wù)公司,其服務(wù)的對(duì)象是金融企業(yè)。這就決定了在技術(shù)探索和業(yè)務(wù)分析上會(huì)有很多的嘗試。百融在很多前沿技術(shù)上都做過探索和創(chuàng)新,百融有自己的聯(lián)合建模實(shí)驗(yàn)室和機(jī)器學(xué)習(xí)團(tuán)隊(duì)。開發(fā)了百融100brain機(jī)器學(xué)習(xí)平臺(tái),它是一個(gè)分布式的純R平臺(tái),在這個(gè)平臺(tái)上做機(jī)器學(xué)習(xí)知識(shí)的傳承和分享。我們內(nèi)部還舉辦了各種技術(shù)大賽,去驗(yàn)證傳統(tǒng)統(tǒng)計(jì)方法和機(jī)器學(xué)習(xí)方法的效果優(yōu)劣。百融在反欺詐領(lǐng)域,我們也采用機(jī)器學(xué)習(xí)的方法,去識(shí)別特征異常的群體和規(guī)律。同時(shí),我們信用風(fēng)險(xiǎn)領(lǐng)域構(gòu)建完整的風(fēng)險(xiǎn)評(píng)分生態(tài),全面去量化個(gè)體在各項(xiàng)信貸業(yè)務(wù)中的表現(xiàn)。應(yīng)該說,探索一直在路上,保持不斷技術(shù)創(chuàng)新的初心。
邏輯回歸可以實(shí)現(xiàn)評(píng)分分布的好壞比校準(zhǔn),機(jī)器學(xué)習(xí)如何實(shí)現(xiàn)?
邏輯回歸評(píng)分的好壞比校準(zhǔn)是一個(gè)調(diào)整準(zhǔn)確性問題,回歸輸出的內(nèi)容是預(yù)測(cè)概率,機(jī)器學(xué)習(xí)同樣是有預(yù)測(cè)概率,方法論上是類似的。兩個(gè)都可以將預(yù)測(cè)概率階段轉(zhuǎn)換成評(píng)分,因?yàn)樾?zhǔn)是在評(píng)分刻度校準(zhǔn)時(shí)實(shí)現(xiàn)的,兩者是同樣的方法論。
如果評(píng)分做得比較準(zhǔn),好壞的校準(zhǔn)是不頻繁的,頻繁的校準(zhǔn)可能是存在過擬和的問題,這需要在機(jī)器學(xué)習(xí)在分析初期,做變量的預(yù)處理和調(diào)整,再用機(jī)器學(xué)習(xí)去做。
關(guān)于模型冷啟動(dòng),一般在還沒有不良數(shù)據(jù)的時(shí)候,如何設(shè)置模型的初始參數(shù)?
這種情況下,一般依賴專家評(píng)分卡,較好的選擇是評(píng)分卡有一個(gè)類似模式經(jīng)過驗(yàn)證,如果是完全沒經(jīng)過驗(yàn)證,初始參數(shù)比較難以調(diào)整到符合業(yè)務(wù)。這種情況下,初始參數(shù)的絕對(duì)值沒那么重要,因?yàn)槟P偷臏?zhǔn)確性是很難滿足的,但可以關(guān)注的是變量維度是否符合業(yè)務(wù)場(chǎng)景,讓初始冷啟動(dòng)模型整體具有排序性,它需要一個(gè)不斷迭代的過程去實(shí)現(xiàn)模型的準(zhǔn)確性。
對(duì)于風(fēng)控團(tuán)隊(duì)來(lái)說,模型人員和策略人員,哪個(gè)更重要呢?策略需要經(jīng)常調(diào)整,而模型可以外包出去很久不更新,策略人員不需懂太多復(fù)雜高深的算法等等,就可以完成審批、授信、反欺詐等日常業(yè)務(wù),是不是風(fēng)控團(tuán)隊(duì)中只需策略人員就可以了呢?
實(shí)際上兩個(gè)角色都很重要。這兩種角色分工一般在架構(gòu)上有兩種情況,一種是問題中提到的方式是分開的兩個(gè)完全獨(dú)立的團(tuán)隊(duì),另一種是按業(yè)務(wù)流程搭配在一起。但業(yè)務(wù)模式和群體沒有太大變動(dòng)的階段,模型的排序性持續(xù)保持,那策略人員不需要太去了解算法,可以完成審批和授信。
但現(xiàn)實(shí)中,很多業(yè)務(wù)發(fā)展中,模型會(huì)因?yàn)槟J降淖兓▌?dòng)很大,這時(shí)調(diào)整策略是不夠的,需要兩者的整合。這個(gè)問題分不同的階段,跟公司運(yùn)營(yíng)模式與所處階段有關(guān)。當(dāng)整體風(fēng)險(xiǎn)表現(xiàn)穩(wěn)定時(shí)模型沒那么重要,而在外包模式下,一旦發(fā)生模型變化,很難及時(shí)對(duì)業(yè)務(wù)很好的調(diào)整銜接。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。