丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
業(yè)界 正文
發(fā)私信給嘉嘉
發(fā)送

0

【北航莊福振分享】NN模型在金融風(fēng)控場(chǎng)景中的應(yīng)用

本文作者: 嘉嘉 2022-07-07 17:45 專題:IEEE X ATEC科技思享會(huì)
導(dǎo)語(yǔ):在社會(huì)數(shù)字化進(jìn)程中,隨著網(wǎng)絡(luò)化、智能化服務(wù)的不斷深入,伴隨服務(wù)衍生出的各類風(fēng)險(xiǎn)不容忽視。

IEEE x ATEC

IEEE x ATEC科技思享會(huì)是由專業(yè)技術(shù)學(xué)會(huì)IEEE與前沿科技探索社區(qū)ATEC聯(lián)合主辦的技術(shù)沙龍。邀請(qǐng)行業(yè)專家學(xué)者分享前沿探索和技術(shù)實(shí)踐,助力數(shù)字化發(fā)展。

在社會(huì)數(shù)字化進(jìn)程中,隨著網(wǎng)絡(luò)化、智能化服務(wù)的不斷深入,伴隨服務(wù)衍生出的各類風(fēng)險(xiǎn)不容忽視。本期分享會(huì)的主題是《網(wǎng)絡(luò)欺詐的風(fēng)險(xiǎn)與對(duì)抗》。五位嘉賓將從不同的技術(shù)領(lǐng)域和觀察視角,圍繞網(wǎng)絡(luò)欺詐場(chǎng)景下的風(fēng)險(xiǎn)及對(duì)抗技術(shù)展開分享。

以下是莊福振研究員的演講,《NN模型在金融風(fēng)控場(chǎng)景中的應(yīng)用》。

【北航莊福振分享】NN模型在金融風(fēng)控場(chǎng)景中的應(yīng)用

演講嘉賓 | 莊福振

北京航空航天大學(xué)人工智能研究院研究員

ATEC科技精英賽高級(jí)咨詢委員會(huì)專家

《NN模型在金融風(fēng)控場(chǎng)景中的應(yīng)用》

很高興能來(lái)參加IEEE x ATEC科技思享會(huì)。我今天分享的題目是《NN模型在金融風(fēng)控場(chǎng)景中的應(yīng)用》。我今天的演講內(nèi)容主要分成三個(gè)部分:背景,研究工作,我們的一點(diǎn)總結(jié)。

眾所周知,在過(guò)去十幾年中,第三方在線支付市場(chǎng)發(fā)展迅速。同時(shí),與在線交易相關(guān)的犯罪活動(dòng)也大大增加,并且這種交易欺詐行為嚴(yán)重威脅了在線支付行業(yè)。2016年,互聯(lián)網(wǎng)犯罪投訴中心就收到了近380萬(wàn)投訴,導(dǎo)致超過(guò)13億的財(cái)務(wù)損失。在線交易欺詐中,最常見(jiàn)的是賬戶被盜以及卡被盜。賬戶被盜指的是未經(jīng)授權(quán)的賬戶操作或欺詐者在控制了某人的付款賬戶后進(jìn)行的交易,通常由于憑證泄露造成的??ū槐I表示某人卡的相關(guān)信息,例如卡號(hào)、賬單信息等已被欺詐者獲取并用于未經(jīng)授權(quán)的一些收費(fèi)。

下面我分享一下我們和螞蟻集團(tuán)聯(lián)合做的一些研究工作。主要有三個(gè)工作,一個(gè)是基于神經(jīng)層級(jí)分解機(jī)的用戶事件序列分析(SIGIR 2020),第二個(gè)是基于雙重重要性感知分解機(jī)的欺詐檢測(cè) (AAAI 2021),第三個(gè)是我們?cè)诳山忉尫矫嫣岢龅睦脤蛹?jí)可解釋網(wǎng)絡(luò)建模用戶行為序列的跨領(lǐng)域欺詐檢測(cè) (WWW 2020)。

一、基于神經(jīng)層級(jí)分解機(jī)的用戶事件序列分析

首先是基于神經(jīng)層級(jí)分解機(jī)的用戶事件序列分析。在支付業(yè)務(wù)中,每個(gè)人都從注冊(cè)系統(tǒng)、登錄系統(tǒng),再到把自己選擇的商品放入購(gòu)物車,最后做交易或者付款。根據(jù)用戶的賬戶動(dòng)態(tài),我們可以判定下次付款到底是不是一個(gè)欺詐行為。用戶的賬戶動(dòng)態(tài)有豐富的數(shù)據(jù)序列信息可供利用。單純只關(guān)注特征組合的工作或者單純關(guān)注序列信息的工作,都只能從單獨(dú)的角度去建模用戶事件序列行為,每個(gè)事件僅通過(guò)簡(jiǎn)單的嵌入、拼接或者全連接,而難以獲得更好的事件表示。我們希望設(shè)計(jì)一個(gè)層次化的模型同時(shí)結(jié)合這兩方面進(jìn)行建模,從而對(duì)欺詐檢測(cè)進(jìn)行分析。

【北航莊福振分享】NN模型在金融風(fēng)控場(chǎng)景中的應(yīng)用

右圖有兩個(gè)案例,一個(gè)是在某網(wǎng)站上的電影點(diǎn)評(píng)記錄(如圖1),同樣也是一個(gè)用戶行為序列,這里面最大的一個(gè)貢獻(xiàn)是怎么去做這個(gè)事件的表示。我們剛才看到,每個(gè)事件實(shí)際上都包含了很多的特征。

【北航莊福振分享】NN模型在金融風(fēng)控場(chǎng)景中的應(yīng)用

如圖2所示,一個(gè)事件的特征包含X1到Xn這么多個(gè)特征。我們?cè)谟脩舻氖录蛄欣?,包括e1到eT的T個(gè)事件,每個(gè)事件在場(chǎng)景里面有56個(gè)特征,包括50個(gè)類別型特征和6個(gè)數(shù)字型特征。事件內(nèi)部的特征之間的組合實(shí)際上更具判別性地來(lái)判定、預(yù)測(cè)欺詐檢驗(yàn)。例如在1分鐘之內(nèi)進(jìn)行的跨國(guó)交易,我們就很容易判斷這是一筆盜卡行為。我們希望用FM模型去建模這種特征組合關(guān)系。FM是一種在嵌入空間中自動(dòng)進(jìn)行二階特征組合的模型??匆幌拢▓D2)事件的表示:vi跟vj是兩個(gè)特征向量化的空間表示,它是兩兩特征之間的一個(gè)組合,Xi跟Xj實(shí)際上是一個(gè)權(quán)重的表示。最后我們會(huì)得到一個(gè)事件的表示,從特征交互得到一個(gè)事件表示。

【北航莊福振分享】NN模型在金融風(fēng)控場(chǎng)景中的應(yīng)用

當(dāng)這個(gè)事件表示完后,我們希望得到一個(gè)比較好的序列表示,即我們對(duì)這個(gè)序列進(jìn)行提取一個(gè)比較好的特征表示。每個(gè)用戶序列實(shí)際上包含多個(gè)事件,兩個(gè)事件組合發(fā)生,對(duì)欺詐行為檢測(cè)更具有判別性。同樣的,我們也希望去考慮事件之間的序列的影響。比如說(shuō)我們先做A事件再做B事件,可能會(huì)導(dǎo)致欺詐的可能性變大。我們希望我們的模型能夠去建模這種序列的影響。從剛才的角度出發(fā),事件組合的建模用S來(lái)表示,同樣也是因子分解機(jī)去做的。不同事件兩兩組合,qi和qj也是它的一個(gè)權(quán)重。對(duì)于序列影響,我們從兩方面去考慮,一是從事件自身的重要性去考慮,它有一個(gè)自注意力機(jī)制來(lái)表示就是Sself;還有一個(gè)是用RNN網(wǎng)絡(luò)來(lái)去建模事件的歷史序列行為信息,也就是雙向的LSTM去建模。最后,我們可得出這個(gè)序列是由三部分組成:事件的組合;事件的自注意力機(jī)制;事件本身具有的一個(gè)特征。把三者組合在一起得到整體的序列表示。

【北航莊福振分享】NN模型在金融風(fēng)控場(chǎng)景中的應(yīng)用

右邊這張圖是我們提出的一個(gè)框架,也叫做神經(jīng)層級(jí)分解機(jī)。從底部開始,是事件的特征。我們對(duì)這個(gè)事件特征進(jìn)行編碼后,就可以得到這個(gè)事件的表示,從而學(xué)習(xí)這個(gè)序列的表示。提取后,可以看到模型做一個(gè)多層感知機(jī)的輸出。我們同樣可以在這個(gè)Feature上面去做一個(gè)線性的分類。最終我們把這兩部分當(dāng)成一個(gè)Sigmoid的一個(gè)參數(shù),得到0到1之間的輸出,最終的一個(gè)優(yōu)化函數(shù)其實(shí)是一個(gè)交叉熵的損失函數(shù),N是對(duì)所有有標(biāo)記的數(shù)據(jù)進(jìn)行學(xué)習(xí)。這是我們的模型的一個(gè)框架。

【北航莊福振分享】NN模型在金融風(fēng)控場(chǎng)景中的應(yīng)用

在這個(gè)實(shí)驗(yàn)中,我們利用工業(yè)界里面的一個(gè)真實(shí)的數(shù)據(jù)集。例如在一個(gè)電商平臺(tái)上,我們從該平臺(tái)上面拿到了三個(gè)地域的數(shù)據(jù)集。這個(gè)數(shù)據(jù)集正例是欺詐行為,負(fù)例是正常的交易行為,可以看到正常交易行為和異常的欺詐行為,相差非常大、類別非常不平衡。我們的公開數(shù)據(jù)集上、電影上的數(shù)據(jù)集也做了一個(gè)實(shí)驗(yàn)。在基準(zhǔn)的算法比較上,我們采用了比較先進(jìn)的一些算法,比如W&D(Wide & deep)寬度和深度,還有NFM、DeepFM、xDeepFM,以及M3利用混合模型同時(shí)學(xué)習(xí)序列的長(zhǎng)短期依賴的模型。

【北航莊福振分享】NN模型在金融風(fēng)控場(chǎng)景中的應(yīng)用

我們的評(píng)價(jià)指標(biāo)是采用真實(shí)工業(yè)場(chǎng)景里面比較關(guān)注的低用戶打擾率時(shí)的召回率,即我們?cè)诮o出結(jié)果時(shí),希望對(duì)前面頭部的百分之多少的用戶打電話告訴他們這可能是一個(gè)欺詐行為。例如打1000個(gè)電話,這1000個(gè)應(yīng)該都是有欺詐行為,即這個(gè)比例應(yīng)該是越高越好的,因此我們采用的評(píng)價(jià)指標(biāo)更關(guān)注于ROC曲線的頭部(FPR<=1%) 。這里面有一個(gè)消融的? 跟 ?,比如我們只考慮事件的交互模塊,NHFM是我們整體的一個(gè)結(jié)果,優(yōu)越于所有的baseline算法,包括消融后的版本也是比baseline要好很多。我們的模型還能夠提取到的高風(fēng)險(xiǎn)的特征和高風(fēng)險(xiǎn)的事件,這對(duì)于欺詐檢測(cè)任務(wù)具有很好的解釋性。比如短時(shí)間內(nèi)從中國(guó)IP變到美國(guó)IP,也可能是一個(gè)欺詐交易。消費(fèi)金額比平常消費(fèi)的金額大10倍、100倍,也可能是一個(gè)欺詐行為。包括你使用的電腦操作系統(tǒng)的一些高風(fēng)險(xiǎn)的特征和一些低風(fēng)險(xiǎn)的特征,也可以看到一些時(shí)間段、交易金額等,比較明顯地指向交易行為是不是欺詐行為。

【北航莊福振分享】NN模型在金融風(fēng)控場(chǎng)景中的應(yīng)用

從左下方這張圖,可以看到這種IP 的變化、還有包括其他的特征值、字段的值的變化,會(huì)導(dǎo)致一些欺詐行為的發(fā)生。

二、基于雙重重要性感知分解機(jī)的欺詐檢測(cè)

【北航莊福振分享】NN模型在金融風(fēng)控場(chǎng)景中的應(yīng)用

基于雙重重要性感知的一個(gè)分解機(jī)用于欺詐檢測(cè)。在剛才第一個(gè)工作里面,可以看到IP在不斷變化。我們需要把一個(gè)系列化的事件的某個(gè)值、某個(gè)字段的演變考慮進(jìn)去。即同一字段值的演變和不同字段值的交互實(shí)際上是非常重要的,而現(xiàn)有的工作沒(méi)有同時(shí)關(guān)注到這兩點(diǎn)。因此,我們想設(shè)計(jì)一個(gè)DIFM模型同時(shí)結(jié)合這兩個(gè)方面。

【北航莊福振分享】NN模型在金融風(fēng)控場(chǎng)景中的應(yīng)用

我們同樣也是基于這個(gè)FM模型做了一個(gè)框架。首先,對(duì)于每個(gè)階段,我們也是通過(guò)FM模型去捕獲不同事件的兩兩之間的演變??梢钥吹紽igure3這張圖,從棕色這個(gè)方向我們?nèi)タ紤]f1的特征,是指它隨事件變化,我們?nèi)グ阉o建模出來(lái),這就是我們新加的一個(gè)貢獻(xiàn)。到FM建模以后,我們又提出了一個(gè)Field Importance-aware這樣的一個(gè)感知模塊。用注意力機(jī)制去感知哪個(gè)字段的演變對(duì)我們的預(yù)測(cè)更加重要,我們又提出了一個(gè)叫重要性感知的模塊。另外一個(gè)方向的話,我們?cè)谇懊驷槍?duì)每個(gè)事件,模型通過(guò)FM捕獲了不同字段值的兩兩交互特征(圖中藍(lán)色部分),然后通過(guò)Event Importance-aware模塊利用注意力機(jī)制感知哪個(gè)事件更重要(圖中綠色部分)。最后我們?cè)偻ㄟ^(guò)Field Importance-aware模塊和Event Importance-aware模塊得到的兩部分信息以及當(dāng)前事件特征輸出預(yù)測(cè)結(jié)果??梢钥吹竭@個(gè)模型是比較簡(jiǎn)單而且實(shí)用的,我們?cè)谶@個(gè)業(yè)務(wù)應(yīng)用場(chǎng)景里面,可以高效率而且效果比較好地在線上去部署,這個(gè)就是我們提出的第二個(gè)工作。

【北航莊福振分享】NN模型在金融風(fēng)控場(chǎng)景中的應(yīng)用

第二個(gè)工作的一些實(shí)驗(yàn)結(jié)果,也是利用了第一個(gè)工作里面的三個(gè)地域的數(shù)據(jù)集。我們?cè)谶@個(gè)工作里面又增加了一些精準(zhǔn)算法,包括AFM,還有利用LSTM做欺詐檢測(cè),還有包括用Latent Cross將上下文信息集成到RNN中,這個(gè)數(shù)據(jù)跟上一個(gè)工作的實(shí)驗(yàn)數(shù)據(jù)是一樣的。

【北航莊福振分享】NN模型在金融風(fēng)控場(chǎng)景中的應(yīng)用

從這個(gè)結(jié)果可以看到,同樣我們是采用低用戶打擾率時(shí)的召回率去評(píng)價(jià)我們的實(shí)驗(yàn),可以看到最底下DIFM(我們的一個(gè)實(shí)驗(yàn)結(jié)果),實(shí)驗(yàn)結(jié)果大大優(yōu)越所有的baseline,包括消融實(shí)驗(yàn),DIFM-α只考慮字段值演變,DIFM-β只考慮字段值交互,DIFM是兩個(gè)子模型的結(jié)合,DIFM也是優(yōu)越于前面所有的比較算法,這就是我們提的一個(gè)又簡(jiǎn)單又實(shí)用的算法。

【北航莊福振分享】NN模型在金融風(fēng)控場(chǎng)景中的應(yīng)用

在可解釋性方面的話,我們的模型還能夠提取到高風(fēng)險(xiǎn)的特征和高風(fēng)險(xiǎn)的事件。從上面右邊這張圖可以看到藍(lán)色圓圈,每一次變化都會(huì)變成一個(gè)藍(lán)色圓圈,相對(duì)有一些改變。可以看到卡后面尾數(shù)落在每個(gè)區(qū)間,每一次的變化就會(huì)產(chǎn)生一個(gè)欺詐的行為,或者卡值的一個(gè)變化。還有包括IP的變化,我們都可以去把它c(diǎn)atch出來(lái)。這就是我們提出來(lái)的、去顯示地建模這種一個(gè)字段值隨著事件、序列在變化的情況用于欺詐檢測(cè),同樣也為可解釋提供了一個(gè)比較好的借鑒。眾所周知,在金融欺詐檢測(cè)里面可解釋性是非常必要的,即你去告訴用戶此交易行為是一個(gè)欺詐行為時(shí),你必須告訴他有哪些特征可能違反了哪些規(guī)則,或者你的事件可能導(dǎo)致一些欺詐行為??山忉屝跃妥兂闪艘粋€(gè)非常重要的工作。在接下來(lái)的這些工作里,希望我們也從可解釋性的角度去對(duì)整個(gè)過(guò)程,從特征層面、從事件層面、 也包括我們跨領(lǐng)域的層面去做可解釋性的層次模型。因此我們也提出利用層級(jí)可解釋性網(wǎng)絡(luò)來(lái)建模用戶行為序列的一個(gè)跨領(lǐng)域的欺詐檢測(cè)。

三、利用層級(jí)可解釋網(wǎng)絡(luò)建模用戶行為序列的跨領(lǐng)域欺詐檢測(cè)

【北航莊福振分享】NN模型在金融風(fēng)控場(chǎng)景中的應(yīng)用

Motivation的話,其實(shí)也比較簡(jiǎn)單、比較直接。第一,前面我們知道了用戶行為序列是非常重要的。第二,我們希望考慮這種可解釋性對(duì)我們的業(yè)務(wù)的幫助。第三,這個(gè)電商平臺(tái)在不同的地域新開展業(yè)務(wù)時(shí),可能因數(shù)據(jù)量少而不能很好建模的情況下,我們希望從其他數(shù)據(jù)比較成熟或者模型比較成熟的平臺(tái)中,把它遷移或借鑒過(guò)來(lái),去建模一個(gè)跨領(lǐng)域的欺詐檢測(cè)模型。

【北航莊福振分享】NN模型在金融風(fēng)控場(chǎng)景中的應(yīng)用

我們提出了這種層次可解釋網(wǎng)絡(luò)。首先我們提出了一個(gè)特征層面、事件層面的可解釋性網(wǎng)絡(luò)來(lái)對(duì)這個(gè)欺詐檢測(cè)。右邊的圖片是我們提出的一個(gè)框架,同樣的,前面是我們對(duì)這個(gè)特征進(jìn)行編碼。Field-level Extractor是對(duì)事件的表示。事件表示完之后,是對(duì)序列的表示。還有一個(gè)我們叫做Wide layer。Wide layer是單純用特征去學(xué)的線性分類器,我們這邊串聯(lián)后用多層感知機(jī)來(lái)去做。這里面的可解釋性就體現(xiàn)在從單領(lǐng)域的模型里面有兩個(gè)可解釋,一個(gè)是哪些字段 、哪些特征是比較重要的,以及序列當(dāng)中哪些歷史事件比較重要的。

【北航莊福振分享】NN模型在金融風(fēng)控場(chǎng)景中的應(yīng)用

對(duì)于每一步,第一個(gè)Look-up embedding,我們實(shí)際上是對(duì)這個(gè)特征值進(jìn)行一個(gè)向量的轉(zhuǎn)化。我們把這個(gè)轉(zhuǎn)化分為類別型的、數(shù)值型的轉(zhuǎn)化規(guī)則,采用這個(gè)式子去做轉(zhuǎn)化。Field-level Extractor是對(duì)事件的一個(gè)表示,前面的工作我們只考慮了即兩兩特征之間的交互,顯示哪個(gè)特征比較重要,我們加了一個(gè)wit,這個(gè)wi相當(dāng)于是說(shuō)針對(duì)這個(gè)特征,在T時(shí)刻它的特征的重要性的歸一化。對(duì)于事件,它同樣有一個(gè)事件重要性的表達(dá)式,也就是UT,UT就是下面的表達(dá)式。下面還有Wide layer對(duì)白名單進(jìn)行學(xué)習(xí),即我們用線性分析去學(xué)習(xí),最后預(yù)測(cè)跟學(xué)習(xí)問(wèn)題,我們同樣也是用MLP還有包括sigmoid函數(shù),來(lái)把它映射到0跟1之間,用交叉熵來(lái)去學(xué)習(xí)整個(gè)學(xué)習(xí)問(wèn)題,這個(gè)是L(θ)。

【北航莊福振分享】NN模型在金融風(fēng)控場(chǎng)景中的應(yīng)用

我們又提出一個(gè)遷移學(xué)習(xí)框架,剛才說(shuō)到可能不同地域或者不同場(chǎng)景,數(shù)據(jù)有些是少的、有些是多的。我們希望由(數(shù)據(jù))少的來(lái)幫助(數(shù)據(jù))多的。我們把少的叫做Target Events,數(shù)據(jù)量多的叫做源領(lǐng)域或者Source  Events。在這里,我們希望去學(xué)到源領(lǐng)域和目標(biāo)領(lǐng)域特有的一些知識(shí),還有它們兩個(gè)共享的一些東西。我們希望這個(gè)Source可以共享一些知識(shí)去幫助Target學(xué)習(xí)及一些預(yù)測(cè)。從幾方面來(lái)考慮,在我們場(chǎng)景里面,一個(gè)是Embedding策略、為什么要提出Embedding策略、共享和你特有的行為序列的抽取,還有包括你的領(lǐng)域的注意力。也就是在一定程度上解釋說(shuō)我這個(gè)領(lǐng)域幫助了我的Target問(wèn)題、幫助了多少、我們?cè)趺慈?duì)齊不同領(lǐng)域之間的一個(gè)分布,也就是Aligning Distributions??山忉屝跃腕w現(xiàn)在Domain Attention的角度。

【北航莊福振分享】NN模型在金融風(fēng)控場(chǎng)景中的應(yīng)用

我們?yōu)槭裁匆岢鲞@種Embedding策略?我們都知道由于不同地域的相同字段對(duì)應(yīng)的取值可能不同,例如中國(guó)跟越南的消費(fèi)字段、消費(fèi)額不同,中國(guó)可能是0到100塊錢,而在越南可能就不是0到100塊錢。所以字段的取值可能是不一樣的,不同地域的用戶行為習(xí)慣可能不同,相同的提取器可能無(wú)法同時(shí)對(duì)兩個(gè)地域有效,所以將行為序列提取器也分為Domain-Specific和Domain-Shared。即我們把一些特定的或者是領(lǐng)域不變的一些特征遷移過(guò)來(lái),保持自身領(lǐng)域特有的一些東西。我們?cè)谶@個(gè)領(lǐng)域的Attention上,把它也分成一個(gè)領(lǐng)域特有和領(lǐng)域共享的表示,即Shared和Specific兩個(gè)因子,計(jì)算公式如圖所示。在不同領(lǐng)域之間的分布的對(duì)齊方面,我們知道傳統(tǒng)的對(duì)齊方法在我們的應(yīng)用場(chǎng)景里面是不適合的,因?yàn)樵谖覀兊膱?chǎng)景里類別是極其不平衡的,即我們得到的這個(gè)正負(fù)類比例相差非常大。例如我們甚至可以是一比一萬(wàn),一萬(wàn)條里面可能只有一條是異常行為。我們?nèi)ヌ岢鲞@種Class-aware,即類別感知的Euclidean Distance。從這個(gè)角度去講,我們計(jì)算這個(gè)領(lǐng)域距離時(shí),是從類別上面去做的,即考慮不同類別的一個(gè)過(guò)程。

【北航莊福振分享】NN模型在金融風(fēng)控場(chǎng)景中的應(yīng)用

進(jìn)一步,我們的遷移學(xué)習(xí)框架泛化成一個(gè)通用的遷移學(xué)習(xí)框架。從上圖的右圖可以看到:虛線的表示我們提出的是一個(gè)層次可解釋網(wǎng)絡(luò),這是作為一個(gè)序列的提取器,即我們可以把這個(gè)虛線里面的序列提取器換成其它的模型去作為事件的提取器。例如我們這個(gè)遷移模型,我們可以把其他的baseline作為我們的一個(gè)特殊情況納入到我們的遷移學(xué)習(xí)框架里面。所以只需要定義好哪部分作為行為序列提取器,我們就可以去做這樣一個(gè)欺詐監(jiān)測(cè)模型。

【北航莊福振分享】NN模型在金融風(fēng)控場(chǎng)景中的應(yīng)用

同樣的,我們?cè)谶@個(gè)數(shù)據(jù)集上面也采用了某電商平臺(tái)上面的數(shù)據(jù)集,此次我們?cè)谶@個(gè)數(shù)據(jù)集上加了一個(gè)數(shù)據(jù)集比較少的情況,即它可能只有幾百、幾千的一個(gè)正例,負(fù)例可能十幾萬(wàn)。同樣的,我們把數(shù)據(jù)最少的作為Target  Events去做我們的實(shí)驗(yàn)。對(duì)于bassline,我們同樣也是選擇W&D、NFM、LSTM4FD還有M3R這樣的Fraud baseline去做我們的基礎(chǔ)模型。我們先看一些單領(lǐng)域的實(shí)驗(yàn)結(jié)果,也是采用低用戶打擾的召回率作為我們的評(píng)價(jià)指標(biāo)。

【北航莊福振分享】NN模型在金融風(fēng)控場(chǎng)景中的應(yīng)用

可以看到這兩張圖,是在C1、C2、C3、C4這4個(gè)地域上的實(shí)驗(yàn)結(jié)果,都比baseline要好很多,最后的豎線就是我們的模型結(jié)果。

【北航莊福振分享】NN模型在金融風(fēng)控場(chǎng)景中的應(yīng)用

我們同樣把我們的遷移學(xué)習(xí)框架用于所有base model上,即我們把剛才所有baseline的model序列行為提取器放到遷移學(xué)習(xí)框架里,把中間的虛線部分給替換掉。藍(lán)線是我們用了遷移學(xué)習(xí)框架后得到的一個(gè)結(jié)果。結(jié)果證明,在遷移學(xué)習(xí)后可以得到比較好的實(shí)驗(yàn)結(jié)果。這個(gè)橫軸是表示我們采用數(shù)據(jù)的從少到多,如從一個(gè)星期作訓(xùn)練數(shù)據(jù)到兩個(gè)星期三個(gè)星期……所以隨著訓(xùn)練數(shù)據(jù)的增加,結(jié)果一般也是變好的。這個(gè)藍(lán)線,指我們先前的效果比原來(lái)要好很多。大概情況就是這樣。

【北航莊福振分享】NN模型在金融風(fēng)控場(chǎng)景中的應(yīng)用

從結(jié)果的可解性來(lái)看,可以看到從特征層面,每一行的顏色越深、它的特征越重要??梢钥吹接忻黠@的catch到我們重要性的一個(gè)特征。從豎的Y軸上面看,深度越深事件越重要,我們可以catch到不同事件的重要性。下面可以看出Domain-Shared等于0.56,意思是說(shuō)我們建立這個(gè)Target 模型,Shared部分貢獻(xiàn)的知識(shí)是56%,Target自己本身是44%。可以看到,我們從三個(gè)層面,從特征的粒度到事件的力度然后再到屬性的力度,去做這樣一個(gè)可解釋。

【北航莊福振分享】NN模型在金融風(fēng)控場(chǎng)景中的應(yīng)用

 我們提出的模型已經(jīng)在該電商網(wǎng)站ATO(account takeover)場(chǎng)景落地,可提供賬戶交易風(fēng)險(xiǎn)分析,進(jìn)行識(shí)別防控以及事件粒度/屬性粒度的權(quán)重值分析,輔助運(yùn)營(yíng)同學(xué)判斷還原風(fēng)險(xiǎn)路徑。我們提出的工作也上線進(jìn)行了部署。

【北航莊福振分享】NN模型在金融風(fēng)控場(chǎng)景中的應(yīng)用

最后,我們總結(jié)一下,我們?cè)诤献鬟^(guò)程當(dāng)中,提出神經(jīng)層次分解機(jī)對(duì)用戶事件序列進(jìn)行分析,同時(shí)建模Field之間交互關(guān)系以及Field Value演化的欺詐檢測(cè)模型,提出通用的遷移學(xué)習(xí)可解釋框架,我們對(duì)檢測(cè)欺詐結(jié)果的可解釋。最后我們也進(jìn)行了線上部署應(yīng)用落地。現(xiàn)在已經(jīng)應(yīng)用得比較好,特別是在一些場(chǎng)景里面把我們的算法結(jié)合到欺詐檢測(cè)的模塊里面去。

我的分享就到這里,非常感謝。

雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))

雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知

分享:
相關(guān)文章
當(dāng)月熱門文章
最新文章
請(qǐng)?zhí)顚懮暾?qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說(shuō)