0
老實(shí)巴交的農(nóng)民林建國(guó)怎么也想不到,他有天竟會(huì)成為別人眼中的“老賴(lài)”,被追債公司逼著還錢(qián)。
這還要從前段時(shí)間有人來(lái)村里招工說(shuō)起,他和一些村民被要求填一張包含姓名、身份證號(hào)、家庭住址等信息的表格,當(dāng)時(shí)為了能快點(diǎn)上工掙錢(qián),大家都沒(méi)猶豫就填了。
后來(lái)他們才知道,這就是一個(gè)陷阱,所謂的招工只是幌子,詐騙團(tuán)伙要的可不是他們廉價(jià)的勞動(dòng)力,而是上面所填的真實(shí)信息,通過(guò)這些信息來(lái)申請(qǐng)信用卡,然后刷卡透支,從而讓這些信息就變?yōu)檎娼鸢足y。
但從未跟信用卡打過(guò)交道的林建國(guó)們,卻從此進(jìn)入了各大銀行的黑名單,背負(fù)債務(wù)不說(shuō),還被抹上了信用污點(diǎn),連整個(gè)村子都被銀行歸為了欺詐地址。以后在申請(qǐng)信用卡、貸款的過(guò)程中,如果出現(xiàn)了這個(gè)地址,就會(huì)很麻煩。
上面這個(gè)故事改編自天云大數(shù)據(jù) CEO 雷濤對(duì)雷鋒網(wǎng)所講的一個(gè)真實(shí)案例,這其實(shí)暴露出銀行在傳統(tǒng)的信用審核中所遇到的難題,即銀行雖然擁有上億萬(wàn)級(jí)的信息數(shù)據(jù)庫(kù),掌握著身份、聯(lián)系方式、設(shè)備信息和資產(chǎn)信息等數(shù)據(jù),但這種識(shí)別已經(jīng)無(wú)法應(yīng)對(duì)日益演進(jìn)的欺詐技術(shù)和模式,而雷濤帶領(lǐng)團(tuán)隊(duì)正在做的,就是希望能用人工智能的技術(shù),解決這個(gè)問(wèn)題。
大家在申請(qǐng)信用卡時(shí),其實(shí)是把自己的數(shù)據(jù)都提交給銀行,以證明我是一個(gè)有償還能力并且守信用的人,銀行多年來(lái)會(huì)有一套自己的辨別系統(tǒng)。
在傳統(tǒng)的銀行系統(tǒng)里,這些數(shù)據(jù)庫(kù)更多的呈現(xiàn)為一種二維的結(jié)構(gòu),叫關(guān)系型數(shù)據(jù)庫(kù)。如何理解?我們先來(lái)看這樣一個(gè)例子。
老張和老王兩個(gè)人準(zhǔn)備相互擔(dān)保進(jìn)行騙貸,然后一起跑路,在銀行傳統(tǒng)的風(fēng)控架構(gòu)下,這種行為很容易被發(fā)現(xiàn),因?yàn)榫S度很小,可以迅速的通過(guò)數(shù)據(jù)庫(kù)來(lái)查詢(xún)。
但目前真實(shí)的騙貸狀況是,老張、老王、老李、老趙、老周的企業(yè)形成了一個(gè)擔(dān)保圈,打算集體跑路,當(dāng)銀行現(xiàn)在要做一個(gè)5度甚至是6度的查詢(xún)時(shí),依據(jù)傳統(tǒng)的計(jì)算方式,已經(jīng)無(wú)法解決這個(gè)問(wèn)題了。
在防止信用卡欺詐方面,國(guó)內(nèi)目前的風(fēng)控都是 rule base(規(guī)則驅(qū)動(dòng))的,更多的是根據(jù)經(jīng)驗(yàn)來(lái),抽象出系列規(guī)則,每一條規(guī)則觸發(fā)一種欺詐場(chǎng)景,交叉組合相應(yīng)的業(yè)務(wù)邏輯來(lái)進(jìn)行判斷,由此來(lái)做出風(fēng)控模型。
但目前,這種方式在效率、有效性、全面性以及成本上都面臨問(wèn)題。與此同時(shí),隨著互聯(lián)網(wǎng)金融的興起,非現(xiàn)場(chǎng)交易的增多,這種模型會(huì)加劇銀行風(fēng)險(xiǎn)防控的難度。
雷濤曾接觸過(guò)很多金融行業(yè)的客戶(hù),以前,他們看一個(gè)進(jìn)件(信用卡申請(qǐng)資料)時(shí),會(huì)注重本身是否健康真實(shí),即有沒(méi)有違約記錄,姓名、身份證號(hào)、電話(huà)號(hào)碼等信息是否真實(shí),但這還是會(huì)出現(xiàn)問(wèn)題。
比如剛剛講的案例,村民的信息確實(shí)是真的,人也沒(méi)有出現(xiàn)過(guò)違約記錄,還是出事了。金融業(yè)的風(fēng)控發(fā)展到今天的趨勢(shì),其實(shí)會(huì)把不同的進(jìn)件連接起來(lái)看深層次的關(guān)系,看從中能否發(fā)現(xiàn)潛在的風(fēng)險(xiǎn)。
簡(jiǎn)單來(lái)說(shuō),就是要在申請(qǐng)和進(jìn)件之間建立關(guān)聯(lián),騙子手里的資源有限,他填的電話(huà)、地址、推薦人等信息,或多或少會(huì)在每天十幾萬(wàn)個(gè)進(jìn)建中重復(fù)。
我們會(huì)把不同的進(jìn)件連接起來(lái)進(jìn)行識(shí)別,在這個(gè)過(guò)程中增加新的維度,如果有其中一個(gè)欺詐電話(huà)號(hào)碼,和他有關(guān)系的有好幾個(gè)進(jìn)件,那我就會(huì)認(rèn)為它有問(wèn)題。
雷濤所說(shuō)的短板,其實(shí)就是現(xiàn)有的風(fēng)控模型對(duì)于數(shù)據(jù)處理能力的不足,這次,他想借力人工智能來(lái)解決這個(gè)問(wèn)題。
對(duì)于金融業(yè)而言,在信息、數(shù)據(jù)大爆炸的今天,會(huì)面臨以下兩個(gè)問(wèn)題:
數(shù)據(jù)來(lái)源多,且存儲(chǔ)在不同系統(tǒng),缺乏數(shù)據(jù)同步機(jī)制、數(shù)據(jù)無(wú)法共享。
數(shù)據(jù)利用不充分,致使行銷(xiāo)、審批、風(fēng)險(xiǎn)、策略研究、催收部等業(yè)務(wù)部門(mén)系統(tǒng)形成信息孤島。
那主打“人工智能”的天云,是如何應(yīng)對(duì)這些難題的?
這跟信用卡反欺詐又有何關(guān)系?
其實(shí)在金融行業(yè),多年來(lái)積累了一定的數(shù)據(jù),無(wú)論是人行的個(gè)人征信數(shù)據(jù),還是部分銀行間可以相互流通的數(shù)據(jù)。(后者的意思是,如果你建行的信用卡逾期了,再申請(qǐng)工行的信用卡,就會(huì)遇到麻煩)
將這些數(shù)據(jù)通過(guò)特征表達(dá)的方式轉(zhuǎn)化到數(shù)據(jù)模型后,機(jī)器就可以借此來(lái)表達(dá)以往很難描述的金融現(xiàn)象,因此特別適合處理風(fēng)險(xiǎn)、欺詐以及金融產(chǎn)品的營(yíng)銷(xiāo),這些依靠過(guò)往經(jīng)驗(yàn)難以準(zhǔn)確定量的事件。
具體到信用卡申請(qǐng)場(chǎng)景,這些數(shù)據(jù)包括申請(qǐng)人的社交數(shù)據(jù)、聯(lián)合推廣人信息數(shù)據(jù)、申請(qǐng)人信息數(shù)據(jù)、單位聯(lián)系數(shù)據(jù)等。
雷濤告訴雷鋒網(wǎng),這么做有3點(diǎn)好處,一是融合了信用卡申請(qǐng)環(huán)節(jié)的各個(gè)業(yè)務(wù)數(shù)據(jù),解決了數(shù)據(jù)孤島的問(wèn)題;其次,這個(gè)過(guò)程中會(huì)引入第三方數(shù)據(jù),比如銀聯(lián)數(shù)據(jù)等,擴(kuò)展了數(shù)據(jù)的維度;第三,通過(guò)構(gòu)建申卡客戶(hù)的社交復(fù)雜網(wǎng)絡(luò)提供客戶(hù)的社交數(shù)據(jù),在拓展覆蓋維度的同時(shí),以弱變量來(lái)體現(xiàn)強(qiáng)變量,并且實(shí)現(xiàn)了社交數(shù)據(jù)的高頻率更新,提高了數(shù)據(jù)的準(zhǔn)確有效性。
將 AI 賦能金融反欺詐,其實(shí)在國(guó)外早已開(kāi)始,雷濤坦言,目前在銀行反欺詐方面中國(guó)與北美的差距還是很大的,硅谷的金融科技創(chuàng)業(yè)公司很早就將這一技術(shù)應(yīng)用起來(lái)了。
比如,京東和百度同時(shí)投資的美國(guó)金融科技公司Zest Finance,便是一家明星公司。
它們利用機(jī)器的深度學(xué)習(xí),從大量的數(shù)據(jù)中提取變量,并采用多個(gè)預(yù)測(cè)分析模型,其中就包括欺詐模型。
除了反欺詐,其在預(yù)付能力模型等方面也用來(lái)幫助用戶(hù)降低信貸成本,它的核心競(jìng)爭(zhēng)力就是數(shù)據(jù)挖掘能力和模型開(kāi)發(fā)能力。
雖然目前在保險(xiǎn)公司或者是運(yùn)營(yíng)商中,都有用機(jī)器學(xué)習(xí)的算法來(lái)做用戶(hù)流失風(fēng)險(xiǎn)預(yù)警,交叉推薦等數(shù)據(jù)挖掘的工作,但目前這在國(guó)內(nèi),卻面臨很多困境。
雷濤告訴雷鋒網(wǎng),一個(gè)很大的問(wèn)題是人才的不足,很多做數(shù)據(jù)科學(xué)的人,一般對(duì)編程領(lǐng)域較為陌生,而熟悉編程的人又不懂算法。
天云正在做的就是將數(shù)據(jù)科學(xué)家的算法能力,與懂業(yè)務(wù)的編程人員相結(jié)合,目前已經(jīng)通過(guò)人工智能算法建立現(xiàn)金分期響應(yīng)模型,預(yù)測(cè)篩選辦理此業(yè)務(wù)的高概率客戶(hù),在信用卡反欺詐方面,也建立可循環(huán)授信模型,對(duì)客戶(hù)行為特征進(jìn)行分類(lèi),并確立客戶(hù)對(duì)循環(huán)授信響應(yīng)評(píng)分。對(duì)于一些評(píng)分高的客戶(hù),他們可以有效推送循環(huán)貸服務(wù),從而提高銀行利潤(rùn)。
為何國(guó)際上基本成熟的業(yè)務(wù)天云要親自再來(lái)做?在采訪中,雷濤提到“后IOE”時(shí)代。
“IOE” 其實(shí)是對(duì)IBM、Oracle、EMC的簡(jiǎn)稱(chēng),其中 IBM 代表硬件以及整體解決方案服務(wù)商,Oracle 代表數(shù)據(jù)庫(kù),EMC 則代表數(shù)據(jù)存儲(chǔ)。
隨著國(guó)內(nèi)去IOE浪潮的興起,大量企業(yè)開(kāi)始在X86服務(wù)器、開(kāi)源數(shù)據(jù)庫(kù)產(chǎn)品、分布式存儲(chǔ)解決方案等方面開(kāi)展研究和探索,而天云正是其中之一。
就如同雖然 Windows 操作系統(tǒng)雖然可以用,但我們依然要研發(fā)國(guó)產(chǎn)自主可控的操作系統(tǒng),尤其是金融等關(guān)乎國(guó)計(jì)民生的重要領(lǐng)域。
而這,也是目前為何國(guó)內(nèi)有很多公司紛紛投入有關(guān)數(shù)據(jù)庫(kù)的研發(fā)和應(yīng)用的重要原因之一。在外企工作過(guò)多年的雷濤透露,他們目前有很多員工就是來(lái)自于IBM、Oracle、EMC等?!罢且?yàn)槲覀冞@些人見(jiàn)過(guò)最好的產(chǎn)品是什么樣,我們才有信心把它做出來(lái),甚至做的更好?!?/p>
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。