0
本文作者: 三川 | 2017-07-08 23:40 | 專題:GAIR 2017 |
7 月 7 日,由中國(guó)計(jì)算機(jī)協(xié)會(huì)(CCF)主辦,雷鋒網(wǎng)、香港中文大學(xué)(深圳)承辦的第二屆 CCF-GAIR 全球人工智能與機(jī)器人峰會(huì)在深圳如期開幕。大會(huì)第二日,作為金融科技專場(chǎng)上午的最后一場(chǎng)報(bào)告,百度金融高級(jí)科學(xué)家吳健民帶來了主題為《智慧金融:助力金融機(jī)構(gòu)迎接 AI 新時(shí)代》的演講。
吳健民老師先后就職于雅虎北京研發(fā)中心、騰訊,從事分布式機(jī)器學(xué)習(xí)算法與搜索相關(guān)的工作。在2014年加入百度,當(dāng)前負(fù)責(zé)百度金融在智能獲客、大數(shù)據(jù)風(fēng)控、金融畫像方面的工作,以及 AI 技術(shù)在百度金融的落地。
AI 技術(shù)服務(wù)于金融機(jī)構(gòu)的業(yè)務(wù)與創(chuàng)新
銀行業(yè)
金融科技的訴求包括用戶畫像、精準(zhǔn)營(yíng)銷、風(fēng)險(xiǎn)管理和智能客服四方面
保險(xiǎn)業(yè)
風(fēng)險(xiǎn)評(píng)估與定價(jià)、交叉銷售、客戶流失管理和理賠欺詐檢測(cè)。同時(shí)有基于場(chǎng)景的保險(xiǎn)產(chǎn)品設(shè)計(jì)及基于使用的風(fēng)險(xiǎn)定價(jià)。
證券業(yè)
AI技術(shù)主要應(yīng)用于股價(jià)預(yù)測(cè)、客戶關(guān)系管理、投資景氣指數(shù)預(yù)測(cè)等。
資本市場(chǎng)對(duì)金融科技投資增幅明顯
埃森哲的報(bào)告顯示,2015 年全球?qū)鹑诳萍嫉耐顿Y有比較大的增幅,呈現(xiàn)地區(qū)結(jié)構(gòu)化的差異。各地區(qū)的投資額增長(zhǎng)率為:
北美 44%,歐洲 120%,亞太 300%,中國(guó)超過400%。
百度金融的7大技術(shù)方向及三步走戰(zhàn)略:
下面逐次有側(cè)重的介紹5大技術(shù)應(yīng)用方向:
智能獲客的核心是降低獲客成本,通過三個(gè)步驟來實(shí)現(xiàn)用戶需求的精準(zhǔn)的定向及滿足:
刻畫用戶的金融畫像及需求,需要做到全面、準(zhǔn)確且能夠及時(shí)觸達(dá)。
生成與場(chǎng)景自然切合的動(dòng)態(tài)創(chuàng)意
通過響應(yīng)模型準(zhǔn)確匹配金融產(chǎn)品與用戶的需求
首先用戶畫像是一個(gè)標(biāo)簽體系,根據(jù)業(yè)務(wù)需求進(jìn)行擴(kuò)展。百度數(shù)據(jù)對(duì)對(duì)用戶金融屬性有比較準(zhǔn)確的刻畫,舉個(gè)例子,如果一個(gè)用戶經(jīng)常出現(xiàn)在加油站或者高速路收費(fèi)口,他很可能有車,可以為他貼上“有車”的標(biāo)簽。這是對(duì)用戶資產(chǎn)是一個(gè)很重要的衡量。
其次是根據(jù)需求場(chǎng)景,人生階段,生活品質(zhì),消費(fèi)水平等確定智能創(chuàng)意的構(gòu)成,實(shí)現(xiàn)響應(yīng)率的優(yōu)化。
最后是根據(jù)用戶的基礎(chǔ)信息、信貸需求、網(wǎng)絡(luò)行為、風(fēng)險(xiǎn)偏好因素及產(chǎn)品的額度、利率及收益率等通過響應(yīng)模型進(jìn)行客群匹配。
老客激活也是一個(gè)很重要的方向,一個(gè)原因是現(xiàn)在獲取新客戶的獲客成本越來越高,大概在3000-4000元左右。老客戶的重復(fù)用信,就具備了相當(dāng)高的價(jià)值,一般一個(gè)信貸用戶有3-5次的重復(fù)用信,業(yè)務(wù)才能實(shí)現(xiàn)盈利,如何高效的激活老客戶的重復(fù)使用是很重要的問題。這需要對(duì)優(yōu)質(zhì)存量客戶進(jìn)行用信激勵(lì)、實(shí)現(xiàn)客群優(yōu)化。以百度錢包的個(gè)性化補(bǔ)貼為例,該業(yè)務(wù)通過在支付環(huán)節(jié)為用戶提供補(bǔ)貼,激勵(lì)用戶使用錢包支付。策略的核心是計(jì)算補(bǔ)貼額度,我們通過模型估算用戶的支付響應(yīng)率,依據(jù)支付響應(yīng)率計(jì)算最優(yōu)的補(bǔ)貼額度。最優(yōu)補(bǔ)貼額度同時(shí)優(yōu)化兩個(gè)目標(biāo):1. 支付率盡可能的高,2. 補(bǔ)貼成本盡可能低;通過數(shù)學(xué)規(guī)劃的方法求解,進(jìn)而得到最優(yōu)的補(bǔ)貼成本。
關(guān)于大數(shù)據(jù)風(fēng)控,百度在內(nèi)部經(jīng)常說風(fēng)險(xiǎn)管理,而不是風(fēng)險(xiǎn)控制。金融做的是風(fēng)險(xiǎn)業(yè)務(wù),相對(duì)于控制風(fēng)險(xiǎn),我們更需要準(zhǔn)確計(jì)量風(fēng)險(xiǎn)并進(jìn)行風(fēng)險(xiǎn)定價(jià)。
大數(shù)據(jù)征信模型面臨來自兩個(gè)方面的挑戰(zhàn):
大數(shù)據(jù)的特征本身高維稀疏、異構(gòu)、弱相關(guān)。高維稀疏是由于用戶本身的行為多樣、差異大。異構(gòu)主要是由于用戶行為大數(shù)據(jù)在電商、搜索、社交等不同的產(chǎn)品線上積累,呈現(xiàn)不同的分布與結(jié)構(gòu)。弱相關(guān)是指相對(duì)于人行征信數(shù)據(jù),大數(shù)據(jù)變量與金融場(chǎng)景是弱相關(guān)的。但大數(shù)據(jù)的好處是用戶互聯(lián)網(wǎng)行為產(chǎn)生的非常多可以利用的弱信號(hào)。如何利用大量弱信號(hào)來構(gòu)建具有強(qiáng)風(fēng)險(xiǎn)區(qū)分的模型,是我們要解決的問題。
另一方面是信貸樣本,首要挑戰(zhàn)是樣本缺少,小貸公司和金融機(jī)構(gòu)的壞賬是核心數(shù)據(jù),大家希望可以用所有壞賬數(shù)據(jù)做區(qū)分能力很好的模型,但當(dāng)前缺少壞賬數(shù)據(jù)共享的機(jī)制,因此帶來的問題是樣本缺少。樣本波動(dòng)性大也是另外一個(gè)挑戰(zhàn)。
主要解決方案包括三個(gè)方面:
通過集成學(xué)習(xí)及boosting方法,融合弱特征生成具有強(qiáng)區(qū)分度的模型;
利用深度學(xué)習(xí),通過降維的方法,解決高維稀疏的問題;
利用半監(jiān)督學(xué)習(xí)來解決樣本過少的問題,通過少量有標(biāo)注樣本及大量無標(biāo)注樣本生產(chǎn)推廣性和穩(wěn)定性好的模型。
完成申請(qǐng)的用戶,需要通過活體識(shí)別、聲紋識(shí)別及手寫簽名等方案來準(zhǔn)確鑒定用戶身份,這些能力的基礎(chǔ)是百度的paddlepaddle深度學(xué)習(xí)平臺(tái)。
關(guān)于量化投資,百度利用 AI 技術(shù)實(shí)現(xiàn)以大數(shù)據(jù)驅(qū)動(dòng)的量化投資策略。包括四個(gè)步驟:投資標(biāo)的調(diào)研、標(biāo)的篩選、投資組合設(shè)定、組合的動(dòng)態(tài)調(diào)整。
以搜索數(shù)據(jù)為例,搜索和股票的市場(chǎng)關(guān)注度高度相關(guān),一個(gè)股票的搜索量和上證指數(shù)的趨勢(shì)有很強(qiáng)的相關(guān)性,加上輿情因子,我們通過搜索量,可以判斷買家和賣家的能量積蓄。基于地圖的時(shí)空數(shù)據(jù)可以幫助我們判斷資產(chǎn)質(zhì)量,如通過對(duì)一個(gè)商業(yè)地產(chǎn)周邊人群的流量、畫像分析,可以有效評(píng)估該商業(yè)地產(chǎn)的價(jià)值。
客服是金融業(yè)務(wù)的最后一步。百度金融通過AI技術(shù),提升金融業(yè)務(wù)客服的效率,一年內(nèi)單次服務(wù)成本降低了 80%。這80%來自于三方面工作:
智能客服機(jī)器人構(gòu)建,通過問題預(yù)測(cè)、檢索及多輪會(huì)話來實(shí)現(xiàn)問題的自動(dòng)服務(wù)。最終金融問題解決率接近90%,解決率是通過客戶的實(shí)際反饋給出的。
對(duì)于智能客服機(jī)器人未解決的問題,通過人工客服來支持,AI幫助我們通過語音輸入、客戶意圖預(yù)測(cè)提升客服人效;
智能語音質(zhì)檢,這本身也是一個(gè)客服成本,假設(shè)有 5% 的客服效果質(zhì)量抽查率,對(duì)應(yīng)客服的成本就增加5%。通過用 AI 提升質(zhì)檢的效率,做到智能自動(dòng)檢測(cè)客服溝通是否滿意,對(duì)關(guān)鍵業(yè)務(wù)覆蓋達(dá)到100%。
這些能力的基礎(chǔ)是百度自然語言處理和語音技術(shù)。雷鋒網(wǎng)雷鋒網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。
本專題其他文章