0
本文作者: 陳伊莉 | 2018-10-11 13:04 |
在AI、大數(shù)據(jù)技術(shù)的推動(dòng)下,銀行的傳統(tǒng)經(jīng)營(yíng)模式正在發(fā)生根本性的變化,數(shù)據(jù)驅(qū)動(dòng)的輕型銀行模式隨之誕生。而在向數(shù)據(jù)驅(qū)動(dòng)方向奔馳的路上,如何高效處理海量數(shù)據(jù)成為一個(gè)重要的課題。作為我國(guó)銀行業(yè)數(shù)字化轉(zhuǎn)型的先鋒軍,招行也面臨著這樣的難題。
IT架構(gòu)轉(zhuǎn)型是數(shù)字化創(chuàng)新的基石,而一個(gè)可擴(kuò)展、高性能的數(shù)據(jù)庫是IT基礎(chǔ)設(shè)施的關(guān)鍵支柱,由此可見數(shù)據(jù)庫之于數(shù)字金融的重要意義。
雷鋒網(wǎng)AI金融評(píng)論獲悉,在近日召開的華為2018全聯(lián)接大會(huì)上,招商銀行總行信息技術(shù)部總經(jīng)理周天虹就帶來了《AI時(shí)代的分布式數(shù)據(jù)庫》主題演講。他談到一個(gè)先進(jìn)的、面向AI時(shí)代的數(shù)據(jù)庫應(yīng)做到六點(diǎn):高擴(kuò)展、高性能、高可用、云架構(gòu)、易運(yùn)維、易開發(fā),并分享了他們聯(lián)合華為研發(fā)的新型數(shù)據(jù)庫GaussDB的相關(guān)經(jīng)驗(yàn)。
以下是演講精要,雷鋒網(wǎng)AI金融評(píng)論進(jìn)行了不改變?cè)獾木庉嫞?/p>
多年來招商銀行一直在持續(xù)進(jìn)行戰(zhàn)略轉(zhuǎn)型。今天我們最新的戰(zhàn)略是金融科技銀行戰(zhàn)略,要致力于打造一家深度科技化的銀行。我們也是一家以零售為主的銀行,所以戰(zhàn)略的主要的內(nèi)容是要打造零售金融3.0,再以基于銀行卡服務(wù)為特征的零售金融一點(diǎn)零時(shí)代,和以生成財(cái)富管理為特征的零售金融二點(diǎn)零時(shí)代,招商銀行都搶占了先機(jī)。今天我們要率先開啟零售金融的3.0時(shí)代。我們認(rèn)為主要要做好三件事。第一是要把手機(jī)APP打造成零售業(yè)務(wù)經(jīng)營(yíng)服務(wù)的主平臺(tái)。招行有兩個(gè)主力APP,目前用戶數(shù)已經(jīng)超過了1.2億,月活超過6000萬。第二是要打造一個(gè)全產(chǎn)品,通過全渠道服務(wù)全客群的數(shù)字化的零售業(yè)務(wù)的經(jīng)營(yíng)服務(wù)體系。第三是要?jiǎng)?chuàng)造最佳客戶體驗(yàn)。
今天一家先進(jìn)的銀行一定要走數(shù)據(jù)驅(qū)動(dòng)的道路,不論是營(yíng)銷獲客,還是服務(wù)運(yùn)營(yíng)和風(fēng)控,招商銀行覆蓋了中國(guó)境內(nèi)的130座城市,客群過億,但是招商銀行的網(wǎng)點(diǎn)數(shù)量只有1700多家,背后的支撐正是我們正在打造的一個(gè)數(shù)字化的銀行業(yè)務(wù)的經(jīng)營(yíng)服務(wù)體系。
這里給大家看幾個(gè)數(shù)據(jù),在線上獲客方面,招行的借記卡線上獲客已經(jīng)達(dá)到了14%,信用卡高達(dá)60%。理財(cái)產(chǎn)品銷售和消費(fèi)信貸這些零售業(yè)務(wù)的主要業(yè)務(wù)大概有50%左右都已經(jīng)是完全在線上產(chǎn)生的。為了更好的了解我們的客戶,我們?cè)趦纱驛PP里面埋點(diǎn)數(shù)量超過3萬個(gè),每天收集的客戶行為日志超過10億條?;诳蛻舻呢?cái)富特征和行為特征,我們每天發(fā)起的個(gè)性化推推薦超過3億次。
最近幾年,隨著深度神經(jīng)網(wǎng)絡(luò)算法的突破,人工智能迎來了誕生60年后的第一次爆發(fā),在金融行業(yè)也有非常多的重要的應(yīng)用。金融行業(yè)是一個(gè)經(jīng)營(yíng)風(fēng)險(xiǎn)的行業(yè),機(jī)器學(xué)習(xí)在金融的風(fēng)控方面正在發(fā)揮越來越重要的作用。在新技術(shù)的浪潮下,銀行的IT基礎(chǔ)設(shè)施也正在發(fā)生一些重要的變化,其中有三個(gè)板塊顯得越來越重要,就是云計(jì)算、大數(shù)據(jù)和人工智能。 后兩者都是用于支撐對(duì)數(shù)據(jù)和信息的深度的挖掘和利用。
招行在AI方面也開展了一系列的探索和實(shí)踐。
2016年,我們?cè)贏TM取現(xiàn)方面應(yīng)用了人臉識(shí)別技術(shù),實(shí)現(xiàn)了刷臉取款,這是在金融行業(yè)人臉核身的第一個(gè)落地項(xiàng)目。
我們知道真正的海量數(shù)據(jù),其實(shí)是來自于互聯(lián)網(wǎng),大量有價(jià)值的信息,是非結(jié)構(gòu)化的文本信息。自然語言處理技術(shù)可以幫助我們有效地利用這些信息。招行通過分析網(wǎng)絡(luò)上的各類企業(yè)和政府的招中標(biāo)公告,解析出其中的中標(biāo)企業(yè)中標(biāo)項(xiàng)目中標(biāo)金額,已經(jīng)成為我們對(duì)公業(yè)務(wù)商機(jī)發(fā)現(xiàn)的起點(diǎn)。類似的,我們通過分析網(wǎng)絡(luò)上的法院判決書,解析出其中的原告被告、涉案案由、判決結(jié)果,用于對(duì)個(gè)人客戶和企業(yè)客戶的風(fēng)險(xiǎn)預(yù)警。
我們正在大力地構(gòu)建企業(yè)級(jí)的零售客戶關(guān)系圖譜和企業(yè)客戶關(guān)系圖譜,用來刻畫個(gè)人和個(gè)人,個(gè)人和企業(yè),企業(yè)和企業(yè)之間各種復(fù)雜的關(guān)系。目前這兩個(gè)圖譜已經(jīng)覆蓋了1.2億的個(gè)人節(jié)點(diǎn)和5000萬的的企業(yè)客戶節(jié)點(diǎn)。
智能問答是自然語言處理技術(shù)和知識(shí)圖譜這兩種技術(shù)的綜合運(yùn)用,招行目前在超過600個(gè)場(chǎng)景已經(jīng)接入了智能問答系統(tǒng)。
在金融行業(yè),營(yíng)銷風(fēng)控和智能投顧是機(jī)器學(xué)習(xí)的主戰(zhàn)場(chǎng),2016年招商銀行推出摩羯智投,今天業(yè)務(wù)規(guī)模已經(jīng)超過了120億,服務(wù)的客戶接近20萬,是銀行業(yè)最大的智能投顧產(chǎn)品,而且投資績(jī)效長(zhǎng)期是基于居于公募基金的前30%。
零售客戶每一筆交易都會(huì)接入反欺詐平臺(tái),在這個(gè)平臺(tái)上部署了一系列復(fù)雜的規(guī)則和模型,但是平均的處理時(shí)間只有50毫秒,實(shí)現(xiàn)了真正的實(shí)時(shí)智能反欺詐。
一個(gè)大型銀行,一個(gè)比較有規(guī)模的經(jīng)濟(jì)體,就會(huì)涉及到大量的人財(cái)物這些資源的調(diào)度和配置。機(jī)器學(xué)習(xí)在預(yù)測(cè)規(guī)劃方面可以發(fā)揮很好的作用。招商銀行我們?cè)谶@方面也做了一些探索。比如說網(wǎng)點(diǎn)客流的預(yù)測(cè),網(wǎng)點(diǎn)業(yè)務(wù)量的預(yù)測(cè),ATM的現(xiàn)金預(yù)測(cè)AI技術(shù)和大數(shù)據(jù)技術(shù)正在快速的融入到銀行的技術(shù)體系,深刻地改變了銀行經(jīng)營(yíng)管理服務(wù)的方方面面。
在AI技術(shù)和大數(shù)據(jù)技術(shù)的推動(dòng)下,銀行的傳統(tǒng)經(jīng)營(yíng)模式將發(fā)生根本的變化,產(chǎn)生一種全新的數(shù)據(jù)驅(qū)動(dòng)的輕型銀行模式。招商銀行正在向數(shù)據(jù)驅(qū)動(dòng)的方向發(fā)展,技術(shù)上要求對(duì)海量數(shù)據(jù)進(jìn)行非常高效的處理。一個(gè)可擴(kuò)展高性能的數(shù)據(jù)庫就成為IT基礎(chǔ)設(shè)施的關(guān)鍵支柱。
招商銀行對(duì)一個(gè)先進(jìn)的數(shù)據(jù)庫有六個(gè)方面的要求:
首先因?yàn)橐幚砗A繑?shù)據(jù),所以需要高擴(kuò)展。
第二,金融場(chǎng)景越來越需要對(duì)海量的數(shù)據(jù)進(jìn)行從準(zhǔn)實(shí)時(shí)到實(shí)時(shí)的處理,這樣就需要高性能。
第三,銀行業(yè)對(duì)整個(gè)信息系統(tǒng)的業(yè)務(wù)連續(xù)性有非常高的要求,因此需要高可用。
第四,我們希望計(jì)算和存儲(chǔ)分離,這樣計(jì)算資源和存儲(chǔ)資源就可以按需分配;我們也需要對(duì)龐大集群上的不同的應(yīng)用有效的隔離,這樣就需要多租戶,這些都可以歸結(jié)為云架構(gòu)。
第五,因?yàn)閿?shù)據(jù)庫的規(guī)模很大,需要易于運(yùn)維。
第六,我們希望在應(yīng)用層面避免分庫分表,開發(fā)人員可以像使用集中式數(shù)據(jù)庫一樣來使用分布式數(shù)據(jù)庫。
但是現(xiàn)在市場(chǎng)上缺乏滿足這六個(gè)要求的成熟產(chǎn)品。常見的做法是在開源數(shù)據(jù)庫上分庫分表,比如使用Mysql,招行也是Mysql的重度用戶。但一方面Mysql存在著一些明顯的不足。比如說單庫性能容量不佳,Mysql單庫容量一旦超過500G,性能就急劇下降;高度依賴分庫分表,復(fù)雜性高,擴(kuò)展性差;另外沒有原生的高可用方案。
另一方面,各種新型數(shù)據(jù)庫,如NoSQL,也都存在著局限。比如說基本上對(duì)于數(shù)據(jù)庫四大事物特征ACID(原子性Atomicity、一致性Consistency、隔離性Isolation、持久性Durability)支持不足,這樣就無法用于金融的一些關(guān)鍵場(chǎng)景。
華為有打造數(shù)據(jù)庫產(chǎn)品的意愿,招行也有需求有場(chǎng)景有實(shí)踐經(jīng)驗(yàn),兩家一拍即合。去年11月,雙方共同成立了分布式數(shù)據(jù)庫聯(lián)合創(chuàng)新實(shí)驗(yàn)室,要打造一款領(lǐng)先的數(shù)據(jù)庫產(chǎn)品,命名為GaussDB。
這款產(chǎn)品目前已經(jīng)發(fā)布了高性能的企業(yè)級(jí)內(nèi)核以及分布式高可用特征。招商銀行也開始在兩個(gè)重要的業(yè)務(wù)系統(tǒng)的生產(chǎn)環(huán)境實(shí)際使用,即綜合支付交易系統(tǒng)和信用卡重資產(chǎn)營(yíng)銷實(shí)時(shí)展示系統(tǒng)。
聯(lián)合創(chuàng)新實(shí)驗(yàn)室對(duì)GaussDB提出了四個(gè)方面的建設(shè)目標(biāo):
第一是高性能企業(yè)級(jí)內(nèi)核,要完整地支持分布式事物,滿足金融行業(yè)對(duì)數(shù)據(jù)強(qiáng)一致的要求。單機(jī)的事物處理能力要達(dá)到每分鐘百萬級(jí)別。
第二個(gè)目標(biāo)是要支持分布式高擴(kuò)展,支持線性擴(kuò)展,擴(kuò)展比要大于0.8,要支持集群的在線擴(kuò)容,擴(kuò)容時(shí)業(yè)務(wù)要零中斷。
第三個(gè)目標(biāo)是分布式高可用,在單數(shù)據(jù)中心內(nèi)要支持RPO (Recovery Point Objective,復(fù)原點(diǎn)目標(biāo))等于0的前提下,RTO (Recovery Time Objective,復(fù)原時(shí)間目標(biāo))達(dá)到秒級(jí),同時(shí)要支持多數(shù)據(jù)中心,多副本、多活,故障可以自動(dòng)診斷、隔離和切換。
最后是分布式云化,就是要支持計(jì)算、存儲(chǔ)分離和多租戶。
關(guān)于未來數(shù)據(jù)庫的總體架構(gòu),招行有三個(gè)方面的主要的思考:
首先要大力發(fā)展分布式數(shù)據(jù)庫,結(jié)合數(shù)據(jù)庫總體架構(gòu)的轉(zhuǎn)型,使數(shù)據(jù)庫能夠更好地支持業(yè)務(wù)發(fā)展。
第二,招行目前的主力數(shù)據(jù)庫種類多達(dá)12種,未來要精簡(jiǎn)主力數(shù)據(jù)庫的品種,精簡(jiǎn)數(shù)據(jù)庫技術(shù)棧,方便開發(fā)和運(yùn)維。
最后要利用AI技術(shù)和機(jī)器學(xué)習(xí)技術(shù),持續(xù)構(gòu)建高度自動(dòng)化智能化的數(shù)據(jù)庫的運(yùn)維管理體系,實(shí)現(xiàn)低成本規(guī)?;\(yùn)維。
更多資訊,請(qǐng)關(guān)注雷鋒網(wǎng)AI金融評(píng)論
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。