專訪平安科技：金融業(yè)已進(jìn)入深度人工智能階段，背后是你看不到的黑科技

本文作者：溫曉樺

2017-03-10 17:26

導(dǎo)語(yǔ)：平安科技人工智能實(shí)驗(yàn)室，以及大數(shù)據(jù)平臺(tái)等團(tuán)隊(duì)在 LFW 人臉數(shù)據(jù)集上99.6%的準(zhǔn)確率，是平安科技的領(lǐng)先技術(shù)在國(guó)際學(xué)術(shù)層面的一次亮相。

近日，平安科技人臉識(shí)別團(tuán)隊(duì)在國(guó)際權(quán)威人臉識(shí)別公開測(cè)試集LFW(Labeled Faces in the Wild)中，獲得在無限制條件下人臉驗(yàn)證測(cè)試（Unrestricted，Labeled Outside Data Results）0.9960±0.0031的成績(jī)。

目前，很多成果在 LFW 人臉數(shù)據(jù)集上的準(zhǔn)確率都停留在 99.5% 左右，平安科技團(tuán)隊(duì)的成績(jī)意味著人工智能技術(shù)之人臉識(shí)別又獲得了突破，人臉識(shí)別、人工智能作用于金融業(yè)有了更穩(wěn)固的保障。

據(jù)雷鋒網(wǎng)了解，這項(xiàng)技術(shù)，來自于平安科技人工智能實(shí)驗(yàn)室，以及大數(shù)據(jù)平臺(tái)等團(tuán)隊(duì)。這次測(cè)試結(jié)果的發(fā)布，是平安科技的領(lǐng)先技術(shù)在國(guó)際學(xué)術(shù)層面的一次亮相。

日前，雷鋒網(wǎng)與平安科技智能引擎部總經(jīng)理兼大數(shù)據(jù)首席總監(jiān)、“”國(guó)家特聘專家肖京博士，以及平安科技人工智能實(shí)驗(yàn)室主任、首席AI科學(xué)家劉飛進(jìn)行了對(duì)話，談及平安科技在人工智能研發(fā)和應(yīng)用的進(jìn)展與未來思考。

專訪平安科技：金融業(yè)已進(jìn)入深度人工智能階段，背后是你看不到的黑科技

劉飛

AI助長(zhǎng)金融

一般來說，在LFW做到99.5%以后，就表明了有基本的人臉識(shí)別算法能力，但商用級(jí)人臉識(shí)別的挑戰(zhàn)與LFW還不太一樣。與實(shí)驗(yàn)室穩(wěn)定的環(huán)境條件不同，實(shí)際應(yīng)用環(huán)境中各種不確定因素比如，在手機(jī)采集照片去比對(duì)身份證照片，但這個(gè)身份證照片的分辨率是被壓縮過的，而且還帶有一些水印等情況，都是對(duì)技術(shù)的考驗(yàn)。而商用級(jí)的人臉識(shí)別應(yīng)用，已經(jīng)基于這些不確定因素而進(jìn)行開發(fā)。

早在2013年，平安就針對(duì)人臉識(shí)別方面開始做了一個(gè)前期的調(diào)研。從2014年開始，平安科技組建了自己的人工智能實(shí)驗(yàn)室團(tuán)隊(duì)，開始研究算法和核心技術(shù)應(yīng)用。

這個(gè)目前不到50人的實(shí)驗(yàn)室團(tuán)隊(duì)，以深度學(xué)習(xí)為主，負(fù)責(zé)研究解決集團(tuán)業(yè)務(wù)中包括機(jī)器視覺、自然語(yǔ)言領(lǐng)域的問題，以及研發(fā)計(jì)算機(jī)認(rèn)知領(lǐng)域的新事物。

在2015年，肖京博士也加盟平安科技，負(fù)責(zé)平安科技大數(shù)據(jù)分析挖掘，及人工智能在風(fēng)險(xiǎn)管控、欺詐識(shí)別、互聯(lián)網(wǎng)健康醫(yī)療、智能運(yùn)營(yíng)以及個(gè)性化精準(zhǔn)營(yíng)銷等金融業(yè)務(wù)場(chǎng)景的研發(fā)及應(yīng)用。

目前，人眼識(shí)別準(zhǔn)確率的極限是97.53%，2016年開始，平安科技的人臉識(shí)別技術(shù)的精準(zhǔn)度在很多測(cè)試條件下已達(dá)99%以上。從核心技術(shù)研究到產(chǎn)品、工程、技術(shù)的實(shí)現(xiàn)，再應(yīng)用到業(yè)務(wù)層面，平安科技只用了一年的時(shí)間。當(dāng)前，該項(xiàng)技術(shù)已應(yīng)用于108個(gè)場(chǎng)景，超過1.03億+使用人次。

劉飛表示，人臉并不是穩(wěn)定的生物特征，在年齡、妝容等因素影響下識(shí)別精度也隨之受到影響。目前，基于平安體系內(nèi)多年積累的大數(shù)據(jù)資源，平安人臉識(shí)別技術(shù)自優(yōu)化的架構(gòu)可以應(yīng)對(duì)人臉隨年齡的增加而發(fā)生的變化，包括大家關(guān)心的同卵雙生雙胞胎問題，只要對(duì)應(yīng)照片被收錄，同樣可以被識(shí)別。

人臉識(shí)別技術(shù)作為人工智能核心一環(huán)，目前已經(jīng)應(yīng)用到金融、安防、身份識(shí)別類等嚴(yán)肅應(yīng)用上，以金融業(yè)為例，包括刷臉開卡、刷臉取款，保險(xiǎn)中理賠對(duì)象識(shí)別等等。

AI技術(shù)的成熟運(yùn)用，是“未來銀行”、“新金融”的基礎(chǔ)。比如，人臉識(shí)別技術(shù)全球首發(fā)應(yīng)用于平安普惠小額貸款 “平安i貸2.0”的融資場(chǎng)景。用戶通過“平安i貸”APP申請(qǐng)貸款時(shí)，只需要打開手機(jī)攝像頭，由系統(tǒng)拍攝并抓取用戶若干面部影像，再進(jìn)行檢測(cè)，即可遠(yuǎn)程完成身份核實(shí)，最快實(shí)現(xiàn)3分鐘放貸。自開通以來，通過“刷臉”完成的業(yè)務(wù)量已達(dá)日均三萬。

平安科技研究深度學(xué)習(xí)，走不一樣的路

人工智能在綜合金融的大規(guī)模應(yīng)用，關(guān)鍵在于安全、準(zhǔn)確、高效，某些規(guī)則性問題下，效率和成效甚至比人做得更出色，比如人臉識(shí)別。然而，這背后的摸索，如同黑暗隧道中前行時(shí)看到的曙光。

更少的數(shù)據(jù)，更高的精度

現(xiàn)在平安科技的人臉識(shí)別技術(shù)準(zhǔn)確率達(dá)到了99.6%，對(duì)于最后的極限，劉飛說，在擁有足夠多的數(shù)據(jù)量以后，我們完全有可能往更極限的目標(biāo)靠近。

但是，在很多場(chǎng)景下采集數(shù)據(jù)是很難的。劉飛說，“理論上說如果有更多的數(shù)據(jù)就能怎么樣，但在理論上就做不到。比如自動(dòng)駕駛的領(lǐng)域，它為了做到足夠安全，需要捕捉事故現(xiàn)場(chǎng)的特征，但是你不可能去制造事故?！?/p>

所以，平安科技在研究的是，如何通過較少的樣本來達(dá)到更高的精度。劉飛表示，如果要用比較少的數(shù)據(jù)也能訓(xùn)練出很高水平的話，法寶在于算法?！拔覀冏罱陀幸粋€(gè)讓人興奮的研究課題，也是最近這幾年在學(xué)術(shù)界也有提及的，叫‘one-shot learning’技術(shù)。”“one-shot learning”技術(shù)，可以在一個(gè)單點(diǎn)領(lǐng)域有足夠高效、深入的應(yīng)用。

與此同時(shí)，和大家都希望部署的大規(guī)模神經(jīng)網(wǎng)絡(luò)不同，平安也在追求的是，做一個(gè)精致小巧的網(wǎng)，它能夠應(yīng)用到更加多樣的平臺(tái)上，同時(shí)精度不被損失?！笆聦?shí)上，我們覺得數(shù)據(jù)還可以再少一些。我們現(xiàn)在是百萬級(jí)的數(shù)據(jù)，但實(shí)際上已經(jīng)可以做到只需要幾十萬的數(shù)據(jù)，訓(xùn)練出99%以上的精度?！?/p>

AI規(guī)模化應(yīng)用，需要通用型AI

劉飛表示，其實(shí)我們現(xiàn)在的人工智能技術(shù)在解決當(dāng)前的問題是相對(duì)分立和孤立的，人臉識(shí)別通過圖象就解決了身份識(shí)別的問題，而至于其它的方向，比如識(shí)別一個(gè)目標(biāo)物體，一個(gè)電話、一輛汽車，它又是一個(gè)問題。目前人工智能，包括深度學(xué)習(xí)的介入，還是正在解決這些單獨(dú)的問題，甚至還用不同的方法解決單個(gè)問題。

比如前文提及的“one-shot learning”技術(shù)，事實(shí)上，該技術(shù)可以在一個(gè)單點(diǎn)領(lǐng)域有足夠高效、深入的應(yīng)用，但對(duì)于廣泛的應(yīng)用來說，用處并不大。

“以往的神經(jīng)網(wǎng)絡(luò)無非就是前波網(wǎng)絡(luò)、反向傳播網(wǎng)絡(luò)這兩個(gè)網(wǎng)絡(luò)，但也是分別在不同的領(lǐng)域解決問題。”劉飛介紹，在實(shí)際業(yè)務(wù)中，如果能夠把無論是語(yǔ)音方面的東西，還是在人臉和其它的特征方面，結(jié)合起來，然后又重新用在非常復(fù)雜的安全領(lǐng)域下，也是非常有前景的。

“人工智能界還需要一些比較通用的方法，使得人工智能的技術(shù)基于某一個(gè)單一方案解決更多的問題。比如現(xiàn)在在研究的多任務(wù)網(wǎng)絡(luò)。一個(gè)神經(jīng)網(wǎng)絡(luò)能不能解決多個(gè)不同的問題？包括靜態(tài)和動(dòng)態(tài)，”

然而，不同的任務(wù)的數(shù)據(jù)參數(shù)都會(huì)不同，因此，多任務(wù)網(wǎng)絡(luò)將如何實(shí)現(xiàn)？其實(shí)這門學(xué)科也是有歷史的，它叫AGI（通用人工智能）。

劉飛說：“現(xiàn)在大家普遍的融合方法，是把幾個(gè)不同任務(wù)的神經(jīng)網(wǎng)絡(luò)淺顯地綜合在一起，過程中訓(xùn)練、研發(fā)還是單獨(dú)的。比如對(duì)卷積神經(jīng)網(wǎng)絡(luò)的應(yīng)用?！?/p>

然而，讓劉飛覺得興奮的是，這兩年學(xué)術(shù)上的突破并不在這方面，“大家發(fā)現(xiàn)誰對(duì)反向傳播網(wǎng)絡(luò)有很大貢獻(xiàn)的話，那個(gè)成果非常值得驕傲，是非常超前的。”

據(jù)雷鋒網(wǎng)了解，現(xiàn)在典型的反向神經(jīng)傳播網(wǎng)絡(luò)LSTM，是用在了語(yǔ)音識(shí)別領(lǐng)域；還有最近一年左右所涌現(xiàn)出來的生成對(duì)抗網(wǎng)絡(luò)（GANs），也是瞄準(zhǔn)在反向傳播網(wǎng)絡(luò)。

不過，“當(dāng)然不是說我們馬上就可以找到一種方式把它們都糅合在一起，但從2006年到現(xiàn)在，所有的生物學(xué)習(xí)獲得突破的問題解決的時(shí)候，都是一些在于反向傳播的突破。如果把這些基礎(chǔ)性的理論問題和相應(yīng)的工程實(shí)踐解決好的話，可能我們未來會(huì)重新看待和設(shè)計(jì)用來解決不同領(lǐng)域的神經(jīng)網(wǎng)絡(luò)的問題?！?/p>

到了今天，我們看到的“刷臉”只是人工智能技術(shù)應(yīng)用的冰山一角。劉飛指出，由于監(jiān)管滯后、傳統(tǒng)行業(yè)規(guī)范的約束，以及人工智能本身的不可解釋性等原因，當(dāng)前許多超前的技術(shù)儲(chǔ)備尚未能面世。舉例來說，平安科技AI實(shí)驗(yàn)室中，科學(xué)家們嘗試通過對(duì)人類維持最低只有30毫秒的微表情的研究，拓展人工智能在情感判斷、服務(wù)決策和判斷等應(yīng)用?！斑@個(gè)還很任重道遠(yuǎn)，但是這樣的課題已經(jīng)在前幾年就被提出來，它還在發(fā)展，而且這個(gè)發(fā)展的過程會(huì)很快?！?/p>

專訪平安科技：金融業(yè)已進(jìn)入深度人工智能階段，背后是你看不到的黑科技

肖京

從規(guī)則利用到數(shù)據(jù)分析，金融業(yè)進(jìn)入深度人工智能階段

除了算法上的摸索，平安科技造的另一個(gè)輪子是大數(shù)據(jù)挖掘。這兩件事，都并非一蹴而就的。

據(jù)了解，平安4年前開始做數(shù)據(jù)的集中。四年前，正是大數(shù)據(jù)火熱的時(shí)候。肖京博士表示，此前數(shù)據(jù)存儲(chǔ)在各個(gè)不同孤島上，很分散，缺乏強(qiáng)關(guān)聯(lián)的線索，導(dǎo)致數(shù)據(jù)缺乏利用的價(jià)值，比如需要更精準(zhǔn)地識(shí)別欺詐時(shí)，無法關(guān)聯(lián)起來的數(shù)據(jù)無法發(fā)揮邏輯分析的作用。

“人工智能的技術(shù)是基于數(shù)據(jù)的，有數(shù)據(jù)才有可為。對(duì)于金融業(yè)來說，現(xiàn)在已經(jīng)進(jìn)入到深度人工智能的階段，讓數(shù)據(jù)發(fā)揮最大的價(jià)值。”

劉飛也解釋稱，即便更少的數(shù)據(jù)、更高的精度成為可能，但我們也不能否認(rèn)數(shù)據(jù)的重要性?！爱?dāng)領(lǐng)域進(jìn)入差異化發(fā)展的時(shí)候，一方面數(shù)據(jù)可帶來算法前瞻的預(yù)言，幫助做出差異化的算法成果，同時(shí)借助數(shù)據(jù)規(guī)模又能夠較早地投入商用。而能夠較早地商用就意味著，又能幫助我們發(fā)現(xiàn)別人還沒有機(jī)會(huì)發(fā)現(xiàn)的問題，從而優(yōu)化算法，反復(fù)來訓(xùn)練。”

而做數(shù)據(jù)集中，這就需要先搭建清洗、整合等一系列的底層數(shù)據(jù)應(yīng)用以及平臺(tái)。這些做完了以后，最重要還是要挖掘數(shù)據(jù)的價(jià)值。做這么多事情，所花的力氣也可想而知。對(duì)平安來說，其無非是堅(jiān)持向數(shù)字化轉(zhuǎn)型。目前第一步，是趕上了大數(shù)據(jù)、AI的列車，通過挖掘數(shù)據(jù)的價(jià)值，來提升客戶的體驗(yàn)，擴(kuò)大自身服務(wù)能力。

平安科技成立于2008年，目前已擁有超過4000名IT技術(shù)人員和IT管理人員。平安科技的成立，是平安集團(tuán)向IT專業(yè)化領(lǐng)域邁進(jìn)，向“科技金融”模式探索的開始，也是今日其技術(shù)自主、能夠率先利用目前最為先進(jìn)的AI技術(shù)創(chuàng)造價(jià)值的前提。劉飛向雷鋒網(wǎng)表示，“平安建立人工智能實(shí)驗(yàn)室，涉及深度學(xué)習(xí)領(lǐng)域時(shí)間不算太晚，我們?cè)谌瞬抨?duì)伍、基礎(chǔ)設(shè)施的投入方面也不小，我們也有做大規(guī)模深度學(xué)習(xí)研究的龐大GPU計(jì)算集群，研發(fā)自己的計(jì)算平臺(tái)?！?/p>

肖京博士表示，IT企業(yè)的發(fā)展要經(jīng)歷幾個(gè)階段——第一個(gè)是信息化；第二個(gè)是數(shù)據(jù)化，信息流通以后有數(shù)據(jù)的接入，才有更好的方法能夠利用好這些信息；第三個(gè)是智能化，有了大量的數(shù)據(jù)以后怎么才能讓我們的決策變得更加的智能。

肖京說道，“在大數(shù)據(jù)的時(shí)代，我們需要有一些機(jī)器學(xué)習(xí)的深度智能的方法，以服務(wù)那些缺乏強(qiáng)關(guān)聯(lián)數(shù)據(jù)的長(zhǎng)尾用戶。這不是以往基于對(duì)明確的業(yè)務(wù)規(guī)則的利用、簡(jiǎn)單的統(tǒng)計(jì)分析技術(shù)能夠完成的。”

平安集團(tuán)擁有金融業(yè)全牌照，業(yè)務(wù)包括傳統(tǒng)金融業(yè)的證券、保險(xiǎn)、銀行、理財(cái)、征信，同時(shí)包括互聯(lián)網(wǎng)金融領(lǐng)域的陸金所，互聯(lián)網(wǎng)銀行橙子銀行，以及醫(yī)療保險(xiǎn)領(lǐng)域的平安好醫(yī)生等。根據(jù)肖京介紹，平安科技作為技術(shù)輸出，其人工智能技術(shù)已應(yīng)用在平安諸多業(yè)務(wù)當(dāng)中，包括金融最核心的大數(shù)據(jù)征信、風(fēng)險(xiǎn)控制、欺詐識(shí)別、市場(chǎng)投資分析等，以及如今最時(shí)尚的精準(zhǔn)營(yíng)銷，以及機(jī)器學(xué)習(xí)輔助的精準(zhǔn)醫(yī)療，用于指定個(gè)性化保費(fèi)等。

人臉識(shí)別作為人工智能在圖像領(lǐng)域中比較成熟的應(yīng)用，已經(jīng)讓許多人驚嘆不已。但劉飛表示，“人工智能會(huì)推動(dòng)行業(yè)變革和發(fā)展的現(xiàn)象，現(xiàn)在只是露了冰山一角。以前沒有人工智能的時(shí)候，一些互聯(lián)網(wǎng)金融業(yè)務(wù)無法開展，現(xiàn)在有了這個(gè)技術(shù)之后就可以在安全、可控、有保證的情況下開展起來了，這可能就會(huì)改變?cè)瓉硌永m(xù)了幾十年的行業(yè)。”

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

4人收藏

相關(guān)文章