1
本文作者: 溫曉樺 | 2017-03-10 17:26 |
近日,平安科技人臉識別團隊在國際權(quán)威人臉識別公開測試集LFW(Labeled Faces in the Wild)中,獲得在無限制條件下人臉驗證測試(Unrestricted,Labeled Outside Data Results)0.9960±0.0031的成績。
目前,很多成果在 LFW 人臉數(shù)據(jù)集上的準(zhǔn)確率都停留在 99.5% 左右,平安科技團隊的成績意味著人工智能技術(shù)之人臉識別又獲得了突破,人臉識別、人工智能作用于金融業(yè)有了更穩(wěn)固的保障。
據(jù)雷鋒網(wǎng)了解,這項技術(shù),來自于平安科技人工智能實驗室,以及大數(shù)據(jù)平臺等團隊。這次測試結(jié)果的發(fā)布,是平安科技的領(lǐng)先技術(shù)在國際學(xué)術(shù)層面的一次亮相。
日前,雷鋒網(wǎng)與平安科技智能引擎部總經(jīng)理兼大數(shù)據(jù)首席總監(jiān)、“”國家特聘專家肖京博士,以及平安科技人工智能實驗室主任、首席AI科學(xué)家劉飛進行了對話,談及平安科技在人工智能研發(fā)和應(yīng)用的進展與未來思考。
劉飛
一般來說,在LFW做到99.5%以后,就表明了有基本的人臉識別算法能力,但商用級人臉識別的挑戰(zhàn)與LFW還不太一樣。與實驗室穩(wěn)定的環(huán)境條件不同,實際應(yīng)用環(huán)境中各種不確定因素比如,在手機采集照片去比對身份證照片,但這個身份證照片的分辨率是被壓縮過的,而且還帶有一些水印等情況,都是對技術(shù)的考驗。而商用級的人臉識別應(yīng)用,已經(jīng)基于這些不確定因素而進行開發(fā)。
早在2013年,平安就針對人臉識別方面開始做了一個前期的調(diào)研。從2014年開始,平安科技組建了自己的人工智能實驗室團隊,開始研究算法和核心技術(shù)應(yīng)用。
這個目前不到50人的實驗室團隊,以深度學(xué)習(xí)為主,負(fù)責(zé)研究解決集團業(yè)務(wù)中包括機器視覺、自然語言領(lǐng)域的問題,以及研發(fā)計算機認(rèn)知領(lǐng)域的新事物。
在2015年,肖京博士也加盟平安科技,負(fù)責(zé)平安科技大數(shù)據(jù)分析挖掘,及人工智能在風(fēng)險管控、欺詐識別、互聯(lián)網(wǎng)健康醫(yī)療、智能運營以及個性化精準(zhǔn)營銷等金融業(yè)務(wù)場景的研發(fā)及應(yīng)用。
目前,人眼識別準(zhǔn)確率的極限是97.53%,2016年開始,平安科技的人臉識別技術(shù)的精準(zhǔn)度在很多測試條件下已達(dá)99%以上。從核心技術(shù)研究到產(chǎn)品、工程、技術(shù)的實現(xiàn),再應(yīng)用到業(yè)務(wù)層面,平安科技只用了一年的時間。當(dāng)前,該項技術(shù)已應(yīng)用于108個場景,超過1.03億+使用人次。
劉飛表示,人臉并不是穩(wěn)定的生物特征,在年齡、妝容等因素影響下識別精度也隨之受到影響。目前,基于平安體系內(nèi)多年積累的大數(shù)據(jù)資源,平安人臉識別技術(shù)自優(yōu)化的架構(gòu)可以應(yīng)對人臉隨年齡的增加而發(fā)生的變化,包括大家關(guān)心的同卵雙生雙胞胎問題,只要對應(yīng)照片被收錄,同樣可以被識別。
人臉識別技術(shù)作為人工智能核心一環(huán),目前已經(jīng)應(yīng)用到金融、安防、身份識別類等嚴(yán)肅應(yīng)用上,以金融業(yè)為例,包括刷臉開卡、刷臉取款,保險中理賠對象識別等等。
AI技術(shù)的成熟運用,是“未來銀行”、“新金融”的基礎(chǔ)。比如,人臉識別技術(shù)全球首發(fā)應(yīng)用于平安普惠小額貸款 “平安i貸2.0”的融資場景。用戶通過“平安i貸”APP申請貸款時,只需要打開手機攝像頭,由系統(tǒng)拍攝并抓取用戶若干面部影像,再進行檢測,即可遠(yuǎn)程完成身份核實,最快實現(xiàn)3分鐘放貸。自開通以來,通過“刷臉”完成的業(yè)務(wù)量已達(dá)日均三萬。
人工智能在綜合金融的大規(guī)模應(yīng)用,關(guān)鍵在于安全、準(zhǔn)確、高效,某些規(guī)則性問題下,效率和成效甚至比人做得更出色,比如人臉識別。然而,這背后的摸索,如同黑暗隧道中前行時看到的曙光。
現(xiàn)在平安科技的人臉識別技術(shù)準(zhǔn)確率達(dá)到了99.6%,對于最后的極限,劉飛說,在擁有足夠多的數(shù)據(jù)量以后,我們完全有可能往更極限的目標(biāo)靠近。
但是,在很多場景下采集數(shù)據(jù)是很難的。劉飛說,“理論上說如果有更多的數(shù)據(jù)就能怎么樣,但在理論上就做不到。比如自動駕駛的領(lǐng)域,它為了做到足夠安全,需要捕捉事故現(xiàn)場的特征,但是你不可能去制造事故?!?/p>
所以,平安科技在研究的是,如何通過較少的樣本來達(dá)到更高的精度。劉飛表示,如果要用比較少的數(shù)據(jù)也能訓(xùn)練出很高水平的話,法寶在于算法?!拔覀冏罱陀幸粋€讓人興奮的研究課題,也是最近這幾年在學(xué)術(shù)界也有提及的,叫‘one-shot learning’技術(shù)。”“one-shot learning”技術(shù),可以在一個單點領(lǐng)域有足夠高效、深入的應(yīng)用。
與此同時,和大家都希望部署的大規(guī)模神經(jīng)網(wǎng)絡(luò)不同,平安也在追求的是,做一個精致小巧的網(wǎng),它能夠應(yīng)用到更加多樣的平臺上,同時精度不被損失?!笆聦嵣希覀冇X得數(shù)據(jù)還可以再少一些。我們現(xiàn)在是百萬級的數(shù)據(jù),但實際上已經(jīng)可以做到只需要幾十萬的數(shù)據(jù),訓(xùn)練出99%以上的精度。”
劉飛表示,其實我們現(xiàn)在的人工智能技術(shù)在解決當(dāng)前的問題是相對分立和孤立的,人臉識別通過圖象就解決了身份識別的問題,而至于其它的方向,比如識別一個目標(biāo)物體,一個電話、一輛汽車,它又是一個問題。目前人工智能,包括深度學(xué)習(xí)的介入,還是正在解決這些單獨的問題,甚至還用不同的方法解決單個問題。
比如前文提及的“one-shot learning”技術(shù),事實上,該技術(shù)可以在一個單點領(lǐng)域有足夠高效、深入的應(yīng)用,但對于廣泛的應(yīng)用來說,用處并不大。
“以往的神經(jīng)網(wǎng)絡(luò)無非就是前波網(wǎng)絡(luò)、反向傳播網(wǎng)絡(luò)這兩個網(wǎng)絡(luò),但也是分別在不同的領(lǐng)域解決問題?!眲w介紹,在實際業(yè)務(wù)中,如果能夠把無論是語音方面的東西,還是在人臉和其它的特征方面,結(jié)合起來,然后又重新用在非常復(fù)雜的安全領(lǐng)域下,也是非常有前景的。
“人工智能界還需要一些比較通用的方法,使得人工智能的技術(shù)基于某一個單一方案解決更多的問題。比如現(xiàn)在在研究的多任務(wù)網(wǎng)絡(luò)。一個神經(jīng)網(wǎng)絡(luò)能不能解決多個不同的問題?包括靜態(tài)和動態(tài),”
然而,不同的任務(wù)的數(shù)據(jù)參數(shù)都會不同,因此,多任務(wù)網(wǎng)絡(luò)將如何實現(xiàn)?其實這門學(xué)科也是有歷史的,它叫AGI(通用人工智能)。
劉飛說:“現(xiàn)在大家普遍的融合方法,是把幾個不同任務(wù)的神經(jīng)網(wǎng)絡(luò)淺顯地綜合在一起,過程中訓(xùn)練、研發(fā)還是單獨的。比如對卷積神經(jīng)網(wǎng)絡(luò)的應(yīng)用?!?/p>
然而,讓劉飛覺得興奮的是,這兩年學(xué)術(shù)上的突破并不在這方面,“大家發(fā)現(xiàn)誰對反向傳播網(wǎng)絡(luò)有很大貢獻的話,那個成果非常值得驕傲,是非常超前的。”
據(jù)雷鋒網(wǎng)了解,現(xiàn)在典型的反向神經(jīng)傳播網(wǎng)絡(luò)LSTM,是用在了語音識別領(lǐng)域;還有最近一年左右所涌現(xiàn)出來的生成對抗網(wǎng)絡(luò)(GANs),也是瞄準(zhǔn)在反向傳播網(wǎng)絡(luò)。
不過,“當(dāng)然不是說我們馬上就可以找到一種方式把它們都糅合在一起,但從2006年到現(xiàn)在,所有的生物學(xué)習(xí)獲得突破的問題解決的時候,都是一些在于反向傳播的突破。如果把這些基礎(chǔ)性的理論問題和相應(yīng)的工程實踐解決好的話,可能我們未來會重新看待和設(shè)計用來解決不同領(lǐng)域的神經(jīng)網(wǎng)絡(luò)的問題?!?/p>
到了今天,我們看到的“刷臉”只是人工智能技術(shù)應(yīng)用的冰山一角。劉飛指出,由于監(jiān)管滯后、傳統(tǒng)行業(yè)規(guī)范的約束,以及人工智能本身的不可解釋性等原因,當(dāng)前許多超前的技術(shù)儲備尚未能面世。舉例來說,平安科技AI實驗室中,科學(xué)家們嘗試通過對人類維持最低只有30毫秒的微表情的研究,拓展人工智能在情感判斷、服務(wù)決策和判斷等應(yīng)用。“這個還很任重道遠(yuǎn),但是這樣的課題已經(jīng)在前幾年就被提出來,它還在發(fā)展,而且這個發(fā)展的過程會很快?!?/p>
肖京
除了算法上的摸索,平安科技造的另一個輪子是大數(shù)據(jù)挖掘。這兩件事,都并非一蹴而就的。
據(jù)了解,平安4年前開始做數(shù)據(jù)的集中。四年前,正是大數(shù)據(jù)火熱的時候。肖京博士表示,此前數(shù)據(jù)存儲在各個不同孤島上,很分散,缺乏強關(guān)聯(lián)的線索,導(dǎo)致數(shù)據(jù)缺乏利用的價值,比如需要更精準(zhǔn)地識別欺詐時,無法關(guān)聯(lián)起來的數(shù)據(jù)無法發(fā)揮邏輯分析的作用。
“人工智能的技術(shù)是基于數(shù)據(jù)的,有數(shù)據(jù)才有可為。對于金融業(yè)來說,現(xiàn)在已經(jīng)進入到深度人工智能的階段,讓數(shù)據(jù)發(fā)揮最大的價值?!?/p>
劉飛也解釋稱,即便更少的數(shù)據(jù)、更高的精度成為可能,但我們也不能否認(rèn)數(shù)據(jù)的重要性?!爱?dāng)領(lǐng)域進入差異化發(fā)展的時候,一方面數(shù)據(jù)可帶來算法前瞻的預(yù)言,幫助做出差異化的算法成果,同時借助數(shù)據(jù)規(guī)模又能夠較早地投入商用。而能夠較早地商用就意味著,又能幫助我們發(fā)現(xiàn)別人還沒有機會發(fā)現(xiàn)的問題,從而優(yōu)化算法,反復(fù)來訓(xùn)練?!?/p>
而做數(shù)據(jù)集中,這就需要先搭建清洗、整合等一系列的底層數(shù)據(jù)應(yīng)用以及平臺。這些做完了以后,最重要還是要挖掘數(shù)據(jù)的價值。做這么多事情,所花的力氣也可想而知。對平安來說,其無非是堅持向數(shù)字化轉(zhuǎn)型。目前第一步,是趕上了大數(shù)據(jù)、AI的列車,通過挖掘數(shù)據(jù)的價值,來提升客戶的體驗,擴大自身服務(wù)能力。
平安科技成立于2008年,目前已擁有超過4000名IT技術(shù)人員和IT管理人員。平安科技的成立,是平安集團向IT專業(yè)化領(lǐng)域邁進,向“科技金融”模式探索的開始,也是今日其技術(shù)自主、能夠率先利用目前最為先進的AI技術(shù)創(chuàng)造價值的前提。劉飛向雷鋒網(wǎng)表示,“平安建立人工智能實驗室,涉及深度學(xué)習(xí)領(lǐng)域時間不算太晚,我們在人才隊伍、基礎(chǔ)設(shè)施的投入方面也不小,我們也有做大規(guī)模深度學(xué)習(xí)研究的龐大GPU計算集群,研發(fā)自己的計算平臺?!?/p>
肖京博士表示,IT企業(yè)的發(fā)展要經(jīng)歷幾個階段——第一個是信息化;第二個是數(shù)據(jù)化,信息流通以后有數(shù)據(jù)的接入,才有更好的方法能夠利用好這些信息;第三個是智能化,有了大量的數(shù)據(jù)以后怎么才能讓我們的決策變得更加的智能。
肖京說道,“在大數(shù)據(jù)的時代,我們需要有一些機器學(xué)習(xí)的深度智能的方法,以服務(wù)那些缺乏強關(guān)聯(lián)數(shù)據(jù)的長尾用戶。這不是以往基于對明確的業(yè)務(wù)規(guī)則的利用、簡單的統(tǒng)計分析技術(shù)能夠完成的?!?/p>
平安集團擁有金融業(yè)全牌照,業(yè)務(wù)包括傳統(tǒng)金融業(yè)的證券、保險、銀行、理財、征信,同時包括互聯(lián)網(wǎng)金融領(lǐng)域的陸金所,互聯(lián)網(wǎng)銀行橙子銀行,以及醫(yī)療保險領(lǐng)域的平安好醫(yī)生等。根據(jù)肖京介紹,平安科技作為技術(shù)輸出,其人工智能技術(shù)已應(yīng)用在平安諸多業(yè)務(wù)當(dāng)中,包括金融最核心的大數(shù)據(jù)征信、風(fēng)險控制、欺詐識別、市場投資分析等,以及如今最時尚的精準(zhǔn)營銷,以及機器學(xué)習(xí)輔助的精準(zhǔn)醫(yī)療,用于指定個性化保費等。
人臉識別作為人工智能在圖像領(lǐng)域中比較成熟的應(yīng)用,已經(jīng)讓許多人驚嘆不已。但劉飛表示,“人工智能會推動行業(yè)變革和發(fā)展的現(xiàn)象,現(xiàn)在只是露了冰山一角。以前沒有人工智能的時候,一些互聯(lián)網(wǎng)金融業(yè)務(wù)無法開展,現(xiàn)在有了這個技術(shù)之后就可以在安全、可控、有保證的情況下開展起來了,這可能就會改變原來延續(xù)了幾十年的行業(yè)?!?/p>
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。