0
本文作者: 溫曉樺 | 2016-12-13 15:59 |
在昨日由前海聯(lián)控、創(chuàng)大資本、前海夢(mèng)工場(chǎng)聯(lián)合舉辦的前海國(guó)際科技創(chuàng)新峰會(huì)期間,全球個(gè)人信用風(fēng)險(xiǎn)評(píng)估體系的締造者,全球領(lǐng)先的預(yù)測(cè)分析和決策管理公司FICO的早期創(chuàng)始成員,前花旗銀行、匯豐銀行、陸金所等國(guó)際級(jí)金融機(jī)構(gòu)首席風(fēng)控官William Yao(姚志平)博士分享了“人工智能、金融科技在美國(guó)銀行的最佳實(shí)踐”。
姚博士表示,美國(guó)的銀行利用機(jī)器學(xué)習(xí)等人工智能技術(shù)用得很深,用人工做決策的已經(jīng)比較少,但是,國(guó)內(nèi)卻停留在“talk-the-talk”層面,應(yīng)用實(shí)踐更多是浮于表面,并直接指出國(guó)內(nèi)很多金融機(jī)構(gòu)的“大數(shù)據(jù)”并非大數(shù)據(jù)。
以下是姚博士的演講,雷鋒網(wǎng)作了不改變?cè)獾木庉嫞?/p>
今天我想跟大家分享一下,美國(guó)的銀行是如何用大數(shù)據(jù)和人工智能來(lái)產(chǎn)生實(shí)效的。美國(guó)的銀行在用大數(shù)據(jù)和人工智能方面,真的是用得很廣泛。他們用人工做決策的比較少,而且他做得很深。比如說(shuō)花旗銀行,這銀行請(qǐng)了個(gè)很有名的物理學(xué)家——混沌理論的創(chuàng)始人,負(fù)責(zé)做模型。這個(gè)物理學(xué)家希望用他的理論來(lái)創(chuàng)造銀行的價(jià)值和增加預(yù)測(cè)的精準(zhǔn)度。
此外,銀行還請(qǐng)過(guò)專門(mén)預(yù)測(cè)地震的地震學(xué)家,用地震的方法來(lái)預(yù)測(cè)一個(gè)人會(huì)好或是壞。還有用數(shù)學(xué)家、計(jì)算機(jī)學(xué)家等,把世界各個(gè)行業(yè)的精英召集起來(lái)做預(yù)測(cè)。
大家注意,這樣的機(jī)構(gòu)不是科學(xué)院,而是個(gè)銀行?。∧敲矗P(guān)于大數(shù)據(jù),我今天講兩個(gè)(案例),一個(gè)反面,一個(gè)正面。
大數(shù)據(jù)是一個(gè)很俗的詞,哪里都可以聽(tīng)到大數(shù)據(jù),但是很多人講的卻不是大數(shù)據(jù)。比如某個(gè)銀行,花了幾千萬(wàn)人民幣,每天在找?guī)讉€(gè)億的數(shù)據(jù)。這就是大數(shù)據(jù)?扒完后,他說(shuō)看到上午某個(gè)人9點(diǎn)半在星巴克喝了咖啡,下面又去干嘛干嘛了,覺(jué)得厲害。其實(shí)這不是大數(shù)據(jù),因?yàn)榇髷?shù)據(jù)不是找一個(gè)人,而是找一群人。這是一個(gè)例子。
此外,還有專門(mén)研究電信大數(shù)據(jù)的人。他們認(rèn)為,發(fā)現(xiàn)如果有人打電話進(jìn)來(lái),結(jié)果打完后時(shí)間很長(zhǎng)的,這個(gè)人肯定打電話的是老板。他覺(jué)得這就是大數(shù)據(jù)。
對(duì)于怎么考察大數(shù)據(jù)的效用,美國(guó)的老板是這么做的——他會(huì)問(wèn):
第一,“你說(shuō)的這個(gè)事(這種特性)到底有多少人?”
第二,你找到了做這個(gè)事和不做這個(gè)事的人的分辨率和預(yù)測(cè)率是多少?
做領(lǐng)導(dǎo)的要問(wèn)這些問(wèn)題。
如果是20人左右不是大數(shù)據(jù);如果說(shuō)100萬(wàn)人有這個(gè)行為,就是大數(shù)據(jù)了。
關(guān)于第二個(gè)問(wèn)題,我舉個(gè)例子,銀行說(shuō)找到了足夠的人來(lái)做這個(gè)事,不能找到幾個(gè)人。但除此之外,如果只找到他們?nèi)ズ瓤Х?,也是沒(méi)用的。這不是大數(shù)據(jù)。
統(tǒng)計(jì)上要跟別人從本質(zhì)上不一樣,必須滿足了這兩個(gè)條件才是有價(jià)值的大數(shù)據(jù)分析。
所以,應(yīng)該關(guān)心的是——找到了多少人,做這個(gè)事和不做這個(gè)事的區(qū)別有多大?一定要這樣做,才會(huì)往前走。
方法太淺,數(shù)據(jù)價(jià)值發(fā)揮不出
20年前的信用卡積累到,肯定是大數(shù)據(jù)了,特別是信用卡的交易數(shù)據(jù)。比如,中國(guó)的銀行有1000萬(wàn)的信用卡,這個(gè)數(shù)字很龐大。假如銀行1000萬(wàn)的信用卡,一個(gè)人做10條交易,一年就是12億的數(shù)據(jù)了。這個(gè)數(shù)據(jù)量也很巨大。
那么,金融的交易數(shù)據(jù)為何有用呢?今天的銀行很多做預(yù)測(cè)模型,都是總結(jié)好的數(shù)據(jù)來(lái)做預(yù)測(cè),用1萬(wàn)元來(lái)做預(yù)測(cè),預(yù)測(cè)出賭博、買酒,去飯店吃飯、買書(shū)等行為。信用卡交易可以做這些方面的預(yù)測(cè)。
當(dāng)然了,光是這個(gè)也不叫大數(shù)據(jù),因?yàn)樘珳\了。所以美國(guó)在幾十年前做這個(gè)東西就有套理論——他們認(rèn)為,銀行的任務(wù)是了解客戶的狀態(tài)空間,所以要知道客戶的創(chuàng)造空間。
但是,實(shí)際上任何一個(gè)國(guó)家,不可能了解每個(gè)人的所有狀態(tài)面,這是做不到的,也很難做到。于是有個(gè)人創(chuàng)造了這么個(gè)理論——這個(gè)理論是指,我應(yīng)該是了解這個(gè)人的創(chuàng)造空間,知道他的XYZ,但跟真實(shí)的狀態(tài)空間并不關(guān)聯(lián)。這個(gè)理論有套東西可以證明——只要變量觀察得足夠長(zhǎng),就是XI+和XI+,就可以跟真的需要找的人的狀態(tài)空間有點(diǎn)重合。
我們講大數(shù)據(jù)啊,如果你光是用來(lái)做這些,這不是大數(shù)據(jù),因?yàn)樘?jiǎn)單了。但是知道這個(gè)的人就已不多了,相信在坐也沒(méi)多少人知道這個(gè)理論,比如用一個(gè)變量的離散空間,構(gòu)造出來(lái)的空間。反正按照目前的樣子,老板聽(tīng)起來(lái),就覺(jué)得這個(gè)東西是值錢(qián)的。
美國(guó)怎么做呢?他們是拿了千萬(wàn)人的信用卡數(shù)據(jù),比如我們?cè)?jīng)試了3000多的變量,就找到了250個(gè)變量。我們分析這250個(gè)變量,“做這個(gè)事”和“不做這個(gè)事”有足夠的預(yù)測(cè)率,最后變成的模型。
所以,技術(shù)的核心是:
如何對(duì)這些變量進(jìn)行構(gòu)造?
人工智能,美國(guó)銀行用得比較狹義,就是機(jī)器學(xué)習(xí),用計(jì)算機(jī)來(lái)學(xué)習(xí)一樣?xùn)|西,讓機(jī)器幫我們做更好的決策。
40年前,美國(guó)的MIT管理學(xué)院做了研究:盡管智商很高的人,其大腦就是擅長(zhǎng)于做單因子的分析。100萬(wàn)人在我們面前,要識(shí)別出好的還是壞的,人很擅長(zhǎng)做這樣的分析——學(xué)歷好和學(xué)歷低的風(fēng)險(xiǎn)、有房子和沒(méi)房子的人的風(fēng)險(xiǎn)(當(dāng)然了,現(xiàn)在我們的房?jī)r(jià)高)、收入高和收入低的風(fēng)險(xiǎn)、女生和男生、年齡大和年齡小的風(fēng)險(xiǎn)的對(duì)比……這些都是人的單因子的分析。
但是如果我給你個(gè)問(wèn)題,站在你面前是100人,都是男生,都是收入10萬(wàn)元一年,都是一套房子,三張信用卡……什么情況都一樣,這幾個(gè)變量都有了,如何誰(shuí)在將來(lái)12個(gè)月中的壞帳比例?想象一下,在坐的各位任何人都無(wú)法回答這個(gè)問(wèn)題,讓愛(ài)因斯坦來(lái)回答也回答不了。
人的大腦擅長(zhǎng)做單因子的分析,不擅長(zhǎng)于做綜合因子的判斷,而擅長(zhǎng)在幾十個(gè)、幾百個(gè)概念中做綜合判斷的,是計(jì)算機(jī)——只要給它數(shù)據(jù),它都可以幫你計(jì)算出來(lái)。這是人工智能值得我們學(xué)習(xí)的地方。他們沒(méi)有感情偏差,能夠通過(guò)大量數(shù)據(jù)和權(quán)重計(jì)算出評(píng)分。
美國(guó)幾乎各大銀行都在用機(jī)器學(xué)習(xí)做決策,這是機(jī)器學(xué)習(xí)一個(gè)很好的方面。各位如果有足夠的數(shù)據(jù)、大數(shù)據(jù),去造一些預(yù)測(cè)模型,你做的決策會(huì)比人類做的決策精準(zhǔn)度要高很多,結(jié)果要好。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。