0
金融科技這一行,存在兩種「?jìng)蜛I產(chǎn)品」。
一種是溫室花朵,產(chǎn)品性能在實(shí)驗(yàn)室和小數(shù)據(jù)場(chǎng)景中表現(xiàn)優(yōu)越,然而一旦放在槍彈雨林的復(fù)雜業(yè)務(wù)環(huán)境中,系統(tǒng)立馬崩潰。好比碰到歐美球隊(duì)的中國(guó)男籃。
二是畫蛇添足式產(chǎn)品,很多IT問題,明明可以用簡(jiǎn)單、傳統(tǒng)的技術(shù)方法就能解決,但企業(yè)非得讓客戶使用更貴、更復(fù)雜的產(chǎn)品。猶如高射炮打蚊子。
金融行業(yè)到底需要什么樣的人工智能?
為此,雷鋒網(wǎng)《AI金融評(píng)論》策劃了「AI能否解決金融剛需問題」系列選題,借同一個(gè)話題,對(duì)不同背景的受訪者、產(chǎn)品和客群各異的企業(yè)們進(jìn)行采訪,期望在不同的商業(yè)和技術(shù)認(rèn)知下捕捉觀點(diǎn)碰撞的火花。
本系列選題的第一篇文章,由冰鑒科技CEO顧凌云講述他眼中AI和金融之間的關(guān)系。
以下為顧凌云的所感所想:
聞到血腥味兒的“鯊魚”
90年代末,我在CMU計(jì)算機(jī)學(xué)院攻讀博士,當(dāng)時(shí)選擇了AI作為研究方向。
其實(shí)在21世紀(jì)的第一個(gè)十年里,人工智能從商用角度來講,始終是陽春白雪,難以落地。
直到深度學(xué)習(xí)爆發(fā)后,我才意識(shí)到,AI的時(shí)代要來了。
于是在2015年,我創(chuàng)辦了AI金融風(fēng)控公司——冰鑒科技。
「冰鑒」擁有上百家客戶,其中也包括工商銀行總行、中國(guó)銀行總行等大客戶,投標(biāo)經(jīng)歷,不可謂不豐富。
當(dāng)年有一家國(guó)有行,在網(wǎng)上公開招標(biāo),這一賽道里的金融科技公司,聽到這條消息后,都像嗅到了血腥味的鯊魚一樣。
那次POC極其慘烈,一共來了29條“鯊魚”。
這29家公司中不僅有做人工智能算法的、有做IT系統(tǒng)的,甚至,連咨詢公司都來湊份熱鬧。
這么多公司只選出5家進(jìn)入第二輪競(jìng)爭(zhēng),而「冰鑒」是這5家公司當(dāng)中「技術(shù)標(biāo)」第一名。
當(dāng)然,這并不意味著我們最終贏得勝利,后面還有競(jìng)爭(zhēng)更為激烈的「商務(wù)標(biāo)」。
商場(chǎng)如戰(zhàn)場(chǎng),這5家公司中,有一家在圈內(nèi)比較知名的公司砸了一個(gè)極低的價(jià)格。
但幸運(yùn)的是,這家大型銀行的商務(wù)標(biāo)的百分比調(diào)的沒有那么高,技術(shù)標(biāo)的百分比也調(diào)的沒那么低。
最后,我們爭(zhēng)得了技術(shù)標(biāo)和綜合標(biāo)的第一名,成功拿到了這一單。
這是我印象最深刻的一次POC經(jīng)歷。
當(dāng)然,POC測(cè)試也好、投標(biāo)經(jīng)歷也罷,要想成功競(jìng)標(biāo),擁有一支技術(shù)鐵軍,永遠(yuǎn)是第一位。
管理一支卓越的技術(shù)隊(duì)伍,最基本的原則就是,領(lǐng)導(dǎo)者能夠清晰地定義問題,清楚地知道每一種AI方法的能力和邊界。
我之前聽一些專家談到這么一個(gè)觀點(diǎn),如果能用上個(gè)世紀(jì)的傳統(tǒng)方法很好地解決問題,那就別輕易用最新的算法。
其實(shí)在金融風(fēng)控領(lǐng)域也同樣如此,很多業(yè)務(wù)根本用不到先進(jìn)的機(jī)器學(xué)習(xí)模型,一個(gè)簡(jiǎn)單的決策樹或邏輯回歸就能完成。
但很多AI公司犯了一個(gè)比較致命的錯(cuò)誤,認(rèn)為凡事都該用前沿和復(fù)雜的方法。最后把AI這個(gè)實(shí)用的工具,弄成了炫技的道具。
這非??杀?。
AI不是一個(gè)筐,任何東西都可以往里裝。
從CMU讀書到創(chuàng)辦冰鑒科技,雖然一直都在和AI打交道,但我不認(rèn)為AI就是放之四海而皆準(zhǔn)的真理、不認(rèn)為在任何場(chǎng)景下AI都可以應(yīng)用地比現(xiàn)有的技術(shù)都要好。
張口閉口談AI,卻對(duì)以往的信貸風(fēng)控方法嗤之以鼻,那它基本不是一家AI公司。
AI不是「排他型」的技術(shù),不會(huì)一路走來像坦克碾壓一樣,把歷史上所有的算法或方法都扔進(jìn)垃圾桶。
在我們做數(shù)據(jù)處理時(shí),數(shù)據(jù)的來源越是繁雜、越是難以用人工分析,AI所發(fā)揮的功能越強(qiáng)。
當(dāng)每一個(gè)物理變量都非常清晰,我們?yōu)槭裁催€一定要用AI畫蛇添足?
但是,這并不意味著企業(yè)要減少科學(xué)家團(tuán)隊(duì)的招募力度。
根據(jù)我多年經(jīng)驗(yàn)來看,搭建一個(gè)特別昂貴的機(jī)器學(xué)習(xí)團(tuán)隊(duì),非常必要。
冰鑒85%以上的員工是技術(shù)人員,很多來自CMU、MIT、斯坦福等高校,他們無論是工程師還是產(chǎn)品經(jīng)理,擼起袖子就可寫代碼、整整領(lǐng)子便能談商務(wù)。
一家科技公司靠一個(gè)算法或者一個(gè)特別復(fù)雜的機(jī)器學(xué)習(xí)模型,就想長(zhǎng)期領(lǐng)跑行業(yè),幾乎不可能。
科技在不斷變遷,研究的方向也在不斷改變,一家公司能在某一技術(shù)領(lǐng)域領(lǐng)先其他對(duì)手6~9個(gè)月,就已經(jīng)非常了不起。
我認(rèn)為,能夠保證我們?cè)谧钚碌念I(lǐng)域中始終保持自己獨(dú)到的見解,甚至再進(jìn)一步,引領(lǐng)行業(yè)新的研究方向,才是我們打造昂貴機(jī)器學(xué)習(xí)團(tuán)隊(duì)的最終目的。
“雞肋”的人工智能
目前人工智能在金融行業(yè)中有著非常多的應(yīng)用,企業(yè)也不斷在拿錘子找釘子。
但很多時(shí)候,AI在一些看似熱門的應(yīng)用領(lǐng)域,其實(shí)際效果并不理想。
在計(jì)算機(jī)視覺當(dāng)中,有個(gè)非常傳統(tǒng)的研究領(lǐng)域叫OCR,說白了就是識(shí)別圖片上的文字,然后提取出來,變成可編輯的文檔。
這些數(shù)據(jù)電子化后,我們做模型就會(huì)非常方便。
聽起來很簡(jiǎn)單,但實(shí)際操作卻非常困難。
如果OCR掃描的是高考試卷,哪里放照片、哪里寫姓名、哪里填數(shù)字,每一張?jiān)嚲淼母袷蕉家粯?,那么OCR可以很快捷的識(shí)別。
但是如果每一張紙的內(nèi)容不同,就很難處理了。
每一次上法庭前,律師都需要準(zhǔn)備大量的材料。每份材料都有相對(duì)應(yīng)的觀點(diǎn),需要一一分類。
這些事,全靠法律實(shí)習(xí)生或者實(shí)習(xí)律師,通過查閱浩如煙海的文獻(xiàn)資料,歸納總結(jié)出來。
律師事務(wù)所就在想,這些法律材料比如公司的營(yíng)業(yè)執(zhí)照、組織機(jī)構(gòu)代碼、財(cái)務(wù)文件、合同等等都是打印出來的圖片。
能否通過OCR將這些圖片掃描,然后通過自然語言處理,找出相關(guān)內(nèi)容,放到律師的觀點(diǎn)下。這樣律師上庭的時(shí)候, 不用自動(dòng)歸納總結(jié),用AI技術(shù)就可以輕松搜證。
這是一個(gè)聽起來,目前技術(shù)可以解決的問題。但是真正操作起來,即使用最好的NLP技術(shù),50%的正確率也達(dá)不到。換言之,和扔硬幣沒區(qū)別,我扔硬幣的準(zhǔn)確率還50%。
法務(wù)這樣的一個(gè)場(chǎng)景,很多公司都在做,都希望賺錢,但實(shí)際上AI的實(shí)際應(yīng)用效果一點(diǎn)都不好,而且價(jià)格高昂。
你可以去任意一家律師事務(wù)所詢問,有沒有人采購(gòu)這種可以輕松分析大量法律文件,歸納總結(jié)并拿去上庭的AI產(chǎn)品。一定不會(huì)有答案。
AI沒能幫助律師事務(wù)所處理這個(gè)問題,實(shí)際上是因?yàn)榈讓拥募夹g(shù)本身還不夠強(qiáng)勁,從理論到實(shí)踐還有很長(zhǎng)的路要走。
想要解決這個(gè)問題,AI企業(yè)第一要做的是將基礎(chǔ)算法再往前推進(jìn)一步,第二點(diǎn)是在數(shù)據(jù)采集的過程中,保證采集的數(shù)據(jù)更加清晰、干凈。
此外,在非常火熱的智能營(yíng)銷領(lǐng)域,由于用戶有多元化的需求,然而市場(chǎng)上的產(chǎn)品較少,導(dǎo)致推薦效果并不理想。
我們的方法則是用很多跟AI相關(guān)的算法,對(duì)流量進(jìn)行分層。一家公司不管好壞,只要購(gòu)買了流量,我們就能根據(jù)非常有限的信息,對(duì)每一個(gè)客戶進(jìn)行一次用戶畫像。
畫像后,進(jìn)行分層,分層后,對(duì)不同的人群和不同的流量,進(jìn)行最優(yōu)化,然后匹配。
讓AI成為“雞腿”
食之無味、棄之可惜,如何讓AI這只“雞肋”變成“雞腿”,一直是金融和科技公司在思考的問題。
銀行需要一些客觀的標(biāo)準(zhǔn)來鑒別哪家金融科技公司AI實(shí)力更強(qiáng),隨著合作的愈發(fā)緊密,甲乙兩方也逐漸摸索出一套比較通用的技術(shù)指標(biāo)。
其中第一個(gè)標(biāo)準(zhǔn)叫「KS值」,KS是俄羅斯兩位科學(xué)家的名字,因?yàn)閮蓚€(gè)人的名字太長(zhǎng),世界上沒幾個(gè)人能記得,所以把他們名字的第一個(gè)字母提取出來。這是一個(gè)用來衡量AI模型好壞非常通用的指標(biāo)。
另外一個(gè)指標(biāo)叫「AUC」(Area Under Curve),就是在一條曲線下的面積到底有多大,在這個(gè)曲線下的面積越大,說明這個(gè)模型效果越好,反之模型效果越差。
還有一個(gè)指標(biāo)叫「F-score」,當(dāng)準(zhǔn)確率變得越來越高的時(shí)候,效果也會(huì)越來越好,可以把更多的壞人擋在門外。
剛才講了三個(gè)指標(biāo),但是如果你的模型覆蓋率太低,那也沒用。
假如某個(gè)模型的目標(biāo)是覆蓋1000萬人,即便你測(cè)試了1000人,達(dá)到了測(cè)試標(biāo)準(zhǔn),但是這并不代表你的AI產(chǎn)品一定就是好的。
此外,AI模型也是有時(shí)效性的,隨著時(shí)間的變化,它的性能是否會(huì)大幅下降?AI模型在更新的過程中,是否需要大量時(shí)間和金錢?AI模型和銀行的核心系統(tǒng)在對(duì)接的過程當(dāng)中是否簡(jiǎn)易?AI模型本身是否做的很標(biāo)準(zhǔn)化?
這些都是在技術(shù)指標(biāo)之外,銀行使用AI產(chǎn)品時(shí),必須要考量的標(biāo)準(zhǔn)。
金融業(yè)務(wù)十分復(fù)雜,每項(xiàng)業(yè)務(wù)所需要的AI能力也不盡相同。
我們知道,人工智能的三大技術(shù)分支:計(jì)算機(jī)視覺、語音語義、機(jī)器學(xué)習(xí),對(duì)實(shí)際業(yè)務(wù)的改善效果也各有千秋。
計(jì)算機(jī)視覺在人臉識(shí)別、生物特征識(shí)別上應(yīng)用的更多,具體到金融業(yè)務(wù)中,在支付方式上應(yīng)用的就很廣泛,現(xiàn)在很多人去商店購(gòu)物都是刷臉支付;當(dāng)你去銀行或者證券公司開戶,也普遍使用這樣的技術(shù)。
當(dāng)一家企業(yè)開完戶后,你如果要申請(qǐng)貸款或者理財(cái)時(shí),語音語義(自然語言處理)所具備的輿情分析能力就變得很重要。
計(jì)算機(jī)視覺、自然語言處理一般是應(yīng)用在貸款過程中。
貸款后,金融機(jī)構(gòu)需要判斷個(gè)人或者企業(yè)發(fā)展穩(wěn)不穩(wěn)定,是否能還錢。而機(jī)器學(xué)習(xí)算法本身就可以幫助金融機(jī)構(gòu)決定誰先還款、如何還款。
在貸后管理環(huán)節(jié),還可以應(yīng)用語音識(shí)別技術(shù)。利用人工智能客服,可以大大減少人力成本、提高效率。此外,教育客戶什么是AI、怎么用AI也是非常重要的一點(diǎn)。
我們的方式是聯(lián)合建模,手把手地和客戶共同完成一個(gè)項(xiàng)目。
聯(lián)合建模比咨詢更進(jìn)一步,大家肩并肩坐在一起,我告訴你我是怎么一步一步把這個(gè)模型建出來的,你跟著我用你的數(shù)據(jù)重復(fù)一遍,這種方法是教育不太懂AI的客戶最好的方法。
當(dāng)然,銀行在評(píng)估金融科技公司的產(chǎn)品時(shí),也會(huì)有自己自有的一套指標(biāo)或者方法。
比如說某些消費(fèi)金融機(jī)構(gòu),會(huì)執(zhí)行一套客觀的指標(biāo)。以24小時(shí)、7天或者30天為一個(gè)期限,他們會(huì)時(shí)時(shí)刻刻監(jiān)控模型的效果,一旦模型的效果超出規(guī)定范圍,馬上就會(huì)根據(jù)期限調(diào)整產(chǎn)品。
即使你本身的模型效果很穩(wěn)定,他也會(huì)每3個(gè)月做一次測(cè)評(píng),每6個(gè)月做一次測(cè)評(píng),每一年對(duì)供應(yīng)商進(jìn)行一次重新的測(cè)評(píng)和調(diào)換。
通過這種方法來保證他們使用的產(chǎn)品,一直由最佳技術(shù)實(shí)力的公司提供。
我的一些思考
從業(yè)這么多年,我不斷地在加深一個(gè)認(rèn)識(shí):科技和監(jiān)管之間的關(guān)系到底是什么?
很多人認(rèn)為這兩者之間是一對(duì)冤家,監(jiān)管越嚴(yán),科技公司發(fā)展得越困難。我覺得不是。
監(jiān)管本身跟誰都沒有仇,監(jiān)管是為了能夠讓金融和科技在合法、合規(guī)的框架中更好的發(fā)展。
監(jiān)管,實(shí)際上監(jiān)管的都是金融機(jī)構(gòu),當(dāng)然金融公司受到了影響,科技公司也會(huì)受到影響,但這并不意味著監(jiān)管直接對(duì)科技產(chǎn)生了影響。
大多時(shí)候,監(jiān)管限制了金融機(jī)構(gòu)的發(fā)展,卻促進(jìn)了金融科技公司的長(zhǎng)遠(yuǎn)進(jìn)步。
沒有監(jiān)管,科技本身將裹足不前。
因?yàn)闆]有監(jiān)管,銀行和金融機(jī)構(gòu)賺錢太容易,從而不會(huì)在技術(shù)上有大規(guī)模的投入。
但是,一旦有了監(jiān)管,金融機(jī)構(gòu)就戴了鎖鏈,還想賺錢就必須提高自己的競(jìng)爭(zhēng)力,而提高自己競(jìng)爭(zhēng)力最好的方法是擁抱科技公司,所以最終監(jiān)管暫時(shí)抑制了金融公司的發(fā)展,促進(jìn)了科技公司的發(fā)展, 最終促進(jìn)了兩者的共同發(fā)展。
監(jiān)管的本質(zhì)是良幣去驅(qū)逐劣幣,監(jiān)管打擊的是劣幣,促進(jìn)了真正的科技公司的發(fā)展。
科技公司一般都比較前衛(wèi),研究的東西也比較新穎。
人們于是認(rèn)為科技公司開著一輛法拉利跑車,嗡地一聲就開出去很遠(yuǎn),監(jiān)管可能還騎著一輛二八大杠的自行車,在后面追也追不上。實(shí)際上不會(huì)這樣。
因?yàn)椤副O(jiān)管」在整個(gè)道路上面設(shè)計(jì)了網(wǎng)格化。網(wǎng)格化就是紅綠燈、限速、停車等標(biāo)志,跑得再快的法拉利,到了路口,也要停下來。
紅綠燈的時(shí)間由「監(jiān)管」來調(diào)控,如果監(jiān)管覺得科技可以跑得更快,就讓綠燈亮的時(shí)間更長(zhǎng);如果覺得科技已經(jīng)跑得太快了,有超速的傾向,監(jiān)管可以將紅燈的時(shí)間調(diào)得更長(zhǎng)。
最后,我也想對(duì)金融科技的創(chuàng)業(yè)者和優(yōu)秀技術(shù)人才說幾句話。
如果你是悲觀主義者,那就別再往AI金融行業(yè)里跳了,它早已不是藍(lán)海,而是一片看不到頭的紅海,你還往里跳什么,即便你穿著救生衣,帶著游泳圈跳進(jìn)來,不淹死你,也能擠死你。
如果你是樂觀派,你們趕緊來吧,AI金融和其他所有行業(yè)比起來,屬于近水樓臺(tái)先得月,是離國(guó)民經(jīng)濟(jì)最核心的地方。
在這樣的行業(yè)中,對(duì)于科技的渴求是最強(qiáng)烈的,是最容易做出一番事業(yè)、最容易發(fā)揮我們技術(shù)人才聰明頭腦的。(雷鋒網(wǎng))雷鋒網(wǎng)
封面圖來源:電影《萬物理論》
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。