0
本文作者: 王金許 | 2017-11-06 17:34 |
雷鋒網(wǎng)按:11 月 6 日,京東舉行 JDD 京東金融全球數(shù)據(jù)探索者大會,在全球范圍內(nèi)尋求志同道合的伙伴共同探索大數(shù)據(jù)和人工智能在金融領(lǐng)域的最佳實踐 。其中,國際人工智能聯(lián)合會理事會主席、香港科技大學計算機科學及工程學系主任楊強作了演講,從學界角度探討了人工智能技術(shù)的商業(yè)化,以及人工智能在金融領(lǐng)域的應用場景。
楊強認為,算法應用到實際場景中需要滿足三個方面的要求。第一,算法的閉環(huán)路徑要短。第二,反饋一定要是足夠高頻、高通量的反饋。第三,反饋效果一定要起到一個復合作用。
其次,他表示,技術(shù)風口主要有基于圖像的學習和理解、自然語言理解、智能推薦、遷移學習四個方面。
而在技術(shù)革新和商業(yè)應用的結(jié)合點,他特別指出金融行業(yè)是擁抱智能時代的領(lǐng)跑者。在金融里面有各種各樣的應用場景,比如和用戶溝通的場景、金融安全、活體識別、人臉識別、聲音識別、行為識別等等。另外運營、投顧方面都可以借助于人工智能大量加強提高效益。
今年的 JDD 賽事中也緊貼金融行業(yè)的應用場景,主要包括登陸的行為識別,信貸需求預測以及店鋪銷量預測,豬臉識別。
以下為楊強演講內(nèi)容實錄,雷鋒網(wǎng)在不改變原意的基礎(chǔ)上進行了編輯。
剛才我們聽到了幾位從不同方面給我們解讀了人工智能、金融、大數(shù)據(jù)方面的前景,我要講的是從另一個方面來看這個問題。
我是一個做學術(shù)的,同時我對商業(yè)也有著濃厚的興趣,所以我想從從學術(shù)的角度來探討一下商業(yè)的問題,我們會得到哪些新的發(fā)現(xiàn)?
人工智能成功的商業(yè)模式
首先來看一下 AlphaGo 的成功能夠引起了很大振動,我們從中能學到什么,對商業(yè)方向有哪些指導。
AlphaGo 本身是幾種算法的結(jié)合,包括深度學習、強化學習,算法和環(huán)境有一個有機連接,那么環(huán)境不斷給算法提供反饋。深度學習既能告訴你當前狀態(tài),又能為未來行為提供一個指導。
這樣一個算法是不是可以應用到實際當中去呢?
第一,閉環(huán)路徑要短。商業(yè)路徑也好、算法路徑也好,它的中間最好不要有過多環(huán)節(jié),比方說從用戶到得到反饋,到反饋到AI的算法得到補充,最后再返回到應用,這個閉環(huán)要足夠短。
第二,反饋一定要是足夠高頻、高通量的反饋,不斷得到反饋,系統(tǒng)得到刺激,這樣智能才能夠成長。
第三,也是大家過去比較忽略的,反饋效果一定要起到一個復合作用。我們在經(jīng)濟上經(jīng)常講復合收益,在人工智能上這一點也是非常重要的。也就是說,這一輪的反饋對系統(tǒng)增益要持續(xù)進行,就會有一個指數(shù)型收益上升。
我們再看看周邊實際遇到的問題,是不是有很多類似場景滿足這樣的需求呢?
我們回顧一下人工智能的里程碑。1997 年,我們有深藍,然后 2011 年的時候我們有 IBM Watson,最近我們又有了 AlphaGo,無人車,包括最近有了德州撲克,這些都是我們引以為豪的人工智能。
在這些里程碑的成功背后是不是路徑閉環(huán)足夠短,反饋足夠頻繁?另外,復合作用是非常明顯的,系統(tǒng)在不斷改進自己,智能在提升。
再看一下周邊工作,我就有一個想法:人工智能在現(xiàn)階段的應用并不是在所有領(lǐng)域都會取得成功,我們一定要非常仔細挑選在哪些領(lǐng)域人工智能比較容易得到成功,在哪些領(lǐng)域還要等一等。
所以,下面就來看一下技術(shù)和商業(yè)這兩方面到底哪些是我們現(xiàn)在可以得到效益的風口。
首先是技術(shù)風口。人類的知識獲得 70% 以上都是通過視覺的,深度學習的發(fā)展肯定對人工智能應用、對人工智能技術(shù)而言一定是持續(xù)發(fā)展的。比如,用更好的深度學習、可解釋的深度學習,包括理解物體之間的關(guān)系,以及通過一個視頻可以理解里面的一些人類能理解的摘要,把它給取出來,為人類和計算機的模型進行溝通。
自然語言緊隨其后。包括文本閱讀、理解、產(chǎn)生、問答、分析等等,現(xiàn)在深度學習都帶來了非常大的提高。但是,這個提高還是要隨著算法的提升有待進一步提高,從而在在使用當中能夠產(chǎn)生更大的效益。
另一個是智能推薦。在電商的網(wǎng)上購物等等都有,但推薦的一個重大問題是我們很容易陷入一個所謂的深坑,也就是在機器學習技術(shù)上所說的過擬合:當我們點擊了一個在手機上的新聞,我們會得到好多類似的新聞,而不會顧及我們對其他(新聞)的興趣。
怎么樣解決這些問題呢?這就是技術(shù)革新所期待的,我們也在不斷做新的研究。
還有一個就是我個人研究的遷移學習。人類很自然就會使用遷移學習,比方說我們在一個領(lǐng)域很專業(yè),怎么把這個知識遷移到另一個領(lǐng)域,能不能讓計算機也有這個能力?有很多專家認為這就是人工智能機器學習的下一個熱點。
遷移學習也會帶來很多技術(shù)革新。比如我們可以在一些小數(shù)據(jù)上面應用大數(shù)據(jù)得到的結(jié)果,在一個領(lǐng)域得到一個非常好的模型,可以把它遷移到周邊一些小數(shù)據(jù)模型,這個也是人類學習的一個有效模式。
遷移學習也可以使得模型的可靠性得到加強。一個模型產(chǎn)生了,我們可以讓它在不同場合都適用,這個模型就更加可靠。
再有越來越多的個性化需求,在場景當中經(jīng)常聽到這樣的名詞,千人千面,這樣一個場景可以用遷移學習實現(xiàn)。比如如果在云端得到一個通用的模型,可以把它適配到各個終端,使它在不同的終端就有不同模型體現(xiàn),這樣就實現(xiàn)一個個性化。
它帶來的另外一個好處就是遷移學習可以解決隱私問題,每一個終端用戶都不必把他的個性化數(shù)據(jù)上傳到云端就可以得到它的結(jié)果。
遷移學習不一定是一步到位,從一個模型遷移到一個場景,我們可以通過一系列場景把一個模型遷移到不同的更廣泛范圍,比方說一個手段就是用深度學習來做遷移學習,這也是我最近一個研究方向。
一個實際應用是最近斯坦福大學和聯(lián)合國共同做了一個應用,利用衛(wèi)星圖片分析非洲大陸不同地區(qū)的貧困程度。利用這種所謂傳遞式遷移學習,就大量節(jié)省了人力。過去是要派一些觀察員到本地去做各種積累、各種調(diào)查,現(xiàn)在就用衛(wèi)星圖片把白天和晚上的地球圖象加以比對,最后訓練出一個模型,大大節(jié)省了人力。
這里我們看到這些技術(shù)可能的革新,這些技術(shù)革新和商業(yè)應用方向有哪些是最契合的?這里我要特別提金融方向。我們之前提過,一個是閉環(huán)的路徑要短,一個是溝通要高頻,最后要有復合效應產(chǎn)生,很快讓模型能夠變得壯大。
人工智能在金融中的應用
金融就是這樣一個領(lǐng)域。我不用多說大家也明白,在金融里面有各種各樣的場景,和用戶溝通的場景、金融安全、活體識別、人臉識別、聲音識別、行為識別等等。在后端,可以對用戶整個風險進行分析,是不是應該借貸。做一筆投資,在這筆投資之前要進行風險分析,現(xiàn)在基于大數(shù)據(jù)和人工智能可以自動產(chǎn)生這樣的分析,像個人和企業(yè)征信。
另外運營、投顧方面都可以借助于人工智能大量加強提高效益。經(jīng)濟本身就是一個不斷提高效益的過程?,F(xiàn)在人工智能又為經(jīng)濟效益的提升提供了一個強大動力。剛剛講的風險管理這里面又分監(jiān)控、識別、評估和干預,每一個方面都可以有大量的人工智能參與。
一個很有趣的例子是從京東金融本身實踐得來的,就是人工智能可以幫助養(yǎng)雞,是一個非常有趣的應用。
過去一個養(yǎng)殖戶用 12 塊錢養(yǎng)一只雞,需要提前貸款,貸一筆很大的款放在那兒,這個時候就產(chǎn)生了很大利息支出,這對養(yǎng)雞戶是一筆很大的費用。但是在雞成長過程中,小雞不需要吃那么多飼料,只有長大的時候才吃。不同的雞對不同飼料需求也不一樣。
當我們能夠掌握這個過程的時候,我們就可以把放貸變得因地制宜,在一開始養(yǎng)雞戶不需要借這么多錢,過去逐次增加。所以如果我們能夠做到按日計息就可以做到這一點,就能夠大大提升效率。現(xiàn)在京東金融可以做到 6 分錢就養(yǎng)一只雞,用人工智能算法來做分析。
同時,我剛剛提到推薦系統(tǒng),大規(guī)模機器學習系統(tǒng)當前共有的一個問題是過擬合,這是為什么呢?這是因為在技術(shù)上,它沒有照顧到兩個需求,一個是準確性需求,一個是多樣性需求。
現(xiàn)在我們在研一個強化學習模型,能夠把兩個需求全部照顧到,這個名詞叫遷移的匪徒模型。用這個模型既照顧到準確率,又照顧到多樣性,就把過擬合的問題徹底解決。
最后,我要說一下 JDD 背后是一個大賽,同時在中美兩邊進行。在學術(shù)界大家都聽說過KDD即數(shù)據(jù)挖掘和知識發(fā)現(xiàn),這樣的大會已經(jīng)有 20 多年的歷史,而且每一年都有一個大賽,就是由工業(yè)界出題,也變成了我們發(fā)現(xiàn)一些優(yōu)秀團隊的一個方式。
今年的 JDD 也采用了這樣一個在金融方面的機會。今年的機會來自三個方面,都是緊貼著金融應用。
一是登陸的行為識別。要發(fā)現(xiàn)有沒有可能是欺詐行為,這里面需要深度學習,需要了解一些金融知識,所以需要兩方面知識。這也是 JDD 大賽的一個特點,我們不僅要技術(shù)上的革新,同時也需要這些參賽隊伍能寫出一個商業(yè)計劃,能把商業(yè)場景想清楚。
二是金融界非常關(guān)鍵的一個需求,就是信貸需求預測,還有店鋪銷量預測。
還有一個非常有趣的識別——豬臉識別,不是人臉識別。
豬臉識別是需要做什么呢?首先我們可以獲取到大量數(shù)據(jù),而不用擔心隱私問題,我們想豬可能不太關(guān)心隱私,同時又是一個活體識別問題。
這確確實實背后有一個商業(yè)場景問題,可以設想一下,假如有學生參加這個比賽,一個場景就是它可以幫助養(yǎng)豬戶鑒別不同的豬在養(yǎng)殖過程中的各種活動,這個豬是不是活躍,它是不是散養(yǎng)的或者它還是一只非常不愛動的豬,由此對健康就可以作決策,對保險就可以作預測。
另外消費者可能也會有挑選,有人可能喜歡不同的豬肉,可能對豬的鑒別就有個性化需求。所以這既有深度學習應用,又有商業(yè)應用,是非常有趣的一個題目。
我們很期待這樣一個學術(shù)界和金融界的結(jié)合。
*雷鋒網(wǎng)整理
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。