丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
金融科技 正文
發(fā)私信給陳伊莉
發(fā)送

0

AI=機器學習2,我們在去往2的路上 | 普林斯頓范劍青教授

本文作者: 陳伊莉 2018-09-20 00:27
導語:每天數(shù)十萬金融分析師涌向華爾街,重復繁瑣的數(shù)據(jù)分析。上百萬銀行業(yè)者匆匆趕到工作崗位,開始他們每天常規(guī)工作。

AI=機器學習2,我們在去往2的路上 | 普林斯頓范劍青教授

雷鋒網(wǎng)AI金融評論報道,在9月18日“2018世界人工智能大會”智能金融主題論壇上,中國互聯(lián)網(wǎng)金融協(xié)會會長李東榮,加州大學伯克利分校邁克爾·歐文·喬丹(Michael I. Jordan)教授,復旦大學大數(shù)據(jù)學院院長、普林斯頓大學教授范劍青、匯付天下董事長兼CEO周曄帶來了主題演講。

其中,范劍青教授分享了《數(shù)據(jù)智能與金融創(chuàng)新》。他主要介紹了人工智能的興起,以及數(shù)據(jù)智能如何增強市場效率,加速產業(yè)發(fā)展、引領高科技的發(fā)展的?!叭斯ぶ悄艿哪康呐c價值,就是把大數(shù)據(jù)加工成智慧數(shù)據(jù),為經濟發(fā)展提供新能源,為科技創(chuàng)新提供新依據(jù),為管理決策提供新信息?!?/p>

“大數(shù)據(jù)與人工智能為健康醫(yī)療、科學發(fā)現(xiàn)、技術創(chuàng)新、商業(yè)管理、政府決策等帶來由信息海嘯驅動的又一次工業(yè)革命,同時方方面面影響著人類的工作、生活和通訊方式。各行各業(yè)創(chuàng)新所產生的大量數(shù)據(jù)又增加了對海量數(shù)據(jù)處理和分析的強烈需求,促進了大數(shù)據(jù)與人工智能的發(fā)展。”

以下是演講原文,雷鋒網(wǎng)作了不改變原意的編輯:

AI是機器學習的平方,我們在去平方的路上

每天數(shù)十萬金融分析師涌向華爾街,重復繁瑣的數(shù)據(jù)分析。上百萬銀行業(yè)者匆匆趕到工作崗位,開始他們每天常規(guī)工作。像一百多年前的農業(yè)、手工業(yè)一樣,我們自然要問能否讓智能機器來輔助這些工作,使得更多聰明才智可以投入高科技生產、藝術創(chuàng)作,提高人的生活體驗。

AI=機器學習2,我們在去往2的路上 | 普林斯頓范劍青教授

人工智能席卷全球,大數(shù)據(jù)、人工智能是伴隨著數(shù)據(jù)與信息革命應運而生,發(fā)展迅速。上百萬的攝像頭,數(shù)億部智能手機和幾十億網(wǎng)絡搜索,和社交網(wǎng)絡上的對話產生巨大海量數(shù)據(jù),其中包括公共安全、公共衛(wèi)生、消費傾向、商業(yè)活動、經濟走勢等等。同樣數(shù)十億的處方、海量的生物、遺傳信息帶來健康大數(shù)據(jù)。海量數(shù)據(jù)的收集促成了大數(shù)據(jù)時代的到來。海量數(shù)據(jù)的挖掘催生了人工智能的發(fā)展。換句話說人工智能就是從大數(shù)據(jù)到智慧數(shù)據(jù)之間的橋梁。

人工智能的起源是來自1955年,John Mccarthy創(chuàng)造了這個術語。理想的狀況有點像科幻小說,“類人”機器,讓它有認知、表達、思考感知能力,但目前還做不到?,F(xiàn)實是希望能夠用技術訓練機器,將人從重復性、簡單性、危險性的繁瑣事物中解放出來,提高人的創(chuàng)造力和生活體驗。換句話說人工智能的目的是要提高人的體驗,不是讓一些人失業(yè)的。

AI第一代比較簡單是機器表達與邏輯推理,機器證明、專家系統(tǒng)、邏輯系統(tǒng)。第二代是概率建模與統(tǒng)計學習的基礎上知識圖譜、機器學習、神經網(wǎng)絡。

何為人工智能,翻譯有點不好,機器智能其實更合適。Michael I. Jordan說它應該是統(tǒng)計學。有些人可能不一定完全同意。在我看來,人工智能是機器學習的平方,讓機器自動學習機器算法是機器學習的理想狀況。它具體表現(xiàn)是在圖像識別、語音識別、機器學習、專家系統(tǒng)、計算機視覺還有自然語言處理等等。如果我們按圖靈測試來檢驗現(xiàn)在的很多系統(tǒng),恐怕我們多半系統(tǒng)是機器學習,不是人工智能。換句話說我們還沒達到平方,只是在往平方的路上。

那么大家可能會問,什么是人工智能?Arthur Samuel的想法是讓機器從數(shù)據(jù)終學習并做決策,我認為它是一個可擴張的統(tǒng)計算法,充分融合統(tǒng)計建模思想,以及計算優(yōu)化方法,使得這些數(shù)據(jù)分析的思想能夠在大數(shù)據(jù)的環(huán)境下得到實現(xiàn)。它最后的產品當然是一個可執(zhí)行的程序。未來有可執(zhí)行的程序我們需要有一個優(yōu)化目標,有優(yōu)化目標跟剛才Michael I. Jordan說的一樣,需要統(tǒng)計建模。

AI=機器學習2,我們在去往2的路上 | 普林斯頓范劍青教授

大家比較熟悉的深度學習,其實是一個神經網(wǎng)絡系統(tǒng),更直白一點是數(shù)學的函數(shù)逼近,它用的是兩種方法,信號源的線性組合,再做非線性的選擇,重復的過程構成很復雜的函數(shù)逼近方法。

為什么它是如此成功,這又是一個權衡偏差和方差的有效方法。深度網(wǎng)絡使得近似高維函數(shù)更加靈活,九十年代已經就有了。大數(shù)據(jù)的到來使得我們大大減少了方差,現(xiàn)代計算技術的革命使得大規(guī)模的優(yōu)化成為可能跟現(xiàn)實,這樣我們就能夠更好更深度的學習函數(shù)逼近的方法。在圖像識別、機器翻譯、自然語言處理等方面都取得了很大的成功。這些問題其實從決策角度來說是比較簡單的,因為個體的差異比較小,我說話有口音,我跟你的差異沒有那么大。第二,信號即已知,我說的話所有的信號都在那里,這樣問題比較簡單。

機器學習的挑戰(zhàn)

AI=機器學習2,我們在去往2的路上 | 普林斯頓范劍青教授

機器學習有很多挑戰(zhàn),在經濟金融、生物醫(yī)學、管理決策、人文科學里面有很多挑戰(zhàn)。個體差異太大,更重要的是信息集未知,特征很難提取,需要多學科交叉。

比如說閃電奔跑,它的信號集是什么我們大都不知道。我們自己也做了一些預測,比如說預測高頻數(shù)據(jù),接下來的走勢是往上還是往下。我們做了自己的分析和特征提取。得到的結果是傳統(tǒng)的邏輯回歸跟深度學習,其實最后消費者差不多。換句話說,其實最后在其他應用里面,有時候如果特征提取是好的話,它的非線性并不是那么重要,更重要是特征自己的提取問題。我們在這個問題基本上可以看得出來,因為市場比較有效,能夠可測性的精確度并不是特別高,這時候深度學習跟邏輯回歸也差不多。

AI=機器學習2,我們在去往2的路上 | 普林斯頓范劍青教授

我最近看到一個消息,微軟推出人工智能心臟風險測試指標,微軟印度總經理表示他們新的API評分是基于四十萬印度人的共享數(shù)據(jù)的基礎之上,可以輕松的識別每一位患者的風險水平。具體他們怎么分析,什么結果都沒有,同樣的文章中只是一直在介紹深度學習的偉大。

我就把他們的結果差不多的東西放在這。這里面也有40萬左右的人口,用80%的數(shù)據(jù)來訓練機器算法。最后得出的結果也是這樣,不過精確度并不算高,比隨機猜測好一點。這個時候深度學習跟邏輯回歸是差不多。這也是另外一個例子說明深度學習不能解決所有的問題,深度學習的成功應用是在語音、圖像識別等方面,而且需要明白數(shù)據(jù)集是什么,特征是什么,這個問題可能更為重要。

AI=機器學習2,我們在去往2的路上 | 普林斯頓范劍青教授

接下來我舉個比較成功的例子——預測債券風險溢價,是我們自己做的。當前我有131個宏觀經濟數(shù)據(jù),此外的數(shù)據(jù)需要自行挖掘。我們用了8個匯總宏觀經濟系列,用已有的信息預測。有專業(yè)指導的信息學習可以改進預測的效果。我們這里用的模型叫做因子增量模型,看上去跟神經網(wǎng)絡有相關的,其實在統(tǒng)計計量里面已經有過這樣的模型。

如果只是用簡單的算法來預測的話,大概可以預測18%;如果用因子選擇,可以預測到24%左右;如果說因子選擇的更好的話,可以預測到32%;如果加入統(tǒng)計的穩(wěn)健思想,可以預測到38%;在這個基礎之上,如果再加入神經網(wǎng)絡,最后的結果可以達到45%左右。

這個例子就說神經網(wǎng)絡是有用的,但是一定要根專業(yè)知識相結合,怎么樣能夠找到更好的影響市場的因子,這樣我們可以達到更好的風險預測跟控制的目的。

AI=機器學習2,我們在去往2的路上 | 普林斯頓范劍青教授

智能數(shù)據(jù)增強市場效率

AI=機器學習2,我們在去往2的路上 | 普林斯頓范劍青教授

第二塊關于智能數(shù)據(jù)增強市場效率。在大數(shù)據(jù)的環(huán)境之下,金融行業(yè)面臨著巨大的挑戰(zhàn),現(xiàn)在的信息密度、深度和廣度都有明顯增加,自然而然我們就需要數(shù)據(jù)智能來提升市場效率跟決策力。除了金融衍生品、股票、外匯、宏觀指數(shù),還有很多非結構的新聞、文本和氣候變化。如果用人工智能機器學習的辦法,我們顯然可以降低信息獲取的成本,拓寬信息獲取的渠道,提高信息傳遞的速度,并且提高信息的真實性。

數(shù)據(jù)智能在金融里面有許多應用,從商業(yè)銀行的消費金融、財務風險、客戶管理、風險判別到證券市場的量化交易、智能投顧、風險防范和信用評估,還有保險業(yè)的信用管理、詐騙分析、獲客分析、保險精算。政府職能里面有風險評判、智能監(jiān)管、預警分析、政策評估。機器智能可以降低勞動力成本,減少信息不對稱性,提高預測能力。

金融創(chuàng)新的一大挑戰(zhàn)也是數(shù)據(jù)。

  • 首先,金融市場的風險觸發(fā)機制更為復雜,有個體風險和系統(tǒng)性風險兩個相疊加,數(shù)據(jù)來源方面多元化,行為更為緊密,除了市場內的交易數(shù)據(jù)之外,還有市場外的社交網(wǎng)絡,影響范圍更廣,傳播速度更快。

  • 第二,在信貸活動方面,信貸活動的評估給風險管理也帶來加強,最大程度上獲取信息,判別欺詐。信貸管理及時預判風險,交叉驗證。

  • 第三,在投資決策方面,我們面臨的不確定性,包括預測分析,對預測分析的需求明顯提高。

金融最基本的作用把投資者的錢投放到生產的地方去,生產的地方錢又安全送回到投資者。實現(xiàn)這樣的載體是我們的金融市場,它的效率分為信息效率、配置效率,后者是從市場形態(tài)、交易成本實現(xiàn)金融市場的職能。智慧數(shù)據(jù)可以提高信息效率,金融的特點數(shù)據(jù)來源多樣,行為隱蔽,包括保密、脫敏、干擾、缺失、幸存者偏差等等。

作為分析師或者作為整個市場和社會,我們無法擁有所有的數(shù)據(jù),每個人只是擁有一小部分,數(shù)據(jù)共享變成是金融市場,提高金融效率的很重要的方面,數(shù)據(jù)擁有者對數(shù)據(jù)貢獻和交流的意愿比較低,數(shù)據(jù)孤島現(xiàn)象經常出現(xiàn),監(jiān)管也難以開展。有些金融機構和監(jiān)管部門,有數(shù)據(jù)不能用,有數(shù)據(jù)不會用,有數(shù)據(jù)不敢用,這樣的情況也經常發(fā)生。

智慧數(shù)據(jù)提高信息效率

AI=機器學習2,我們在去往2的路上 | 普林斯頓范劍青教授

怎么樣構造一個機制實現(xiàn)數(shù)據(jù)共享呢?大數(shù)據(jù)金融創(chuàng)新中心提出這樣一個構思,利用數(shù)據(jù)沙箱設計實現(xiàn)數(shù)據(jù)安全,同時在不影響隱私的情況下,充分發(fā)表充分的統(tǒng)計量,這樣充分的統(tǒng)計量可以幫助我們分析數(shù)據(jù),增強數(shù)據(jù)的信號。我們盡量設計鼓勵數(shù)據(jù)共享的機制,以區(qū)塊鏈等技術來實現(xiàn)共識的穩(wěn)定,提高合作與激勵的效率。推動監(jiān)管科技提高靈活性,減少消極監(jiān)管或者錯殺,這是我們提高數(shù)據(jù)效率的關鍵部分。

我們要實現(xiàn)的目標就是數(shù)據(jù)共享來增加數(shù)據(jù)的流通性跟可靠性。數(shù)據(jù)挖掘方面可以提高它的使用效率,實現(xiàn)數(shù)據(jù)的價值。在存儲方面,安全方面,我們可以保障存儲隔離,保障數(shù)據(jù)的原始狀態(tài)和可溯源,還有自動化配置等等。在金融里面很簡單的一個問題,我們剛才說的數(shù)據(jù)源到底數(shù)據(jù)要用多大,如何篩選高效低險的企業(yè),如何辨別不良企業(yè),如何克服信用風險,如何防范風險道德。這些非常簡單的問題需要從多元交付、海量增長的數(shù)據(jù)里面挖掘,在挖掘這些數(shù)據(jù)的同時,也能夠讓我們關注市場的微觀行為,從而達到更有效的監(jiān)管。

人工智能的目的就是提高數(shù)據(jù)挖掘的能力,而挖掘數(shù)據(jù)的相關性是多種多樣的。舉個例子,為了盡早預測沃爾瑪?shù)臉I(yè)績,分析師會想方設法找比它更早預報業(yè)績的相關公司,比如紙袋公司,從而用他們的數(shù)據(jù)幫助預測一個公司的業(yè)績。但這種做法既費事又不精確。AI可以大大提高這些分析的效率和節(jié)省費用。一個星期的分析師和工程師的工作可以在一分鐘內用機器學習的方法完成。AI能夠增加市場效率,解決信息不對稱的問題。

我們有很多網(wǎng)絡數(shù)據(jù)和各種各樣的“學習”。比如說高杠桿基金的持股網(wǎng)絡中心能夠幫助政府評估系統(tǒng)風險,如果市場需要,可以更精確地干預。而同樣的,我們的同事研究過怎樣從一個基金經理的持股情況推算出他的社交網(wǎng)絡,辨別社交網(wǎng)絡是否有違規(guī)的行為。在市場數(shù)據(jù)里面,網(wǎng)絡數(shù)據(jù)里面,是非常之豐富的。

數(shù)據(jù)智能能夠加速產業(yè)發(fā)展

第三部分,數(shù)據(jù)智能能夠加速產業(yè)發(fā)展。第一表現(xiàn)在,金融科技的未來可以顛覆傳統(tǒng)風控。主要有三方面體現(xiàn)。

  • 科技紅利,互聯(lián)網(wǎng)使金融服務觸達更多用戶,收集海量多元的數(shù)據(jù),而且除了這之外還有市場內外的信息。

  • 大數(shù)據(jù)紅利,傳統(tǒng)的風控在新的經濟環(huán)境下積累了60多年的數(shù)據(jù),互聯(lián)網(wǎng)也積累了十多年數(shù)據(jù),這些數(shù)據(jù)可以徹底改變傳統(tǒng)風控手段。

  • 金融科技紅利,智能創(chuàng)新的多尺度風險測度和風險手段不斷涌現(xiàn),這些手段可以得到及時的測試和反饋。我們做風控控制的目的不是預測風險的到來,而是反饋,消除風險。隨著大數(shù)據(jù)的到來,人工智能的到來,我們能夠有更多更好的方法來學習自適應、自回歸的過程。

具體到業(yè)務產品,比如智能投顧,基本思想是利用機器完成客戶需求分析、投資分析、資產配置選擇等工作。意在替代人類完成財富管理或者投資建議方面的工作,實現(xiàn)投資的自動化。其中關鍵的技術有三點:

  • 數(shù)據(jù):數(shù)據(jù)有市場行為,比如說情緒指數(shù)和政策變量等;用戶的行為,比如說社交、電商數(shù)據(jù)等。

  • 方法:決策樹、深度學習、回歸分析等。

  • 理論是基于投資理論尋求風險和資金組合最合適的最優(yōu)級。

另一重要產品是大數(shù)據(jù)征信,利用數(shù)據(jù)采集、存儲、分析,獲取信用主體的多維行為信息,評估個人征信水平,降低信貸失信率。

  • 關鍵技術是數(shù)據(jù)采集、數(shù)據(jù)存儲、數(shù)據(jù)分析到評分模型,評分非常關鍵。

  • 數(shù)據(jù)來源也是非常豐富,除了平時的生活數(shù)據(jù)之外,還有網(wǎng)絡購物、客戶評價、信息交易、社交信息等。

  • 應用的范圍包括信貸管理、實物租賃、消費金融、保險風控。

  • 服務的群體是小微金融和銀行貸款無法覆蓋的個體。小微金融是指從小資投資者的錢到小創(chuàng)業(yè)者。小微金融的產品基本上是低收入個體他們的金融需要是什么,從存儲到投資到個人貸款等等之類的。它在經濟發(fā)展中起著非常重要的作用。在發(fā)達國家大概能夠幫助實現(xiàn)經濟增長率為4%到5%,發(fā)達國家是2%左右。

值得注意的是,小微金融的發(fā)展瓶頸是合理定價。合理定價是任何金融產品可持續(xù)的基礎。而基于大數(shù)據(jù)、人工智能的信用評估,能夠提供更快更有效的決策。小微金融顯然證明了現(xiàn)在的科技創(chuàng)新可以開拓金融服務的對象,對于過去低收入或者沒有多少信用的人,現(xiàn)在也能對其進行一些信用的基本分析。

中國大數(shù)據(jù)征信的挑戰(zhàn)是體量比較大,貸款比較難,因為分布比較零散,業(yè)務不規(guī)模,盈利不明朗,信用比較難構建。網(wǎng)絡社交消費大數(shù)據(jù)為征信提供了很有效的基本原料。

過去幾年小微金融的發(fā)展頗為迅速,市場引導和政府指導是一個長遠發(fā)展的基礎,政府布局對高科技產業(yè)發(fā)展尤其重要。舉幾個例子,張江高科技園支持了早期的展訊通信,現(xiàn)在變成世界第三大手機芯片供應商,也是國內最先進的領先半導體產業(yè)。上海硅產業(yè)投資公司幾年前投資了數(shù)家歐洲半導體公司,現(xiàn)在估值翻了10多倍。中關村也有相關的例子。

政府布局對人工智能、大數(shù)據(jù)、金融科技這些新興產業(yè),現(xiàn)在應該是非常重要的時候,所以需要市場引領和政府指導相結合,才能夠把市場弄的更有效。

數(shù)據(jù)智能引領高科技

最后講一下數(shù)據(jù)智能引領高科技。數(shù)據(jù)智能的發(fā)展促進了相關學科的發(fā)展,計算機、數(shù)學、信息學、統(tǒng)計學等等,也推動了高科技的創(chuàng)新從硬件軟件到系統(tǒng),也激勵新產品的開發(fā),拓展了新的服務對象。

舉個例子,數(shù)據(jù)智能對機器學習、統(tǒng)計學發(fā)起了挑戰(zhàn)。比如精準營銷、精準醫(yī)療,難點在于數(shù)據(jù)多樣性,我們如何讓數(shù)據(jù)來源更多元,進行分析,對稀疏性、內生性、測量誤差等,因為大數(shù)據(jù)的原因產生了很多新的統(tǒng)計問題,處理這些問題需要更復雜更有效的算法。

對應用數(shù)學同樣也有類似的挑戰(zhàn)。從計算瓶頸上,我們經常會出現(xiàn)大規(guī)模的非凸的優(yōu)化問題,我們經常需要在計算、統(tǒng)計上面提出新思想。對大數(shù)據(jù)系統(tǒng)也是同樣有非常大的挑戰(zhàn)。

更多資訊,請關注雷鋒網(wǎng)AI金融評論。

AI=機器學習2,我們在去往2的路上 | 普林斯頓范劍青教授

雷峰網(wǎng)版權文章,未經授權禁止轉載。詳情見轉載須知

分享:
相關文章

編輯

數(shù)據(jù)漫游天地間。 聯(lián)系可通過上方郵箱或WeChat(請注明身份、姓名、來意,thx)
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經綁定,現(xiàn)在您可以設置密碼以方便用郵箱登錄
立即設置 以后再說