0
本文作者: AI金融評論 | 2018-07-01 18:07 | 專題:2018 CCF-GAIR 全球人工智能與機器人峰會 |
雷鋒網(wǎng)AI金融評論按:2018全球人工智能與機器人峰會(CCF-GAIR)在深圳召開,峰會由中國計算機學會(CCF)主辦,雷鋒網(wǎng)、香港中文大學(深圳)承辦,得到了深圳寶安區(qū)政府的大力指導,是國內(nèi)人工智能和機器人學術(shù)界、工業(yè)界及投資界三大領(lǐng)域的頂級交流盛會,旨在打造國內(nèi)人工智能領(lǐng)域最具實力的跨界交流合作平臺。
6月30日下午,在金融科技專場上,通聯(lián)數(shù)據(jù)首席科學家蔣龍分享了題為《人工智能和大數(shù)據(jù)助力科學投資》演講。蔣龍畢業(yè)于北京大學,曾任微軟亞洲研究院副研究員、阿里巴巴高級算法專家。專注于機器學習、自然語言處理、搜索算法、廣告投放算法等研究領(lǐng)域,在AAAI、KDD、ACL、SIGIR等國際頂級會議,IEEE Trans. Knowl. Data. Eng.、ACM. Trans. Inf. Syst.等國際頂級期刊上發(fā)表過十余篇論文,擁有多項中美發(fā)明專利。
以下是演講原文,雷鋒網(wǎng)作了不改變原意的編輯:
今天的主題是金融科技,金融科技是非常廣的領(lǐng)域,有信貸、支付、證券、保險等,我要談的是金融的子領(lǐng)域,就是資產(chǎn)管理領(lǐng)域。
資產(chǎn)管理,簡單說就是如何更好地配置人類所積累下來的財富,使得社會能夠更快進步,能為人類產(chǎn)生更多價值。我們怎么用最好的手段管理財富,比如說把這些錢應(yīng)該投向什么行業(yè),投向什么技術(shù),讓誰來引導這些錢,讓財富更快增長,這是一個巨大的挑戰(zhàn),在這個挑戰(zhàn)背后,我們看到人工智能和大數(shù)據(jù)可以給我們帶來很大的助力。
說到投資大家可能會立馬想到股票、基金,有些人想到風險投資,有的人可能會想到投資大宗商品,有的人可能想到做一些收藏品,這些都是投資,投資的種類很多,但是投資的核心是預(yù)測,基于拿到的各種數(shù)據(jù)去挖掘規(guī)律,根據(jù)規(guī)律對未來做出判斷,判斷可能是這個人未來可能會成就一番大事業(yè),所以投資他的初創(chuàng)企業(yè),或者你預(yù)測到了人們的消費趨勢在變化,你看到變化能夠知道某些行業(yè)未來會受益,你把資源投資這些行業(yè),這些都是基于預(yù)測的投資。
所以信息通訊和計算技術(shù)對于投資領(lǐng)域的影響一直以來非常巨大,70年代開始誕生指數(shù)基金,由人管理錢變成計算機自動管理錢。截至2017年,在北美市場上,指數(shù)和量化基金的規(guī)模第一次超過了人主動管理的規(guī)模,已經(jīng)成為主流。隨著互聯(lián)網(wǎng)帶來的數(shù)據(jù)量的變化,隨著計算機在數(shù)據(jù)分析上的能力的提升,漸漸的我們有辦法去對資產(chǎn)的收益和風險進行一些分析預(yù)測,所以我們可以做一些量化對沖,把我們知道的信息變現(xiàn),對沖所有風險。隨著大數(shù)據(jù)人工智能的發(fā)展,現(xiàn)在有更多的投資科技的名詞誕生,比如說智能投顧、智能投研等等。
當今投資科技的要素有三個——專業(yè)投資理解、大數(shù)據(jù)和人工智能。為什么第一個是專業(yè)投資理解?幾年前美國有一個博士生做過一個實驗,他分析了世界上各種各樣的數(shù)據(jù),后來他發(fā)現(xiàn)孟加拉的黃油價格跟標普的走勢非常想象,他用過去十年的數(shù)據(jù)證明了這兩個基本上可以完全的擬合,但是這只是偶然擬合,你不可能拿孟加拉的黃油價格去預(yù)測接下來標普500的走勢。因為世界上的數(shù)據(jù)實在太多了,任何一個數(shù)據(jù)都可能發(fā)現(xiàn)偶然相似的事情,在機器學習領(lǐng)域我們經(jīng)常說過擬合,怎么控制過擬合?如果有足夠多的數(shù)據(jù),可以通過數(shù)據(jù)自動解決,但是沒有的情況下,我們需要有先驗支持,有了投資科技,我們開始把投資變成一種科學化,大家都知道投資大師巴菲特有投資藝術(shù),藝術(shù)的東西只會意會不可言傳,無法把投資邏輯復(fù)制出來,沒辦法去得到同樣的投資結(jié)果,也沒有辦法去歷史上去做實驗,投資好在哪里,弱點在哪里,這就不是科學。有了大數(shù)據(jù),人工智能、量化科技,我們有可能把投資作為科學,可以重復(fù)實驗分析投資里面的策略問題,能夠更有效的提升。
人工智能和大數(shù)據(jù)在投資里面的應(yīng)用非常廣泛,我這里列舉了幾個比較重要的場景。
第一個叫投資研究,投資研究的目的是把信息進行加工,從里面得出投資決策,現(xiàn)在是信息爆炸的時代,如何挖掘信息,人腦已經(jīng)漸漸發(fā)覺很有挑戰(zhàn),需要AI幫我們,這里還有非結(jié)構(gòu)化的數(shù)據(jù)處理,像圖象信息、自然語言文本信息、音頻數(shù)據(jù)等等,有了這些信息之后,我們?nèi)绾伟l(fā)掘規(guī)律,人腦可以處理一些變量不太復(fù)雜的,如果一百個一千個變量的話,人腦基本無能為力,這時候如何通過AI來幫我們完成在海量變量下的投資預(yù)測。在得到投資決策之后,我們需要通過交易來實現(xiàn)決策,如何更低成本的去進行交易,每天有很多人在股票市場交易,你怎么保證最低成本,對市場是造成最小沖擊的,這里基于博弈論的機器學習的方法正在實現(xiàn)價值,包括風控,投資的時候如何控制風險。另外是投資服務(wù),也是新的領(lǐng)域,有了投資能力之后,最終是要為人類服務(wù)的,不管是為個人還是企業(yè),怎么樣讓我們的服務(wù)變得更高效,智能投顧是一個非常大的創(chuàng)新。
我們生處在一個加速發(fā)展的大數(shù)據(jù)時代,每隔幾年數(shù)據(jù)就要十倍的增長,并且指數(shù)提升。大數(shù)據(jù)背后我們知道有數(shù)據(jù)采集能力,像智能硬件這方面的進步,也有計算機處理的能力進步,更多的是場景,有了這個技術(shù),有了場景,有了閉環(huán),導致數(shù)據(jù)像滾雪球一樣越來越大,這樣的數(shù)據(jù)對投資來講可以分成三大類,一種是客觀世界的數(shù)據(jù),比如說可以通過衛(wèi)星來觀察地球發(fā)生什么變化,也可以通過微博去觀測人們表達出來的主觀想法,從主觀世界了解人們的想法,我們也有移動支付,有很多的交易,有些企業(yè)里面的工業(yè)生產(chǎn)的資料,讓我們發(fā)現(xiàn)一些關(guān)系的變化,比如說錢怎么從一方到另外一方,這三種變化可以讓我們對世界觀察非常細致徹底,而且非常及時,對投資來說這非常重要。
這里我們可以看一個例子,如何利用客觀世界的數(shù)據(jù)幫助我們做宏觀預(yù)測。我這里引用了去年美國國家經(jīng)濟研究中心的一篇文章,這篇文章的標題很有吸引力,“中國的GDP增速可能被低估了”,大家都知道西方經(jīng)濟學對中國的增長不是那么信任,尤其是統(tǒng)計局的數(shù)據(jù),但他們有自己的方法研究,他們會利用一些另類數(shù)據(jù),比如說燈光數(shù)據(jù),大家可以看到圖上右上角的圖片,是美國軍用衛(wèi)星拍攝的北京和天津地區(qū)夜晚燈光情況,利用同樣類似數(shù)據(jù),美國這些經(jīng)濟學家發(fā)現(xiàn)在98年亞洲金融危機之后,亞洲各個國家的經(jīng)濟恢復(fù)速度和夜晚燈光變化有關(guān)系,通過這種方式來預(yù)測中國,發(fā)現(xiàn)中國過去幾十年的GDP增長,可能比我們公布出來的還要高,所以我們不是高估,而是低估了自己,他們估計可能是中國缺乏對第三產(chǎn)業(yè)準確預(yù)估的能力。
右下角是我們的實踐,我們?nèi)ゾW(wǎng)站上也下載了中國各個省自治區(qū)夜晚燈光的圖片,我們做了分析,發(fā)現(xiàn)人均GDP和人均單位面積燈光強度是有非常大的關(guān)系,同樣的還有很多的自然信息可以利用,比如說有些公司會分析各個地區(qū)空氣污染物的成分和比例,來分析當?shù)氐哪芎?,從能耗里面反映GDP增長,還有人利用衛(wèi)星圖片觀察農(nóng)作物的生產(chǎn)情況,預(yù)測接下來GDP的發(fā)展情況。除了客觀世界,主觀世界,還有很多東西來預(yù)測。
如果我們要做投資,會面對海量數(shù)據(jù),比如一個國內(nèi)投資者每天會面臨上千篇的上市公司公告、上萬篇的財經(jīng)和行業(yè)的重要信息,還有數(shù)以千萬計的投資者和社交媒體發(fā)布的消息,這些肯定是處理不過來的,這時候就要借助于AI來幫助我們分析。這里分享一個簡單例子,怎么樣從上市公司發(fā)布的公告去提取信息,判斷公告是否重要,下面是一篇公司發(fā)布的重大合同公告,用自然語言方式描述了合同簽訂雙方和金額等等,通過自然語言提取的技術(shù),能把這里的關(guān)鍵信息,比如說甲方、乙方、合同金額提取出來,提取之后,根據(jù)金額和這個企業(yè)過去的情況去判斷這些信息是否重要,再結(jié)合關(guān)系圖譜去識別這兩個關(guān)系是否存在潛在關(guān)聯(lián)信息等等,這都是我們做結(jié)構(gòu)化處理的重要幫助。
剛才提到量化管理已經(jīng)超過主動管理,成為最主要的投資策略,傳統(tǒng)量化是線性模型或者說多因子模型,多因子模型是把一個資產(chǎn)的收益分解成很多因子收益的求和,但是現(xiàn)實生活中太多因子,其實并不是線性關(guān)系。比如左邊的圖是二次關(guān)系,用傳統(tǒng)基于IC的方法或者做多做空的方法,很難找到有效的因子,機器學習發(fā)展給了我們這樣的機會,機器學習在對非線性模型的研究上有很多的積累,我們可以利用這樣的知識去發(fā)掘信息中的非線性關(guān)系,幫助我們預(yù)測未來資產(chǎn)的收益。
這是我們利用深度學習做的宏觀預(yù)測,我們用了很多的經(jīng)濟變量,比如衡量供給方面、需求方面,衡量人們信息方面,貨幣方面的指標,結(jié)合隱藏層的模型做一個預(yù)測,預(yù)測目標是市場的主要指數(shù),比如債的指數(shù),大宗商品的指數(shù),股票的指數(shù),基于這樣的指數(shù)可以做宏觀的資產(chǎn)配置和套利。
這是對一個公司的預(yù)測,利用機器學習數(shù)據(jù),可以像研究員一樣去分析公司的業(yè)務(wù),去預(yù)測分析影響公司核心的指標,最終得出營收的預(yù)測。這個圖我們是以航空公司為例,一步一步按照人的邏輯去分析收入和成本情況,最后會發(fā)現(xiàn)一些重要指標,比如說客座率是非常影響公司財務(wù)數(shù)據(jù)的,這樣的指標如何預(yù)測,其實我們可以用一些方法,利用人均GDP的增長,利用航線數(shù),利用鐵路運輸情況、機場擁堵度等等數(shù)據(jù)去預(yù)測每個航空公司的客座率,再把這些數(shù)據(jù)綜合起來去預(yù)測航空公司未來幾個月甚至幾年財務(wù)的情況。
從我們自己做的一些實驗結(jié)果來看,在預(yù)測主營收入上,機器人分析的準確率比人要做得更好,而且對于不同行業(yè)來說,有80%以上的行業(yè)都比人做得好,在美國的一些研究得到同樣結(jié)論,美國的一些公司也做了對美股研究,發(fā)現(xiàn)用機器學習研究的平均誤差是22%,但是人工分析師是30%的誤差。
除了在預(yù)測營收,預(yù)測關(guān)鍵財務(wù)數(shù)字外,交易上機器學習也能幫助我們很多,像阿爾法狗用的是強化學習技術(shù),面臨的場景和交易是一樣的,都需要在動態(tài)博弈的環(huán)境里觀察對手的行為,做出自己的判斷。在強化學習之前,大家更多的是用傳統(tǒng)的,用過去交易量的數(shù)據(jù)來估計未來的交易量,現(xiàn)在可以利用強化學習,利用更細致的盤口數(shù)據(jù)來預(yù)測,根據(jù)研究,這樣比傳統(tǒng)做法降低27-35%的交易成本。
最后想分享一點關(guān)于智能投顧,這也是過去非常熱的概念,它的想法很好,世界上有很多人都需要財務(wù)顧問,但是人工顧問的成本非常高,所以絕大部分享受不到這樣的服務(wù),當我們有了機器人這樣的智能能力之后,我們有機會把顧問服務(wù)成本降得很低,讓金融的好處能夠被更多的人享受到。
北美地區(qū)的智能投顧更多集中在根據(jù)用戶的風險和投資期限來推薦資產(chǎn)配置組合。根據(jù)我們的研究,中國人還是不太愿意做更長線的投資,而且中國人很喜歡去故事交易,散戶非常多,所以我們還要教育用戶,以及幫助中國散戶做股票交易。我們通過分析每個用戶的交易流水,分析他們的錯誤點,一種情況是市場大盤預(yù)測不好,導致倉位有很大虧損。我們分析了這樣的問題之后,可以針對性地提供一些幫助,比如可以提供一些智能化的方法,智能化的倉位控制、止盈止損提醒等等幫助投資者改進弱點。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。
本專題其他文章