0
AI+投資其實(shí)并不新鮮,但為什么不少模型和算法的表現(xiàn)都不盡如人意?
在微軟亞洲研究院副院長劉鐵巖看來,原因之一是動(dòng)態(tài)變化的股市里,人們往往很難確定各種投資因子到底在哪個(gè)時(shí)段更加有效,如果機(jī)器能識(shí)別出當(dāng)時(shí)的市場是否“正?!保瑢W(xué)透不同的歷史規(guī)律,那無疑會(huì)給投資策略帶來更有效的決策依據(jù)。
創(chuàng)辦時(shí)間超過二十年的微軟亞洲研究院被譽(yù)為“AI黃埔軍?!?,AI+投資也正是這家科研機(jī)構(gòu)長期關(guān)注的領(lǐng)域之一。近日,在通聯(lián)數(shù)據(jù)主辦的全球資產(chǎn)管理數(shù)字化轉(zhuǎn)型峰會(huì)上,副院長劉鐵巖就以《共同探索智能投資研究的新邊界》為主題進(jìn)行了分享。
劉鐵巖從高頻數(shù)據(jù)、市場狀態(tài)、交易成本等多個(gè)角度出發(fā),詳細(xì)介紹了他們對(duì)于智能化投資的研究,并討論了金融投資的實(shí)戰(zhàn)和研究之間存在的巨大鴻溝:算法有時(shí)只在論文的小型數(shù)據(jù)上有效果,研究者不清楚金融場景特有的實(shí)現(xiàn)細(xì)節(jié),缺乏領(lǐng)域知識(shí),缺乏穩(wěn)定公開的數(shù)據(jù)源等等。
以下是劉鐵巖的演講內(nèi)容,雷鋒網(wǎng)AI金融評(píng)論做了不改變?cè)獾恼砗途庉嫞?/strong>
今天跟大家探討一下我們?cè)谥悄芡顿Y研究方面的心得體會(huì)。
微軟亞洲研究院是微軟在海外最大的基礎(chǔ)和應(yīng)用型研究機(jī)構(gòu),在過去20年間,我們?cè)谟?jì)算機(jī)領(lǐng)域,全球最頂級(jí)的會(huì)議和期刊上發(fā)表了大量學(xué)術(shù)成果,被MIT技術(shù)評(píng)論譽(yù)為全球最火的計(jì)算機(jī)實(shí)驗(yàn)室。中國各大高校的學(xué)界精英、各大高科技企業(yè)的領(lǐng)軍人物,很多都是微軟亞洲研究院培養(yǎng)的院友。
雖然我來自這樣一個(gè)基礎(chǔ)科研機(jī)構(gòu),但和金融也不是毫無關(guān)系。2017年微軟亞洲研究院成立了創(chuàng)新匯,它的目標(biāo)是和中國各行各業(yè)領(lǐng)軍企業(yè)一起探索智能化、數(shù)字化轉(zhuǎn)型。正是借助創(chuàng)新匯的平臺(tái),我有幸和金融界的朋友探討智能化投資話題,也激起了我本人的興趣。
所以在過去的一段時(shí)間里,我們針對(duì)智能投資做了一系列的研究工作,這也正是今天想要和大家分享的內(nèi)容。
作為一名學(xué)者,我關(guān)心的并不是股市的風(fēng)云變換、大盤的漲跌起伏,相反更關(guān)注的是投資背后的科學(xué)規(guī)律,希望從表象能抽取出行之有效的技術(shù)框架,能夠服務(wù)更多的金融機(jī)構(gòu)和行業(yè)。
我們雖然關(guān)注的是金融投資方面的研究,但是也不完全是紙上談兵,過去4年中我們研發(fā)了一系列金融投資場景下的技術(shù),也和合作伙伴一起進(jìn)行了AI技術(shù)的實(shí)盤測試。
這張圖展示的是其中一個(gè)AI模型在過去一年的表現(xiàn),對(duì)標(biāo)的是中證500,與指數(shù)相比大概有超過30%的超額收益。
不過,今天和大家分享的并不是這個(gè)模型,而是從更廣泛的角度探討AI對(duì)于資管、投資行業(yè)有什么樣的啟示。
在過去幾年間,我們開發(fā)了一套自頂向下、比較完善的智能投資技術(shù)框架,包含:
數(shù)據(jù)智能:從海量的數(shù)據(jù)當(dāng)中挖掘有效的α因子;
智能預(yù)測:針對(duì)市場動(dòng)態(tài)性自適應(yīng)地訓(xùn)練高效的人工智能模型;
智能策略:基于AI的風(fēng)險(xiǎn)分析和投資組合構(gòu)建,
智能交易:用AI技術(shù)輔助自動(dòng)化訂單執(zhí)行。
不過,這里我想強(qiáng)調(diào)的是,所有這些技術(shù)都只是一種工具和服務(wù),是用來輔助人類投資者的,只有HI(human intelligence,人類智能)+AI,才能實(shí)現(xiàn)混合智能,做出最好的投資決策。
在金融投資中,當(dāng)進(jìn)行日頻、周頻、月頻投資時(shí),很少利用高頻交易數(shù)據(jù)。那些關(guān)心高頻數(shù)據(jù)的人,很多是為了實(shí)現(xiàn)日內(nèi)的算法交易。這里其實(shí)有一個(gè)很有意思的問題:在做中低頻投資時(shí),高頻交易數(shù)據(jù)到底有沒有用?
智能投資的優(yōu)勢(shì)在于,從更廣泛更海量的原始數(shù)據(jù)里,抽取有效的投資信號(hào)。某種意義上來講,在金融投資這個(gè)大型博弈場里,誰擁有更多的數(shù)據(jù),誰對(duì)數(shù)據(jù)挖掘的更充分、更全面,誰就占有更多的先機(jī)。
從這個(gè)角度講,高頻數(shù)據(jù)應(yīng)該是有價(jià)值的,因?yàn)樗_實(shí)包含了更加豐富的信息。但是天下沒有免費(fèi)的午餐,高頻數(shù)據(jù)的信噪比很低,有時(shí)高頻數(shù)據(jù)所蘊(yùn)含的趨勢(shì)和規(guī)律與中低頻數(shù)據(jù)可能存在矛盾。
另外,雖然有高頻數(shù)據(jù)作為輸入,但是我們能夠利用的反饋信號(hào)(如收益),通常還是中低頻的。這種中低頻反饋信號(hào)對(duì)于高頻數(shù)據(jù)而言,密度很低且有效性存疑。
為了解決這些問題,我們的研究團(tuán)隊(duì)開發(fā)了一套基于自監(jiān)督對(duì)比學(xué)習(xí)的表征預(yù)訓(xùn)練方法。該方法的基本想法是:人為定義一些反饋信號(hào)用以提高反饋信號(hào)的密度,如果設(shè)計(jì)得當(dāng),它有可能作為高頻數(shù)據(jù)和中低頻預(yù)測目標(biāo)之間的橋梁。
為此,我們利用了兩種依賴關(guān)系:
一、空間依賴,指來自高頻數(shù)據(jù)和中低頻數(shù)據(jù)的信息,要在某種程度上保持一致;
二、時(shí)間依賴,指的是在時(shí)間軸上不太遠(yuǎn)的兩個(gè)高頻數(shù)據(jù),需要具有某種一致性。
有了這樣的自監(jiān)督對(duì)比學(xué)習(xí)方法,我們有望從高頻數(shù)據(jù)里去偽存真,找到對(duì)我們有用的信息。那么效果如何呢?
首先來看一下左邊這個(gè)圖,它是直接使用純粹的高頻數(shù)據(jù),不使用額外的自監(jiān)督對(duì)比學(xué)習(xí)方法。其中,紅點(diǎn)是未來一周按照股票價(jià)格走向衡量表現(xiàn)最差的20%股票,綠點(diǎn)是表現(xiàn)最好的20%股票。
可以看到,直接對(duì)比二者的高頻信號(hào),其實(shí)沒什么區(qū)別;但使用自監(jiān)督對(duì)比學(xué)習(xí)之后得到右圖,可以清晰地看到,頭部20%和尾部20%的區(qū)分力被明顯擴(kuò)大。
我們對(duì)自監(jiān)督對(duì)比學(xué)習(xí)進(jìn)行了更系統(tǒng)的評(píng)估,計(jì)算了它所對(duì)應(yīng)的Rank IC。
藍(lán)色:簡單使用中低頻(日頻)信號(hào);
橙色:把日頻信號(hào)和高頻信號(hào)簡單拼接在一起;
灰色:用自監(jiān)督對(duì)比學(xué)習(xí)技術(shù)從高頻數(shù)據(jù)中學(xué)到的因子。
可以看出,通過使用自監(jiān)督對(duì)比學(xué)習(xí),我們得到了更好的投資有效性。在將近一年的時(shí)間里,其整體預(yù)測效果明顯超越只使用日頻或者簡單拼接日頻+高頻的方法。
用自監(jiān)督對(duì)比學(xué)習(xí)方法解決了反饋信號(hào)密度的問題,但還有一個(gè)問題沒有回答——反饋信號(hào)的有效性。有關(guān)這個(gè)問題,我們需要考察兩點(diǎn):
一,頻率的差別。從中低頻數(shù)據(jù)中得到反饋信號(hào),去指導(dǎo)高頻學(xué)習(xí),這種頻率之間的跨越是不是需要一些技術(shù)來填補(bǔ);
二,投資鏈條很長,預(yù)測只是其中一環(huán),如果用下期的預(yù)測目標(biāo)作為反饋信號(hào),有可能并不能代表未來整體投資的收益,是否應(yīng)該重新考量如何定義反饋信號(hào)。
為了解決這些問題,我們發(fā)明了基于元學(xué)習(xí)的模塊,為預(yù)測模塊提供新的反饋信號(hào)。
圖中畫圈處(Meta Model)即是元學(xué)習(xí)模塊,它的輸入既有高頻數(shù)據(jù)也有低頻數(shù)據(jù),既有歷史數(shù)據(jù)又有未來數(shù)據(jù),在此基礎(chǔ)上為預(yù)測模型提供反饋信號(hào)。
而反饋信號(hào)好壞的評(píng)價(jià)準(zhǔn)則,是整個(gè)投資鏈條最后的收益。其實(shí)元學(xué)習(xí)是近年來人工智能領(lǐng)域的常用技術(shù),換句話說就是用機(jī)器學(xué)習(xí)來指導(dǎo)機(jī)器學(xué)習(xí)。預(yù)測模型是一個(gè)機(jī)器學(xué)習(xí)任務(wù),元學(xué)習(xí)也是一個(gè)機(jī)器學(xué)習(xí)任務(wù),后者對(duì)前者的訓(xùn)練過程進(jìn)行指導(dǎo)。
為了更好地展示元學(xué)習(xí)模塊的效果,我們限定它的行為——要求它只對(duì)未來20天的預(yù)測目標(biāo)進(jìn)行加權(quán)平均,用它來作為預(yù)測模型的反饋信號(hào)。從圖中可以看出通過引入元學(xué)習(xí)模塊,我們?cè)谀昊找娴膶用嫔嫌辛舜蠓忍岣摺?/p>
圖中綠色曲線表示元學(xué)習(xí)模塊給預(yù)測模塊提供反饋信號(hào);而藍(lán)色曲線表示用下一期的目標(biāo)作為反饋信號(hào)指導(dǎo)預(yù)測學(xué)習(xí)。
通過調(diào)整投資過程的交易成本,我們發(fā)現(xiàn)隨著交易成本的提升,元學(xué)習(xí)模塊會(huì)把權(quán)重更多的分配給更長期的目標(biāo)值。
換言之,交易成本越高,元學(xué)習(xí)模塊越希望我們頻繁交易,算法希望關(guān)注長期趨勢(shì)。這說明元學(xué)習(xí)模塊可以自動(dòng)學(xué)到有用信息,提高預(yù)測模型的反饋信號(hào)效果。
大家知道,金融投資有個(gè)很大的挑戰(zhàn):股票市場是動(dòng)態(tài)變化的,各種投資因子的有效性隨著時(shí)間此起彼伏;其中的悖論就是,我們不能確定哪一個(gè)因子在哪一個(gè)時(shí)間段更加有效。
面對(duì)這一復(fù)雜問題,我們并不是無能為力,至少能做如下的問題拆解:
第一,判斷一下當(dāng)前的市場狀態(tài)是否在歷史上曾經(jīng)出現(xiàn)過?一旦出現(xiàn)過,就可以利用歷史數(shù)據(jù)中的蛛絲馬跡,對(duì)當(dāng)前市場進(jìn)行處理;如果當(dāng)前市場狀態(tài)在歷史上從未出現(xiàn)過,說明這是異常的市場,其實(shí)我們也不必糾結(jié),“躺平”也許是最好的辦法。
第二,假設(shè)當(dāng)前市場狀態(tài)在歷史上曾經(jīng)出現(xiàn)過,我們需要對(duì)歷史數(shù)據(jù)進(jìn)行充分的學(xué)習(xí)和總結(jié),以希望從中找到有用的規(guī)律。那么相關(guān)的問題就是:歷史規(guī)律是否只有一種?如果有多種相互矛盾的規(guī)律,比如動(dòng)量和反轉(zhuǎn),又該如何學(xué)習(xí)?
第三,假設(shè)我們已經(jīng)可以學(xué)習(xí)了不同的歷史規(guī)律,那么針對(duì)當(dāng)前市場,該如何動(dòng)態(tài)選擇一種或者幾種歷史規(guī)律,做出最好的投資決策呢?
為了回答這些問題,我們研發(fā)了基于市場狀態(tài)調(diào)整和選擇投資策略的框架。
我們使用了自編碼器對(duì)市場狀態(tài)進(jìn)行表達(dá),再把這種表達(dá)傳給異常檢測模塊。如果異常檢測模塊對(duì)當(dāng)前市場狀態(tài)給予非常低的置信度,我們應(yīng)該采取被動(dòng)的投資策略。如果置信度比較高,說明我們有一定自信,可以通過組合歷史數(shù)據(jù)和歷史規(guī)律處理當(dāng)前情況。
右圖是異常市場檢測模塊的性能,藍(lán)色對(duì)應(yīng)指數(shù)波動(dòng),橙色對(duì)應(yīng)于異常檢測模塊給出的置信度。可以看見,2015年股災(zāi)附近,異常檢測模塊就給了很低的置信度,并且提前有所預(yù)警。
可能有人會(huì)說,當(dāng)時(shí)整個(gè)市場走勢(shì)異常肉眼可見,何必使用那么復(fù)雜的模型來判斷呢?
那我們?cè)倏匆粋€(gè)例子:2019年貿(mào)易戰(zhàn)期間的市場狀態(tài),變化其實(shí)沒有那么劇烈,人眼不太看出得來。但事實(shí)上當(dāng)時(shí)很多行業(yè)受到打擊,也有很多行業(yè)因此得到機(jī)會(huì),行業(yè)結(jié)構(gòu)的調(diào)整,單從指數(shù)上是看不到的,但是自編碼器就能充分感知。這就是為什么我們的模型,在2019年之初就有非常明確的預(yù)警信號(hào)。
當(dāng)我們能夠判斷當(dāng)前市場是異?;蛘V?,接下來的任務(wù),就是從歷史數(shù)據(jù)中找到未來可以借鑒的規(guī)律。
但難點(diǎn)在于,因?yàn)闅v史數(shù)據(jù)存在各種互不兼容的規(guī)律,這些規(guī)律反復(fù)出現(xiàn),不同時(shí)段出現(xiàn)的頻率也不穩(wěn)定。如果忽略規(guī)律的矛盾性,只簡單學(xué)習(xí)一種模型,那這種模型通常會(huì)顧此失彼,學(xué)到模糊的平均狀態(tài),對(duì)每一種歷史規(guī)律的刻畫都不到位。
我們的做法是:同時(shí)學(xué)習(xí)多個(gè)模型,希望這些模型盡可能不同,盡可能體現(xiàn)出各自的特點(diǎn),并且能夠?qū)κ袌鲇幸粋€(gè)非常好的解釋。
我們發(fā)現(xiàn),這個(gè)任務(wù)和最優(yōu)運(yùn)輸問題異曲同工。我們的任務(wù)是把每一條歷史數(shù)據(jù)分配到某個(gè)歷史規(guī)律之下。歷史數(shù)據(jù)相當(dāng)于最優(yōu)運(yùn)輸問題里的物品,歷史規(guī)律相當(dāng)于最優(yōu)運(yùn)輸問題里的目的地。而歷史數(shù)據(jù)和規(guī)律的契合度,就相當(dāng)于物品到達(dá)目的地的運(yùn)輸成本。
做了這個(gè)對(duì)應(yīng)之后,我們就可以利用最優(yōu)運(yùn)輸問題的各種優(yōu)化方法,幫我們實(shí)現(xiàn)高效的數(shù)據(jù)劃分。
下圖展示了基于最優(yōu)運(yùn)輸問題進(jìn)行數(shù)據(jù)劃分,得到的各種歷史模型之間的性能。
左邊是一個(gè)基線算法,采取的是簡單的多路神經(jīng)網(wǎng)絡(luò),沒有做預(yù)先的數(shù)據(jù)劃分;右邊這個(gè)圖展示的是基于最優(yōu)運(yùn)輸算法實(shí)現(xiàn)數(shù)據(jù)劃分之后再進(jìn)行學(xué)習(xí)的結(jié)果。左圖中,各個(gè)模型表現(xiàn)大差不差,相關(guān)性非常高,在各時(shí)段的表現(xiàn)都沒有那么亮眼。
相反,我們的方法可以學(xué)到相關(guān)性比較低的多個(gè)模型,這些模型在不同時(shí)間段的表現(xiàn)非常不同,這就給我們提供了機(jī)會(huì)——因?yàn)檫@些模型越不同,越此消彼漲,我們就越有機(jī)會(huì)用動(dòng)態(tài)的方式組合它們,最終應(yīng)對(duì)比較復(fù)雜的市場。
為了動(dòng)態(tài)組合這些模型,我們使用了注意力網(wǎng)絡(luò)。所謂注意力網(wǎng)絡(luò),是近年來人工智能領(lǐng)域非常有用的技術(shù)。從本質(zhì)上來講,它是對(duì)既有的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和參數(shù)根據(jù)外部輸入進(jìn)行調(diào)整,所以我們得到的不是一張靜態(tài)的神經(jīng)網(wǎng)絡(luò),而是隨著時(shí)間和外部信息動(dòng)態(tài)變化的神經(jīng)網(wǎng)絡(luò)。
正是利用這種動(dòng)態(tài)性,我們才有可能在跌蕩起伏的股市上保證常勝狀態(tài)。這個(gè)圖告訴我們,在使用了自適應(yīng)網(wǎng)絡(luò)之后,最終可以取得各種模型性能的上包絡(luò)。
俗話說:投資有風(fēng)險(xiǎn)、入市須謹(jǐn)慎。也就是說:風(fēng)險(xiǎn)控制是金融投資里面非常重要的環(huán)節(jié)。一個(gè)人之所以成為投資高手,不是因?yàn)樗馨l(fā)現(xiàn)一兩個(gè)阿爾法因子,而是他能夠有效地控制風(fēng)險(xiǎn),能夠在股市里面找到常勝的規(guī)律。
那么,投資過程中的風(fēng)險(xiǎn)有哪些類別?
首先,未來市場充滿未知,我們總是會(huì)面臨投資不確定性,這就是所謂的固有風(fēng)險(xiǎn)。
其次,在使用預(yù)測模型輔助投資時(shí),因?yàn)槟P捅旧淼恼`差,會(huì)引入額外的模型風(fēng)險(xiǎn)。
只有在構(gòu)建投資組合時(shí),把所有這些風(fēng)險(xiǎn)都考慮在內(nèi),才能在投資時(shí)立于不敗之地。
人們雖然對(duì)于風(fēng)險(xiǎn)因子的重要性沒有什么異議,但是對(duì)風(fēng)險(xiǎn)因子的研究進(jìn)展卻非常緩慢。因?yàn)閭鹘y(tǒng)因子的構(gòu)建需要依賴專家的理論創(chuàng)新和經(jīng)驗(yàn)積累,同時(shí)對(duì)于不同的市場需要用不同的方式人工去定義因子。
大家知道,從最早的CAPM模型到Fama TFM模型經(jīng)過了31年,也無外乎增加了size、value這幾個(gè)風(fēng)險(xiǎn)因子。而從Fama TFM發(fā)展到BARRA CNE5,經(jīng)過了20年,也只是增加了動(dòng)量、成長等為數(shù)不多的幾個(gè)因子。
在風(fēng)險(xiǎn)因子挖掘方面人工智能大有所為,因?yàn)槿斯ぶ悄芸梢宰詣?dòng)從數(shù)據(jù)當(dāng)中發(fā)現(xiàn)有用的規(guī)律,可以把風(fēng)險(xiǎn)因子的刻畫做得更充實(shí)、有效、及時(shí)。在人工智能的眼中,所謂固有風(fēng)險(xiǎn)因子就是要學(xué)習(xí)出市場狀態(tài)的正交基;而所謂模型風(fēng)險(xiǎn)就是刻畫出預(yù)測結(jié)果的置信度和相關(guān)性。
具體而言,針對(duì)固有風(fēng)險(xiǎn)的學(xué)習(xí),我們的任務(wù)是利用少量獨(dú)立的風(fēng)險(xiǎn)因子解釋市場,未來希望投資組合在這些因子上有充分的暴露。
用數(shù)學(xué)語言來描述,就是希望從高維非線性的原始數(shù)據(jù)空間,變化到低維的隱式風(fēng)險(xiǎn)因子空間。
為了實(shí)現(xiàn)這一點(diǎn),要有一個(gè)優(yōu)化目標(biāo),我們希望在低維的隱式風(fēng)險(xiǎn)因子空間里,各維度盡量獨(dú)立,同時(shí)對(duì)市場解釋能力足夠強(qiáng),這就對(duì)應(yīng)于幻燈片里展示的優(yōu)化式子。
這個(gè)式子的藍(lán)色部分,表達(dá)的是最大化股票收益在這些因子上的投影;紅色描述的是各因子之間的相關(guān)性,希望最小化相關(guān)性或者最大化差異度。
通過這個(gè)優(yōu)化過程,我們可以自動(dòng)學(xué)習(xí)出一組風(fēng)險(xiǎn)因子。它們可能不像傳統(tǒng)風(fēng)險(xiǎn)因子那么容易解釋,但它們對(duì)市場的描述更充分,并且先天具有非線性性。在構(gòu)建投資組合時(shí),效果更好。
接下來,我們談一談模型風(fēng)險(xiǎn)。單只股票的模型風(fēng)險(xiǎn)很容易理解,描述的是股票實(shí)際收益低于預(yù)期收益的情況——但并不是單只股票模型風(fēng)險(xiǎn)大,投資組合的風(fēng)險(xiǎn)就一定大。
比如左圖里兩只股票,預(yù)測得分都很高,但實(shí)際收益很低,顯然單點(diǎn)的模型風(fēng)險(xiǎn)和組合風(fēng)險(xiǎn)是一致的。右圖兩個(gè)股票的預(yù)測值很高,但是實(shí)際上一個(gè)高收益一個(gè)低收益,這種情況下投資組合的風(fēng)險(xiǎn)其實(shí)是不高的。
投資組合之所以要做風(fēng)險(xiǎn)控制,就是希望至少有一些股票表示強(qiáng)勁,不要大家同漲同跌,所以在這種情況下我們認(rèn)為投資組合的模型風(fēng)險(xiǎn)并不高。
換句話說,投資組合的模型風(fēng)險(xiǎn),需要考慮股票之間的關(guān)系,而不是簡單由每支股票自己的單點(diǎn)模型風(fēng)險(xiǎn)所決定的。
為了更好地給模型風(fēng)險(xiǎn)建模,我們考慮到圖神經(jīng)網(wǎng)絡(luò),在這里面每個(gè)點(diǎn)描述的是單只股票的模型風(fēng)險(xiǎn),邊描述的是兩只股票之間的關(guān)聯(lián)關(guān)系。
在整個(gè)圖神經(jīng)網(wǎng)絡(luò)迭代的過程中,單點(diǎn)模型風(fēng)險(xiǎn)會(huì)不斷修正投資組合的模型風(fēng)險(xiǎn),反過來投資組合模型也會(huì)修正單點(diǎn)的模型風(fēng)險(xiǎn)。所以當(dāng)整個(gè)圖神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)收斂之后,我們就得到了一個(gè)整體的模型風(fēng)險(xiǎn)矩陣Σμ,這個(gè)矩陣加上之前自動(dòng)學(xué)習(xí)出來的隱式固有風(fēng)險(xiǎn)的矩陣,共同用于投資組合的優(yōu)化。
我們對(duì)于這種基于AI的風(fēng)控方法進(jìn)行了評(píng)測。右圖中,藍(lán)點(diǎn)表示基線方法(BARRA模型),紅點(diǎn)使用了隱式固有風(fēng)險(xiǎn)技術(shù),而綠點(diǎn)則同時(shí)考慮了隱式固有風(fēng)險(xiǎn)和基于圖神經(jīng)網(wǎng)絡(luò)模型組合風(fēng)險(xiǎn)。
從圖中可以清楚地看到,使用新的風(fēng)險(xiǎn)因子確實(shí)可以得到更好的收益和風(fēng)險(xiǎn)的平衡。
當(dāng)我們有了好的投資組合之后,最后一公里的事情就是執(zhí)行換倉的訂單。
這個(gè)事情非常重要,因?yàn)榻o定一個(gè)換倉的訂單,不同的執(zhí)行方案會(huì)對(duì)應(yīng)完全不同的交易成本,所以很多有實(shí)力的交易機(jī)構(gòu)都會(huì)在日級(jí)別元訂單的基礎(chǔ)上,關(guān)注小時(shí)、分鐘甚至秒級(jí)的操作,希望能控制交易成本。
而一個(gè)訂單執(zhí)行方法的好壞,通常我們會(huì)用訂單完成后的平均價(jià)格去衡量。
這張圖是訂單執(zhí)行策略的基本概念,如果有一組訂單把他們按照時(shí)間均勻執(zhí)行,就會(huì)得到按照時(shí)間加權(quán)的平均價(jià)格。
如果可以預(yù)測每一個(gè)時(shí)間段的交易量TWAP,并且按照這個(gè)預(yù)測結(jié)果調(diào)整訂單速度,就會(huì)得到按照交易量加權(quán)平均的價(jià)格VWAP。
它們都是市面上常用的交易算法,但顯然它們都不是最優(yōu)的,因?yàn)槿绻覀冋嬗斜臼略趦r(jià)值最高點(diǎn)去執(zhí)行訂單,一定會(huì)有更好的平均價(jià)格——但這個(gè)事情又不是那么簡單,因?yàn)樵谌魏螘r(shí)間點(diǎn)都有交易量的上限,很可能在價(jià)格最高點(diǎn)沒有足夠的市場容量去完成訂單的交易。
因此,訂單的執(zhí)行不是一件簡單的事情,需要很好的算法支撐。
我們嘗試了使用強(qiáng)化學(xué)習(xí)來實(shí)現(xiàn)自動(dòng)的訂單執(zhí)行。強(qiáng)化學(xué)習(xí)是人工智能領(lǐng)域非常重要的門類,大家都聽過的AlphaGo就是使用深度強(qiáng)化學(xué)習(xí)的算法。
我們的訂單執(zhí)行任務(wù)因?yàn)榭梢院芎玫亟3蓮?qiáng)化學(xué)習(xí)的問題:給定一個(gè)狀態(tài)(市場信息、剩余時(shí)間、剩余訂單量),選擇合適的動(dòng)作(控制當(dāng)前訂單執(zhí)行的速度),從而得到某種獎(jiǎng)勵(lì)(比如訂單執(zhí)行后的平均交易成本、訂單是否如期完成、瞬間的交易量是否過大等等)。
看起來強(qiáng)化學(xué)習(xí)是非常好的工具,可以解決訂單學(xué)習(xí)的問題,但如果大家是行家就知道,強(qiáng)化學(xué)習(xí)是不容易駕馭的工具。
強(qiáng)化學(xué)習(xí)有很多缺點(diǎn),其中包括:訓(xùn)練過程不穩(wěn)定;樣本效率比較低。為了解決這些問題我們發(fā)明了一套新的技術(shù),叫做先知教練,它具有完美信息的訪問權(quán),可以看到未來的價(jià)格和交易量,不需要去猜,所以可以通過優(yōu)化的手段得到全局最優(yōu)的執(zhí)行策略。
有了先知教練之后,可以用它為基礎(chǔ),利用策略蒸餾的方式,把它的所知所得傳遞給RL智能體,以此提高學(xué)習(xí)智能體的學(xué)習(xí)效率和穩(wěn)定性。
最終實(shí)際使用AI模型在線實(shí)現(xiàn)訂單交易時(shí),我們當(dāng)然不能使用先知教練,但被完美先知教練調(diào)教出來的智能體已經(jīng)有了很好的表現(xiàn)。
到此為止我向大家介紹了數(shù)據(jù)智能、智能預(yù)測、智能策略、智能交易等研究的進(jìn)展。當(dāng)然,四年的積累遠(yuǎn)比我今天介紹的內(nèi)容多得多,如果大家有興趣,可以通過微軟亞洲研究院創(chuàng)新匯的平臺(tái)和我們建立長期的戰(zhàn)略研究合作關(guān)系,共同去探索智能投資的邊界。
最后還想和大家分享一下我關(guān)于智能投資研究與實(shí)戰(zhàn)的思考。通過這4年的親身經(jīng)歷,我發(fā)現(xiàn)金融投資的實(shí)戰(zhàn)和研究之間存在巨大的鴻溝,很多算法僅在論文里的小型數(shù)據(jù)上有效果,拿到實(shí)盤上測試表現(xiàn)就大相徑庭。
其中一部分原因是這些研究者并不了解金融場景特有的實(shí)現(xiàn)細(xì)節(jié),缺乏領(lǐng)域知識(shí),缺乏穩(wěn)定公開的數(shù)據(jù)源等等。我們只有填平這個(gè)鴻溝,架起連接研究和實(shí)戰(zhàn)的橋梁,才能讓學(xué)界和金融業(yè)界共同促進(jìn)智能投資的發(fā)展。
懷著這樣的愿望,我們團(tuán)隊(duì)開源了一個(gè)項(xiàng)目叫Qlib,是全球第一個(gè)智能輔助量化投資的技術(shù)框架。我們采用MIT協(xié)議,將我們的研究環(huán)境,向廣大金融從業(yè)者開放,未來也會(huì)逐步將我們的研究成果通過這個(gè)平臺(tái)進(jìn)行分享。這個(gè)開源項(xiàng)目剛剛上線幾個(gè)月就得到很多關(guān)注,在GitHub上收獲了超過五千顆星,很多國際知名的投資機(jī)構(gòu)都因?yàn)檫@個(gè)項(xiàng)目和我們建立了交流和合作。
那么我們?yōu)槭裁醋鲞@個(gè)開源項(xiàng)目呢?它對(duì)促進(jìn)金融實(shí)戰(zhàn)和研究的融合能夠起到什么作用?
在做金融投資研究的過程中,我們需要構(gòu)建數(shù)據(jù)集,這里其實(shí)有非常多的陷阱。比如,左圖所示的幸存者偏差:其實(shí)很多股票在歷史上都消失了,今天幸存的股票是比較常見有韌性的股票。
如果我們只關(guān)注存留的股票,忽略當(dāng)時(shí)市場上存在的股票,我們學(xué)習(xí)的環(huán)境就會(huì)與當(dāng)時(shí)的市場不一致,就會(huì)出現(xiàn)學(xué)習(xí)的時(shí)候不錯(cuò),但拿到實(shí)盤上損失慘重的情況。
再比如,我們?cè)跇?gòu)建數(shù)據(jù)集時(shí),經(jīng)常需要對(duì)股票價(jià)格進(jìn)行處理。通常有兩種方式,一是前復(fù)權(quán)價(jià)格,也就是把歷史股價(jià)按除權(quán)后的價(jià)格進(jìn)行調(diào)整,二是后復(fù)權(quán)價(jià)格,就是將當(dāng)前股價(jià)按除權(quán)前的價(jià)格進(jìn)行調(diào)整。
其實(shí)無論哪一種處理辦法聽起來好像都沒有問題,但是當(dāng)我們把它用于機(jī)器學(xué)習(xí)和人工智能的時(shí)候,就會(huì)出現(xiàn)一些隱患:
假設(shè)我們使用前復(fù)權(quán),就會(huì)把股票未來的走勢(shì)通過復(fù)權(quán)的行為融入到歷史數(shù)據(jù)中去,這時(shí)學(xué)習(xí)過程中就會(huì)出現(xiàn)未來信息泄露的問題,學(xué)到了看似很有效的模型,在真實(shí)場景中使用就會(huì)出現(xiàn)很大的紕漏。
回測的時(shí)候也是一樣,比如很多論文都沒有考慮漲停不可買入,跌停不可賣出的現(xiàn)象,沒有考慮最低交易量的種種限制,所以一旦把這些因素考慮在內(nèi),回測出的超額收益會(huì)有非常大幅度的變化。
所以我們認(rèn)為有一套通用的、非常接近實(shí)盤操作的開源框架,是促進(jìn)金融投資、智能投資方面的研究和實(shí)戰(zhàn)的必由之路。
除了前面提到的幾點(diǎn)以外,Qlib還在其他很多方面做了細(xì)致的工作。當(dāng)然我們不可能面面俱到,所以我們非常期待金融界的同行去試用這個(gè)項(xiàng)目,發(fā)現(xiàn)其中的問題,和我們一起把這個(gè)做的更好,在學(xué)界和業(yè)界之間架起更加通暢的橋梁。
最后,我想說:金融領(lǐng)域的智能化進(jìn)程剛剛拉開帷幕,雖然我們和合作伙伴一起在AI投資方面進(jìn)行了一些令人鼓舞的研究嘗試,但未來的路還很長。所以,我們呼吁大家一起努力,借助整個(gè)AI研究社區(qū)的力量,共同推動(dòng)金融科技的發(fā)展。聯(lián)手攻克核心技術(shù),才能水漲船高,共同繁榮。謝謝大家!
雷鋒網(wǎng)雷鋒網(wǎng)雷鋒網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。