微軟亞洲研究院副院長(zhǎng)劉鐵巖：讓智能投資擺脫「紙上談兵」

本文作者：周蕾

2021-06-24 20:33

導(dǎo)語(yǔ)：智能投資的“戰(zhàn)績(jī)”難免讓人疑惑：市場(chǎng)真的有規(guī)律嗎？

AI+投資其實(shí)并不新鮮，但為什么不少模型和算法的表現(xiàn)都不盡如人意？

在微軟亞洲研究院副院長(zhǎng)劉鐵巖看來(lái)，原因之一是動(dòng)態(tài)變化的股市里，人們往往很難確定各種投資因子到底在哪個(gè)時(shí)段更加有效，如果機(jī)器能識(shí)別出當(dāng)時(shí)的市場(chǎng)是否“正?！?，學(xué)透不同的歷史規(guī)律，那無(wú)疑會(huì)給投資策略帶來(lái)更有效的決策依據(jù)。

創(chuàng)辦時(shí)間超過(guò)二十年的微軟亞洲研究院被譽(yù)為“AI黃埔軍?！?，AI+投資也正是這家科研機(jī)構(gòu)長(zhǎng)期關(guān)注的領(lǐng)域之一。近日，在通聯(lián)數(shù)據(jù)主辦的全球資產(chǎn)管理數(shù)字化轉(zhuǎn)型峰會(huì)上，副院長(zhǎng)劉鐵巖就以《共同探索智能投資研究的新邊界》為主題進(jìn)行了分享。

劉鐵巖從高頻數(shù)據(jù)、市場(chǎng)狀態(tài)、交易成本等多個(gè)角度出發(fā)，詳細(xì)介紹了他們對(duì)于智能化投資的研究，并討論了金融投資的實(shí)戰(zhàn)和研究之間存在的巨大鴻溝：算法有時(shí)只在論文的小型數(shù)據(jù)上有效果，研究者不清楚金融場(chǎng)景特有的實(shí)現(xiàn)細(xì)節(jié)，缺乏領(lǐng)域知識(shí)，缺乏穩(wěn)定公開(kāi)的數(shù)據(jù)源等等。

以下是劉鐵巖的演講內(nèi)容，雷鋒網(wǎng)AI金融評(píng)論做了不改變?cè)獾恼砗途庉嫞?/strong>

今天跟大家探討一下我們?cè)谥悄芡顿Y研究方面的心得體會(huì)。

微軟亞洲研究院是微軟在海外最大的基礎(chǔ)和應(yīng)用型研究機(jī)構(gòu)，在過(guò)去20年間，我們?cè)谟?jì)算機(jī)領(lǐng)域，全球最頂級(jí)的會(huì)議和期刊上發(fā)表了大量學(xué)術(shù)成果，被MIT技術(shù)評(píng)論譽(yù)為全球最火的計(jì)算機(jī)實(shí)驗(yàn)室。中國(guó)各大高校的學(xué)界精英、各大高科技企業(yè)的領(lǐng)軍人物，很多都是微軟亞洲研究院培養(yǎng)的院友。

雖然我來(lái)自這樣一個(gè)基礎(chǔ)科研機(jī)構(gòu)，但和金融也不是毫無(wú)關(guān)系。2017年微軟亞洲研究院成立了創(chuàng)新匯，它的目標(biāo)是和中國(guó)各行各業(yè)領(lǐng)軍企業(yè)一起探索智能化、數(shù)字化轉(zhuǎn)型。正是借助創(chuàng)新匯的平臺(tái)，我有幸和金融界的朋友探討智能化投資話題，也激起了我本人的興趣。

所以在過(guò)去的一段時(shí)間里，我們針對(duì)智能投資做了一系列的研究工作，這也正是今天想要和大家分享的內(nèi)容。

作為一名學(xué)者，我關(guān)心的并不是股市的風(fēng)云變換、大盤的漲跌起伏，相反更關(guān)注的是投資背后的科學(xué)規(guī)律，希望從表象能抽取出行之有效的技術(shù)框架，能夠服務(wù)更多的金融機(jī)構(gòu)和行業(yè)。

我們雖然關(guān)注的是金融投資方面的研究，但是也不完全是紙上談兵，過(guò)去4年中我們研發(fā)了一系列金融投資場(chǎng)景下的技術(shù)，也和合作伙伴一起進(jìn)行了AI技術(shù)的實(shí)盤測(cè)試。

這張圖展示的是其中一個(gè)AI模型在過(guò)去一年的表現(xiàn)，對(duì)標(biāo)的是中證500，與指數(shù)相比大概有超過(guò)30%的超額收益。

不過(guò)，今天和大家分享的并不是這個(gè)模型，而是從更廣泛的角度探討AI對(duì)于資管、投資行業(yè)有什么樣的啟示。

在過(guò)去幾年間，我們開(kāi)發(fā)了一套自頂向下、比較完善的智能投資技術(shù)框架，包含：

數(shù)據(jù)智能：從海量的數(shù)據(jù)當(dāng)中挖掘有效的α因子；

智能預(yù)測(cè)：針對(duì)市場(chǎng)動(dòng)態(tài)性自適應(yīng)地訓(xùn)練高效的人工智能模型；

智能策略：基于AI的風(fēng)險(xiǎn)分析和投資組合構(gòu)建，

智能交易：用AI技術(shù)輔助自動(dòng)化訂單執(zhí)行。

不過(guò)，這里我想強(qiáng)調(diào)的是，所有這些技術(shù)都只是一種工具和服務(wù)，是用來(lái)輔助人類投資者的，只有HI（human intelligence，人類智能）+AI，才能實(shí)現(xiàn)混合智能，做出最好的投資決策。

如何從海量的高頻數(shù)據(jù)中挖掘有效的投資因子？

在金融投資中，當(dāng)進(jìn)行日頻、周頻、月頻投資時(shí)，很少利用高頻交易數(shù)據(jù)。那些關(guān)心高頻數(shù)據(jù)的人，很多是為了實(shí)現(xiàn)日內(nèi)的算法交易。這里其實(shí)有一個(gè)很有意思的問(wèn)題：在做中低頻投資時(shí)，高頻交易數(shù)據(jù)到底有沒(méi)有用？

智能投資的優(yōu)勢(shì)在于，從更廣泛更海量的原始數(shù)據(jù)里，抽取有效的投資信號(hào)。某種意義上來(lái)講，在金融投資這個(gè)大型博弈場(chǎng)里，誰(shuí)擁有更多的數(shù)據(jù)，誰(shuí)對(duì)數(shù)據(jù)挖掘的更充分、更全面，誰(shuí)就占有更多的先機(jī)。

從這個(gè)角度講，高頻數(shù)據(jù)應(yīng)該是有價(jià)值的，因?yàn)樗_實(shí)包含了更加豐富的信息。但是天下沒(méi)有免費(fèi)的午餐，高頻數(shù)據(jù)的信噪比很低，有時(shí)高頻數(shù)據(jù)所蘊(yùn)含的趨勢(shì)和規(guī)律與中低頻數(shù)據(jù)可能存在矛盾。

另外，雖然有高頻數(shù)據(jù)作為輸入，但是我們能夠利用的反饋信號(hào)（如收益），通常還是中低頻的。這種中低頻反饋信號(hào)對(duì)于高頻數(shù)據(jù)而言，密度很低且有效性存疑。

為了解決這些問(wèn)題，我們的研究團(tuán)隊(duì)開(kāi)發(fā)了一套基于自監(jiān)督對(duì)比學(xué)習(xí)的表征預(yù)訓(xùn)練方法。該方法的基本想法是：人為定義一些反饋信號(hào)用以提高反饋信號(hào)的密度，如果設(shè)計(jì)得當(dāng)，它有可能作為高頻數(shù)據(jù)和中低頻預(yù)測(cè)目標(biāo)之間的橋梁。

為此，我們利用了兩種依賴關(guān)系：

一、空間依賴，指來(lái)自高頻數(shù)據(jù)和中低頻數(shù)據(jù)的信息，要在某種程度上保持一致；

二、時(shí)間依賴，指的是在時(shí)間軸上不太遠(yuǎn)的兩個(gè)高頻數(shù)據(jù)，需要具有某種一致性。

有了這樣的自監(jiān)督對(duì)比學(xué)習(xí)方法，我們有望從高頻數(shù)據(jù)里去偽存真，找到對(duì)我們有用的信息。那么效果如何呢？

首先來(lái)看一下左邊這個(gè)圖，它是直接使用純粹的高頻數(shù)據(jù)，不使用額外的自監(jiān)督對(duì)比學(xué)習(xí)方法。其中，紅點(diǎn)是未來(lái)一周按照股票價(jià)格走向衡量表現(xiàn)最差的20%股票，綠點(diǎn)是表現(xiàn)最好的20%股票。

可以看到，直接對(duì)比二者的高頻信號(hào)，其實(shí)沒(méi)什么區(qū)別；但使用自監(jiān)督對(duì)比學(xué)習(xí)之后得到右圖，可以清晰地看到，頭部20%和尾部20%的區(qū)分力被明顯擴(kuò)大。

我們對(duì)自監(jiān)督對(duì)比學(xué)習(xí)進(jìn)行了更系統(tǒng)的評(píng)估，計(jì)算了它所對(duì)應(yīng)的Rank IC。

藍(lán)色：簡(jiǎn)單使用中低頻（日頻）信號(hào)；

橙色：把日頻信號(hào)和高頻信號(hào)簡(jiǎn)單拼接在一起；

灰色：用自監(jiān)督對(duì)比學(xué)習(xí)技術(shù)從高頻數(shù)據(jù)中學(xué)到的因子。

可以看出，通過(guò)使用自監(jiān)督對(duì)比學(xué)習(xí)，我們得到了更好的投資有效性。在將近一年的時(shí)間里，其整體預(yù)測(cè)效果明顯超越只使用日頻或者簡(jiǎn)單拼接日頻+高頻的方法。

用自監(jiān)督對(duì)比學(xué)習(xí)方法解決了反饋信號(hào)密度的問(wèn)題，但還有一個(gè)問(wèn)題沒(méi)有回答——反饋信號(hào)的有效性。有關(guān)這個(gè)問(wèn)題，我們需要考察兩點(diǎn)：

一，頻率的差別。從中低頻數(shù)據(jù)中得到反饋信號(hào)，去指導(dǎo)高頻學(xué)習(xí)，這種頻率之間的跨越是不是需要一些技術(shù)來(lái)填補(bǔ)；

二，投資鏈條很長(zhǎng)，預(yù)測(cè)只是其中一環(huán)，如果用下期的預(yù)測(cè)目標(biāo)作為反饋信號(hào)，有可能并不能代表未來(lái)整體投資的收益，是否應(yīng)該重新考量如何定義反饋信號(hào)。

為了解決這些問(wèn)題，我們發(fā)明了基于元學(xué)習(xí)的模塊，為預(yù)測(cè)模塊提供新的反饋信號(hào)。

圖中畫圈處（Meta Model）即是元學(xué)習(xí)模塊，它的輸入既有高頻數(shù)據(jù)也有低頻數(shù)據(jù)，既有歷史數(shù)據(jù)又有未來(lái)數(shù)據(jù)，在此基礎(chǔ)上為預(yù)測(cè)模型提供反饋信號(hào)。

而反饋信號(hào)好壞的評(píng)價(jià)準(zhǔn)則，是整個(gè)投資鏈條最后的收益。其實(shí)元學(xué)習(xí)是近年來(lái)人工智能領(lǐng)域的常用技術(shù)，換句話說(shuō)就是用機(jī)器學(xué)習(xí)來(lái)指導(dǎo)機(jī)器學(xué)習(xí)。預(yù)測(cè)模型是一個(gè)機(jī)器學(xué)習(xí)任務(wù)，元學(xué)習(xí)也是一個(gè)機(jī)器學(xué)習(xí)任務(wù)，后者對(duì)前者的訓(xùn)練過(guò)程進(jìn)行指導(dǎo)。

為了更好地展示元學(xué)習(xí)模塊的效果，我們限定它的行為——要求它只對(duì)未來(lái)20天的預(yù)測(cè)目標(biāo)進(jìn)行加權(quán)平均，用它來(lái)作為預(yù)測(cè)模型的反饋信號(hào)。從圖中可以看出通過(guò)引入元學(xué)習(xí)模塊，我們?cè)谀昊找娴膶用嫔嫌辛舜蠓忍岣摺?/p>

圖中綠色曲線表示元學(xué)習(xí)模塊給預(yù)測(cè)模塊提供反饋信號(hào)；而藍(lán)色曲線表示用下一期的目標(biāo)作為反饋信號(hào)指導(dǎo)預(yù)測(cè)學(xué)習(xí)。

通過(guò)調(diào)整投資過(guò)程的交易成本，我們發(fā)現(xiàn)隨著交易成本的提升，元學(xué)習(xí)模塊會(huì)把權(quán)重更多的分配給更長(zhǎng)期的目標(biāo)值。

換言之，交易成本越高，元學(xué)習(xí)模塊越希望我們頻繁交易，算法希望關(guān)注長(zhǎng)期趨勢(shì)。這說(shuō)明元學(xué)習(xí)模塊可以自動(dòng)學(xué)到有用信息，提高預(yù)測(cè)模型的反饋信號(hào)效果。

如何基于市場(chǎng)狀態(tài)，調(diào)整投資策略？

大家知道，金融投資有個(gè)很大的挑戰(zhàn)：股票市場(chǎng)是動(dòng)態(tài)變化的，各種投資因子的有效性隨著時(shí)間此起彼伏；其中的悖論就是，我們不能確定哪一個(gè)因子在哪一個(gè)時(shí)間段更加有效。

面對(duì)這一復(fù)雜問(wèn)題，我們并不是無(wú)能為力，至少能做如下的問(wèn)題拆解：

第一，判斷一下當(dāng)前的市場(chǎng)狀態(tài)是否在歷史上曾經(jīng)出現(xiàn)過(guò)？一旦出現(xiàn)過(guò)，就可以利用歷史數(shù)據(jù)中的蛛絲馬跡，對(duì)當(dāng)前市場(chǎng)進(jìn)行處理；如果當(dāng)前市場(chǎng)狀態(tài)在歷史上從未出現(xiàn)過(guò)，說(shuō)明這是異常的市場(chǎng)，其實(shí)我們也不必糾結(jié)，“躺平”也許是最好的辦法。

第二，假設(shè)當(dāng)前市場(chǎng)狀態(tài)在歷史上曾經(jīng)出現(xiàn)過(guò)，我們需要對(duì)歷史數(shù)據(jù)進(jìn)行充分的學(xué)習(xí)和總結(jié)，以希望從中找到有用的規(guī)律。那么相關(guān)的問(wèn)題就是：歷史規(guī)律是否只有一種？如果有多種相互矛盾的規(guī)律，比如動(dòng)量和反轉(zhuǎn)，又該如何學(xué)習(xí)？

第三，假設(shè)我們已經(jīng)可以學(xué)習(xí)了不同的歷史規(guī)律，那么針對(duì)當(dāng)前市場(chǎng)，該如何動(dòng)態(tài)選擇一種或者幾種歷史規(guī)律，做出最好的投資決策呢？

為了回答這些問(wèn)題，我們研發(fā)了基于市場(chǎng)狀態(tài)調(diào)整和選擇投資策略的框架。

我們使用了自編碼器對(duì)市場(chǎng)狀態(tài)進(jìn)行表達(dá)，再把這種表達(dá)傳給異常檢測(cè)模塊。如果異常檢測(cè)模塊對(duì)當(dāng)前市場(chǎng)狀態(tài)給予非常低的置信度，我們應(yīng)該采取被動(dòng)的投資策略。如果置信度比較高，說(shuō)明我們有一定自信，可以通過(guò)組合歷史數(shù)據(jù)和歷史規(guī)律處理當(dāng)前情況。

右圖是異常市場(chǎng)檢測(cè)模塊的性能，藍(lán)色對(duì)應(yīng)指數(shù)波動(dòng)，橙色對(duì)應(yīng)于異常檢測(cè)模塊給出的置信度?？梢钥匆?jiàn)，2015年股災(zāi)附近，異常檢測(cè)模塊就給了很低的置信度，并且提前有所預(yù)警。

可能有人會(huì)說(shuō)，當(dāng)時(shí)整個(gè)市場(chǎng)走勢(shì)異常肉眼可見(jiàn)，何必使用那么復(fù)雜的模型來(lái)判斷呢？

那我們?cè)倏匆粋€(gè)例子：2019年貿(mào)易戰(zhàn)期間的市場(chǎng)狀態(tài)，變化其實(shí)沒(méi)有那么劇烈，人眼不太看出得來(lái)。但事實(shí)上當(dāng)時(shí)很多行業(yè)受到打擊，也有很多行業(yè)因此得到機(jī)會(huì)，行業(yè)結(jié)構(gòu)的調(diào)整，單從指數(shù)上是看不到的，但是自編碼器就能充分感知。這就是為什么我們的模型，在2019年之初就有非常明確的預(yù)警信號(hào)。

當(dāng)我們能夠判斷當(dāng)前市場(chǎng)是異?；蛘Ｖ?，接下來(lái)的任務(wù)，就是從歷史數(shù)據(jù)中找到未來(lái)可以借鑒的規(guī)律。

但難點(diǎn)在于，因?yàn)闅v史數(shù)據(jù)存在各種互不兼容的規(guī)律，這些規(guī)律反復(fù)出現(xiàn)，不同時(shí)段出現(xiàn)的頻率也不穩(wěn)定。如果忽略規(guī)律的矛盾性，只簡(jiǎn)單學(xué)習(xí)一種模型，那這種模型通常會(huì)顧此失彼，學(xué)到模糊的平均狀態(tài)，對(duì)每一種歷史規(guī)律的刻畫都不到位。

我們的做法是：同時(shí)學(xué)習(xí)多個(gè)模型，希望這些模型盡可能不同，盡可能體現(xiàn)出各自的特點(diǎn)，并且能夠?qū)κ袌?chǎng)有一個(gè)非常好的解釋。

我們發(fā)現(xiàn)，這個(gè)任務(wù)和最優(yōu)運(yùn)輸問(wèn)題異曲同工。我們的任務(wù)是把每一條歷史數(shù)據(jù)分配到某個(gè)歷史規(guī)律之下。歷史數(shù)據(jù)相當(dāng)于最優(yōu)運(yùn)輸問(wèn)題里的物品，歷史規(guī)律相當(dāng)于最優(yōu)運(yùn)輸問(wèn)題里的目的地。而歷史數(shù)據(jù)和規(guī)律的契合度，就相當(dāng)于物品到達(dá)目的地的運(yùn)輸成本。

做了這個(gè)對(duì)應(yīng)之后，我們就可以利用最優(yōu)運(yùn)輸問(wèn)題的各種優(yōu)化方法，幫我們實(shí)現(xiàn)高效的數(shù)據(jù)劃分。

下圖展示了基于最優(yōu)運(yùn)輸問(wèn)題進(jìn)行數(shù)據(jù)劃分，得到的各種歷史模型之間的性能。

左邊是一個(gè)基線算法，采取的是簡(jiǎn)單的多路神經(jīng)網(wǎng)絡(luò)，沒(méi)有做預(yù)先的數(shù)據(jù)劃分；右邊這個(gè)圖展示的是基于最優(yōu)運(yùn)輸算法實(shí)現(xiàn)數(shù)據(jù)劃分之后再進(jìn)行學(xué)習(xí)的結(jié)果。左圖中，各個(gè)模型表現(xiàn)大差不差，相關(guān)性非常高，在各時(shí)段的表現(xiàn)都沒(méi)有那么亮眼。

相反，我們的方法可以學(xué)到相關(guān)性比較低的多個(gè)模型，這些模型在不同時(shí)間段的表現(xiàn)非常不同，這就給我們提供了機(jī)會(huì)——因?yàn)檫@些模型越不同，越此消彼漲，我們就越有機(jī)會(huì)用動(dòng)態(tài)的方式組合它們，最終應(yīng)對(duì)比較復(fù)雜的市場(chǎng)。

為了動(dòng)態(tài)組合這些模型，我們使用了注意力網(wǎng)絡(luò)。所謂注意力網(wǎng)絡(luò)，是近年來(lái)人工智能領(lǐng)域非常有用的技術(shù)。從本質(zhì)上來(lái)講，它是對(duì)既有的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和參數(shù)根據(jù)外部輸入進(jìn)行調(diào)整，所以我們得到的不是一張靜態(tài)的神經(jīng)網(wǎng)絡(luò)，而是隨著時(shí)間和外部信息動(dòng)態(tài)變化的神經(jīng)網(wǎng)絡(luò)。

正是利用這種動(dòng)態(tài)性，我們才有可能在跌蕩起伏的股市上保證常勝狀態(tài)。這個(gè)圖告訴我們，在使用了自適應(yīng)網(wǎng)絡(luò)之后，最終可以取得各種模型性能的上包絡(luò)。

手握預(yù)測(cè)結(jié)果，怎么做投資組合構(gòu)建？

俗話說(shuō)：投資有風(fēng)險(xiǎn)、入市須謹(jǐn)慎。也就是說(shuō)：風(fēng)險(xiǎn)控制是金融投資里面非常重要的環(huán)節(jié)。一個(gè)人之所以成為投資高手，不是因?yàn)樗馨l(fā)現(xiàn)一兩個(gè)阿爾法因子，而是他能夠有效地控制風(fēng)險(xiǎn)，能夠在股市里面找到常勝的規(guī)律。

那么，投資過(guò)程中的風(fēng)險(xiǎn)有哪些類別？

首先，未來(lái)市場(chǎng)充滿未知，我們總是會(huì)面臨投資不確定性，這就是所謂的固有風(fēng)險(xiǎn)。

其次，在使用預(yù)測(cè)模型輔助投資時(shí)，因?yàn)槟Ｐ捅旧淼恼`差，會(huì)引入額外的模型風(fēng)險(xiǎn)。

只有在構(gòu)建投資組合時(shí)，把所有這些風(fēng)險(xiǎn)都考慮在內(nèi)，才能在投資時(shí)立于不敗之地。

人們雖然對(duì)于風(fēng)險(xiǎn)因子的重要性沒(méi)有什么異議，但是對(duì)風(fēng)險(xiǎn)因子的研究進(jìn)展卻非常緩慢。因?yàn)閭鹘y(tǒng)因子的構(gòu)建需要依賴專家的理論創(chuàng)新和經(jīng)驗(yàn)積累，同時(shí)對(duì)于不同的市場(chǎng)需要用不同的方式人工去定義因子。

大家知道，從最早的CAPM模型到Fama TFM模型經(jīng)過(guò)了31年，也無(wú)外乎增加了size、value這幾個(gè)風(fēng)險(xiǎn)因子。而從Fama TFM發(fā)展到BARRA CNE5，經(jīng)過(guò)了20年，也只是增加了動(dòng)量、成長(zhǎng)等為數(shù)不多的幾個(gè)因子。

在風(fēng)險(xiǎn)因子挖掘方面人工智能大有所為，因?yàn)槿斯ぶ悄芸梢宰詣?dòng)從數(shù)據(jù)當(dāng)中發(fā)現(xiàn)有用的規(guī)律，可以把風(fēng)險(xiǎn)因子的刻畫做得更充實(shí)、有效、及時(shí)。在人工智能的眼中，所謂固有風(fēng)險(xiǎn)因子就是要學(xué)習(xí)出市場(chǎng)狀態(tài)的正交基；而所謂模型風(fēng)險(xiǎn)就是刻畫出預(yù)測(cè)結(jié)果的置信度和相關(guān)性。

具體而言，針對(duì)固有風(fēng)險(xiǎn)的學(xué)習(xí)，我們的任務(wù)是利用少量獨(dú)立的風(fēng)險(xiǎn)因子解釋市場(chǎng)，未來(lái)希望投資組合在這些因子上有充分的暴露。

用數(shù)學(xué)語(yǔ)言來(lái)描述，就是希望從高維非線性的原始數(shù)據(jù)空間，變化到低維的隱式風(fēng)險(xiǎn)因子空間。

為了實(shí)現(xiàn)這一點(diǎn)，要有一個(gè)優(yōu)化目標(biāo)，我們希望在低維的隱式風(fēng)險(xiǎn)因子空間里，各維度盡量獨(dú)立，同時(shí)對(duì)市場(chǎng)解釋能力足夠強(qiáng)，這就對(duì)應(yīng)于幻燈片里展示的優(yōu)化式子。

這個(gè)式子的藍(lán)色部分，表達(dá)的是最大化股票收益在這些因子上的投影；紅色描述的是各因子之間的相關(guān)性，希望最小化相關(guān)性或者最大化差異度。

通過(guò)這個(gè)優(yōu)化過(guò)程，我們可以自動(dòng)學(xué)習(xí)出一組風(fēng)險(xiǎn)因子。它們可能不像傳統(tǒng)風(fēng)險(xiǎn)因子那么容易解釋，但它們對(duì)市場(chǎng)的描述更充分，并且先天具有非線性性。在構(gòu)建投資組合時(shí)，效果更好。

接下來(lái)，我們談一談模型風(fēng)險(xiǎn)。單只股票的模型風(fēng)險(xiǎn)很容易理解，描述的是股票實(shí)際收益低于預(yù)期收益的情況——但并不是單只股票模型風(fēng)險(xiǎn)大，投資組合的風(fēng)險(xiǎn)就一定大。

比如左圖里兩只股票，預(yù)測(cè)得分都很高，但實(shí)際收益很低，顯然單點(diǎn)的模型風(fēng)險(xiǎn)和組合風(fēng)險(xiǎn)是一致的。右圖兩個(gè)股票的預(yù)測(cè)值很高，但是實(shí)際上一個(gè)高收益一個(gè)低收益，這種情況下投資組合的風(fēng)險(xiǎn)其實(shí)是不高的。

投資組合之所以要做風(fēng)險(xiǎn)控制，就是希望至少有一些股票表示強(qiáng)勁，不要大家同漲同跌，所以在這種情況下我們認(rèn)為投資組合的模型風(fēng)險(xiǎn)并不高。

換句話說(shuō)，投資組合的模型風(fēng)險(xiǎn)，需要考慮股票之間的關(guān)系，而不是簡(jiǎn)單由每支股票自己的單點(diǎn)模型風(fēng)險(xiǎn)所決定的。

為了更好地給模型風(fēng)險(xiǎn)建模，我們考慮到圖神經(jīng)網(wǎng)絡(luò)，在這里面每個(gè)點(diǎn)描述的是單只股票的模型風(fēng)險(xiǎn)，邊描述的是兩只股票之間的關(guān)聯(lián)關(guān)系。

在整個(gè)圖神經(jīng)網(wǎng)絡(luò)迭代的過(guò)程中，單點(diǎn)模型風(fēng)險(xiǎn)會(huì)不斷修正投資組合的模型風(fēng)險(xiǎn)，反過(guò)來(lái)投資組合模型也會(huì)修正單點(diǎn)的模型風(fēng)險(xiǎn)。所以當(dāng)整個(gè)圖神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)收斂之后，我們就得到了一個(gè)整體的模型風(fēng)險(xiǎn)矩陣Σμ，這個(gè)矩陣加上之前自動(dòng)學(xué)習(xí)出來(lái)的隱式固有風(fēng)險(xiǎn)的矩陣，共同用于投資組合的優(yōu)化。

我們對(duì)于這種基于AI的風(fēng)控方法進(jìn)行了評(píng)測(cè)。右圖中，藍(lán)點(diǎn)表示基線方法（BARRA模型），紅點(diǎn)使用了隱式固有風(fēng)險(xiǎn)技術(shù)，而綠點(diǎn)則同時(shí)考慮了隱式固有風(fēng)險(xiǎn)和基于圖神經(jīng)網(wǎng)絡(luò)模型組合風(fēng)險(xiǎn)。

從圖中可以清楚地看到，使用新的風(fēng)險(xiǎn)因子確實(shí)可以得到更好的收益和風(fēng)險(xiǎn)的平衡。

從訂單執(zhí)行控制交易成本，AI能做什么？

當(dāng)我們有了好的投資組合之后，最后一公里的事情就是執(zhí)行換倉(cāng)的訂單。

這個(gè)事情非常重要，因?yàn)榻o定一個(gè)換倉(cāng)的訂單，不同的執(zhí)行方案會(huì)對(duì)應(yīng)完全不同的交易成本，所以很多有實(shí)力的交易機(jī)構(gòu)都會(huì)在日級(jí)別元訂單的基礎(chǔ)上，關(guān)注小時(shí)、分鐘甚至秒級(jí)的操作，希望能控制交易成本。

而一個(gè)訂單執(zhí)行方法的好壞，通常我們會(huì)用訂單完成后的平均價(jià)格去衡量。

這張圖是訂單執(zhí)行策略的基本概念，如果有一組訂單把他們按照時(shí)間均勻執(zhí)行，就會(huì)得到按照時(shí)間加權(quán)的平均價(jià)格。

如果可以預(yù)測(cè)每一個(gè)時(shí)間段的交易量TWAP，并且按照這個(gè)預(yù)測(cè)結(jié)果調(diào)整訂單速度，就會(huì)得到按照交易量加權(quán)平均的價(jià)格VWAP。

它們都是市面上常用的交易算法，但顯然它們都不是最優(yōu)的，因?yàn)槿绻覀冋嬗斜臼略趦r(jià)值最高點(diǎn)去執(zhí)行訂單，一定會(huì)有更好的平均價(jià)格——但這個(gè)事情又不是那么簡(jiǎn)單，因?yàn)樵谌魏螘r(shí)間點(diǎn)都有交易量的上限，很可能在價(jià)格最高點(diǎn)沒(méi)有足夠的市場(chǎng)容量去完成訂單的交易。

因此，訂單的執(zhí)行不是一件簡(jiǎn)單的事情，需要很好的算法支撐。

我們嘗試了使用強(qiáng)化學(xué)習(xí)來(lái)實(shí)現(xiàn)自動(dòng)的訂單執(zhí)行。強(qiáng)化學(xué)習(xí)是人工智能領(lǐng)域非常重要的門類，大家都聽(tīng)過(guò)的AlphaGo就是使用深度強(qiáng)化學(xué)習(xí)的算法。

我們的訂單執(zhí)行任務(wù)因?yàn)榭梢院芎玫亟３蓮?qiáng)化學(xué)習(xí)的問(wèn)題：給定一個(gè)狀態(tài)（市場(chǎng)信息、剩余時(shí)間、剩余訂單量），選擇合適的動(dòng)作（控制當(dāng)前訂單執(zhí)行的速度），從而得到某種獎(jiǎng)勵(lì)（比如訂單執(zhí)行后的平均交易成本、訂單是否如期完成、瞬間的交易量是否過(guò)大等等）。

看起來(lái)強(qiáng)化學(xué)習(xí)是非常好的工具，可以解決訂單學(xué)習(xí)的問(wèn)題，但如果大家是行家就知道，強(qiáng)化學(xué)習(xí)是不容易駕馭的工具。

強(qiáng)化學(xué)習(xí)有很多缺點(diǎn)，其中包括：訓(xùn)練過(guò)程不穩(wěn)定；樣本效率比較低。為了解決這些問(wèn)題我們發(fā)明了一套新的技術(shù)，叫做先知教練，它具有完美信息的訪問(wèn)權(quán)，可以看到未來(lái)的價(jià)格和交易量，不需要去猜，所以可以通過(guò)優(yōu)化的手段得到全局最優(yōu)的執(zhí)行策略。

有了先知教練之后，可以用它為基礎(chǔ)，利用策略蒸餾的方式，把它的所知所得傳遞給RL智能體，以此提高學(xué)習(xí)智能體的學(xué)習(xí)效率和穩(wěn)定性。

最終實(shí)際使用AI模型在線實(shí)現(xiàn)訂單交易時(shí)，我們當(dāng)然不能使用先知教練，但被完美先知教練調(diào)教出來(lái)的智能體已經(jīng)有了很好的表現(xiàn)。

到此為止我向大家介紹了數(shù)據(jù)智能、智能預(yù)測(cè)、智能策略、智能交易等研究的進(jìn)展。當(dāng)然，四年的積累遠(yuǎn)比我今天介紹的內(nèi)容多得多，如果大家有興趣，可以通過(guò)微軟亞洲研究院創(chuàng)新匯的平臺(tái)和我們建立長(zhǎng)期的戰(zhàn)略研究合作關(guān)系，共同去探索智能投資的邊界。

最后還想和大家分享一下我關(guān)于智能投資研究與實(shí)戰(zhàn)的思考。通過(guò)這4年的親身經(jīng)歷，我發(fā)現(xiàn)金融投資的實(shí)戰(zhàn)和研究之間存在巨大的鴻溝，很多算法僅在論文里的小型數(shù)據(jù)上有效果，拿到實(shí)盤上測(cè)試表現(xiàn)就大相徑庭。

其中一部分原因是這些研究者并不了解金融場(chǎng)景特有的實(shí)現(xiàn)細(xì)節(jié)，缺乏領(lǐng)域知識(shí)，缺乏穩(wěn)定公開(kāi)的數(shù)據(jù)源等等。我們只有填平這個(gè)鴻溝，架起連接研究和實(shí)戰(zhàn)的橋梁，才能讓學(xué)界和金融業(yè)界共同促進(jìn)智能投資的發(fā)展。

智能投資如何逃出“紙上談兵”困局？

懷著這樣的愿望，我們團(tuán)隊(duì)開(kāi)源了一個(gè)項(xiàng)目叫Qlib，是全球第一個(gè)智能輔助量化投資的技術(shù)框架。我們采用MIT協(xié)議，將我們的研究環(huán)境，向廣大金融從業(yè)者開(kāi)放，未來(lái)也會(huì)逐步將我們的研究成果通過(guò)這個(gè)平臺(tái)進(jìn)行分享。這個(gè)開(kāi)源項(xiàng)目剛剛上線幾個(gè)月就得到很多關(guān)注，在GitHub上收獲了超過(guò)五千顆星，很多國(guó)際知名的投資機(jī)構(gòu)都因?yàn)檫@個(gè)項(xiàng)目和我們建立了交流和合作。

那么我們?yōu)槭裁醋鲞@個(gè)開(kāi)源項(xiàng)目呢？它對(duì)促進(jìn)金融實(shí)戰(zhàn)和研究的融合能夠起到什么作用？

在做金融投資研究的過(guò)程中，我們需要構(gòu)建數(shù)據(jù)集，這里其實(shí)有非常多的陷阱。比如，左圖所示的幸存者偏差：其實(shí)很多股票在歷史上都消失了，今天幸存的股票是比較常見(jiàn)有韌性的股票。

如果我們只關(guān)注存留的股票，忽略當(dāng)時(shí)市場(chǎng)上存在的股票，我們學(xué)習(xí)的環(huán)境就會(huì)與當(dāng)時(shí)的市場(chǎng)不一致，就會(huì)出現(xiàn)學(xué)習(xí)的時(shí)候不錯(cuò)，但拿到實(shí)盤上損失慘重的情況。

再比如，我們?cè)跇?gòu)建數(shù)據(jù)集時(shí)，經(jīng)常需要對(duì)股票價(jià)格進(jìn)行處理。通常有兩種方式，一是前復(fù)權(quán)價(jià)格，也就是把歷史股價(jià)按除權(quán)后的價(jià)格進(jìn)行調(diào)整，二是后復(fù)權(quán)價(jià)格，就是將當(dāng)前股價(jià)按除權(quán)前的價(jià)格進(jìn)行調(diào)整。

其實(shí)無(wú)論哪一種處理辦法聽(tīng)起來(lái)好像都沒(méi)有問(wèn)題，但是當(dāng)我們把它用于機(jī)器學(xué)習(xí)和人工智能的時(shí)候，就會(huì)出現(xiàn)一些隱患：

假設(shè)我們使用前復(fù)權(quán)，就會(huì)把股票未來(lái)的走勢(shì)通過(guò)復(fù)權(quán)的行為融入到歷史數(shù)據(jù)中去，這時(shí)學(xué)習(xí)過(guò)程中就會(huì)出現(xiàn)未來(lái)信息泄露的問(wèn)題，學(xué)到了看似很有效的模型，在真實(shí)場(chǎng)景中使用就會(huì)出現(xiàn)很大的紕漏。

回測(cè)的時(shí)候也是一樣，比如很多論文都沒(méi)有考慮漲停不可買入，跌停不可賣出的現(xiàn)象，沒(méi)有考慮最低交易量的種種限制，所以一旦把這些因素考慮在內(nèi)，回測(cè)出的超額收益會(huì)有非常大幅度的變化。

所以我們認(rèn)為有一套通用的、非常接近實(shí)盤操作的開(kāi)源框架，是促進(jìn)金融投資、智能投資方面的研究和實(shí)戰(zhàn)的必由之路。

除了前面提到的幾點(diǎn)以外，Qlib還在其他很多方面做了細(xì)致的工作。當(dāng)然我們不可能面面俱到，所以我們非常期待金融界的同行去試用這個(gè)項(xiàng)目，發(fā)現(xiàn)其中的問(wèn)題，和我們一起把這個(gè)做的更好，在學(xué)界和業(yè)界之間架起更加通暢的橋梁。

最后，我想說(shuō)：金融領(lǐng)域的智能化進(jìn)程剛剛拉開(kāi)帷幕，雖然我們和合作伙伴一起在AI投資方面進(jìn)行了一些令人鼓舞的研究嘗試，但未來(lái)的路還很長(zhǎng)。所以，我們呼吁大家一起努力，借助整個(gè)AI研究社區(qū)的力量，共同推動(dòng)金融科技的發(fā)展。聯(lián)手攻克核心技術(shù)，才能水漲船高，共同繁榮。謝謝大家！

雷鋒網(wǎng)雷鋒網(wǎng)雷鋒網(wǎng)

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

1人收藏

分享：

相關(guān)文章

智能投資

2021全球智博會(huì)在蘇州啟幕！十余位產(chǎn)學(xué)大咖，20場(chǎng)高 ...

人工智能輔助投研，資產(chǎn)管理行業(yè)的數(shù)字化轉(zhuǎn)型之路該 ...

“CCF-NLP走進(jìn)高?！毕盗懈咝LP研究分享報(bào)告會(huì)（華 ...

專家觀點(diǎn) | 美股“史詩(shī)級(jí)熔斷”，真相你怎么看？

周蕾

編輯

云計(jì)算/To B/金融科技丨微信：LorraineSummer

掃描關(guān)注作者微信

發(fā)私信

當(dāng)月熱門文章

最新文章

10歲的網(wǎng)商銀行，想用AI大模型做千萬(wàn)小微企業(yè)的CFO

對(duì)話Zilliz星爵：大模型會(huì)讓向量數(shù)據(jù)庫(kù)淪為“花架子”嗎？

中關(guān)村科金攜手華為云，發(fā)布昇騰云 + 得助大模型平臺(tái)聯(lián)合解決方案

對(duì)話澤拓科技趙偉：數(shù)據(jù)庫(kù)公司深陷的“自研軍備競(jìng)賽”，用戶真的在意嗎？

對(duì)話云器科技喻思成：AI助增云湖倉(cāng)需求

對(duì)話ClapDB李令輝：AI爆發(fā)讓數(shù)據(jù)庫(kù)市場(chǎng)價(jià)格戰(zhàn)失去意義？

熱門搜索

安卓 iOS游戲 TensorFlow iPad mini Model 3 知乎 Xbox One 雷鋒早報(bào) 黑產(chǎn) 李明小米手環(huán)

微軟亞洲研究院副院長(zhǎng)劉鐵巖：讓智能投資擺脫「紙上談兵」

如何從海量的高頻數(shù)據(jù)中挖掘有效的投資因子？

如何基于市場(chǎng)狀態(tài)，調(diào)整投資策略？

手握預(yù)測(cè)結(jié)果，怎么做投資組合構(gòu)建？

從訂單執(zhí)行控制交易成本，AI能做什么？

智能投資如何逃出“紙上談兵”困局？

如何基于市場(chǎng)狀態(tài)，調(diào)整投資策略？

手握預(yù)測(cè)結(jié)果，怎么做投資組合構(gòu)建？

從訂單執(zhí)行控制交易成本，AI能做什么？

智能投資如何逃出“紙上談兵”困局？