1
本文作者: 吳陽煜 | 2017-10-26 21:19 |
雷鋒網(wǎng)AI金融評論按:本文為雷鋒網(wǎng)AI金融評論與AI慕課學院舉辦的智能投顧高級系列特訓班的資產(chǎn)配置常見模型詳解課程(上)的精要回顧。在接下來的系列課程中,王蓁博士即將帶來更加詳細、實踐化機器學習算法進階的教程,手把手教你搭建專屬的智能資產(chǎn)配置模型!為了讓更多人了解智能投顧,AI金融評論摘取本次課程的部分精彩內容回顧,希望能幫你窺探到課程的核心。
http://www.ozgbdpf.cn/special/mooc/03.html
雷鋒網(wǎng)AI金融評論報道,隨著人工智能以不可阻擋的態(tài)勢漸漸滲透到我們日常生活的方方面面,在高度量化的金融投資領域,變革求新、提速高效的追求也催生了智能投顧作為AI全新產(chǎn)品的蓬勃發(fā)展。大量的金融科技、人工智能相關崗位的招聘和交易員、量化研究員崗位的消失正見證著這一AI新業(yè)態(tài)隨著時代發(fā)展的嶄新面貌,那么在著手構建智能投顧產(chǎn)品具體操作的過程中,該如何去建立核心模型這一“心臟部位”去投入運行?雷鋒網(wǎng)AI金融評論與AI慕課學院主辦的智能投顧配置特訓班講師王蓁特別指出,智能投顧整體模型的關鍵在于運算公式的建立和參數(shù)的估計。
以下是本次直播課程內容回顧:
今天是初級課程第三講,今天開始正式來介紹,各個資產(chǎn)配置模型具體的原理,以及我們應該怎么在各個資產(chǎn)配置模型當中,去真正完成資產(chǎn)配置的操作。
今天我們會講兩個模型,第一個模型是美國也是世界第二大資產(chǎn)管理公司—先鋒(Vanguard)所使用的資產(chǎn)配置模型。先鋒在2016年介入智能投顧行業(yè)這個領域,它們的資產(chǎn)配置模型其實是對外采購的,我們先來看看這個資產(chǎn)配置模型的投資邏輯:
第一,假設投資周期是10年,或者更長的時間;
第二,假設投資的是美股的市場,也就是一個震蕩上行的市場。為什么第二點這么重要呢?是因為,美股是一個特殊的市場,像定投,或者長期投資,在美股市場是比較有效的;
第三點是假定市場有效,也就是巴菲特一直在說的,所有的投資不如買大盤,所以他們推崇的是被動式投資,做的是大類資產(chǎn)的配置。每一個大類資產(chǎn)配置當中,所選的標的不進行主動式管理,也不進行收益增強,而是純粹地跟隨指數(shù)進行增長;
第四點是假定投資不會產(chǎn)生超額收益Alpha,所以說在這個邏輯之下,最大的考慮是降低交易的頻率和每一次交易下的交易費用。其實不止交易費用,在ETF和公募基金之間,也會選擇交易費用、維持費用比較少的。因為我們知道,共募基金有前端費用、后端費用,還有營銷費用、花費費率,以及管理費等等非常多的費用。ETF內部也有維持的費用,但是在考慮這些費用的情況下,一般來講,ETF要比公募基金要低很多。所以說,他們會選擇費用較低、維持成本和交易成本較低的標的來進行投資。
另外,他們采用了人工劃分投資者的辦法,并且人工選定了投資者的類型,大類資產(chǎn)是什么樣的權重,以及通過人工確定,每一個大類下,他們認為的固定的,最優(yōu)的有代表性的投資標的,也就是ETF。所以第五、第六、第七和第九點,考慮到頻率較低(具有可操作性),他們每年都會去做。
同時也是因為是長期投資,所以并不會在乎,今天買到的這個價格,是100元還是101元。
先鋒模型,本質就是人工定好每一項大類資產(chǎn)配置,又定好了每一大類資產(chǎn)的投資標的,然后再人工確定這樣的組合對應的特征,也就是風險等級,一一對應起來建成幾個大框。把這些大框放在一起,用戶一來就可以扔進去了。
課件上是一些例子,它們其實是根據(jù)投資周期的長短先進行劃分,我們在第一節(jié)課也提到了,用戶風險等級主要取決于兩個因素:一個是投資周期,一個是用戶的風險承受能力。用戶的風險承受能力可以進一步劃分為兩方面,就是用戶的客觀風險承受能力和主觀風險承受能力。用戶從資產(chǎn)端考慮,從最左邊到最右邊,隨著投資周期的增長,股票在里面占有的比例越來越大,債券占有的比例越來越小。下面的表格也寫著過去九十年的結果,這在中國是不可想象的。過去九十年的結果就是這樣,每一年5%,6%或者7%的收益,這是比較難以想象的。但是我們可以看到,整體來講,隨著投資周期的增長,隨著股票占有比例的逐漸增多,波動性加大,風險在提高的同時收益也在提高。
這是先鋒另外的一些配置,把用戶的需求分為幾個大的目標。你是想均衡型的,就看左邊的一列;或者是成長型的,就看右邊的一列。均衡型要比成長型保守,成長型更加的激進,比如一個剛步入職場的年輕人,先鋒可能會認為,他更適合一個成長型的配置。
以上就是先鋒的資產(chǎn)配置模型,所有工作都是純人工去做的,這和國內某知名智能投顧提供商一樣。這并不是我們真正想要的智能投顧。它的好處是什么呢?策略原理簡單、透明,人工確定了所有的東西,所以你選的人非常厲害,是巴菲特之流,那么你的收益就會很高。交易執(zhí)行也非常簡單,一年一次,不存在調倉的考慮,所需的成本非常低,需要做的工作非常少。
但是它的缺點也非常明顯,成也蕭何敗也蕭何。如果你選的是巴菲特,你可以獲得比較好的收益,假如你隨便選了一個國內的公募基金經(jīng)理,那么你就可能會虧得很慘。先鋒的這個資產(chǎn)配置模型,只適合于美股市場。國內的市場,一方面存在著周期,另一方面投資的周期相對較短,其次是一個震蕩下行的市場,或者說長期來看沒有往上走的趨勢,與美股市場不一樣。國內市場不如美股市場有效,存在著超額收益,先鋒的這套資產(chǎn)配置模型的先決條件,在國內其實是不成立的。
好,重點來了。那我們該怎么辦呢?下面就到了量化資產(chǎn)配置最為基礎的現(xiàn)代資產(chǎn)組合理論,馬克維茨模型,也叫均值方差優(yōu)化。
我們講的MPV,Markowitz,還是MVO,其實它們都是基于同一套的理論,只不過不同的人出于不同的習慣有不同的稱呼而已。我們接下來就會詳細地來講講,馬克維茨模型的的原理是什么,它是如何去進行資產(chǎn)配置的,又是如何去融合不同的用戶風險等級的。
為什么我要仔細去講這個模型呢?這個模型發(fā)軔于1952年,是一個很老的模型,雖然實用性值得商榷,但它卻是其他所有量化資產(chǎn)配置模型的基礎,相當于我們要學會1+1,只有當我們學會了資產(chǎn)配置中的1+1以后,我們后續(xù)才會講1+2,1+3,但都是要有這個1+1的基礎。所以大家一定要對這個模型比較了解。
模型目標是什么呢?是給定風險的收益最大化,或者是給定收益的風險最小化,這兩者其實是同一個意思。在數(shù)學上,我們追求效用的最大化,收益減去千分之五,乘以A,一般來說A為風險延誤指數(shù),再乘以投資組合的方差,這里面有兩項:第一項是投資組合的收益,為鼓勵項,再減去懲罰項,就得到效用。當我們把效用最大化的時候,我們就得到給定風險等級下的最優(yōu)函數(shù)。因為給定風險下的效用最大化,證明了其他任何的資產(chǎn)配置都無法比現(xiàn)在這個組合性價比最優(yōu)。
我在這里列舉了馬克維茨模型七個很重要的假設:
第一個假設是,風險是可預測的,并且收益是正態(tài)分布的。這一個假設,也是1952年馬克維茨在博士論文中提出的結論。
第二點假設是,效用是風險和激勵綜合作用下得到的函數(shù)。
并且是向邊際遞減的單調函數(shù),也就是說收益越高,額外的每個單位收益帶來的快樂或者心理滿足感是越來越少的。當投資人是處于虧錢的狀態(tài),年收益率為-5%的時候,他獲得了10%的收益達到了5%,這個時候他的心理滿足感是非常大的;而當他的年化收益率為80%的時候,同樣是給予他10%的收益達到了90%,這個時候他獲取的心理滿足感遠遠不及前者,效用函數(shù)的增加遠遠小于-5%到5%的滿意度,這就是所謂的編輯效用遞減。
第四點假設是所有的投資人都是風險厭惡型的。也就是說現(xiàn)在有兩個選擇,第一,我給你10塊錢,是完全確定的;另一個選項是50%的幾率會得到20塊錢,和50%的幾率不獲得金錢。理論上來講,兩者的數(shù)學期望都是10塊錢,一個風險中性的人對這兩個選項是無所謂的,他可以拿這10塊錢,也可以選擇后者。但是,基于這個假設,投資者都會選擇第一項,也就是風險更小的那項。雖然預期收益都是10,但是前者風險更小,它的收益是確定的,所以投資者都會選擇前者。
還有一個理性人假設,以及沒有投資費用和有效市場假設等等。
這個模型很簡單,它的輸入是三個元素:第一個是每一類資產(chǎn)的預期收益,也就是前面提到的收益項,第二個是每一項資產(chǎn)的標準差,也就是風險項,作為風險的衡量,第三個是各個資產(chǎn)之間的相關性,如果是多于兩個資產(chǎn),就是相關性矩陣,來衡量資產(chǎn)之間的關系。
它的輸出是一個叫有效邊際的東西……接下來,王蓁開始教大家,在真正開始搭建馬克維茨這一個智能投顧中的基礎核心模型的時候,如何去做數(shù)學的組合計算。王蓁還會在該節(jié)課程中詳細講解,在含有和不包含無風險資產(chǎn)情況下,該如何計算得到有效前沿;還有,作為核心基礎的馬克維茨模型參數(shù)又是如何求得的呢?參數(shù)估計方法有哪些--有使用歷史樣本值;有使用多因子模型;還有使用Bootstrapping和貝葉斯估計,想知道它們是如何具體運算來求得模型參數(shù),一點一滴建立起具體可行的模型的嗎?計算過程詳解和耐心細致的指導都在智能投顧高級培訓班初級課程第三節(jié)當中!
王蓁最后總結道,今天(周二)講的模型公式比較基礎簡單,大家回去一定要注意復習。下一節(jié)課周四的BL(Black-Litterman)模型會涉及到更多的數(shù)據(jù)推導,會更復雜一些,也更有意思。
獲取更多內容,請點擊:智能投顧高級特訓班:初級-高級 系統(tǒng)詳解,全網(wǎng)獨家
學員: 我的理解是 智能投顧實現(xiàn)的是 通過對用戶資產(chǎn)、用戶投資需求的分析形成的用戶風險偏好無差異曲線和資產(chǎn)組合相切實現(xiàn)的。用戶的風險偏好無差異曲線是怎么得來的?
王蓁:在不同的模型當中有不同的實現(xiàn)方式。下一節(jié)課要講的BL模型有其他的實現(xiàn)方式,而在今天講的馬克維茲模型當中,通過引入一個用戶的風險偏好的變量,這個變量是一個非負數(shù)的實數(shù)。當該變量變大的時候,風險偏好會越來越低。我們在目標函數(shù)中直接引入風險偏好參數(shù),對目標函數(shù)進行最優(yōu)化求解,從而得到給定風險等級下最優(yōu)的組合配比。下節(jié)課我們在講BL(Black-Litterman)模型的時候,我也會講如何加入用戶風險等級這個因素進去。
學員:能不能多多講解一下如何看懂課件里的圖形和數(shù)據(jù)?
王蓁:課件里的圖形有一些還可以忽略,不太重要。主要是公式,一定要理解透。比如如何通過多因子模型(APT)來估計,分解成各個因子后,因子的收益是可以通過其他途徑比如線性回歸得到的,這樣就可以通過兩個向量的內積得到預期收益,有了預期收益,推導求出協(xié)方差的矩陣就可以得出最后的結果了。
學員:如果要開發(fā)智能投顧,核心是否就是提供公式給研發(fā)同事并實現(xiàn)?
王蓁:簡單來說,是的。稍微展開一下,實際我們在項目實施的過程當中,這些模型或者公式就是我們的研究成果。當我們有了這些公式之后,我們需要做的事情就是結合具體的數(shù)據(jù),把它寫成一個實現(xiàn)流程的說明文檔而已。
舉個例子,如果我要使用歷史樣板的估計值,來做馬克維茨模型的實現(xiàn),那我會怎么去寫清楚呢?我會告訴同事,取過去三個月每天的數(shù)據(jù),來求簡單算術平均得到一個值。開發(fā)的同事不需要了解這是什么,只需要知道這是一個值即可。然后,再使用過去三個月每一天的這個值求得方差,和協(xié)方差的矩陣。獲得了之后,所有的參數(shù)和流程就齊全了。在這個過程中,可以做一個說明,說我們的數(shù)據(jù)是要什么格式的,可能要做什么樣的整理,計算和清洗,這些都是屬于數(shù)據(jù)獲取部門的工作。
但在研究的過程中,我們也是需要做一些這樣的工作。數(shù)據(jù)處理完了之后,去進行建模的一個過程才是我們工作的核心。剛才講的第一步通過簡單算術平均求值是第一步,求協(xié)方差矩陣是第二步,那么第三步就是設定好實際調查得出的風險變量后,將這些參數(shù)求得的值代入到建立的函數(shù)當中去。數(shù)值計算可以我們自己來求,也可以教研發(fā)同事如何去求,求出來以后將這個極值返回給我們,就完成了整體模型的全部步驟了。所以核心就是這整套公式的建立和參數(shù)該如何去估計,這是最難的一點。
學員:我們如何知道,市場上的智能投顧產(chǎn)品使用的是什么模型?
王蓁:沒有辦法從表面的觀察得知,除非是對方告訴我們。比如說Wealthfront,號稱使用了Black-Litterman Model,比這節(jié)課的模型要復雜,我們下節(jié)課會講;比如說國內很多的智能投顧提供商,都會說自己采用的是基于馬克維茨模型的智能投顧系統(tǒng)。我們今天上完課的學員,不需要聽后面的課程,出去都可以帶領團隊,在兩三周內開發(fā)基于馬克維茨模型的智能投顧,效果如何暫且不管,但一定是基于馬克維茨理論開發(fā)的模型。
希望大家理解,所有智能投顧的核心或者門檻,都是在于需要計算的模型本身,其他數(shù)據(jù)之類的,在目前來說遠遠構不成門檻。原因就在于,現(xiàn)在國內懂智能投顧模型的人很少很少。
——————————————————————————————————————————————
更詳細的智能投顧以及量化投資實操系列特訓課程,詳解四大行實操智能投顧系統(tǒng)端到端的經(jīng)典案例,教你利用人工智能算法搭建系統(tǒng)的智能投顧項目。敬請訪問雷鋒網(wǎng)旗下AI慕課學院:
加入“智能投顧”行業(yè)交流群:添加助手小艾(微信號MOOCCAI),發(fā)送“智能投顧”,并提交姓名+公司/職位,同行業(yè)大咖和你一起玩轉智能投顧。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉載。詳情見轉載須知。