0
本文作者: 溫曉樺 | 2016-11-14 14:55 |
圖片來源:epochtimes
“做私募(基金)的朋友在離開公募(基金)的大平臺后面臨很多問題,沒有IT環(huán)境、研究環(huán)境,缺乏運營環(huán)境,建立自己一套平臺或者環(huán)境需要大量的投入。”通聯(lián)數(shù)據(jù)CEO王政曾在采訪中表示:“我們看到了這樣的行業(yè)趨勢,所以從2012年開始籌備通聯(lián)數(shù)據(jù),幫助私募解決運營、研究、投資和管理上的需求?!?/p>
通聯(lián)數(shù)據(jù)(DataYes)是萬向集團投資成立的一家金融資訊和投資管理服務(wù)公司,該公司希望通過大數(shù)據(jù)、云計算、機器學習等信息技術(shù),為資產(chǎn)管理人提供新的金融資訊和投資研究數(shù)據(jù)分析服務(wù)。前不久,該公司獲得了中國電子信息產(chǎn)業(yè)發(fā)展研究院頒發(fā)的“中國人工智能金融行業(yè)領(lǐng)軍企業(yè)獎”。
在2012年正是P2P互聯(lián)網(wǎng)金融這樣的新金融火起時,多年以前就布局金融領(lǐng)域謀求轉(zhuǎn)型的萬向集團,選擇的卻是“最底層”領(lǐng)域,包括今日看見的區(qū)塊鏈、人工智能大數(shù)據(jù)平臺等。要知道,曾經(jīng)的P2P如今營收融資都以億為單位計算,只是互聯(lián)網(wǎng)金融這些場景化為主行業(yè),如今面臨著迫切的技術(shù)變革的要求和挑戰(zhàn)。
萬向控股副董事長肖風,也是通聯(lián)數(shù)據(jù)董事長,曾任博時基金總經(jīng)理,他稱,“互聯(lián)網(wǎng)金融熱起來時,我們在想新的金融業(yè)態(tài),新的金融形態(tài)我們投不投?當時考慮的過程當中,我們認為萬向這樣一個集團去做P2P的話是沒有場景優(yōu)勢的。沒有場景硬上P2P或者眾籌就可能走歪了,現(xiàn)在看到很多人已經(jīng)走歪了?!彼跃C合考慮后,萬向集團決定不做P2P。
那么,互聯(lián)網(wǎng)IT技術(shù)+金融,放下區(qū)塊鏈不說,在這個“言必稱大數(shù)據(jù)、人工智能”的時代,萬向旗下專注于資產(chǎn)管理創(chuàng)新的通聯(lián)數(shù)據(jù),又在做些什么呢?
通聯(lián)數(shù)據(jù),如今剛剛從萬向大廈搬離至新的辦公樓,“原來的地方坐不下了?!睋?jù)悉,過去三年到現(xiàn)在,通聯(lián)數(shù)據(jù)花費3.5億元,將團隊擴充至200余人,并建立了多個基于云的底層數(shù)據(jù)平臺。
在底層數(shù)據(jù)庫之上,通聯(lián)數(shù)據(jù)又構(gòu)建了兩個云平臺,蘿卜投研和優(yōu)礦,其中蘿卜投研是針對基金經(jīng)理和研究員提供智能投資研究數(shù)據(jù)服務(wù)的平臺,而優(yōu)礦則是一個眾包的、分享式的金融數(shù)據(jù)量化平臺。它們主要對海量投資需要的信息進行降噪、歸類和推薦,通過機器學習、文本挖掘提供投資分析中需要的輿情分析。用戶可以從中獲取數(shù)據(jù)分析,搭建自己的交易策略并共享。
優(yōu)礦界面
把各類數(shù)據(jù)集中一起,并依靠數(shù)據(jù)、機器學習模型將其作用于投資分析,通聯(lián)數(shù)據(jù)智能投研總監(jiān)向偉表示, “我們做大數(shù)據(jù)驅(qū)動的基本面投研,是期望能夠從市場上海量的、高頻的、更細力度的數(shù)據(jù)當中,去抽象挖掘一定的機制,把超越人腦能夠分析的大數(shù)據(jù)當中所蘊含的價值進行提純。最終對接基本面投研所需要的假設(shè)?!?/p>
據(jù)介紹,通聯(lián)數(shù)據(jù)現(xiàn)在的數(shù)據(jù)來源分為三部分,一部分自己搜集整理,二是從第三方購買,第三種是數(shù)據(jù)商把數(shù)據(jù)整合過來放在云平臺,有用戶使用則向數(shù)據(jù)商繳費的模式。這些數(shù)據(jù)對接了滬深股市/期權(quán)、債券、基金、咨詢、研究報告等,并提供API開放給外界。對于主要發(fā)力點在數(shù)據(jù)端及數(shù)據(jù)質(zhì)量優(yōu)化,肖風表示,“我覺得這是一個方向,在現(xiàn)在人工智能逐漸興起的這個階段,創(chuàng)辦工業(yè)數(shù)據(jù)的深度學習技術(shù),是相當有必要的?!?nbsp;
而通聯(lián)數(shù)據(jù)的團隊配置,據(jù)介紹主要包括兩類人:一類是金融背景的人才,這些人此前是資產(chǎn)管理機構(gòu)的研究員、基金經(jīng)理,如金融工程董事總經(jīng)理薛昆,他原是瑞士銀行投行全球量化團隊董事及摩根大通量化研究團隊副總裁;另一類是互聯(lián)網(wǎng)人才,一般來自谷歌、微軟、阿里等互聯(lián)網(wǎng)巨頭,如智能投研總監(jiān)向偉,他曾任百度個性化搜索負責人。
眾所周知,私募基金面臨硬件、軟件、數(shù)據(jù)、運營等系統(tǒng)的大量建設(shè),后續(xù)硬件換代的維護和升級也非常麻煩,時間成本和資金成本很高。“以往的模式是買硬件買軟件,招IT人來搭建系統(tǒng),資金、時間、人力成本居高不下。而基于云的金融投資管理的IT服務(wù)平臺只需要注冊登記即可使用,可以做基金管理完整業(yè)務(wù),包括收集整理數(shù)據(jù)、研究、交易、風控、估值結(jié)算等全部都有?!蓖?lián)數(shù)據(jù)CEO王政介紹,一家大中型基金公司每年的IT投入至少幾千萬,甚至上億,而采取租用集中了多類數(shù)據(jù)源的平臺的形式,“成本至少可以減少一半?!蓖跽群髶闻聿┵Y訊研究部經(jīng)理、巴克萊全球投資公司基金經(jīng)理、博時基金股票投資部總經(jīng)理、ETF及量化投資總監(jiān)等職,作為一名過來人,他深有體會。
此外,智能投研總監(jiān)向偉表示,傳統(tǒng)基金研究員的工作是刀耕火種式的,盯數(shù)據(jù)、拉研報等等,要花費很高的時間和人力成本。“一個研究員盯一家公司可能不覺得有什么,但假如一次盯三十家就會覺得很累;如果一下要盯一百家甚至五百家呢?這下就抓狂了。但其實這對機器來說是可以批量去做的?!痹谡麄€投資研究的過程中,“里面每一個點都可以找出一些原則問題來自動化完成,比如從開始的尋找數(shù)據(jù)、鑒別數(shù)據(jù)的真?zhèn)涡院蛢r值,以及如何從大數(shù)據(jù)當中精選篩選出一些合情的小數(shù)據(jù)等。讓人來做幾個樣本給機器學習,比如說采集一些媒體、流量數(shù)據(jù),機器學習到這些模板后可以批量去做,把各個品類的數(shù)據(jù)都采集到。 ”
“所以說,機器的加入不是要取代人,而是提高研究的效率,節(jié)省成本?!?/p>
然而,在投資研究的過程中,找數(shù)據(jù)只是完成第一個任務(wù),在接下來的環(huán)節(jié)中,機器學習又有何用處呢?
比如數(shù)據(jù)清理完后需要建立模型。向偉稱:“建立模型中各家的打法也不一樣,所以我們會去市場看看,主要的買方和賣方各家的數(shù)據(jù)分析方法有哪些?數(shù)據(jù)做回歸、預(yù)測和相關(guān)性分析一般會有哪些方法?……無論哪家研究所,這些基礎(chǔ)工具都差不多,所以我們會做一些原子化的底層數(shù)據(jù)分析,把更多的自由度留給上層的研究員,讓他們?nèi)テ唇?、組合,來相互佐證?!?/p>
那這個層面機器能做哪些事呢?“現(xiàn)在我們并不缺idea,而是idea太多,每天都會有各種各樣的研報會發(fā)表,這就存在了去偽存真的需要。所以,首先機器能夠做的是:回測誰才是專家;或者誰擅長建哪一類的模型、應(yīng)該信任哪一類的模型——機器能夠通過回測來進行量化層面的鑒定?!?/p>
而完成去偽存真的第一步后,機器開始需要進行一些深度學習知識層面的問題?!芭e個例子,要對一家賣藥的上市公司的業(yè)績進行預(yù)判,人分析的過程應(yīng)該是:賣哪一種藥?市場格局大概是怎樣?賣得好的地域是哪里?是直銷的還是經(jīng)銷?……從各個維度去篩選并拼接。這對機器來說是一件困難的事情,但機器可以學習——它可以解析這些研報當中的語義結(jié)構(gòu),比如其中什么預(yù)判或觀點使用了哪一些數(shù)據(jù)去支撐。這些邏輯關(guān)系讓人來做幾遍給機器看,機器就可以批量解析。然后再配合大型的量化框架,就能知道哪一套分析方法靠譜,或者有足夠數(shù)據(jù)支撐。”
“建立模型這個過程可淺可深,也與研究員的段位相關(guān)。 一般機構(gòu)研究一個基金或者股票,他們會先安排一個助理,讓其去看數(shù)十篇研報。一個也許比較初階,而且對行業(yè)也不熟悉的助理,在看完數(shù)十篇研報之后也能夠拿出一篇基本的財務(wù)預(yù)測報表,只是這個報表預(yù)測的方差有可能比較大,需要額外佐證其偏差之處,以及需要微調(diào)的幅度大概有多少等問題。而在這個過程中,機器也可以用來解析研報、金融數(shù)據(jù)和財務(wù)類數(shù)據(jù),來組織一個邏輯關(guān)系,然后像搭積木一樣,拼出一個粗略的模型出來。當然這個模型有可能比較有缺陷,但它可以線上和分析師產(chǎn)生交互,讓他們觀測機器是根據(jù)哪一塊數(shù)據(jù)修正了哪一些假設(shè),使得這個預(yù)測方差更小?!?/p>
再往后就是決策環(huán)節(jié),需要去做離線回測,來量化風險和收益?!捌鋵嵄举|(zhì)是有一個離線價值網(wǎng)絡(luò)來評價風險。有了這套離線框架的話,就可以每天人在睡覺的時候,機器仍不斷地左右互搏進行演練,包括模型選擇、參數(shù)選擇。機器學習做完交易決策后,人要對其進行擬合、復(fù)盤等?!?/p>
所以說,“相當于這是一個人機交互的過程,在這個過程中人和機器都是互相成長和迭代的。人在機器的配合下可以分析人本身存在的軟肋,從而做得比單純?nèi)藖碜鲆谩H丝梢酝?,機器不可以停,這些就是機器超越人的表現(xiàn)。我們不是說讓機器取代人,而是在某些方面可以顯著性地超越人腦?!?/p>
不過當然,如今人工智能、機器學習技術(shù)的發(fā)展仍在早期階段,自然語言處理尚未有質(zhì)的突破,機器的準確性、魯棒性(穩(wěn)健性、強健性)還要克服很多挑戰(zhàn)。向偉坦言,這是一個漸進的過程,所以一開始人會干預(yù)的多一點,但是隨著人工正負反饋積累得越多,機器學習模型的魯棒性會逐漸增強。
而從風控的角度講,薛昆稱,金融的本質(zhì)是風控。“我們最終給客戶提供的是贏的概率。在這個過程中,無論是基本面分析,還是主動投資,需要關(guān)注的是怎么用一套非常成熟的體系來告訴客戶其風險歸因、業(yè)績歸因是什么。也就是說,這套體系可以告訴客戶他在賭什么,比如主動投資的組合的基金經(jīng)理,也可以從風控的角度去看他押注哪些因子、哪些風格;量化投資的基金經(jīng)理在做研究的過程中,無論是交易前還是交易后,也都可以根據(jù)其來審視,包括其中的風險因子有沒有風險漂移等事情發(fā)生。 ”
“風控體系的好壞在于時間的考驗——經(jīng)歷的時間越長就越好。某些特定的資產(chǎn)類別和策略是很難去評估其風險,這也是需要時間去積累的?!?/span>
資產(chǎn)管理業(yè)的“人工智能+”目前出現(xiàn)兩個方向:一個是to B——智能投研,一個是to C——智能投顧。包括國內(nèi)巨頭、初創(chuàng)公司,最初多選擇面向C端的服務(wù),但在許多質(zhì)疑之下,許多尤其是初創(chuàng)公司的智能投顧服務(wù)也逐漸顯現(xiàn)出強弩之末之勢。
“其實兩年前我們就開始做to C的智能投顧,但做一段時間后把這個項目暫時停掉了。因為我們覺得中國還沒到這個智能投顧的階段,”薛昆稱,智能投顧在美國之所以可行,是因為美國市場的被動化投資已經(jīng)發(fā)展到一定程度,其市場足夠有效,因此智能投顧真正不用花很大的成本,只要押注某些因素就可以了,而且這些東西是可以程序化、模型化的。但相比較之下,現(xiàn)在中國還是一個非常非常不有效的市場,而且中國可配置的資產(chǎn)實質(zhì)上不多。
“現(xiàn)在大家都在講‘資產(chǎn)荒’,但事實上不是資產(chǎn)荒,而是Beta荒。其實還是有Alpha的,但Alpha的特點是你要找到一些獨特的投資機會?!盇lpha是指絕對收益,一般是資產(chǎn)管理人通過證券選擇和時機選擇獲得;Beta收益指相對收益,是管理人通過承擔系統(tǒng)風險獲得的收益。
薛昆表示,“如果服務(wù)C端(智能投顧),一定要是在貝塔市場非常好的時候才可以做到,因為那個時候才能規(guī)?;?。這其實是策略容量的問題,一個策略能夠規(guī)?;拍芊?wù)C端。”
“所以,現(xiàn)在Beta荒的市場上,你要找到一個特別好的資產(chǎn)類別去服務(wù)長尾C端的客戶,像螞蟻金服和百度金融的智能投顧服務(wù),他們也會很痛苦,因為沒有辦法超越金融的本質(zhì),他們其實也在尋找各種各樣的(Beta)資產(chǎn)?!?/span>
回到前面,怎么找到這些產(chǎn)生Alpha的投資機會呢?薛昆補充道:“量化投資中有一個叫時間因素的東西,即當市場有了些賺錢的信號,但這些信號不是在每一個市場環(huán)境都可以工作,面對這種情況,先驗的知識大部分都在基金經(jīng)理的大腦里,看行業(yè)數(shù)據(jù)的時候自己腦袋里會有這樣一些模型——什么時候該用什么信號來構(gòu)建組合并做調(diào)整。那這些基金經(jīng)理的知識能不能由機器來學習呢?現(xiàn)在的結(jié)論是可以的。但前提是,你要有賺錢的信號。這就是為什么說到技術(shù)要跟非常專業(yè)的框架在一起工作。這些信號有些是來自于基本面,或者大數(shù)據(jù)。”舉個例子,如果要預(yù)測一個港口的出貨量,傳統(tǒng)的方法需要統(tǒng)計學統(tǒng)計概率來預(yù)測,但是機器就可以直接調(diào)用衛(wèi)星圖等數(shù)據(jù)。
“這些非結(jié)構(gòu)的數(shù)據(jù)都可以轉(zhuǎn)化成結(jié)構(gòu)化的數(shù)據(jù),快數(shù)據(jù)可以預(yù)測慢數(shù)據(jù),機器也可以快人一步地做一些預(yù)測性的事情。從這些數(shù)據(jù)當中提取出來的信號會成為Manager Alpha的來源?!?/p>
“所以,在人工智能推進傳統(tǒng)資管業(yè)進步的角度上,我們的做法是幫助基金經(jīng)理在基本面分析或量化這一過程找到Alpha,在資產(chǎn)端創(chuàng)新。因為從策略的角度看市場是輪動的,可能今年上半年做Alpha的人不太好做,反而做CTA的活得很滋潤,那在這一個領(lǐng)域我們實質(zhì)上是創(chuàng)造一個能夠讓客戶能夠很快找到市場上什么策略才是有用的?!?/p>
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。