0
雷鋒網(wǎng) AI 科技評論按:7 月 12 日-7 月 14 日,2019 第四屆全球人工智能與機器人峰會(CCF-GAIR 2019)于深圳正式召開。峰會由中國計算機學會(CCF)主辦,雷鋒網(wǎng)、香港中文大學(深圳)承辦,深圳市人工智能與機器人研究院協(xié)辦,得到了深圳市政府的大力指導,是國內(nèi)人工智能和機器人學術界、工業(yè)界及投資界三大領域的頂級交流博覽盛會,旨在打造國內(nèi)人工智能領域極具實力的跨界交流合作平臺。
7 月 12 日,加拿大工程院院士、Citadel 首席人工智能官、前微軟 AI 首席科學家、IEEE Fellow 鄧力教授為「人工智能前沿專場」帶來了《AI Models:From Speech and Language to Financial Markets》的大會報告。以下為鄧力教授所做的大會報告全文。
本次我演講的主題可能跟其他演講者不太一樣,但我相信其中還是有一些共性值得我們探討。因為人工智能涵蓋了很多領域,其中就包括剛才 Hackman 教授提到的重要主題,即人工智能和教育以及人工智能如何在教育領域?qū)崿F(xiàn)更多的應用,我認為這一類的落地應用絕對是人工智能領域未來發(fā)展的重點之一。
今天我要重點分享的內(nèi)容包括兩個部分:第一部分是人工智能語音語言領域的應用,比如說語音識別和語言處理;第二部分是過渡到人工智能在金融領域的一些前沿進展和挑戰(zhàn)。
首先,我先介紹一下目前深度學習(即現(xiàn)代人工智能技術)在一些領域中現(xiàn)有的成功應用。
近年來,深度學習的發(fā)展特別快,例如語音識別,自然語言處理、機器人、計算機視覺等領域取得了非常大的進展。同時我也認為,這些領域在接下來的幾年時間內(nèi)還將實現(xiàn)更大的發(fā)展。
另外,我認為一些大家比較關注但是還沒有通過媒體上看到的取得特別大進展的行業(yè),如農(nóng)業(yè)、教育、金融以及零售等,也具有非常大的潛能。在這里,我會重點介紹人工智能在金融領域的可行性。
在此之前,我先問大家一個問題,大家覺得人工智能在推動金融市場(包括商業(yè)模式和交易)的轉(zhuǎn)型上有多大的潛力?為了讓大家更好地回答這個問題,我們先來回顧一下大概十年前發(fā)生的一件事。
2009 年 12 月 12 日的 NIPS 上,我負責主辦了一個 workshop,當時我邀請了微軟和多倫多大學的同事們參加,與俞棟、Geoffrey Hinton 一同探討了深度學習未來的發(fā)展前景,并通過調(diào)查研究從不同的維度來分析深度學習和神經(jīng)網(wǎng)絡在語音語言領域未來幾年的發(fā)展態(tài)勢。
之后,我們微軟在語音識別和翻譯領域投入了很多人力,希望通過深度學習、神經(jīng)網(wǎng)絡來實現(xiàn)機器語音識別和翻譯。經(jīng)過微軟兩年高強度的研究,2012 年,深度學習在語音識別領域取得了較大的進展,這也是深度神經(jīng)網(wǎng)絡研究在語音識別領域上的一次早期的大規(guī)模嘗試,也是深度學習第一次在工業(yè)界取得成功的案例。
2012 年,正好就在中國天津,我當時所在的微軟研究院嘗試使用語音識別和翻譯技術來對演講進行英到中的口語自動翻譯。這可以說是語音識別領域的一個里程碑式的時刻。在這前后,科大訊飛、百度等很多公司都加入到這個領域的研究中來,研發(fā)基于深度學習的新一代語音識別和翻譯技術。
而更早之前,大約從 1993 年開始,我和很多同行者就開始研究即時語音識別技術。到 2000 年,即時語音識別的錯誤率非常明顯得在不斷下降,但當時基于隱馬爾科夫模型的語音識別技術在 2000 年至 2009 年期間一直處于瓶頸停滯期,而在 2009 年引入深度學習以后開始有了新的進展:2009 年至 2012 年又有了第二輪更明顯的錯誤率的下降。1993 年到 2000 年、2009 年至 2012 年是這項技術的兩個標志性的階段。
十年以后的今天,大家可能認為這一切都發(fā)展得自然而然,對人工智能領域的所有概念都習以為常,但在那個時候,深度學習的應用是非常罕見的。
上圖是用于語音識別的常見深度神經(jīng)網(wǎng)絡架構(gòu),獲得了很大的成功,我們同樣也希望讓這項深度學習技術在金融領域發(fā)揮同樣的作用。
上圖是常見的語音識別系統(tǒng)的基本組成模塊。我們將麥克風拾取的聲音和文本作為數(shù)據(jù),通過聲學模型、詞義模型和語言模型等不同的模塊來訓練完整的語音識別系統(tǒng)。我展示這個圖主要就是想給大家看我們最早期的研究方式是怎么樣分步訓練完整的語音識別系統(tǒng)的,就是說在真正的深度神經(jīng)網(wǎng)絡開始之前,我們會使用不同的語音和文本數(shù)據(jù)來訓練這些不同的模型模塊。
這些不同的模型模塊的研發(fā)過程中往往是相對獨立的,即便是微軟這樣的公司,在早期都是獨立組建團隊去專門負責聲學模型和語言模型不同模塊的研發(fā)。但是發(fā)展到后期,由于有了深度神經(jīng)網(wǎng)絡端到端學習的能力,我們就可以建立綜合性的解決方案,將所有不同的聲學模型模塊和語言模型模塊連接起來綜合訓練。
金融界的從業(yè)者應該都知道,目前量化交易的系統(tǒng)也分成許多不同的模塊,類似于深度神經(jīng)網(wǎng)絡端到端學習之前的語音識別系統(tǒng)。現(xiàn)代語音識別從獨立研究不同模塊的方式轉(zhuǎn)變成一體化模型研發(fā),使得模型的綜合性越來越高,這應該有助于啟發(fā)研究者們思考怎樣改善基于相對獨立模塊的量化交易的金融系統(tǒng)。
在自然語言處理方面,深度學習同樣起到了顛覆性的作用。其中就包括機器翻譯,關于這個部分,周明博士會在今天下午的演講中跟大家詳細分享。
而深度學習等熱門技術的挑戰(zhàn)在哪里呢?主要還在于需要設計一個正確的、合適的架構(gòu)來落地,包括清楚相應應用領域的機器學習難點,同時也需要足夠的有標注的數(shù)據(jù)來訓練機器解決問題。前一輪的人工智能技術無法成功解決大型的問題,需要通過現(xiàn)在新一輪的人工智能技術來解決。
簡單介紹一下深度學習在自然語言處理的一個有趣的應用 --- 看圖說話。上面這張圖像是奧巴馬的夫人和她的女兒們以及彭麗媛的合照,人工智能技術可以通過臉部識別與數(shù)據(jù)庫進行比對來識別他們的身份,然后用一個自然語言的句子來描述這張照片的內(nèi)容。這是人工智能技術應用得非常成功的案例之一。
作為一個非常特殊的領域,金融領域在人工智能技術應用層面所面臨的挑戰(zhàn)要比我在前面介紹的語音語言領域更大,其中以三大挑戰(zhàn)最為典型,包括:
其一是金融數(shù)據(jù)的噪音非常大,不僅在輸入端,更在輸出端。在金融市場中,比如說股市存在的大量市場數(shù)據(jù)就有非常大的噪聲,這些數(shù)據(jù)很多時候不能反映真實的股票市場情況,甚至噪聲還會覆蓋掉有用的信息。因此需要人類分析師或人工智能去對這些數(shù)據(jù)進行提煉,從而獲得有價值的信息。也就是說,如果你要基于一些金融機構(gòu)提供的數(shù)據(jù)做預測,首先就需要排除噪音,而對于語音識別、自然語言處理等領域而言,這一類挑戰(zhàn)幾乎是不存在的。目前,金融領域還沒有相應的成熟機制來解決這一問題,所以需要探索各類人工智能技術來解決這一難題,而我們目前也看到了一些前進的方向。
其二是由于數(shù)據(jù)共享缺失以及數(shù)據(jù)和市場的非穩(wěn)定性所導致的人工智能建模問題。這個挑戰(zhàn)很大程度上是由于金融領域的競爭特性所決定的。金融公司的算法和數(shù)據(jù)基本上都無法像很多巨頭科技公司那樣將很多算法和數(shù)據(jù)進行開源分享,所以競爭激烈的金融領域是無法像自然語言處理等領域那樣,能夠基于過去的大數(shù)據(jù)用統(tǒng)計學的方法進行大數(shù)據(jù)分析,只能對一些在不斷變動的波動數(shù)據(jù)進行分析。同時,激烈的競爭還會讓新開發(fā)的統(tǒng)計模型和算法漸漸失去他們的有效性,遠快過自然語言處理和語音識別的模型和算法。因此,這個在金融領域獨有的棘手和難以駕馭的問題同樣也需要非常特殊的人工智能技術來解決。
其三是異構(gòu)數(shù)據(jù)問題,包括非傳統(tǒng)金融數(shù)據(jù)和傳統(tǒng)金融數(shù)據(jù)的整合和綜合利用。以華爾街的金融分析師為例,他們并不都在使用標準數(shù)據(jù)。傳統(tǒng)的金融數(shù)據(jù)包括很多種,其中一種是市場信息,很多技術分析師都使用一套規(guī)則和模板識別來分析股票;另一種叫做基本面數(shù)據(jù),即分析師根據(jù)公司過去、現(xiàn)在和將來的盈利分析來預測未來的股市變化。他們會基于金融市場的過去數(shù)據(jù)和公司的基本面數(shù)據(jù)來看其呈現(xiàn)的動態(tài),從而進行宏觀和微觀經(jīng)濟學分析。非傳統(tǒng)金融數(shù)據(jù),也稱為另類數(shù)據(jù),包括對金融市場有影響的海量文本、衛(wèi)星圖像和語音數(shù)據(jù)等等。這種數(shù)據(jù)的多樣性就是這里講的異構(gòu)數(shù)據(jù)的問題。它對于傳統(tǒng)的統(tǒng)計方法和金融數(shù)據(jù)分析而言,是一個巨大的挑戰(zhàn)。而有了人工智能賦能后,金融投資領域就能夠?qū)Ξ悩?gòu)或非標準金融數(shù)據(jù)進行更精準的分析。這是因為深度神經(jīng)網(wǎng)絡可以很自然地將異構(gòu)數(shù)據(jù)整合在一起。
現(xiàn)在,華爾街的很多金融機構(gòu)都關注或應用了人工智能技術,其中一些我熟悉的對沖基金也聘用了同我有類似背景的人工智能專家來幫助他們開發(fā)相應的人工智能技術。在兩年多前,我們(Citadel)就啟動了相關的研究項目,而我們的競爭對手如 Two Sigma、DE Shaw、JP Morgan、Goldman Sachs 等也在一年前聘用了人工智能科學家,跟進了相關的工作。它們現(xiàn)在也在人工智能人才上同我的團隊竟爭。金融機構(gòu)爭相勘實自己的人工智能技術的這一現(xiàn)狀,也間接說明了人工智能技術的應用對于金融投資領域的作用不言而喻。在使用人工智能分析金融市場時,能用到一些比較明顯的異構(gòu)數(shù)據(jù)。這里我舉兩個例子,都是來源自金融學的學術文獻。
一個例子是新聞社交媒體的文本數(shù)據(jù)。比如說,我們可以采用人工智能來分析一些新聞社交媒體對于市場行情的分析和討論,以了解機構(gòu)投資者以及散戶投資者對于金融市場的情緒。這一點是非常重要的,因為金融市場實際上包含心理學上的博弈,也就是說這是買賣雙方在市場上的博弈,由此形成金融市場的走向。因此,自然語言處理等技術對于金融分析而言,是非常有意義的。
另一個例子是公開演講或訪談的數(shù)據(jù)。這種數(shù)據(jù)對于金融投資分析來說,也是一種有用的異構(gòu)數(shù)據(jù)。舉個例子,在 Enron 出事的前段時間,我們是否能從這家公司 CEO 的某個采訪中看到一些欺詐或遮掩的貓膩?他們在訪談中可能會透露一些微弱的信號,也可能會故意說假話,并且在說假話時的說話方式可能會跟說真話的時候不太一樣,當時呈現(xiàn)的語音語調(diào)、互動表情都能夠成為尋找蛛絲馬跡的點,也都可以成為分析金融市場的波動和走向的信息源。投行等機構(gòu),也都會在與一些公司的 CEO 打交道和交通的過程中對其進行分析,以獲得一些有價值的信息。而這個尋找一些蛛絲馬跡來分析問題的過程,實際上是可以通過人工智能賦能金融市場來完成的。
那么為什么這樣的一些另類(異構(gòu))的數(shù)據(jù)對于金融市場的研究至關重要,且是獨一無二的呢?因為其實人工智能的很多落地經(jīng)常只會用到單類或至多兩類數(shù)據(jù):影像數(shù)據(jù)和文本數(shù)據(jù)。而對分析金融市場有用的數(shù)據(jù)則更加復雜、更加多類。一般分析師通過基本面數(shù)據(jù)來分析上市公司在金融市場、實體經(jīng)濟中的市場表現(xiàn)等,這些數(shù)據(jù)可以充分展現(xiàn)某家公司目前的財務狀況、經(jīng)營狀況,同時,它可以同歷史市場數(shù)據(jù)以及圖像,文本,甚至和語音數(shù)據(jù)綜合起來應用。而這個將所有數(shù)據(jù)整合起來的過程,是能夠通過人工智能來助力和賦能,整合分散的多類數(shù)據(jù),從而挖掘更多真相。
那投行和對沖基金等在使用人工智能技術分析金融市場時還能注意其他哪些事情,未來能做什么呢?
首先,我們要確保數(shù)據(jù)的可獲得性,也就是說讓更多的人更好地獲得一些對他們的研究有幫助的有價值的數(shù)據(jù),這樣我們才有更大發(fā)揮空間。
其次,我們要確保數(shù)據(jù)不侵犯隱私,控制好金融風險。對沖基金公司雖然擁有非常多的數(shù)據(jù),但是需要更加精準地去篩選合適的數(shù)據(jù)并不侵犯隱私。
同時,我們需要招募到一些具備良好金融素養(yǎng)的又精通人工智能的有價值的人才,同時也需要對有潛力的人才進行培訓。一般而言,擁有很強金融背景的人可能不太精通人工智能,所有我們特別需要招募到既有金融背景又懂人工智能的人才,他們就是我們所說的「明星雇員」。
最后,我們也需要針對金融領域的數(shù)據(jù)分析定制算法,從而更好地應對金融領域所面臨的獨特的挑戰(zhàn)。
謝謝大家聆聽我的演講。
演講結(jié)束后,雷鋒網(wǎng) AI 科技評論也對鄧力教授進行了提問,在提問中問到了大家都比較關注的兩個問題:一是鄧力教授與 Geoffrey Hinton 教授的淵源;二是鄧力教授從微軟離職進入金融領域后的一些感想。雷鋒網(wǎng) AI 科技評論整理如下:
AI 科技評論:您放下神經(jīng)網(wǎng)絡的研究再到重拾該方向的研究并取得突破性的進展,似乎都與 Geoffrey Hinton 存在著某些聯(lián)系,您怎樣評價 Hinton 對您研究生涯的影響?
鄧力教授:是的,Hinton 對我的職業(yè)生涯幫助很大,主要體現(xiàn)在兩個方面:
第一個是我在他身上看到了信念的力量。Hinton 從神經(jīng)網(wǎng)絡的研究初期,也就是大家非常質(zhì)疑這種方法的時候,他始終都堅持神經(jīng)網(wǎng)絡能夠解決人工智能問題,一直到現(xiàn)在,我個人真的非常佩服他。
第二個是思維方法。在跟 Hinton 的合作中,他教給了我很多好的思維方法。
AI 科技評論:在此前媒體對您離職微軟的報道中,了解到您曾表示「我覺得現(xiàn)在金融領域已經(jīng)非常成熟了,可以讓人工智能來大顯神威?!鼓M入金融領域兩年多,想法是否還與當年一樣呢?
鄧力教授:進入金融領域之前和之后的感受是完全不同的。
在進入之前,我當時的想法是,我自己在語音識別及信息和語言處理等領域已經(jīng)研究得比較不錯的,對于我而言不再具有特別大的挑戰(zhàn)性,所以我就想換到一個更具挑戰(zhàn)性的領域去展開研究。當時考慮到金融領域的數(shù)據(jù)量特別豐富,更多的數(shù)據(jù)就能夠讓我的研究工作做得更好,而需要用到的最基本方法與我之前用的那一套不會相差太遠。當時就覺得到金融領域做研究問題應該不大,并且非常具有前景性。
但是真正轉(zhuǎn)到金融領域后,我才發(fā)現(xiàn),該領域在應用人工智能方面的挑戰(zhàn)性遠遠要比其它我熟悉的領域大得多,就比如我在演講中提到的數(shù)據(jù)的噪聲大、由競爭導致的非穩(wěn)定性以及異構(gòu)數(shù)據(jù)問題,這都是非常復雜有趣的。不過我們目前也取得了不少技術成果,能夠比較好地解決金融領域的特殊問題。
雷鋒網(wǎng) AI 科技評論報道
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。