深度 | 鄧力：從語音 AI 到金融 AI，挑戰(zhàn)有哪些？

本文作者：叢末

2019-07-20 12:33

導(dǎo)語：看語音學(xué)者鄧力如何轉(zhuǎn)向金融 AI

雷鋒網(wǎng) AI 科技評論按：7 月 12 日-7 月 14 日，2019 第四屆全球人工智能與機器人峰會（CCF-GAIR 2019）于深圳正式召開。峰會由中國計算機學(xué)會（CCF）主辦，雷鋒網(wǎng)、香港中文大學(xué)（深圳）承辦，深圳市人工智能與機器人研究院協(xié)辦，得到了深圳市政府的大力指導(dǎo)，是國內(nèi)人工智能和機器人學(xué)術(shù)界、工業(yè)界及投資界三大領(lǐng)域的頂級交流博覽盛會，旨在打造國內(nèi)人工智能領(lǐng)域極具實力的跨界交流合作平臺。

7 月 12 日，加拿大工程院院士、Citadel 首席人工智能官、前微軟 AI 首席科學(xué)家、IEEE Fellow 鄧力教授為「人工智能前沿專場」帶來了《AI Models：From Speech and Language to Financial Markets》的大會報告。以下為鄧力教授所做的大會報告全文。

深度 | 鄧力：從語音 AI 到金融 AI，挑戰(zhàn)有哪些？

本次我演講的主題可能跟其他演講者不太一樣，但我相信其中還是有一些共性值得我們探討。因為人工智能涵蓋了很多領(lǐng)域，其中就包括剛才 Hackman 教授提到的重要主題，即人工智能和教育以及人工智能如何在教育領(lǐng)域?qū)崿F(xiàn)更多的應(yīng)用，我認(rèn)為這一類的落地應(yīng)用絕對是人工智能領(lǐng)域未來發(fā)展的重點之一。

今天我要重點分享的內(nèi)容包括兩個部分：第一部分是人工智能語音語言領(lǐng)域的應(yīng)用，比如說語音識別和語言處理；第二部分是過渡到人工智能在金融領(lǐng)域的一些前沿進(jìn)展和挑戰(zhàn)。

1、語音歷史

首先，我先介紹一下目前深度學(xué)習(xí)（即現(xiàn)代人工智能技術(shù)）在一些領(lǐng)域中現(xiàn)有的成功應(yīng)用。

近年來，深度學(xué)習(xí)的發(fā)展特別快，例如語音識別，自然語言處理、機器人、計算機視覺等領(lǐng)域取得了非常大的進(jìn)展。同時我也認(rèn)為，這些領(lǐng)域在接下來的幾年時間內(nèi)還將實現(xiàn)更大的發(fā)展。

另外，我認(rèn)為一些大家比較關(guān)注但是還沒有通過媒體上看到的取得特別大進(jìn)展的行業(yè)，如農(nóng)業(yè)、教育、金融以及零售等，也具有非常大的潛能。在這里，我會重點介紹人工智能在金融領(lǐng)域的可行性。

在此之前，我先問大家一個問題，大家覺得人工智能在推動金融市場（包括商業(yè)模式和交易）的轉(zhuǎn)型上有多大的潛力？為了讓大家更好地回答這個問題，我們先來回顧一下大概十年前發(fā)生的一件事。

深度 | 鄧力：從語音 AI 到金融 AI，挑戰(zhàn)有哪些？

2009 年 12 月 12 日的 NIPS 上，我負(fù)責(zé)主辦了一個 workshop，當(dāng)時我邀請了微軟和多倫多大學(xué)的同事們參加，與俞棟、Geoffrey Hinton 一同探討了深度學(xué)習(xí)未來的發(fā)展前景，并通過調(diào)查研究從不同的維度來分析深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)在語音語言領(lǐng)域未來幾年的發(fā)展態(tài)勢。

之后，我們微軟在語音識別和翻譯領(lǐng)域投入了很多人力，希望通過深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)來實現(xiàn)機器語音識別和翻譯。經(jīng)過微軟兩年高強度的研究，2012 年，深度學(xué)習(xí)在語音識別領(lǐng)域取得了較大的進(jìn)展，這也是深度神經(jīng)網(wǎng)絡(luò)研究在語音識別領(lǐng)域上的一次早期的大規(guī)模嘗試，也是深度學(xué)習(xí)第一次在工業(yè)界取得成功的案例。

深度 | 鄧力：從語音 AI 到金融 AI，挑戰(zhàn)有哪些？

2012 年，正好就在中國天津，我當(dāng)時所在的微軟研究院嘗試使用語音識別和翻譯技術(shù)來對演講進(jìn)行英到中的口語自動翻譯。這可以說是語音識別領(lǐng)域的一個里程碑式的時刻。在這前后，科大訊飛、百度等很多公司都加入到這個領(lǐng)域的研究中來，研發(fā)基于深度學(xué)習(xí)的新一代語音識別和翻譯技術(shù)。

深度 | 鄧力：從語音 AI 到金融 AI，挑戰(zhàn)有哪些？

而更早之前，大約從 1993 年開始，我和很多同行者就開始研究即時語音識別技術(shù)。到 2000 年，即時語音識別的錯誤率非常明顯得在不斷下降，但當(dāng)時基于隱馬爾科夫模型的語音識別技術(shù)在 2000 年至 2009 年期間一直處于瓶頸停滯期，而在 2009 年引入深度學(xué)習(xí)以后開始有了新的進(jìn)展：2009 年至 2012 年又有了第二輪更明顯的錯誤率的下降。1993 年到 2000 年、2009 年至 2012 年是這項技術(shù)的兩個標(biāo)志性的階段。

十年以后的今天，大家可能認(rèn)為這一切都發(fā)展得自然而然，對人工智能領(lǐng)域的所有概念都習(xí)以為常，但在那個時候，深度學(xué)習(xí)的應(yīng)用是非常罕見的。

2、從語音到金融

深度 | 鄧力：從語音 AI 到金融 AI，挑戰(zhàn)有哪些？

上圖是用于語音識別的常見深度神經(jīng)網(wǎng)絡(luò)架構(gòu)，獲得了很大的成功，我們同樣也希望讓這項深度學(xué)習(xí)技術(shù)在金融領(lǐng)域發(fā)揮同樣的作用。

深度 | 鄧力：從語音 AI 到金融 AI，挑戰(zhàn)有哪些？

上圖是常見的語音識別系統(tǒng)的基本組成模塊。我們將麥克風(fēng)拾取的聲音和文本作為數(shù)據(jù)，通過聲學(xué)模型、詞義模型和語言模型等不同的模塊來訓(xùn)練完整的語音識別系統(tǒng)。我展示這個圖主要就是想給大家看我們最早期的研究方式是怎么樣分步訓(xùn)練完整的語音識別系統(tǒng)的，就是說在真正的深度神經(jīng)網(wǎng)絡(luò)開始之前，我們會使用不同的語音和文本數(shù)據(jù)來訓(xùn)練這些不同的模型模塊。

這些不同的模型模塊的研發(fā)過程中往往是相對獨立的，即便是微軟這樣的公司，在早期都是獨立組建團(tuán)隊去專門負(fù)責(zé)聲學(xué)模型和語言模型不同模塊的研發(fā)。但是發(fā)展到后期，由于有了深度神經(jīng)網(wǎng)絡(luò)端到端學(xué)習(xí)的能力，我們就可以建立綜合性的解決方案，將所有不同的聲學(xué)模型模塊和語言模型模塊連接起來綜合訓(xùn)練。

金融界的從業(yè)者應(yīng)該都知道，目前量化交易的系統(tǒng)也分成許多不同的模塊，類似于深度神經(jīng)網(wǎng)絡(luò)端到端學(xué)習(xí)之前的語音識別系統(tǒng)?，F(xiàn)代語音識別從獨立研究不同模塊的方式轉(zhuǎn)變成一體化模型研發(fā)，使得模型的綜合性越來越高，這應(yīng)該有助于啟發(fā)研究者們思考怎樣改善基于相對獨立模塊的量化交易的金融系統(tǒng)。

在自然語言處理方面，深度學(xué)習(xí)同樣起到了顛覆性的作用。其中就包括機器翻譯，關(guān)于這個部分，周明博士會在今天下午的演講中跟大家詳細(xì)分享。

而深度學(xué)習(xí)等熱門技術(shù)的挑戰(zhàn)在哪里呢？主要還在于需要設(shè)計一個正確的、合適的架構(gòu)來落地，包括清楚相應(yīng)應(yīng)用領(lǐng)域的機器學(xué)習(xí)難點，同時也需要足夠的有標(biāo)注的數(shù)據(jù)來訓(xùn)練機器解決問題。前一輪的人工智能技術(shù)無法成功解決大型的問題，需要通過現(xiàn)在新一輪的人工智能技術(shù)來解決。

深度 | 鄧力：從語音 AI 到金融 AI，挑戰(zhàn)有哪些？

簡單介紹一下深度學(xué)習(xí)在自然語言處理的一個有趣的應(yīng)用 --- 看圖說話。上面這張圖像是奧巴馬的夫人和她的女兒們以及彭麗媛的合照，人工智能技術(shù)可以通過臉部識別與數(shù)據(jù)庫進(jìn)行比對來識別他們的身份，然后用一個自然語言的句子來描述這張照片的內(nèi)容。這是人工智能技術(shù)應(yīng)用得非常成功的案例之一。

3、三大獨特挑戰(zhàn)

作為一個非常特殊的領(lǐng)域，金融領(lǐng)域在人工智能技術(shù)應(yīng)用層面所面臨的挑戰(zhàn)要比我在前面介紹的語音語言領(lǐng)域更大，其中以三大挑戰(zhàn)最為典型，包括：

其一是金融數(shù)據(jù)的噪音非常大，不僅在輸入端，更在輸出端。在金融市場中，比如說股市存在的大量市場數(shù)據(jù)就有非常大的噪聲，這些數(shù)據(jù)很多時候不能反映真實的股票市場情況，甚至噪聲還會覆蓋掉有用的信息。因此需要人類分析師或人工智能去對這些數(shù)據(jù)進(jìn)行提煉，從而獲得有價值的信息。也就是說，如果你要基于一些金融機構(gòu)提供的數(shù)據(jù)做預(yù)測，首先就需要排除噪音，而對于語音識別、自然語言處理等領(lǐng)域而言，這一類挑戰(zhàn)幾乎是不存在的。目前，金融領(lǐng)域還沒有相應(yīng)的成熟機制來解決這一問題，所以需要探索各類人工智能技術(shù)來解決這一難題，而我們目前也看到了一些前進(jìn)的方向。
其二是由于數(shù)據(jù)共享缺失以及數(shù)據(jù)和市場的非穩(wěn)定性所導(dǎo)致的人工智能建模問題。這個挑戰(zhàn)很大程度上是由于金融領(lǐng)域的競爭特性所決定的。金融公司的算法和數(shù)據(jù)基本上都無法像很多巨頭科技公司那樣將很多算法和數(shù)據(jù)進(jìn)行開源分享，所以競爭激烈的金融領(lǐng)域是無法像自然語言處理等領(lǐng)域那樣，能夠基于過去的大數(shù)據(jù)用統(tǒng)計學(xué)的方法進(jìn)行大數(shù)據(jù)分析，只能對一些在不斷變動的波動數(shù)據(jù)進(jìn)行分析。同時，激烈的競爭還會讓新開發(fā)的統(tǒng)計模型和算法漸漸失去他們的有效性，遠(yuǎn)快過自然語言處理和語音識別的模型和算法。因此，這個在金融領(lǐng)域獨有的棘手和難以駕馭的問題同樣也需要非常特殊的人工智能技術(shù)來解決。
其三是異構(gòu)數(shù)據(jù)問題，包括非傳統(tǒng)金融數(shù)據(jù)和傳統(tǒng)金融數(shù)據(jù)的整合和綜合利用。以華爾街的金融分析師為例，他們并不都在使用標(biāo)準(zhǔn)數(shù)據(jù)。傳統(tǒng)的金融數(shù)據(jù)包括很多種，其中一種是市場信息，很多技術(shù)分析師都使用一套規(guī)則和模板識別來分析股票；另一種叫做基本面數(shù)據(jù)，即分析師根據(jù)公司過去、現(xiàn)在和將來的盈利分析來預(yù)測未來的股市變化。他們會基于金融市場的過去數(shù)據(jù)和公司的基本面數(shù)據(jù)來看其呈現(xiàn)的動態(tài)，從而進(jìn)行宏觀和微觀經(jīng)濟(jì)學(xué)分析。非傳統(tǒng)金融數(shù)據(jù)，也稱為另類數(shù)據(jù)，包括對金融市場有影響的海量文本、衛(wèi)星圖像和語音數(shù)據(jù)等等。這種數(shù)據(jù)的多樣性就是這里講的異構(gòu)數(shù)據(jù)的問題。它對于傳統(tǒng)的統(tǒng)計方法和金融數(shù)據(jù)分析而言，是一個巨大的挑戰(zhàn)。而有了人工智能賦能后，金融投資領(lǐng)域就能夠?qū)Ξ悩?gòu)或非標(biāo)準(zhǔn)金融數(shù)據(jù)進(jìn)行更精準(zhǔn)的分析。這是因為深度神經(jīng)網(wǎng)絡(luò)可以很自然地將異構(gòu)數(shù)據(jù)整合在一起。

4、如何應(yīng)用 AI ？

現(xiàn)在，華爾街的很多金融機構(gòu)都關(guān)注或應(yīng)用了人工智能技術(shù)，其中一些我熟悉的對沖基金也聘用了同我有類似背景的人工智能專家來幫助他們開發(fā)相應(yīng)的人工智能技術(shù)。在兩年多前，我們（Citadel）就啟動了相關(guān)的研究項目，而我們的競爭對手如 Two Sigma、DE Shaw、JP Morgan、Goldman Sachs 等也在一年前聘用了人工智能科學(xué)家，跟進(jìn)了相關(guān)的工作。它們現(xiàn)在也在人工智能人才上同我的團(tuán)隊竟?fàn)?。金融機構(gòu)爭相勘實自己的人工智能技術(shù)的這一現(xiàn)狀，也間接說明了人工智能技術(shù)的應(yīng)用對于金融投資領(lǐng)域的作用不言而喻。在使用人工智能分析金融市場時，能用到一些比較明顯的異構(gòu)數(shù)據(jù)。這里我舉兩個例子，都是來源自金融學(xué)的學(xué)術(shù)文獻(xiàn)。

一個例子是新聞社交媒體的文本數(shù)據(jù)。比如說，我們可以采用人工智能來分析一些新聞社交媒體對于市場行情的分析和討論，以了解機構(gòu)投資者以及散戶投資者對于金融市場的情緒。這一點是非常重要的，因為金融市場實際上包含心理學(xué)上的博弈，也就是說這是買賣雙方在市場上的博弈，由此形成金融市場的走向。因此，自然語言處理等技術(shù)對于金融分析而言，是非常有意義的。
另一個例子是公開演講或訪談的數(shù)據(jù)。這種數(shù)據(jù)對于金融投資分析來說，也是一種有用的異構(gòu)數(shù)據(jù)。舉個例子，在 Enron 出事的前段時間，我們是否能從這家公司 CEO 的某個采訪中看到一些欺詐或遮掩的貓膩？他們在訪談中可能會透露一些微弱的信號，也可能會故意說假話，并且在說假話時的說話方式可能會跟說真話的時候不太一樣，當(dāng)時呈現(xiàn)的語音語調(diào)、互動表情都能夠成為尋找蛛絲馬跡的點，也都可以成為分析金融市場的波動和走向的信息源。投行等機構(gòu)，也都會在與一些公司的 CEO 打交道和交通的過程中對其進(jìn)行分析，以獲得一些有價值的信息。而這個尋找一些蛛絲馬跡來分析問題的過程，實際上是可以通過人工智能賦能金融市場來完成的。

那么為什么這樣的一些另類（異構(gòu)）的數(shù)據(jù)對于金融市場的研究至關(guān)重要，且是獨一無二的呢？因為其實人工智能的很多落地經(jīng)常只會用到單類或至多兩類數(shù)據(jù)：影像數(shù)據(jù)和文本數(shù)據(jù)。而對分析金融市場有用的數(shù)據(jù)則更加復(fù)雜、更加多類。一般分析師通過基本面數(shù)據(jù)來分析上市公司在金融市場、實體經(jīng)濟(jì)中的市場表現(xiàn)等，這些數(shù)據(jù)可以充分展現(xiàn)某家公司目前的財務(wù)狀況、經(jīng)營狀況，同時，它可以同歷史市場數(shù)據(jù)以及圖像，文本，甚至和語音數(shù)據(jù)綜合起來應(yīng)用。而這個將所有數(shù)據(jù)整合起來的過程，是能夠通過人工智能來助力和賦能，整合分散的多類數(shù)據(jù)，從而挖掘更多真相。

那投行和對沖基金等在使用人工智能技術(shù)分析金融市場時還能注意其他哪些事情，未來能做什么呢？

首先，我們要確保數(shù)據(jù)的可獲得性，也就是說讓更多的人更好地獲得一些對他們的研究有幫助的有價值的數(shù)據(jù)，這樣我們才有更大發(fā)揮空間。
其次，我們要確保數(shù)據(jù)不侵犯隱私，控制好金融風(fēng)險。對沖基金公司雖然擁有非常多的數(shù)據(jù)，但是需要更加精準(zhǔn)地去篩選合適的數(shù)據(jù)并不侵犯隱私。
同時，我們需要招募到一些具備良好金融素養(yǎng)的又精通人工智能的有價值的人才，同時也需要對有潛力的人才進(jìn)行培訓(xùn)。一般而言，擁有很強金融背景的人可能不太精通人工智能，所有我們特別需要招募到既有金融背景又懂人工智能的人才，他們就是我們所說的「明星雇員」。
最后，我們也需要針對金融領(lǐng)域的數(shù)據(jù)分析定制算法，從而更好地應(yīng)對金融領(lǐng)域所面臨的獨特的挑戰(zhàn)。

謝謝大家聆聽我的演講。

演講結(jié)束后，雷鋒網(wǎng) AI 科技評論也對鄧力教授進(jìn)行了提問，在提問中問到了大家都比較關(guān)注的兩個問題：一是鄧力教授與 Geoffrey Hinton 教授的淵源；二是鄧力教授從微軟離職進(jìn)入金融領(lǐng)域后的一些感想。雷鋒網(wǎng) AI 科技評論整理如下：

AI 科技評論：您放下神經(jīng)網(wǎng)絡(luò)的研究再到重拾該方向的研究并取得突破性的進(jìn)展，似乎都與 Geoffrey Hinton 存在著某些聯(lián)系，您怎樣評價 Hinton 對您研究生涯的影響？

鄧力教授：是的，Hinton 對我的職業(yè)生涯幫助很大，主要體現(xiàn)在兩個方面：

第一個是我在他身上看到了信念的力量。Hinton 從神經(jīng)網(wǎng)絡(luò)的研究初期，也就是大家非常質(zhì)疑這種方法的時候，他始終都堅持神經(jīng)網(wǎng)絡(luò)能夠解決人工智能問題，一直到現(xiàn)在，我個人真的非常佩服他。
第二個是思維方法。在跟 Hinton 的合作中，他教給了我很多好的思維方法。

AI 科技評論：在此前媒體對您離職微軟的報道中，了解到您曾表示「我覺得現(xiàn)在金融領(lǐng)域已經(jīng)非常成熟了，可以讓人工智能來大顯神威?！鼓M(jìn)入金融領(lǐng)域兩年多，想法是否還與當(dāng)年一樣呢？

鄧力教授：進(jìn)入金融領(lǐng)域之前和之后的感受是完全不同的。

在進(jìn)入之前，我當(dāng)時的想法是，我自己在語音識別及信息和語言處理等領(lǐng)域已經(jīng)研究得比較不錯的，對于我而言不再具有特別大的挑戰(zhàn)性，所以我就想換到一個更具挑戰(zhàn)性的領(lǐng)域去展開研究。當(dāng)時考慮到金融領(lǐng)域的數(shù)據(jù)量特別豐富，更多的數(shù)據(jù)就能夠讓我的研究工作做得更好，而需要用到的最基本方法與我之前用的那一套不會相差太遠(yuǎn)。當(dāng)時就覺得到金融領(lǐng)域做研究問題應(yīng)該不大，并且非常具有前景性。

但是真正轉(zhuǎn)到金融領(lǐng)域后，我才發(fā)現(xiàn)，該領(lǐng)域在應(yīng)用人工智能方面的挑戰(zhàn)性遠(yuǎn)遠(yuǎn)要比其它我熟悉的領(lǐng)域大得多，就比如我在演講中提到的數(shù)據(jù)的噪聲大、由競爭導(dǎo)致的非穩(wěn)定性以及異構(gòu)數(shù)據(jù)問題，這都是非常復(fù)雜有趣的。不過我們目前也取得了不少技術(shù)成果，能夠比較好地解決金融領(lǐng)域的特殊問題。

雷鋒網(wǎng) AI 科技評論報道

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。