丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
金融科技 正文
發(fā)私信給叨叨
發(fā)送

0

中科院羅平演講全文:自動撰寫金融文檔如何實(shí)現(xiàn),用 AI 解救“金融民工” | CCF-GAIR 2017

本文作者: 叨叨 2017-07-09 22:22 專題:GAIR 2017
導(dǎo)語:特別是做低級的投行從業(yè)者,他們每天都在撰寫各種金融文檔、各種募集說明書

雷鋒網(wǎng)按:光鮮亮麗的投行工作看似有著羨煞旁人的超高回報(bào),但在幾百頁“金融文檔”的日常重壓之下,會被瞬間秒回原形。在中國計(jì)算機(jī)學(xué)會(CCF)主辦,雷鋒網(wǎng)與香港中文大學(xué)(深圳)承辦的 CCF-GAIR 2017 的第二天,中科院計(jì)算所副研究員、微信人工智能首席科學(xué)顧問、博士生導(dǎo)師羅平教授帶來了題為《人工智能在智能投行中的應(yīng)用》的分享,講解了如何用 AI 來解救金融民工,給金融文檔的復(fù)核和撰寫帶來福音。

中科院羅平演講全文:自動撰寫金融文檔如何實(shí)現(xiàn),用 AI 解救“金融民工” | CCF-GAIR 2017

以下為羅平演講速記全文整理,雷鋒網(wǎng)在不改變原意的基礎(chǔ)上做了精編:

非常榮幸參加 CCF-GAIR 2017 金融科技專場,特別是外地的同事,到這兒來的都是真愛,而且是一種緣分。為什么這樣說?昨天晚上我坐在飛機(jī)上,本來飛機(jī)已經(jīng)停了一兩個小時了,準(zhǔn)備要飛了,結(jié)果北京下冰雹。我覺得可能沒有緣分跟大家見面了,但是它最終還是飛過來了,得以順利跟大家見面。

剛才主持人說希望跟大家講講干貨,我是做技術(shù)的,切入到金融行業(yè),希望能跟大家分享一些技術(shù)方面的干貨。

中科院羅平演講全文:自動撰寫金融文檔如何實(shí)現(xiàn),用 AI 解救“金融民工” | CCF-GAIR 2017

我的演講主題是《AI在智能投行中的應(yīng)用》,任何的技術(shù)要切入到一個非常具體的場景才有價值。我們看看智能投行場景需要解決什么問題。

首先投行是做什么的呢?

中科院羅平演講全文:自動撰寫金融文檔如何實(shí)現(xiàn),用 AI 解救“金融民工” | CCF-GAIR 2017

其實(shí)投行是一個金融的媒介,它實(shí)際上是資金需求方和投資方的媒介,讓資金能夠順利的給到資金需求方。投行基本的工作有幾個步驟:

  • 承攬

  • 盡調(diào)與承做

  • 發(fā)行與承銷

  • 后續(xù)督導(dǎo)

這是從前臺到后臺的順序。

中科院羅平演講全文:自動撰寫金融文檔如何實(shí)現(xiàn),用 AI 解救“金融民工” | CCF-GAIR 2017

知乎上有一個調(diào)查:整個金融行業(yè)什么樣的職位最苦逼,排在第一名的是投資銀行家,他們非常的苦,他們苦在哪兒呢?投行的從業(yè)者門檻非常高,每個人都必須要有光鮮的背景,都是海歸、或名校畢業(yè)。

中科院羅平演講全文:自動撰寫金融文檔如何實(shí)現(xiàn),用 AI 解救“金融民工” | CCF-GAIR 2017

但是實(shí)際上他們每天都做著非??啾频墓ぷ?,特別是事業(yè)初期的投行從業(yè)者,每天都在撰寫各種金融文檔、各種募集說明書,包括債券募集說明書、IPO或者資產(chǎn)證券化說明書。這些說明書平均都是500頁以上,撰寫起來非常的痛苦。而且這些東西都有 Deadline,你不能錯過,錯過要等好幾個月才能重新審批。這么大的工作量,他們非常非常的痛苦。

中科院羅平演講全文:自動撰寫金融文檔如何實(shí)現(xiàn),用 AI 解救“金融民工” | CCF-GAIR 2017

同時,金融監(jiān)管機(jī)構(gòu)對文檔的質(zhì)量要求非常高,有三個詞:真實(shí)、準(zhǔn)確、完整,這是他們必須做到的基本原則。如果你沒有做到這個要求會有什么后果呢?

中科院羅平演講全文:自動撰寫金融文檔如何實(shí)現(xiàn),用 AI 解救“金融民工” | CCF-GAIR 2017因?yàn)楣_的金融文檔是具有一定法律效力的,公布出來的行業(yè)數(shù)據(jù)有錯誤,可能會承擔(dān)訴訟的連帶責(zé)任。監(jiān)管部門也會對文檔質(zhì)量有非常高的要求。文檔質(zhì)量往往關(guān)乎IPO是否能成功;文檔質(zhì)量也是證監(jiān)會考評每個投資銀行的重要指標(biāo)。如果級別從A降到B,投行每年將支付更多的監(jiān)管費(fèi)用,這是很大的一筆運(yùn)營成本。

中科院羅平演講全文:自動撰寫金融文檔如何實(shí)現(xiàn),用 AI 解救“金融民工” | CCF-GAIR 2017

那么,我們來看看一些報(bào)道出來的金融文檔出錯的例子,大量的例子實(shí)際上是沒有報(bào)道出來的。

2011年,高盛的一個私募產(chǎn)品,里面存在數(shù)字方面的錯誤,帶來超過 4500 萬美金的賠償訴訟。另外,國內(nèi)某銀行在財(cái)報(bào)中公布“負(fù)債8億億”,實(shí)際上是8萬億。該新聞上就有投資者質(zhì)問:財(cái)報(bào)這么不負(fù)責(zé)任,我們也無法信賴所提供的金融服務(wù)。所以,金融文檔撰寫的操作風(fēng)險(xiǎn)高,所面臨的聲譽(yù)損失和經(jīng)濟(jì)損失非常大。

所以,撰寫這些文檔的投資銀行家們壓力山大。

中科院羅平演講全文:自動撰寫金融文檔如何實(shí)現(xiàn),用 AI 解救“金融民工” | CCF-GAIR 2017

中科院羅平演講全文:自動撰寫金融文檔如何實(shí)現(xiàn),用 AI 解救“金融民工” | CCF-GAIR 2017

最苦逼的是什么呢?這個市場每年都在壯大,也就是說,投行從業(yè)者每年的工作量都在增加。這確實(shí)是一個深刻的痛點(diǎn)。我們看看能不能用AI技術(shù)來消除這些痛點(diǎn)。

中科院羅平演講全文:自動撰寫金融文檔如何實(shí)現(xiàn),用 AI 解救“金融民工” | CCF-GAIR 2017

我們給這項(xiàng)技術(shù)取了一個很酷的名字,叫做庖丁解文。大家都知道一個成語叫庖丁解牛。我們希望AI技術(shù)能夠像庖丁一樣,干凈利落的把金融文檔結(jié)構(gòu)化。

這項(xiàng)自然語言結(jié)構(gòu)化的技術(shù)有三個特點(diǎn)

  • 瞬時:全自動的,都是機(jī)器自動做,沒有人工干預(yù)

  • 精準(zhǔn):非常準(zhǔn)確

  • 深度:要把所有的語義,特別是金融數(shù)據(jù)間的勾稽關(guān)系,都解析出來。


中科院羅平演講全文:自動撰寫金融文檔如何實(shí)現(xiàn),用 AI 解救“金融民工” | CCF-GAIR 2017

我給大家舉一個例子:大量的金融文檔中都有一些對公司各種財(cái)務(wù)指標(biāo)的描述。

實(shí)際上,這句話要讓機(jī)器去理解,是非常難的事情。大家都知道,現(xiàn)在機(jī)器翻譯是做得很好的,但其實(shí)機(jī)器翻譯沒有做任何理解,它可以把這句話翻譯成英文,但是你要是詢問:2014年公司第一大客戶的營業(yè)額是多少,翻譯程序是回答不了的。

如果要精確問答這樣的問題,機(jī)器需要做什么呢?需要把自然語言的描述都結(jié)構(gòu)化。我們研發(fā)的深度結(jié)構(gòu)化技術(shù)包含兩個層面:

  • 第一個層面是 Text2Tuple,從文本到元組。元組是時間、財(cái)務(wù)指標(biāo)、值的三元組,比如說:2013、2014、2015年第一大客戶的營業(yè)額分別是多少錢,我們需要提取出來。

  • 第二個層面是 Text2Equ,我們需要把文本中這些比例數(shù)字,如60%、58%、55%,解釋為語義相同的計(jì)算公式;同時文中提到“呈現(xiàn)逐漸下降的趨勢”,所以,也需要提取出這個不等式的關(guān)系。

這就是我們的核心技術(shù):從非結(jié)構(gòu)化的文檔中自動提取出對應(yīng)語義的元組和公式。因此,我們研發(fā)的模型,輸入為非結(jié)構(gòu)化或半結(jié)構(gòu)化的文本,輸出為可供計(jì)算機(jī)搜索、比對、分析的結(jié)構(gòu)化的數(shù)據(jù)。這其實(shí)是自動構(gòu)建知識圖譜的核心技術(shù)。有了知識圖譜,后續(xù)可以支撐很多應(yīng)用。

中科院羅平演講全文:自動撰寫金融文檔如何實(shí)現(xiàn),用 AI 解救“金融民工” | CCF-GAIR 2017

我們現(xiàn)在關(guān)注的是金融文檔復(fù)核的應(yīng)用。什么是文檔復(fù)核呢?簡言之,就是對金融文檔中的數(shù)字的勾稽關(guān)系進(jìn)行復(fù)核。任何公開的募集說明書都包含大量的數(shù)字,同樣的一個財(cái)務(wù)指標(biāo),它可能會在文字和表格中被多次描述。由于,撰寫過程可能多次修改原始數(shù)據(jù);這將導(dǎo)致數(shù)據(jù)前后不一致的情況。

復(fù)核文檔,英文叫 Authorized Reading,是投行業(yè)的一項(xiàng)重要工作。有了深度結(jié)構(gòu)化技術(shù),我們將能將這項(xiàng)工作完全自動化。

中科院羅平演講全文:自動撰寫金融文檔如何實(shí)現(xiàn),用 AI 解救“金融民工” | CCF-GAIR 2017

舉一個實(shí)際的例子,文本中提到:發(fā)行人的固定資產(chǎn)在2014年是紅色的數(shù)字;但是在表格中,2014年的固定資產(chǎn)對應(yīng)不上。這顯然是一個錯誤。

中科院羅平演講全文:自動撰寫金融文檔如何實(shí)現(xiàn),用 AI 解救“金融民工” | CCF-GAIR 2017

因此,我們研發(fā)了一個自動復(fù)核的產(chǎn)品,AutoDoc。使用起來很簡單,用戶只需上傳需要復(fù)核的金融文檔,經(jīng)過自動解析和比對,機(jī)器會自動標(biāo)注出數(shù)據(jù)不一致的地方。

效果怎么樣呢?我們在1000個已公開的債券募集說明書上進(jìn)行測試和人工確認(rèn)。測試結(jié)果是令人驚訝的。

中科院羅平演講全文:自動撰寫金融文檔如何實(shí)現(xiàn),用 AI 解救“金融民工” | CCF-GAIR 2017

我們發(fā)現(xiàn)這1000個募集說明書里面,有68.92%的文檔存在錯誤,平均包含4.26個錯誤。

中科院羅平演講全文:自動撰寫金融文檔如何實(shí)現(xiàn),用 AI 解救“金融民工” | CCF-GAIR 2017

有了這樣的測試,我們在4月26日把這個功能發(fā)布在微信公眾號 “債有主”上。到目前為止,已經(jīng)有近1000份募集說明書上傳。我們的數(shù)據(jù)是:98.4%的文檔存在錯誤,平均每個文檔中有6.5個錯誤。

中科院羅平演講全文:自動撰寫金融文檔如何實(shí)現(xiàn),用 AI 解救“金融民工” | CCF-GAIR 2017

我們解密一下這項(xiàng)功能背后究竟是什么樣的技術(shù)。實(shí)際上,我們打造一個 NeuSALG 的平臺,什么是 SALG 呢?就是 Semantic Acquisition和 Language Generation。這個平臺最核心的一點(diǎn)是打造一個通路平臺,溝通標(biāo)注、訓(xùn)練、預(yù)測、反饋4個部分。只有數(shù)據(jù)在通路中反復(fù)扭轉(zhuǎn),系統(tǒng)的性能才會越來越好。

中科院羅平演講全文:自動撰寫金融文檔如何實(shí)現(xiàn),用 AI 解救“金融民工” | CCF-GAIR 2017

其實(shí),性能的突破并不是單點(diǎn)的突破,需要從底層深度學(xué)習(xí)框架、模型能力、數(shù)據(jù)等各方面發(fā)力。這也是我們多年研究的積累。比如,在優(yōu)化算法方面,今年我們在 KDD 上發(fā)表了一項(xiàng)研究,能夠動態(tài)確定隨機(jī)梯度下降每輪所需數(shù)據(jù)的大小,這一研究能夠減少多機(jī)多卡的環(huán)境下進(jìn)行訓(xùn)練的通信開銷,從而減少訓(xùn)練時間。這將大幅度提供模型的迭代速度。


中科院羅平演講全文:自動撰寫金融文檔如何實(shí)現(xiàn),用 AI 解救“金融民工” | CCF-GAIR 2017

最后,我想給大家一些對 FinTech 和 AI 的思考。我覺得金融科技應(yīng)該特別關(guān)注金融業(yè)務(wù)場景的中后臺,其實(shí)金融這個領(lǐng)域非常大,它有各式各樣的業(yè)務(wù)場景。

中科院羅平演講全文:自動撰寫金融文檔如何實(shí)現(xiàn),用 AI 解救“金融民工” | CCF-GAIR 2017

比如說,在投行領(lǐng)域,從前臺到后臺的流程是承攬、盡調(diào)與承做、發(fā)行與承銷或者后續(xù)督導(dǎo)。承攬的工作,通常需要跟發(fā)行人和客戶打交道,這是靠關(guān)系、靠人脈的,這個環(huán)節(jié)機(jī)器做不了,而機(jī)器能做的是中后臺的業(yè)務(wù)。又比如,二級市場的資金業(yè)務(wù),從交易、風(fēng)控到清算與結(jié)賬。

我覺得金融科技應(yīng)該在中后臺的業(yè)務(wù)領(lǐng)域里面發(fā)揮作用。

中科院羅平演講全文:自動撰寫金融文檔如何實(shí)現(xiàn),用 AI 解救“金融民工” | CCF-GAIR 2017

為什么?我們發(fā)現(xiàn),金融中后臺的這些工作有兩個特點(diǎn):第一是每天都做同樣的事,重復(fù)的做;第二個特點(diǎn)是:單次工作的難度相對較低。例如:對一句話進(jìn)行復(fù)核,這是很簡單的事情。

但是,整個任務(wù)的難度是兩個方面的乘積, W是完成單次任務(wù)的難度,Dur是持久性難度系數(shù)。

中科院羅平演講全文:自動撰寫金融文檔如何實(shí)現(xiàn),用 AI 解救“金融民工” | CCF-GAIR 2017

我們需要指出:單次完成任務(wù)的難度,需要區(qū)分人和機(jī)器的差異。我們看看,人擅長什么,機(jī)器擅長什么。機(jī)器擅長計(jì)算、存儲、檢索,只要插上電,機(jī)器就能完成。但是,機(jī)器不擅長下棋、不擅長聽、說、寫、理解。阿爾法狗做的事情是把下棋這個事情轉(zhuǎn)換成一個計(jì)算的問題,一旦完成這樣的轉(zhuǎn)換,人是永遠(yuǎn)都不能夠戰(zhàn)勝機(jī)器的。

但是對于人來講,下棋是非常難的,計(jì)算、邏輯推理稍微簡單一點(diǎn);最簡單的是聽說讀寫,就是每個人的基本功能,但是這個事情恰恰是機(jī)器難以做到的。

當(dāng)前AI技術(shù)的成功,實(shí)際都是“弱人工智能”的勝利,它實(shí)質(zhì)是將所謂的“智能”功能轉(zhuǎn)化為計(jì)算的問題。

中科院羅平演講全文:自動撰寫金融文檔如何實(shí)現(xiàn),用 AI 解救“金融民工” | CCF-GAIR 2017

所以,我們現(xiàn)在想做的事情,實(shí)際上是把人類的聽說讀寫和理解的智能功能轉(zhuǎn)換成計(jì)算的過程。如果完成了這樣的轉(zhuǎn)換,那么機(jī)器就能反復(fù)運(yùn)行,一切都會變得簡單。

因此,我們的愿景是:把 paperwork 變成 happywork;釋放人力,讓投資銀行家們完成更多創(chuàng)造性的有價值的工作。

謝謝大家!

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

分享:
相關(guān)文章

編輯

雷鋒網(wǎng)北京編輯。關(guān)注人工智能,略雜。微信(yougo5654)可以找到我。
當(dāng)月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說