0
本文作者: AI研習社 | 2019-07-15 16:18 |
雷鋒網(wǎng)AI研習社按:近年來,隨著深度學習在圖像和語音上的快速發(fā)展,更多領域的開發(fā)者們紛紛將目光投入到這個新興的領域,但是是否深度學習適用于大多數(shù)實際場景呢?是否深度學習一定優(yōu)于傳統(tǒng)的統(tǒng)計方法以及機器學習方法呢?在本次公開課中,作者結合實際在杉數(shù)科技的實際項目經(jīng)驗,為大家解析深度學習的技術細節(jié)以及實際效果。
分享嘉賓:添然,杉數(shù)科技高級算法工程師,美國明尼蘇達大學本科及碩士學位,專業(yè)是自動化控制和計算機科學。2017年三月加入杉數(shù)科技,主要負責收益管理及需求預測。
公開課鏈接:http://www.mooc.ai/open/course/672?=from%20leiphone
分享主題:時序預測中深度學習介紹
分享提綱:
深度學習背景介紹
深度學習算法概述
實際案例分析
推薦閱讀
雷鋒網(wǎng)AI研習社將其分享內容整理如下:
簡單自我介紹一下,我是杉數(shù)的算法工程師,主要負責機器學習、數(shù)據(jù)分析相應的工作,有一定零售業(yè)預測的經(jīng)驗,今天在這里主要跟大家分享一下相關經(jīng)驗,這是今天的主要提綱,如圖:
首先背景方面,相信大家對深度學習這個詞語并不陌生,那什么是深度學習呢?如果結合圖的話,他有不同的層,并且不用的層協(xié)調處理一些特征篩選,達到最終的目的。
為什么使用深度學習呢?圖中這三篇論文奠定了近年來深度學習的基礎,不過我把為什么使用深度學習歸結為兩個點,第一個是大數(shù)據(jù),企業(yè)中積累大數(shù)據(jù)為深度學習提供了燃料,第二個就是高性能計算,GPU在深度學習中大放異彩,這兩個點在我看來是重要的推動因素。
下面簡單過一下一些基本的應用,如圖像上的應用:
NLP上的應用:
接下來會簡單提一下深度學習兩個基礎的框架構成,首先就是卷積神經(jīng)網(wǎng)絡,總結下來有五個部分,另一些卷積神經(jīng)網(wǎng)絡的變種,也是萬變不離其宗,只是對這五部分做了一些針對性的調整,如下圖:
折射到今天的話題,假設要做一個持續(xù)預測,那如何利用卷積神經(jīng)網(wǎng)絡呢?一般遇到的預測問題都是偏一維的,比如預測天氣、商店的銷量等,借鑒這個思路,使用一維的卷積神經(jīng)網(wǎng)絡,據(jù)圖示output是預測的樣本點,可以利用之前的樣本點進行輸入。作為卷積神經(jīng)網(wǎng)絡,有滑動窗口這樣一個概念,所以能夠通過滑動序列來產(chǎn)生這樣的特征。如何做到能夠提取更多特征呢?那就需要疊加更多的卷積層,這樣可以獲得更多的特征提取能力。簡單來說一維卷積神經(jīng)網(wǎng)絡是作為持續(xù)預測比較的一種方式,并且也是大家喜歡嘗試的一個方向。
接著就是循環(huán)神經(jīng)網(wǎng)絡,他天然具有某些時序處理的能力。圖中我列的是一個比較復雜的模型,不過原理幾乎差不多。
Google提出的Encoder-Decoder模型主要用于語音生成等相關的部分,Encoder將模型儲存成context,然后再傳給Decoder。這個模型在當時Google翻譯中是非常成功的。雖然這個模型很簡單,但確實是一個非常經(jīng)典的預測模型,在實際應用中也很常見。
下面我來介紹一下案例,一個案例就是某大型出行平臺的交通預測。要做的是預測給定地理區(qū)域未來某個時間段的出行供需缺口,比如北京東城區(qū)八點到八點半這段時間會有多少人要打車,訂單數(shù)據(jù)可能是得到的最基礎的數(shù)據(jù),但還有一些其他數(shù)據(jù),例如城市POI信息,交通擁堵信息、天氣信息等,這些數(shù)據(jù)是我們預測時主要考慮的幾個方面。
怎么構建深度學習的模型呢?把一些固有的屬性用Embedding的方式處理,并將它們連接起來,就構成了Identity Block,Older Block和User Block就是針對訂單相關的數(shù)據(jù),Supply Block就是對應天氣類交通類的特征。右邊圖示使用的殘差連接可以使訓練得到更好的收斂性,還可以有效緩解梯度消失這個問題。圖示就是整個深度學習的框架。
那么效果如何呢?從這幅圖看出,深度學習在一些峰值的預測上效果是非常不錯的,有些可能跟機器學習的方式差不多,但在拐點的預測方式上優(yōu)勢還是比較明顯。
下一個例子就是件量預測,這也是時序問題,在預測的時候也會得到一些歷史數(shù)據(jù),方法也與上面的例子類似,因為知道了深度學習一些大的框架,其他細節(jié)方面做一些小的調整就行,基本的建模思路跟前者差不多。
來看看結果,這張圖的結果可能比上一張更能反映深度學習的一些特性,同樣深度學習模型在一些峰值和谷值的預測更準確一些。但從圖中可以看出,如果將兩種模型進行簡單的融合,得到的結果會更準確一些。
總體來看,以上是在實際經(jīng)驗中比較有代表性的例子,在預測拐點這種問題上深度學習可能更容易發(fā)現(xiàn)某種規(guī)律,不過實際中如果想要一個更準確的模型,深度學習模型和其他模型融合起來的方式會比較好一點。
接下來給大家推薦一些讀物,如圖示:
今天分享的內容大概就這么多,謝謝大家。
以上就是本期嘉賓的全部分享內容。更多公開課視頻請到雷鋒網(wǎng)(公眾號:雷鋒網(wǎng)) AI 研習社社區(qū)(https://ai.yanxishe.com/?=from%20leiphone)觀看。關注微信公眾號:AI 研習社(okweiwu),可獲取最新公開課直播時間預告。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉載。詳情見轉載須知。