丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
人工智能 正文
發(fā)私信給AI研習(xí)社-譯站
發(fā)送

1

手把手教你訓(xùn)練 RNN | Part II

本文作者: AI研習(xí)社-譯站 2018-06-04 16:11
導(dǎo)語:手把手演示 RNN 訓(xùn)練過程,讓你輕松搞懂 RNN。

雷鋒網(wǎng)按:本文為雷鋒字幕組編譯的技術(shù)博客,原標(biāo)題 Step-by-step walkthrough of RNN Training - Part II,作者為 Eniola Alese。

翻譯 | 陳濤    整理 |  凡江


RNN 的反向傳播是為了計算出關(guān)于損失函數(shù)的梯度值

讀者可以在這里看到本文的 Part I(http://www.ozgbdpf.cn/news/201805/ZMeniGUPBZ50lyvk.html)。

單個 RNN 單元的反向傳播

RNN 中反向傳播的目的是計算出最終的損失值 L 分別對權(quán)值矩陣(W_xh,W_ah,W_ao)和偏置向量(b_h,b_o)的偏導(dǎo)數(shù)值。

手把手教你訓(xùn)練 RNN  | Part II

推導(dǎo)出所需的導(dǎo)數(shù)值非常簡單,我們只需要利用鏈?zhǔn)椒▌t就能計算出它們。

第一步:為了計算代價,需要先定義損失函數(shù)。一般根據(jù)具體手中的任務(wù)來選擇該損失函數(shù)。在這個例子里,對于多分類輸出問題,我們采用交叉熵?fù)p失函數(shù) L?t?,其具體計算過程如下:

手把手教你訓(xùn)練 RNN  | Part II

第二步:接下來我們開始往后計算損失函數(shù) L?t? 對預(yù)測輸出值的激活值 ??t? 的偏導(dǎo)數(shù)值。因為在前向傳播過程中 softmax 函數(shù)以多分類的輸出值作為輸入,因此下面的偏導(dǎo)數(shù)值手把手教你訓(xùn)練 RNN  | Part II的計算分為兩種情況:分類 i 時和分類 k 時:

手把手教你訓(xùn)練 RNN  | Part II

第三步:接著利用分類 i 時和分類 k 時的偏導(dǎo)數(shù)值手把手教你訓(xùn)練 RNN  | Part II,可以計算出損失函數(shù) L?t? 對預(yù)測輸出值 o?t? 的偏導(dǎo)數(shù)值:

手把手教你訓(xùn)練 RNN  | Part II

第四步:利用偏導(dǎo)數(shù)值手把手教你訓(xùn)練 RNN  | Part II及鏈?zhǔn)椒▌t,計算出損失函數(shù) L?t? 對輸出過程中的偏置向量 b_o 的偏導(dǎo)數(shù)值:


手把手教你訓(xùn)練 RNN  | Part II

第五步:利用偏導(dǎo)數(shù)值手把手教你訓(xùn)練 RNN  | Part II及鏈?zhǔn)椒▌t,計算出損失函數(shù) L?t? 對隱層至輸出層中的權(quán)值矩陣 W_ao 的偏導(dǎo)數(shù)值:

手把手教你訓(xùn)練 RNN  | Part II

第六步: 利用偏導(dǎo)數(shù)值手把手教你訓(xùn)練 RNN  | Part II手把手教你訓(xùn)練 RNN  | Part II及鏈?zhǔn)椒▌t,計算出損失函數(shù) L?t? 對隱狀態(tài)的激活值 a?t? 的偏導(dǎo)數(shù)值:

手把手教你訓(xùn)練 RNN  | Part II

第七步: 利用偏導(dǎo)數(shù)值手把手教你訓(xùn)練 RNN  | Part II及鏈?zhǔn)椒▌t,計算出損失函數(shù) L?t? 對隱狀態(tài) h?t? 的偏導(dǎo)數(shù)值:

手把手教你訓(xùn)練 RNN  | Part II

第八步: 利用偏導(dǎo)數(shù)值手把手教你訓(xùn)練 RNN  | Part II及鏈?zhǔn)椒▌t,計算出損失函數(shù) L?t? 對隱狀態(tài)的偏置向量 b_h 的偏導(dǎo)數(shù)值:

手把手教你訓(xùn)練 RNN  | Part II

第九步:利用偏導(dǎo)數(shù)值手把手教你訓(xùn)練 RNN  | Part II及鏈?zhǔn)椒▌t,計算出損失函數(shù) L?t? 對輸入層至隱層中的偏置矩陣 W_xh 的偏導(dǎo)數(shù)值:

手把手教你訓(xùn)練 RNN  | Part II

第十步:利用偏導(dǎo)數(shù)值手把手教你訓(xùn)練 RNN  | Part II及鏈?zhǔn)椒▌t,計算出損失函數(shù) L?t? 對輸入層至隱層中的偏置矩陣 W_ah 的偏導(dǎo)數(shù)值:

手把手教你訓(xùn)練 RNN  | Part II

隨時間反向傳播(BPTT)

就像前文中提到的前向傳播過程一樣,將循環(huán)網(wǎng)絡(luò)展開,BPTT 將沿此一直運行著上述步驟。

手把手教你訓(xùn)練 RNN  | Part II

手把手教你訓(xùn)練 RNN  | Part II

主要的區(qū)別在于我們必須將每個時間步 t 的偏導(dǎo)數(shù)值手把手教你訓(xùn)練 RNN  | Part II累加起來,從而更新權(quán)值和偏置,這是因為這些參數(shù)在前向傳播的過程中是被各個時間步所共享的。

總結(jié)

在本文的第一部分和第二部分中,我們了解了循環(huán)神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程中所涉及到的前向傳播和反向傳播。接下來,我們將著眼于 RNN 中所存在的梯度消失問題,并討論 LSTM 和 GRU 網(wǎng)絡(luò)的進(jìn)展。


博客原址:https://medium.com/learn-love-ai/step-by-step-walkthrough-of-rnn-training-part-ii-7141084d274b

手把手教你訓(xùn)練 RNN  | Part II

雷鋒網(wǎng)雷鋒網(wǎng)

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

手把手教你訓(xùn)練 RNN  | Part II

分享:
相關(guān)文章

知情人士

AI研習(xí)社(yanxishe.com)譯站頻道,傳播前沿人工智能知識,讓語言不再成為學(xué)習(xí)知識的門檻。(原雷鋒字幕組)
當(dāng)月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說