丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
人工智能 正文
發(fā)私信給夏睿
發(fā)送

0

如何讓無人機靈活穿越滿是障礙的房間?訓練一個循環(huán)神經網(wǎng)絡試試看

本文作者: 夏睿 2017-03-20 20:33
導語:實驗中,研究人員放棄了傳統(tǒng)的前饋神經網(wǎng)絡,采用的是基于RNN/LSTM的無人機視覺導航技術。

 如何讓無人機靈活穿越滿是障礙的房間?訓練一個循環(huán)神經網(wǎng)絡試試看

如今,深度學習已經在語音識別、計算機視覺等多個應用領域取得了重大突破。然而,要說到它在機器人領域的發(fā)展,那就要另當別論了——深度學習在機器人領域,不僅發(fā)展速度慢,甚至還遭到很多人的質疑。為什么呢?

究其原因,最重要的一點在于所需數(shù)據(jù)難以共享——將深度學習應用到機器人領域,涉及到許多具體物理系統(tǒng)的表達。這意味著,所需數(shù)據(jù)往往是機器人領域的特定數(shù)據(jù)集。因此,研究人員在收集數(shù)據(jù)時,就要耗費較多時間;而在處理和環(huán)境相交互的主動系統(tǒng)時,則會更加費時。

近日,來自魯汶大學的兩位研究人員Klaas Kelchtermans和Tinne Tuytelaars就為解決這一問題展開了研究,并將研究成果撰寫成論文《How hard is it to cross the room ? - Training (Recurrent) Neural Networks to steer a UAV》,發(fā)布在了arXiv上。雷鋒網(wǎng)對論文進行了部分編譯。

論文地址:https://arxiv.org/abs/1702.07600

摘要

我們研究了在無人機導航控制中采用循環(huán)神經網(wǎng)絡(RNN)代替前饋神經網(wǎng)絡(FNN),是否能增加其活動的靈活性。實驗條件是:無人機在執(zhí)行高級導航任務時,需要用前視攝像頭收集信息。

為了讓無人機通過模仿學習學會執(zhí)行導航任務,我們建立了一個用來訓練神經網(wǎng)絡、可應用于空中和陸地兩種交通工具的通用框架。實驗中,我們把框架應用于在模擬環(huán)境中飛行的無人機中,讓它學習如何穿越有多障礙物的房間。

到目前為止,無人機控制的訓練過程中通常只使用前饋神經網(wǎng)絡。為了處理更多高難度的任務,我們提出,引入循環(huán)神經網(wǎng)絡代替前饋神經網(wǎng)絡,并且訓練一個長短期存儲器( LSTM)來控制無人機。

通過視覺信息進行控制屬于序列預測問題,并且需要高相關性的輸入數(shù)據(jù)。這一高相關性就使得訓練神經網(wǎng)絡,尤其是循環(huán)神經網(wǎng)絡,變得不容易進行。

為了克服這一問題,我們在訓練網(wǎng)絡時采用了WW-TBPTT法(window-wise truncated backpropagation through time)。另外,考慮到端對端訓練所需的數(shù)據(jù)通常無法獲得,我們將“只對全連接(FC)進行再訓練的控制層”和“只對長短期存儲器控制層(所需網(wǎng)絡為端到端的訓練)進行再訓練的控制層”的表現(xiàn)進行了對比。

最后,通過讓無人機穿越有障礙物房間這一相對簡單的實驗,我們已經能看出訓練神經控制網(wǎng)絡所具有的重要指導意義和其良好的實踐效果??梢暬牟町愋杂兄诮忉専o人機學習到的行為。 

如何讓無人機靈活穿越滿是障礙的房間?訓練一個循環(huán)神經網(wǎng)絡試試看

雷鋒網(wǎng)注:此圖為論文中的圖12——平均模仿?lián)p失對比圖

實驗變量:已知和未知的房間、無人機用不同構架的神經網(wǎng)絡和不同訓練方法進行控制、是否有攝像頭;

 S-LSTM 用S-TBPTT訓練、WW-LSTM用WW-TBPTT。

探討和結論

此研究中,我們測試了在導航控制中,存儲器(圖12)能如何幫助深度神經網(wǎng)絡更高效地運作。

結果表明,用WW-TBPTT去除訓練數(shù)據(jù)的相關性,在訓練如長短期存儲器這樣的循環(huán)神經網(wǎng)絡時,極其有幫助。盡管使用WW-TBPTT 法會使實驗方差增大,計算存儲值的過程也使訓練變慢(如圖12最右邊一組條形圖),但它能通過時間長度有效避免滑動截斷反向傳播的順序偏差(the sequential bias of sliding truncated back propagation)。

另外,實驗結果表明,預先訓練網(wǎng)絡也非常有意義。在導航控制試驗中,僅僅重訓練最后一層卷積網(wǎng)絡全連接層(如Inception),比訓練端對端訓練網(wǎng)絡表現(xiàn)更好。訓練端對端網(wǎng)絡不僅需要更多數(shù)據(jù),而且時間也更長。也正是上述這個原因,機器人(雷鋒網(wǎng)注:這里指無人機)在實際應用中才不夠靈活。

我們將公開“穿過房間一”和“穿過房間二”兩次實驗的數(shù)據(jù)集(它們代表了實驗所需數(shù)據(jù)的復雜程度),讓其他研究人員能以此為參考標準,學習導航控制。

最后,我們還想強調,想要打開深度學習這個黑箱子,差異化評價法和可視化是非常有必要的。

雷峰網(wǎng)版權文章,未經授權禁止轉載。詳情見轉載須知。

如何讓無人機靈活穿越滿是障礙的房間?訓練一個循環(huán)神經網(wǎng)絡試試看

分享:
相關文章

編輯

求索于科技人文間, 流連在 AI 浪潮下; 我在這兒, 斟酒,燃香,等你故事
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經綁定,現(xiàn)在您可以設置密碼以方便用郵箱登錄
立即設置 以后再說