0
本文作者: AI研習社 | 2020-01-08 14:50 |
為了幫助各位學術(shù)青年更好地學習前沿研究成果和技術(shù),AI科技評論聯(lián)合Paper 研習社(paper.yanxishe.com),重磅推出【今日 Paper】欄目, 每天都為你精選關(guān)于人工智能的前沿學術(shù)論文供你學習參考。以下是今日的精選內(nèi)容——
Self learning robot using real-time neural networks
Robust Semantic Segmentation of Brain Tumor Regions from 3D MRIs
Inferring Convolutional Neural Networks' accuracies from their architectural characterizations
Hierarchical Reinforcement Learning as a Model of Human Task Interleaving
A Hybrid Gaussian Process Approach to Robust Economic Model Predictive Control
Attributed Multi-Relational Attention Network for Fact-checking URL Recommendation
Data Structure Primitives>
HandAugment: A Simple Data Augmentation for HANDS19 Challenge Task 1 -- Depth-Based 3D Hand Pose Estimation
From 'F' to 'A'>
Information Theoretic Model Predictive Q-Learning
論文名稱:Self learning robot using real-time neural networks
作者:Gupta Chirag /Nangia Chikita /Kumar Chetan
發(fā)表時間:2020/1/6
論文鏈接:https://paper.yanxishe.com/review/8314?from=leiphonecolumn_paperreview0108
推薦理由:隨著高容量,低精度計算技術(shù)的發(fā)展以及認知人工智能啟發(fā)式系統(tǒng)的應(yīng)用研究,通過具有實時學習功能的神經(jīng)網(wǎng)絡(luò)的機器學習解決方案引起了研究界以及整個行業(yè)的極大興趣。
本文涉及對神經(jīng)網(wǎng)絡(luò)的研究,開發(fā)和實驗分析,該神經(jīng)網(wǎng)絡(luò)在帶有手臂的機器人上實現(xiàn),通過該機器人的進化可以學習直線或根據(jù)需要行走。神經(jīng)網(wǎng)絡(luò)使用梯度下降和反向傳播算法進行學習。神經(jīng)網(wǎng)絡(luò)的實現(xiàn)和訓練均在樹莓派pi 3上的機器人上本地完成,因此其學習過程是完全獨立的。首先在MATLAB上開發(fā)的自定義模擬器上對神經(jīng)網(wǎng)絡(luò)進行測試,然后在樹莓派計算機上對其進行實現(xiàn)。存儲每一代不斷發(fā)展的網(wǎng)絡(luò)中的數(shù)據(jù),并對數(shù)據(jù)進行數(shù)學和圖形分析。分析了學習率和容錯度等因素對學習過程和最終輸出的影響。
論文名稱:Robust Semantic Segmentation of Brain Tumor Regions from 3D MRIs
作者:Myronenko Andriy /Hatamizadeh Ali
發(fā)表時間:2020/1/6
論文鏈接:https://paper.yanxishe.com/review/8316?from=leiphonecolumn_paperreview0108
推薦理由:多模式腦腫瘤分割挑戰(zhàn)(BraTS)將研究人員召集起來,以改進3D MRI腦腫瘤分割的自動化方法。 腫瘤分割是疾病診斷和治療計劃所必需的基本視覺任務(wù)之一。 得益于現(xiàn)代GPU的出現(xiàn),前幾年獲勝的方法都是基于深度學習的,可以快速優(yōu)化深度卷積神經(jīng)網(wǎng)絡(luò)體系結(jié)構(gòu)。
在這項工作中,作者探索了3D語義分割的最佳實踐,包括常規(guī)的編碼器-解碼器體系結(jié)構(gòu)以及組合的損失函數(shù),以試圖進一步提高分割的準確性。 作者評估了BraTS 2019挑戰(zhàn)賽的方法。
論文名稱:Inferring Convolutional Neural Networks' accuracies from their architectural characterizations
作者:Hoang D. /Hamer J. /Perdue G. N. /Young S. R. /Miller J. /Ghosh A.
發(fā)表時間:2020/1/7
論文鏈接:https://paper.yanxishe.com/review/8311?from=leiphonecolumn_paperreview0108
推薦理由:卷積神經(jīng)網(wǎng)絡(luò)(CNN)在分析來自許多領(lǐng)域(包括粒子成像探測器)的科學數(shù)據(jù)方面顯示出了巨大的希望。但是,對于特定的應(yīng)用程序和不同的數(shù)據(jù)集選擇合適的網(wǎng)絡(luò)體系結(jié)構(gòu)(深度,內(nèi)核形狀,激活功能等)的挑戰(zhàn)仍然知之甚少。
在本文中,作者通過提出一種系統(tǒng)的語言來研究CNN的體系結(jié)構(gòu)與其性能之間的關(guān)系,該語言對于訓練之前的不同CNN的體系結(jié)構(gòu)之間的比較很有用。通過不同的屬性來表征CNN的體系結(jié)構(gòu),并證明這些屬性可以預測兩個特定的基于計算機視覺的物理問題中的網(wǎng)絡(luò)性能-事件頂點發(fā)現(xiàn)和費米國家加速器實驗室的MINERvA實驗中的強子多重性分類。為此,作者從針對物理問題的優(yōu)化網(wǎng)絡(luò)架構(gòu)中提取了幾種架構(gòu)屬性,這些屬性是一種稱為多節(jié)點深度學習神經(jīng)網(wǎng)絡(luò)的模型選擇算法(MENNDL)的輸出。作者使用機器學習模型來預測網(wǎng)絡(luò)在訓練之前是否可以比某個閾值精度更好地運行。
與隨機猜測相比,模型的執(zhí)行效果要好16-20%。此外,作者在大量網(wǎng)絡(luò)的準確性回歸中發(fā)現(xiàn)普通最小二乘模型的確定系數(shù)為0.966。
論文名稱:Hierarchical Reinforcement Learning as a Model of Human Task Interleaving
作者:Gebhardt Christoph /Oulasvirta Antti /Hilliges Otmar
發(fā)表時間:2020/1/4
論文鏈接:https://paper.yanxishe.com/review/8313?from=leiphonecolumn_paperreview0108
推薦理由:人們?nèi)绾螞Q定一項任務(wù)要持續(xù)多長時間,何時切換以及執(zhí)行另一項任務(wù)?理解支持任務(wù)交錯的機制是認知科學的一個長期目標。先前的工作提出了貪婪的啟發(fā)法和最大化邊際收益率的政策。然而,目前尚不清楚這種策略如何適應(yīng)于提供多種任務(wù),轉(zhuǎn)換成本昂貴且回報延遲的日常環(huán)境。
在這里,作者開發(fā)了由強化學習(RL)驅(qū)動的監(jiān)督控制的分層模型。主管級別使用特定于任務(wù)的近似效用估計值學習切換,這些估計值是在較低級別上計算的。即使在具有多個任務(wù)以及任意和不確定的報酬和成本結(jié)構(gòu)的條件下,也可以從經(jīng)驗中學到分層的最優(yōu)價值函數(shù)分解。該模型再現(xiàn)了任務(wù)交錯的已知經(jīng)驗效果。與六任務(wù)問題(N = 211)中的近視基線相比,它可以更好地預測個人數(shù)據(jù)。結(jié)果支持分層RL作為任務(wù)交織的合理模型。
論文名稱:A Hybrid Gaussian Process Approach to Robust Economic Model Predictive Control
作者:Rostam Mohammadreza /Nagamune Ryozo /Grebenyuk Vladimir
發(fā)表時間:2020/1/7
論文鏈接:https://paper.yanxishe.com/review/8308?from=leiphonecolumn_paperreview0108
推薦理由:為了減少控制器的保守性,本文提出了一種混合高斯過程(GP)方法,用于在未知未來擾動下進行魯棒的經(jīng)濟模型預測控制。提出的混合GP是兩種已知方法的組合,即核成分和非線性自回歸。在分析預測結(jié)果之后,采用切換機制來選擇這些方法中的一種來進行干擾預測。混合GP旨在通過使用過去的干擾測量來檢測模式,而且還檢測未知干擾中的意外行為。
在混合GP中還使用了一種新穎的遺忘因子概念,可以減輕較舊的測量的權(quán)重,從而基于最近的干擾值提高預測精度。}檢測到的干擾信息用于減少預測的不確定性。經(jīng)濟模型的預測控制器。仿真結(jié)果表明,與其他基于GP的方法相比,在擾動具有可識別模式的情況下,該方法可以提高經(jīng)濟模型預測控制器的整體性能。
論文名稱:Attributed Multi-Relational Attention Network for Fact-checking URL Recommendation
作者:You Di /Vo Nguyen /Lee Kyumin /Liu Qiang
發(fā)表時間:2020/1/7
論文鏈接:https://paper.yanxishe.com/review/8309?from=leiphonecolumn_paperreview0108
推薦理由:為了打擊假新聞,研究人員主要致力于發(fā)現(xiàn)假新聞,而新聞工作者則建立并維護了事實檢查網(wǎng)站(例如,此URL(https://www.snopes.com/)和此 URL(https://www.politifact.com/))。 但是,通過社交媒體網(wǎng)站大大促進了虛假新聞的傳播,并且這些事實檢查網(wǎng)站還沒有得到充分利用。
為了克服這些問題并補充現(xiàn)有的偽造新聞方法,本文提出了一種基于深度學習的事實檢查URL推薦器系統(tǒng),以減輕偽造新聞在諸如Twitter和Facebook等社交媒體網(wǎng)站上的影響。 特別是,作者提出的框架由一個多關(guān)系注意模塊和一個異構(gòu)圖注意力網(wǎng)絡(luò)組成,以學習用戶URL對,用戶對用戶對和URL URL對之間的復雜/語義關(guān)系。 在真實數(shù)據(jù)集上進行的大量實驗表明,我們提出的框架優(yōu)于八個最新的推薦模型,至少提高了3?5.3%。
論文名稱:Data Structure Primitives>作者:G?tze Philipp /Tharanatha Arun Kumar /Sattler Kai-Uwe
發(fā)表時間:2020/1/7
論文鏈接:https://paper.yanxishe.com/review/8310?from=leiphonecolumn_paperreview0108
推薦理由:永久內(nèi)存(PM),例如已經(jīng)可用的Intel Optane DC永久性存儲器的技術(shù)代表了一種非常有前途的下一代存儲器解決方案,對數(shù)據(jù)庫體系結(jié)構(gòu)具有重大影響。已經(jīng)提出了這項新技術(shù)的幾種數(shù)據(jù)結(jié)構(gòu)及其特性。但是,基本上只提出并評估了完整的結(jié)構(gòu),掩蓋了個人想法和PM特征的影響。
因此,在本文中,我們將分解目前為止介紹的結(jié)構(gòu),識別其基礎(chǔ)設(shè)計原語,并將其分配給有關(guān)PM的適當設(shè)計目標。在真實的PM硬件上進行全面實驗的結(jié)果是,作者能夠在微觀水平上揭示基元的取舍。由此,可以導出所選圖元的性能配置文件。有了這些,就可以精確地確定其最佳用例以及漏洞。除了對基于PM的數(shù)據(jù)結(jié)構(gòu)設(shè)計的一般見解之外,作者還發(fā)現(xiàn)了迄今為止文獻中尚未考慮的新的有希望的組合。
論文名稱:HandAugment: A Simple Data Augmentation for HANDS19 Challenge Task 1 -- Depth-Based 3D Hand Pose Estimation
作者:Zhang Zhaohui /Xie Shipeng /Chen Mingxiu /Zhu Haichao
發(fā)表時間:2020/1/3
論文鏈接: https://paper.yanxishe.com/review/8175?from=leiphonecolumn_paperreview0108
推薦理由:這篇論文考慮的是3D景深圖像中預估手勢的問題。
這篇論文提出了一個簡單的數(shù)據(jù)增強方法HandAugment,包含兩階段的神經(jīng)網(wǎng)絡(luò)學習:第一階段在迭代的模式下抽取手部圖像塊,并根據(jù)深度圖預估手的初始姿態(tài),過濾掉噪音圖塊(例如背景與手臂)。被抽取出的圖塊與初始化手部姿態(tài)被代入第二階段的神經(jīng)網(wǎng)絡(luò),以獲取最終的手部姿態(tài)。
這種兩階段策略極大提升了手勢識別的準確率,并在HANDS19挑戰(zhàn)任務(wù)1-基于景深的3D手勢識別大賽上獲得了第一名。
論文名稱:From 'F' to 'A'>作者:Clark Peter /Etzioni Oren /Khashabi Daniel /Khot Tushar /Mishra Bhavana Dalvi /Richardson Kyle /Sabharwal Ashish /Schoenick Carissa...
發(fā)表時間:2019/9/4
論文鏈接:https://paper.yanxishe.com/review/7846?from=leiphonecolumn_paperreview0108
推薦理由:人工智能已經(jīng)在國際象棋,圍棋和撲克,甚至《危險》等游戲上獲得了非凡的掌握,但是各種各樣的標準化考試仍然是一個巨大的挑戰(zhàn)。即使在2016年,最好的AI系統(tǒng)在8年級科學考試挑戰(zhàn)中也僅達到59.3%。
這篇論文報道了在紐約8年級攝政科學考試中取得了空前的成功,該系統(tǒng)首次在該考試的非圖表多項選擇(NDMC)問題上得分超過90%。此外,基于最近的語言模型的成功,我們的Aristo系統(tǒng)在相應(yīng)的12年級科學考試NDMC問題上超過了83%。在看不見的測試問題上得出的結(jié)果在不同的測試年份和這種測試的不同變體中都是可靠的。他們證明了現(xiàn)代的NLP方法可以精通此任務(wù)。雖然不是一般問題解答的完整解決方案(問題是多項選擇,并且領(lǐng)域僅限于8年級科學),但它代表了該領(lǐng)域的重要里程碑。
論文名稱:Information Theoretic Model Predictive Q-Learning
作者:Bhardwaj Mohak /Handa Ankur /Fox Dieter /Boots Byron
發(fā)表時間:2019/12/31
論文鏈接:https://paper.yanxishe.com/review/8312?from=leiphonecolumn_paperreview0108
推薦理由:當可以廉價地收集經(jīng)驗時,無模型強化學習(RL)算法可以很好地解決順序決策問題;當可以準確地建模系統(tǒng)動力學時,基于模型的RL有效。但是,這兩個假設(shè)在諸如機器人技術(shù)之類的現(xiàn)實世界問題中都可能違背,在這種情況下,查詢系統(tǒng)的成本可能過高,而現(xiàn)實世界的動力學可能難以準確建模。盡管模擬到真實的方法(例如域隨機化)試圖減輕有偏模擬的影響,但它們?nèi)匀粫馐軆?yōu)化挑戰(zhàn)(例如局部最小值和針對隨機化的手工設(shè)計分布),從而難以學習準確的全局值函數(shù)或直接轉(zhuǎn)移到現(xiàn)實世界的政策。
與RL相反,模型預測控制(MPC)算法使用模擬器在線優(yōu)化簡單的策略類,從而構(gòu)建可以有效應(yīng)對現(xiàn)實世界動態(tài)變化的閉環(huán)控制器。MPC性能通常受模型偏差和優(yōu)化范圍有限等因素的限制。
在這項工作中,作者提出了信息理論MPC與熵正則化RL之間的新型理論聯(lián)系,并開發(fā)了一種可利用偏差模型的Q學習算法。我們驗證了在Sim-to-sim控制任務(wù)上提出的算法,以證明優(yōu)化控制和從頭開始強化學習的改進。我們的方法為系統(tǒng)地在真實機器人上部署強化學習算法鋪平了道路。
雷鋒網(wǎng)雷鋒網(wǎng)雷鋒網(wǎng)
相關(guān)文章:
今日 Paper | 精簡BERT;面部交換;三維點云;DeepFakes 及 5G 等
今日 Paper | 虛假新聞檢測;馬爾可夫決策過程;場景文本識別;博弈論框架等
今日 Paper | 問答系統(tǒng);3D人體形狀和姿勢;面部偽造檢測;AdderNet等
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。