0
本文作者: AI研習(xí)社 | 2020-01-08 14:50 |
為了幫助各位學(xué)術(shù)青年更好地學(xué)習(xí)前沿研究成果和技術(shù),AI科技評(píng)論聯(lián)合Paper 研習(xí)社(paper.yanxishe.com),重磅推出【今日 Paper】欄目, 每天都為你精選關(guān)于人工智能的前沿學(xué)術(shù)論文供你學(xué)習(xí)參考。以下是今日的精選內(nèi)容——
Self learning robot using real-time neural networks
Robust Semantic Segmentation of Brain Tumor Regions from 3D MRIs
Inferring Convolutional Neural Networks' accuracies from their architectural characterizations
Hierarchical Reinforcement Learning as a Model of Human Task Interleaving
A Hybrid Gaussian Process Approach to Robust Economic Model Predictive Control
Attributed Multi-Relational Attention Network for Fact-checking URL Recommendation
Data Structure Primitives>
HandAugment: A Simple Data Augmentation for HANDS19 Challenge Task 1 -- Depth-Based 3D Hand Pose Estimation
From 'F' to 'A'>
Information Theoretic Model Predictive Q-Learning
論文名稱:Self learning robot using real-time neural networks
作者:Gupta Chirag /Nangia Chikita /Kumar Chetan
發(fā)表時(shí)間:2020/1/6
論文鏈接:https://paper.yanxishe.com/review/8314?from=leiphonecolumn_paperreview0108
推薦理由:隨著高容量,低精度計(jì)算技術(shù)的發(fā)展以及認(rèn)知人工智能啟發(fā)式系統(tǒng)的應(yīng)用研究,通過具有實(shí)時(shí)學(xué)習(xí)功能的神經(jīng)網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)解決方案引起了研究界以及整個(gè)行業(yè)的極大興趣。
本文涉及對(duì)神經(jīng)網(wǎng)絡(luò)的研究,開發(fā)和實(shí)驗(yàn)分析,該神經(jīng)網(wǎng)絡(luò)在帶有手臂的機(jī)器人上實(shí)現(xiàn),通過該機(jī)器人的進(jìn)化可以學(xué)習(xí)直線或根據(jù)需要行走。神經(jīng)網(wǎng)絡(luò)使用梯度下降和反向傳播算法進(jìn)行學(xué)習(xí)。神經(jīng)網(wǎng)絡(luò)的實(shí)現(xiàn)和訓(xùn)練均在樹莓派pi 3上的機(jī)器人上本地完成,因此其學(xué)習(xí)過程是完全獨(dú)立的。首先在MATLAB上開發(fā)的自定義模擬器上對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行測(cè)試,然后在樹莓派計(jì)算機(jī)上對(duì)其進(jìn)行實(shí)現(xiàn)。存儲(chǔ)每一代不斷發(fā)展的網(wǎng)絡(luò)中的數(shù)據(jù),并對(duì)數(shù)據(jù)進(jìn)行數(shù)學(xué)和圖形分析。分析了學(xué)習(xí)率和容錯(cuò)度等因素對(duì)學(xué)習(xí)過程和最終輸出的影響。
論文名稱:Robust Semantic Segmentation of Brain Tumor Regions from 3D MRIs
作者:Myronenko Andriy /Hatamizadeh Ali
發(fā)表時(shí)間:2020/1/6
論文鏈接:https://paper.yanxishe.com/review/8316?from=leiphonecolumn_paperreview0108
推薦理由:多模式腦腫瘤分割挑戰(zhàn)(BraTS)將研究人員召集起來,以改進(jìn)3D MRI腦腫瘤分割的自動(dòng)化方法。 腫瘤分割是疾病診斷和治療計(jì)劃所必需的基本視覺任務(wù)之一。 得益于現(xiàn)代GPU的出現(xiàn),前幾年獲勝的方法都是基于深度學(xué)習(xí)的,可以快速優(yōu)化深度卷積神經(jīng)網(wǎng)絡(luò)體系結(jié)構(gòu)。
在這項(xiàng)工作中,作者探索了3D語義分割的最佳實(shí)踐,包括常規(guī)的編碼器-解碼器體系結(jié)構(gòu)以及組合的損失函數(shù),以試圖進(jìn)一步提高分割的準(zhǔn)確性。 作者評(píng)估了BraTS 2019挑戰(zhàn)賽的方法。
論文名稱:Inferring Convolutional Neural Networks' accuracies from their architectural characterizations
作者:Hoang D. /Hamer J. /Perdue G. N. /Young S. R. /Miller J. /Ghosh A.
發(fā)表時(shí)間:2020/1/7
論文鏈接:https://paper.yanxishe.com/review/8311?from=leiphonecolumn_paperreview0108
推薦理由:卷積神經(jīng)網(wǎng)絡(luò)(CNN)在分析來自許多領(lǐng)域(包括粒子成像探測(cè)器)的科學(xué)數(shù)據(jù)方面顯示出了巨大的希望。但是,對(duì)于特定的應(yīng)用程序和不同的數(shù)據(jù)集選擇合適的網(wǎng)絡(luò)體系結(jié)構(gòu)(深度,內(nèi)核形狀,激活功能等)的挑戰(zhàn)仍然知之甚少。
在本文中,作者通過提出一種系統(tǒng)的語言來研究CNN的體系結(jié)構(gòu)與其性能之間的關(guān)系,該語言對(duì)于訓(xùn)練之前的不同CNN的體系結(jié)構(gòu)之間的比較很有用。通過不同的屬性來表征CNN的體系結(jié)構(gòu),并證明這些屬性可以預(yù)測(cè)兩個(gè)特定的基于計(jì)算機(jī)視覺的物理問題中的網(wǎng)絡(luò)性能-事件頂點(diǎn)發(fā)現(xiàn)和費(fèi)米國(guó)家加速器實(shí)驗(yàn)室的MINERvA實(shí)驗(yàn)中的強(qiáng)子多重性分類。為此,作者從針對(duì)物理問題的優(yōu)化網(wǎng)絡(luò)架構(gòu)中提取了幾種架構(gòu)屬性,這些屬性是一種稱為多節(jié)點(diǎn)深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的模型選擇算法(MENNDL)的輸出。作者使用機(jī)器學(xué)習(xí)模型來預(yù)測(cè)網(wǎng)絡(luò)在訓(xùn)練之前是否可以比某個(gè)閾值精度更好地運(yùn)行。
與隨機(jī)猜測(cè)相比,模型的執(zhí)行效果要好16-20%。此外,作者在大量網(wǎng)絡(luò)的準(zhǔn)確性回歸中發(fā)現(xiàn)普通最小二乘模型的確定系數(shù)為0.966。
論文名稱:Hierarchical Reinforcement Learning as a Model of Human Task Interleaving
作者:Gebhardt Christoph /Oulasvirta Antti /Hilliges Otmar
發(fā)表時(shí)間:2020/1/4
論文鏈接:https://paper.yanxishe.com/review/8313?from=leiphonecolumn_paperreview0108
推薦理由:人們?nèi)绾螞Q定一項(xiàng)任務(wù)要持續(xù)多長(zhǎng)時(shí)間,何時(shí)切換以及執(zhí)行另一項(xiàng)任務(wù)?理解支持任務(wù)交錯(cuò)的機(jī)制是認(rèn)知科學(xué)的一個(gè)長(zhǎng)期目標(biāo)。先前的工作提出了貪婪的啟發(fā)法和最大化邊際收益率的政策。然而,目前尚不清楚這種策略如何適應(yīng)于提供多種任務(wù),轉(zhuǎn)換成本昂貴且回報(bào)延遲的日常環(huán)境。
在這里,作者開發(fā)了由強(qiáng)化學(xué)習(xí)(RL)驅(qū)動(dòng)的監(jiān)督控制的分層模型。主管級(jí)別使用特定于任務(wù)的近似效用估計(jì)值學(xué)習(xí)切換,這些估計(jì)值是在較低級(jí)別上計(jì)算的。即使在具有多個(gè)任務(wù)以及任意和不確定的報(bào)酬和成本結(jié)構(gòu)的條件下,也可以從經(jīng)驗(yàn)中學(xué)到分層的最優(yōu)價(jià)值函數(shù)分解。該模型再現(xiàn)了任務(wù)交錯(cuò)的已知經(jīng)驗(yàn)效果。與六任務(wù)問題(N = 211)中的近視基線相比,它可以更好地預(yù)測(cè)個(gè)人數(shù)據(jù)。結(jié)果支持分層RL作為任務(wù)交織的合理模型。
論文名稱:A Hybrid Gaussian Process Approach to Robust Economic Model Predictive Control
作者:Rostam Mohammadreza /Nagamune Ryozo /Grebenyuk Vladimir
發(fā)表時(shí)間:2020/1/7
論文鏈接:https://paper.yanxishe.com/review/8308?from=leiphonecolumn_paperreview0108
推薦理由:為了減少控制器的保守性,本文提出了一種混合高斯過程(GP)方法,用于在未知未來擾動(dòng)下進(jìn)行魯棒的經(jīng)濟(jì)模型預(yù)測(cè)控制。提出的混合GP是兩種已知方法的組合,即核成分和非線性自回歸。在分析預(yù)測(cè)結(jié)果之后,采用切換機(jī)制來選擇這些方法中的一種來進(jìn)行干擾預(yù)測(cè)?;旌螱P旨在通過使用過去的干擾測(cè)量來檢測(cè)模式,而且還檢測(cè)未知干擾中的意外行為。
在混合GP中還使用了一種新穎的遺忘因子概念,可以減輕較舊的測(cè)量的權(quán)重,從而基于最近的干擾值提高預(yù)測(cè)精度。}檢測(cè)到的干擾信息用于減少預(yù)測(cè)的不確定性。經(jīng)濟(jì)模型的預(yù)測(cè)控制器。仿真結(jié)果表明,與其他基于GP的方法相比,在擾動(dòng)具有可識(shí)別模式的情況下,該方法可以提高經(jīng)濟(jì)模型預(yù)測(cè)控制器的整體性能。
論文名稱:Attributed Multi-Relational Attention Network for Fact-checking URL Recommendation
作者:You Di /Vo Nguyen /Lee Kyumin /Liu Qiang
發(fā)表時(shí)間:2020/1/7
論文鏈接:https://paper.yanxishe.com/review/8309?from=leiphonecolumn_paperreview0108
推薦理由:為了打擊假新聞,研究人員主要致力于發(fā)現(xiàn)假新聞,而新聞工作者則建立并維護(hù)了事實(shí)檢查網(wǎng)站(例如,此URL(https://www.snopes.com/)和此 URL(https://www.politifact.com/))。 但是,通過社交媒體網(wǎng)站大大促進(jìn)了虛假新聞的傳播,并且這些事實(shí)檢查網(wǎng)站還沒有得到充分利用。
為了克服這些問題并補(bǔ)充現(xiàn)有的偽造新聞方法,本文提出了一種基于深度學(xué)習(xí)的事實(shí)檢查URL推薦器系統(tǒng),以減輕偽造新聞在諸如Twitter和Facebook等社交媒體網(wǎng)站上的影響。 特別是,作者提出的框架由一個(gè)多關(guān)系注意模塊和一個(gè)異構(gòu)圖注意力網(wǎng)絡(luò)組成,以學(xué)習(xí)用戶URL對(duì),用戶對(duì)用戶對(duì)和URL URL對(duì)之間的復(fù)雜/語義關(guān)系。 在真實(shí)數(shù)據(jù)集上進(jìn)行的大量實(shí)驗(yàn)表明,我們提出的框架優(yōu)于八個(gè)最新的推薦模型,至少提高了3?5.3%。
論文名稱:Data Structure Primitives>作者:G?tze Philipp /Tharanatha Arun Kumar /Sattler Kai-Uwe
發(fā)表時(shí)間:2020/1/7
論文鏈接:https://paper.yanxishe.com/review/8310?from=leiphonecolumn_paperreview0108
推薦理由:永久內(nèi)存(PM),例如已經(jīng)可用的Intel Optane DC永久性存儲(chǔ)器的技術(shù)代表了一種非常有前途的下一代存儲(chǔ)器解決方案,對(duì)數(shù)據(jù)庫體系結(jié)構(gòu)具有重大影響。已經(jīng)提出了這項(xiàng)新技術(shù)的幾種數(shù)據(jù)結(jié)構(gòu)及其特性。但是,基本上只提出并評(píng)估了完整的結(jié)構(gòu),掩蓋了個(gè)人想法和PM特征的影響。
因此,在本文中,我們將分解目前為止介紹的結(jié)構(gòu),識(shí)別其基礎(chǔ)設(shè)計(jì)原語,并將其分配給有關(guān)PM的適當(dāng)設(shè)計(jì)目標(biāo)。在真實(shí)的PM硬件上進(jìn)行全面實(shí)驗(yàn)的結(jié)果是,作者能夠在微觀水平上揭示基元的取舍。由此,可以導(dǎo)出所選圖元的性能配置文件。有了這些,就可以精確地確定其最佳用例以及漏洞。除了對(duì)基于PM的數(shù)據(jù)結(jié)構(gòu)設(shè)計(jì)的一般見解之外,作者還發(fā)現(xiàn)了迄今為止文獻(xiàn)中尚未考慮的新的有希望的組合。
論文名稱:HandAugment: A Simple Data Augmentation for HANDS19 Challenge Task 1 -- Depth-Based 3D Hand Pose Estimation
作者:Zhang Zhaohui /Xie Shipeng /Chen Mingxiu /Zhu Haichao
發(fā)表時(shí)間:2020/1/3
論文鏈接: https://paper.yanxishe.com/review/8175?from=leiphonecolumn_paperreview0108
推薦理由:這篇論文考慮的是3D景深圖像中預(yù)估手勢(shì)的問題。
這篇論文提出了一個(gè)簡(jiǎn)單的數(shù)據(jù)增強(qiáng)方法HandAugment,包含兩階段的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí):第一階段在迭代的模式下抽取手部圖像塊,并根據(jù)深度圖預(yù)估手的初始姿態(tài),過濾掉噪音圖塊(例如背景與手臂)。被抽取出的圖塊與初始化手部姿態(tài)被代入第二階段的神經(jīng)網(wǎng)絡(luò),以獲取最終的手部姿態(tài)。
這種兩階段策略極大提升了手勢(shì)識(shí)別的準(zhǔn)確率,并在HANDS19挑戰(zhàn)任務(wù)1-基于景深的3D手勢(shì)識(shí)別大賽上獲得了第一名。
論文名稱:From 'F' to 'A'>作者:Clark Peter /Etzioni Oren /Khashabi Daniel /Khot Tushar /Mishra Bhavana Dalvi /Richardson Kyle /Sabharwal Ashish /Schoenick Carissa...
發(fā)表時(shí)間:2019/9/4
論文鏈接:https://paper.yanxishe.com/review/7846?from=leiphonecolumn_paperreview0108
推薦理由:人工智能已經(jīng)在國(guó)際象棋,圍棋和撲克,甚至《危險(xiǎn)》等游戲上獲得了非凡的掌握,但是各種各樣的標(biāo)準(zhǔn)化考試仍然是一個(gè)巨大的挑戰(zhàn)。即使在2016年,最好的AI系統(tǒng)在8年級(jí)科學(xué)考試挑戰(zhàn)中也僅達(dá)到59.3%。
這篇論文報(bào)道了在紐約8年級(jí)攝政科學(xué)考試中取得了空前的成功,該系統(tǒng)首次在該考試的非圖表多項(xiàng)選擇(NDMC)問題上得分超過90%。此外,基于最近的語言模型的成功,我們的Aristo系統(tǒng)在相應(yīng)的12年級(jí)科學(xué)考試NDMC問題上超過了83%。在看不見的測(cè)試問題上得出的結(jié)果在不同的測(cè)試年份和這種測(cè)試的不同變體中都是可靠的。他們證明了現(xiàn)代的NLP方法可以精通此任務(wù)。雖然不是一般問題解答的完整解決方案(問題是多項(xiàng)選擇,并且領(lǐng)域僅限于8年級(jí)科學(xué)),但它代表了該領(lǐng)域的重要里程碑。
論文名稱:Information Theoretic Model Predictive Q-Learning
作者:Bhardwaj Mohak /Handa Ankur /Fox Dieter /Boots Byron
發(fā)表時(shí)間:2019/12/31
論文鏈接:https://paper.yanxishe.com/review/8312?from=leiphonecolumn_paperreview0108
推薦理由:當(dāng)可以廉價(jià)地收集經(jīng)驗(yàn)時(shí),無模型強(qiáng)化學(xué)習(xí)(RL)算法可以很好地解決順序決策問題;當(dāng)可以準(zhǔn)確地建模系統(tǒng)動(dòng)力學(xué)時(shí),基于模型的RL有效。但是,這兩個(gè)假設(shè)在諸如機(jī)器人技術(shù)之類的現(xiàn)實(shí)世界問題中都可能違背,在這種情況下,查詢系統(tǒng)的成本可能過高,而現(xiàn)實(shí)世界的動(dòng)力學(xué)可能難以準(zhǔn)確建模。盡管模擬到真實(shí)的方法(例如域隨機(jī)化)試圖減輕有偏模擬的影響,但它們?nèi)匀粫?huì)遭受優(yōu)化挑戰(zhàn)(例如局部最小值和針對(duì)隨機(jī)化的手工設(shè)計(jì)分布),從而難以學(xué)習(xí)準(zhǔn)確的全局值函數(shù)或直接轉(zhuǎn)移到現(xiàn)實(shí)世界的政策。
與RL相反,模型預(yù)測(cè)控制(MPC)算法使用模擬器在線優(yōu)化簡(jiǎn)單的策略類,從而構(gòu)建可以有效應(yīng)對(duì)現(xiàn)實(shí)世界動(dòng)態(tài)變化的閉環(huán)控制器。MPC性能通常受模型偏差和優(yōu)化范圍有限等因素的限制。
在這項(xiàng)工作中,作者提出了信息理論MPC與熵正則化RL之間的新型理論聯(lián)系,并開發(fā)了一種可利用偏差模型的Q學(xué)習(xí)算法。我們驗(yàn)證了在Sim-to-sim控制任務(wù)上提出的算法,以證明優(yōu)化控制和從頭開始強(qiáng)化學(xué)習(xí)的改進(jìn)。我們的方法為系統(tǒng)地在真實(shí)機(jī)器人上部署強(qiáng)化學(xué)習(xí)算法鋪平了道路。
雷鋒網(wǎng)雷鋒網(wǎng)雷鋒網(wǎng)
相關(guān)文章:
今日 Paper | 精簡(jiǎn)BERT;面部交換;三維點(diǎn)云;DeepFakes 及 5G 等
今日 Paper | 虛假新聞檢測(cè);馬爾可夫決策過程;場(chǎng)景文本識(shí)別;博弈論框架等
今日 Paper | 問答系統(tǒng);3D人體形狀和姿勢(shì);面部偽造檢測(cè);AdderNet等
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。