0
本文作者: AI研習(xí)社 | 2020-02-03 15:10 |
論文名稱:Domain Independent Unsupervised Learning to grasp the Novel Objects
作者:Pharswan Siddhartha Vibhu /Vohra Mohit /Kumar Ashish /Behera Laxmidhar
發(fā)表時(shí)間:2020/1/9
論文鏈接:https://paper.yanxishe.com/review/9222
這篇論文考慮的是機(jī)械臂抓取新物體的問題。
基于視覺抓握任務(wù)的一個(gè)主要挑戰(zhàn)是當(dāng)機(jī)械臂遇到新物體時(shí),該如何選擇有效的抓握區(qū)域。最新的研究都是試圖用高計(jì)算量和時(shí)間為代價(jià)的卷積神經(jīng)網(wǎng)絡(luò)。這篇論文提出了一種新的無監(jiān)督學(xué)習(xí)算法來選擇有效抓握區(qū)域。在經(jīng)過坐標(biāo)對齊方法處理后,新方法應(yīng)用K均值聚類方法到圖像平面以識別該區(qū)域。這篇論文定義了一個(gè)名為“抓握決策索引”(Grasp Decide Index,GDI)的新概念來選擇在圖像平面中采取最佳抓握姿勢。在雜亂或隔離的環(huán)境中對Amazon Robotics Challenge 2017和Amazon Picking Challenge 2016的標(biāo)準(zhǔn)對象進(jìn)行實(shí)驗(yàn)的結(jié)果表明,這篇論文提出的新算法在不同領(lǐng)域中的各種新對象上具有魯棒性和自適應(yīng)性。
論文名稱:Short-Term Temporal Convolutional Networks for Dynamic Hand Gesture Recognition
作者:Zhang Yi /Wang Chong /Zheng Ye /Zhao Jieyu /Li Yuqi /Xie Xijiong
發(fā)表時(shí)間:2019/12/31
論文鏈接:https://paper.yanxishe.com/review/9221
這篇論文要解決的是手勢識別問題。
這篇論文的貢獻(xiàn)是提出了一種基于3D密度卷積網(wǎng)絡(luò)(3D-DenseNets)與改進(jìn)時(shí)序卷積網(wǎng)絡(luò)(TCNs)的多模態(tài)手勢識別方法,其核心思路是找到一種壓縮的、有效的空間與時(shí)間特征表示信息。在空間分析中,這篇論文采用3D-DenseNets來學(xué)習(xí)短程空間-時(shí)間特征;隨后在時(shí)間分析中,這篇論文使用TCNs來抽取時(shí)間特征并運(yùn)用改進(jìn)壓縮與激勵(lì)網(wǎng)絡(luò)(SENets)來增強(qiáng)來自每個(gè)TCNs層的時(shí)間特征的表示能力。這篇論文提出的方法在VIVA和NVIDIA動態(tài)手勢數(shù)據(jù)集上分別獲得了91.54%與86.37%的識別準(zhǔn)確率。
論文名稱:A BERT based Sentiment Analysis and Key Entity Detection Approach for Online Financial Texts
作者:Zhao Lingyun /Li Lin /Zheng Xinhao
發(fā)表時(shí)間:2020/1/14
論文鏈接:https://paper.yanxishe.com/review/9218
這篇論文考慮的是金融文本的情感分析問題。
隨著互聯(lián)網(wǎng)的出現(xiàn)和迅猛發(fā)展,互聯(lián)網(wǎng)對金融領(lǐng)域的影響越來越大。怎樣快速而準(zhǔn)確地從海量金融文本中挖掘有用的信息,已成為投資者與決策者的關(guān)注焦點(diǎn)。這篇論文提出一個(gè)基于BERT的情感分析和關(guān)鍵實(shí)體檢測方法,用于社交媒體的金融文本挖掘和公共觀點(diǎn)分析。通過使用預(yù)訓(xùn)練模型,這篇論文首先進(jìn)行情感分析,然后考慮關(guān)鍵實(shí)體檢測,將其考慮為一個(gè)句子匹配或機(jī)器閱讀理解任務(wù),且涉及不同文本粒度。另外,這篇論文也使用聚類算法來提升所提方法的表現(xiàn)力。在兩個(gè)金融情感分析和關(guān)鍵實(shí)體檢測數(shù)據(jù)集上測試了SVM,LR,NBM和BERT,這篇論文提出的方法取得了最佳結(jié)果。
論文名稱:Robust Speaker Recognition Using Speech Enhancement And Attention Model
作者:Shi Yanpei /Huang Qiang /Hain Thomas
發(fā)表時(shí)間:2020/1/14
論文鏈接:https://paper.yanxishe.com/review/9219
推薦原因
這篇論文通過級聯(lián)語音增強(qiáng)和說話人處理,提出了一個(gè)新的說話人識別模型,在語音信號被噪聲破壞時(shí)提高說話者識別模型的性能表現(xiàn)。與以前的方法將語音增強(qiáng)和說話者識別這兩者分開處理不同,這篇論文提出的方法通過使用深度神經(jīng)網(wǎng)絡(luò)的聯(lián)合優(yōu)化將這兩個(gè)模塊集成到一個(gè)框架中。為了提高模型的噪聲魯棒性,這篇論文采用多階段注意力機(jī)制來突出從上下文信息中學(xué)到的與說話者相關(guān)的特征。在VoxCeleb1數(shù)據(jù)集上進(jìn)行的實(shí)驗(yàn)中,作者們采用了三種信噪比級別的普通噪聲、音樂和胡言亂語,以評估其提出方法的噪聲魯棒性。實(shí)驗(yàn)結(jié)果表明,這篇論文提出的語音增強(qiáng)和多階段注意力模塊能明顯提升模型的噪聲魯棒性。
論文名稱:MetaInit: Initializing learning by learning to initialize
作者:Yann N. Dauphin /Samuel S. Schoenholz
發(fā)表時(shí)間:2019/12/9
論文鏈接:https://paper.yanxishe.com/review/9220
推薦原因:直到今天,從零開始訓(xùn)練深度模型的時(shí)候我們都希望能有一組好的初始值,能讓優(yōu)化器更好地工作、讓模型更快收斂、以及訓(xùn)練出更高的準(zhǔn)確率。不過一直以來的慣例做法都是用隨機(jī)數(shù)作為初始值,效果好不好可以說完全看人品了,但畢竟也沒有什么好的替代方法。
這篇論文里作者們提出了一種不隨機(jī)的、生成對后續(xù)優(yōu)化有幫助的網(wǎng)絡(luò)初始值的方法。這個(gè)方法來源于這個(gè)假說:好的初始值能讓梯度下降從一個(gè)局部線性、二階影響小的位置開始,這樣就能得到更好的梯度下降過程。作者們把這個(gè)假說做了公式化的描述,從而可以在任意網(wǎng)絡(luò)架構(gòu)或者數(shù)據(jù)集上計(jì)算 —— 雖然這個(gè)過程也是用梯度下降計(jì)算的,但能快速找到好的權(quán)重初始值。
作者們在正常連接的神經(jīng)網(wǎng)絡(luò)和帶有殘差連接的神經(jīng)網(wǎng)絡(luò)上都進(jìn)行了實(shí)驗(yàn),結(jié)果表明,通過他們的方法找到好的初始值從而訓(xùn)練出的網(wǎng)絡(luò)不僅可以在沒有批標(biāo)準(zhǔn)化、沒有殘差連接的情況下獲得和最好的模型相當(dāng)?shù)谋憩F(xiàn),而且也可以自動地把網(wǎng)絡(luò)從不好的初始值里拯救出來。這個(gè)方法有一定的拓展性,可以用在ResNet-50的ImageNet訓(xùn)練上。
為了更好地服務(wù)廣大 AI 青年,AI 研習(xí)社正式推出全新「論文」版塊,希望以論文作為聚合 AI 學(xué)生青年的「興趣點(diǎn)」,通過論文整理推薦、點(diǎn)評解讀、代碼復(fù)現(xiàn)。致力成為國內(nèi)外前沿研究成果學(xué)習(xí)討論和發(fā)表的聚集地,也讓優(yōu)秀科研得到更為廣泛的傳播和認(rèn)可。
我們希望熱愛學(xué)術(shù)的你,可以加入我們的論文作者團(tuán)隊(duì)。
加入論文作者團(tuán)隊(duì)你可以獲得
1.署著你名字的文章,將你打造成最耀眼的學(xué)術(shù)明星
2.豐厚的稿酬
3.AI 名企內(nèi)推、大會門票福利、獨(dú)家周邊紀(jì)念品等等等。
加入論文作者團(tuán)隊(duì)你需要:
1.將你喜歡的論文推薦給廣大的研習(xí)社社友
2.撰寫論文解讀
如果你已經(jīng)準(zhǔn)備好加入 AI 研習(xí)社的論文兼職作者團(tuán)隊(duì),可以添加運(yùn)營小姐姐的微信,備注“論文兼職作者”
雷鋒網(wǎng)雷鋒網(wǎng)雷鋒網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。