丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
人工智能 正文
發(fā)私信給skura
發(fā)送

0

FAIR 最新論文:一種不需要訓練就能探索句子分類的隨機編碼器

本文作者: skura 2019-01-31 15:21
導語:同時, github 上也有論文相關的代碼。

雷鋒網 AI 科技評論按,作為人工智能的重要方向之一,NLP 領域的研究目前開展得如火如荼。1 月 30 日,facebook 人工智能研究院(FAIR)發(fā)布了一篇博文,公布了他們的論文「No Training Required: Exploring Random Encoders for Sentence Classification 」。

這篇論文被發(fā)布在 arxiv 上,主要講了一種不需要訓練就能探索句子分類的隨機編碼器。論文的主要介紹如下:

研究內容:

這是一個強大的,新穎的語句嵌入基線,它不需要進行任何訓練。在沒有任何額外訓練的情況下,我們探索了用預訓練單詞嵌入來計算句子表達方式的各種方法。其目的是讓語句嵌入具有更堅實的基礎:1)看看現(xiàn)代句子嵌入從訓練中獲得了多少好處(令人驚訝的是,事實證明,這是微乎其微的);2)為該領域提供更合適(也更強大)的基線。

它是如何工作的:

句子嵌入是一種矢量表示方法,其中句子被映射到表示其意義的數字序列。這通常是通過組合函數轉換單詞嵌入來創(chuàng)建的。句子嵌入是自然語言處理(NLP)中的一個熱門話題,因為它比單獨使用單詞嵌入更容易進行文本分類。鑒于句子表達研究的快速進展,建立堅實的基線是很重要的。
我們開始使用當前最先進的方法來確定有哪些收獲,而不是采用隨機的方法,這些隨機的方法只結合了預訓練的單詞嵌入。隨機特性的作用在機器學習社區(qū)中早已為人所知,因此我們將其應用到這個 NLP 任務中。我們探索了三種方法:隨機嵌入投影包、隨機 LSTM 和回聲狀態(tài)網絡。我們的研究結果表明,句子嵌入中的提升很大程度上來自于詞語表征。我們發(fā)現(xiàn),對經過預訓練的單詞嵌入的隨機參數化構成了一個非常強的基線,有些時候,這些基線甚至與諸如 SkipThought 和 InferSent 等著名的句子編碼器的性能相匹配。這些發(fā)現(xiàn)為今后的句子表征學習的研究提供了強有力的基礎。我們還對句子分類評估的一些合適的實驗方案進行了認真的探討,并對今后的研究提出了建議。雷鋒網

為什么它如此重要:

盡管最近對句子編碼的研究較多,但是 NLP 的研究者們對于詞匯嵌入和句子嵌入之間的關系仍然知之甚少。隨著該領域研究的快速進展,對不同方法進行比較并不總是正確的。每隔一段時間我們需要往前回顧,以便對現(xiàn)有的最先進的方法產生更深入地理解,并分析這些方法為什么有效,這一點很重要。通過對句子嵌入的研究提供新的見解,并設置更強的基線,我們可以提高對神經網絡表示和理解語言的原理的認識。他們在 Github 上分享了他們的代碼。

點擊以下鏈接,閱讀全文:

No Training Required: Exploring Random Encoders for Sentence Classification

via:https://code.fb.com/ml-applications/random-encoders/

雷鋒網

雷峰網版權文章,未經授權禁止轉載。詳情見轉載須知。

FAIR 最新論文:一種不需要訓練就能探索句子分類的隨機編碼器

分享:
相關文章
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經綁定,現(xiàn)在您可以設置密碼以方便用郵箱登錄
立即設置 以后再說