丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
人工智能學(xué)術(shù) 正文
發(fā)私信給楊曉凡
發(fā)送

1

和清華大學(xué)自然語言處理與社會(huì)人文計(jì)算實(shí)驗(yàn)室一起讀機(jī)器翻譯論文

本文作者: 楊曉凡 2019-02-08 18:16
導(dǎo)語:論文海中一盞燈

雷鋒網(wǎng) AI 科技評(píng)論按:在生產(chǎn)和經(jīng)濟(jì)高度全球化的今天,機(jī)器翻譯(Machine Translation)是人類面對(duì)外語時(shí)最渴望擁有的工具,也是神經(jīng)網(wǎng)絡(luò)帶來最大變革的人工智能問題之一。

從最早的基于規(guī)則的機(jī)器翻譯,到基于概率的機(jī)器翻譯,再到現(xiàn)在的基于神經(jīng)網(wǎng)絡(luò)的機(jī)器翻譯,機(jī)器學(xué)習(xí)和語言學(xué)的研究人員們一起經(jīng)歷了幾十年的歷程。如今的機(jī)器翻譯系統(tǒng)雖然還算不上盡善盡美,但以谷歌翻譯、百度翻譯為代表的,使用神經(jīng)機(jī)器翻譯技術(shù)的大規(guī)模開放使用的翻譯系統(tǒng),已經(jīng)可以時(shí)不時(shí)地給出一些流暢、明了的雙語互譯結(jié)果了。

當(dāng)然了,在神經(jīng)網(wǎng)絡(luò)/深度學(xué)習(xí)的沖擊之下,我們也不免看到這樣的調(diào)侃:“團(tuán)隊(duì)里每開除一個(gè)語言學(xué)家,翻譯模型的準(zhǔn)確率就可以再提升一點(diǎn)?!痹谠絹碓酱蟮恼Z料庫(kù)、越來越多的模型設(shè)計(jì)和訓(xùn)練技巧的幫助下,來自語言學(xué)領(lǐng)域的指導(dǎo)帶來的提升遠(yuǎn)不如機(jī)器學(xué)習(xí)領(lǐng)域的新技術(shù)成果、甚至已有技術(shù)成果的好的實(shí)現(xiàn)帶來的提升大。雷鋒網(wǎng) AI 科技評(píng)論的讀者們相信也有這樣的感覺。

機(jī)器翻譯,尤其是神經(jīng)機(jī)器翻譯(neural machine translation,NMT)也是清華大學(xué)自然語言處理與社會(huì)人文計(jì)算實(shí)驗(yàn)室重點(diǎn)關(guān)注的研究課題之一。為了便于自己研究,也給這個(gè)課題的其他研究人員提供參考和指引,清華大學(xué)自然語言處理與社會(huì)人文計(jì)算實(shí)驗(yàn)室機(jī)器翻譯小組在 GitHub 上維護(hù)著一份神經(jīng)機(jī)器翻譯論文清單,包含了這個(gè)領(lǐng)域內(nèi)他們認(rèn)為起到重要作用的研究論文。

列表中的神經(jīng)機(jī)器翻譯論文劃分為了模型架構(gòu)、注意力機(jī)制、開放詞庫(kù)、訓(xùn)練目標(biāo)、解碼、低語言資源翻譯、先驗(yàn)知識(shí)集成、文檔級(jí)別翻譯、魯棒性、可視化和可解釋性、語言學(xué)解釋、公平性和多樣性、效率、語音翻譯、多模態(tài)、集成和重新排序、預(yù)訓(xùn)練、領(lǐng)域適應(yīng)、質(zhì)量估計(jì)、以人為中心的神經(jīng)機(jī)器翻譯、單詞翻譯及雙語專用語翻譯、詩(shī)歌翻譯等主題,內(nèi)容十分全面細(xì)致。除此之外,他們也列出了 10 篇必讀論文。

這 10 篇必讀論文是:

  • Peter E. Brown, Stephen A. Della Pietra, Vincent J. Della Pietra, and Robert L. Mercer. 1993. The Mathematics of Statistical Machine Translation: Parameter Estimation. Computational Linguistics. (Citation: 4,965)

  • Kishore Papineni, Salim Roukos, Todd Ward, and Wei-Jing Zhu. 2002. BLEU: a Method for Automatic Evaluation of Machine Translation. In Proceedings of ACL 2002. (Citation: 8,507)

  • Philipp Koehn, Franz J. Och, and Daniel Marcu. 2003. Statistical Phrase-Based Translation. In Proceedings of NAACL 2003. (Citation: 3,514)

  • Franz Josef Och. 2003. Minimum Error Rate Training in Statistical Machine Translation. In Proceedings of ACL 2003. (Citation: 2,982)

  • David Chiang. 2007. Hierarchical Phrase-Based Translation. Computational Linguistics. (Citation: 1,192)

  • Ilya Sutskever, Oriol Vinyals, and Quoc V. Le. 2014. Sequence to Sequence Learning with Neural Networks. In Proceedings of NIPS 2014. (Citation: 5,428)

  • Dzmitry Bahdanau, Kyunghyun Cho, and Yoshua Bengio. 2015. Neural Machine Translation by Jointly Learning to Align and Translate. In Proceedings of ICLR 2015. (Citation: 5,572)

  • Diederik P. Kingma, Jimmy Ba. 2015. Adam: A Method for Stochastic Optimization. In Proceedings of ICLR 2015. (Citation: 16,572)

  • Rico Sennrich, Barry Haddow, and Alexandra Birch. 2016. Neural Machine Translation of Rare Words with Subword Units. In Proceedings of ACL 2016. (Citation: 789)

  • Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszkoreit, Llion Jones, Aidan N. Gomez, Lukasz Kaiser, and Illia Polosukhin. 2017. Attention is All You Need. In Proceedings of NIPS 2017. (Citation: 1,047)

論文列表具體內(nèi)容請(qǐng)見:https://github.com/THUNLP-MT/MT-Reading-List

另外,在清華大學(xué)自然語言處理與社會(huì)人文計(jì)算實(shí)驗(yàn)室機(jī)器翻譯小組的 GitHub 頁面還可以看到他們的開源神經(jīng)機(jī)器翻譯工具包 THUMT (https://github.com/THUNLP-MT/THUMT  )。

祝各位閱讀論文愉快。

雷鋒網(wǎng) AI 科技評(píng)論報(bào)道。

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知

和清華大學(xué)自然語言處理與社會(huì)人文計(jì)算實(shí)驗(yàn)室一起讀機(jī)器翻譯論文

分享:
相關(guān)文章

讀論文為生

日常笑點(diǎn)滴,學(xué)術(shù)死腦筋
當(dāng)月熱門文章
最新文章
請(qǐng)?zhí)顚懮暾?qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說