0
本文作者: 叢末 | 2020-06-04 11:28 |
自然語言處理是人工智能皇冠上的明珠,而填補語言鴻溝的機器翻譯則是自然語言處理最典型的應(yīng)用技術(shù)之一。自20世紀90年代起,機器翻譯邁入了基于統(tǒng)計建模的時代,發(fā)展到今天,深度學習等機器學習方法已經(jīng)在機器翻譯中得到了大量的應(yīng)用,因此目前也是相當火爆。想必同學們也會經(jīng)常在網(wǎng)上找一些好的學習資源。
最近,筆者在 github 上發(fā)現(xiàn)了一份機器翻譯的教程,項目的 GitHub 地址為:
https://github.com/NiuTrans/MTBook
(文末附一鍵下載地址)
電子書截圖1
電子書截圖2
這套教程對機器翻譯的統(tǒng)計建模和深度學習方法進行較為系統(tǒng)地介紹,不僅有相應(yīng)的原理介紹和實現(xiàn)代碼,還提供了實戰(zhàn)案例,并通過圖例對一些形式化定義和算法進行解釋(共320張插圖),對初學者來說,極為友好,可以學會建立自己的模型。
電子書截圖3
值得一提的是,這份機器翻譯教程還很貼心地提供slides,每個章節(jié)都有對應(yīng)的課件,slides 共有 598頁之多。整理好的slides,直接下載PDF就能使用,這人文關(guān)懷,無微不至。
slides 截圖 1
slides 截圖 2
slides 截圖 3
就有網(wǎng)友評價道:算法、參數(shù)設(shè)置實驗都比較細致,對小白友好,對專業(yè)領(lǐng)域的小伙伴很有幫助。
廢話就不多說了,讓我們一起來具體看看都有哪些內(nèi)容吧:本教程共分為七個章節(jié),章節(jié)的順序參考了機器翻譯技術(shù)發(fā)展的時間脈絡(luò),同時兼顧了機器翻譯知識體系的內(nèi)在邏輯。各章節(jié)的主要內(nèi)容包括:
第一章:機器翻譯簡介
第二章:詞法、語法及統(tǒng)計建模基礎(chǔ)
第三章:基于詞的機器翻譯模型
第四章:基于短語和句法的機器翻譯模型
第五章:人工神經(jīng)網(wǎng)絡(luò)和神經(jīng)語言建模
第六章:神經(jīng)機器翻譯模型
第七章:神經(jīng)機器翻譯實戰(zhàn)(參加一次比賽)
電子書截圖 4
如果在學習中遇到相關(guān)問題,還可以點擊下面的網(wǎng)址,加入討論區(qū)答疑:
https://github.com/NiuTrans/MTBook/issues
這份名為《機器翻譯:統(tǒng)計建模與深度學習方法》的教程是由肖桐、朱靖波老師編著,東北大學自然語言處理實驗室· 小牛翻譯聯(lián)合出品的。作者表示,開源的本質(zhì)是,通過對于源代碼的免費共享使得無論軟件還是硬件都可以通過社會化協(xié)作的方式,吸引更多志同道合者。這種“人人為我,我為人人”也是他們團隊做開源項目所推崇的。撰寫這份教程的目的,是讓更多的人理解并學會機器翻譯技術(shù),并讓這項技術(shù)幫助更多有需要的人。這套教程可以供計算機相關(guān)專業(yè)高年級本科生及研究生學習之用,也可以作為自然語言處理,特別是機器翻譯領(lǐng)域相關(guān)研究人員的參考資料。
目前,所有源代碼均已開放。上架不到一周的時間,在GitHub上的熱度已經(jīng)突破1000顆星星~這么好的資源,同學們趕快學起來吧!
一鍵下載電子書和PPT地址:https://www.yanxishe.com/resourceDetail/1692 雷鋒網(wǎng) 雷鋒網(wǎng) 雷鋒網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。