谷歌發(fā)布神經(jīng)機(jī)器翻譯，翻譯質(zhì)量接近筆譯人員

本文作者：楊波

2016-09-28 08:13

導(dǎo)語：谷歌方面表示，神經(jīng)機(jī)器翻譯具有里程碑意義。

谷歌發(fā)布神經(jīng)機(jī)器翻譯，翻譯質(zhì)量接近筆譯人員據(jù)外媒報(bào)道，谷歌于昨日發(fā)布了網(wǎng)頁版本和移動版本的谷歌翻譯。在漢譯英的過程中，谷歌翻譯會采用全新的神經(jīng)機(jī)器翻譯機(jī)制，而這個(gè)App每天要進(jìn)行一千八百萬次這樣的翻譯。此外，谷歌針對這個(gè)神經(jīng)機(jī)器翻譯系統(tǒng)的運(yùn)作原理，專門發(fā)表了一篇學(xué)術(shù)論文。

早前，谷歌就曾表示過，他們在谷歌翻譯中運(yùn)用了神經(jīng)網(wǎng)絡(luò)技術(shù)，但只限于實(shí)時(shí)視覺翻譯這個(gè)功能。前段時(shí)間，谷歌一名叫Jeff Dean的高級員工曾經(jīng)告訴VentureBeat，谷歌已經(jīng)在嘗試把越來越多的深度學(xué)習(xí)功能和機(jī)制融入到谷歌翻譯中。除此之外，谷歌的一位發(fā)言人在郵件中告訴VentureBeat，最新的神經(jīng)機(jī)器翻譯是他們努力研發(fā)深度學(xué)習(xí)功能和機(jī)制的成果。

實(shí)際上，谷歌一直以來都在致力于將深度神經(jīng)網(wǎng)絡(luò)融入它旗下越來越多的應(yīng)用軟件中，其中包括Google Allo和Inbox by Gmail。這個(gè)功能可以幫助谷歌更加快捷、更加有效地處理它們獲取到的數(shù)據(jù)。

谷歌的神經(jīng)機(jī)器翻譯（GNMT）對八層長的短時(shí)記憶遞歸神經(jīng)網(wǎng)絡(luò)（LSTM-RNNs）的依賴性很強(qiáng)。“通過層間殘留聯(lián)系可以加強(qiáng)梯度流?！惫雀璧目茖W(xué)家在他們發(fā)表的學(xué)術(shù)論文中寫道。在圖像處理器的幫助下，神經(jīng)網(wǎng)絡(luò)一旦變得足夠成熟，谷歌就可以依靠它尚未發(fā)布的張量處理單元進(jìn)行數(shù)據(jù)處理。

雖然神經(jīng)機(jī)器翻譯并不永遠(yuǎn)是最佳之選，但是從谷歌的各種嘗試中我們不難發(fā)現(xiàn)，在某些情況下，神經(jīng)機(jī)器翻譯還是有其過人之處的。

谷歌發(fā)布神經(jīng)機(jī)器翻譯，翻譯質(zhì)量接近筆譯人員

“人們對這個(gè)翻譯系統(tǒng)的評價(jià)顯示，與之前那個(gè)基于短語的翻譯系統(tǒng)相比，在翻譯多種語言時(shí)，神經(jīng)學(xué)習(xí)翻譯系統(tǒng)的錯(cuò)誤率已經(jīng)降低了60%左右，其中包括英法互譯，英西互譯以及英漢互譯。附加實(shí)驗(yàn)的結(jié)果顯示，翻譯系統(tǒng)的質(zhì)量將和筆譯人員平均水準(zhǔn)更加接近?！?/p>

在谷歌昨天發(fā)表的一篇博文中，Google Brain Team的研發(fā)科學(xué)家Quoc Le 和Mike Schuster提到，有了雙語評分員的幫助，在翻譯Wikipedia上的多語種樣句時(shí)，谷歌神經(jīng)機(jī)器翻譯的錯(cuò)誤率實(shí)際上已經(jīng)降低了55%到85%。

盡管如此，這個(gè)系統(tǒng)還是不完美的?！吧窠?jīng)機(jī)器翻譯還是會犯一些筆譯人員永遠(yuǎn)都不可能犯的錯(cuò)誤，比如遺漏了一些單詞、把一些常見的名字或是少見的專有名詞翻錯(cuò)、對文章的語境缺乏整體把控等等。所以，我們還是有很大的進(jìn)步空間。但不可否認(rèn)的是，神經(jīng)機(jī)器翻譯真的具有里程碑意義?！?/p>

感興趣的讀者們可以猛戳谷歌論文原文和原博了解詳情哦。

via venturebeat

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

1人收藏

相關(guān)文章

楊波

編輯

最后一只小魚干

發(fā)私信

當(dāng)月熱門文章

谷歌發(fā)布神經(jīng)機(jī)器翻譯，翻譯質(zhì)量接近筆譯人員

谷歌發(fā)布神經(jīng)機(jī)器翻譯，翻譯質(zhì)量接近筆譯人員