2
據外媒報道,谷歌于昨日發(fā)布了網頁版本和移動版本的谷歌翻譯。在漢譯英的過程中,谷歌翻譯會采用全新的神經機器翻譯機制,而這個App每天要進行一千八百萬次這樣的翻譯。此外,谷歌針對這個神經機器翻譯系統(tǒng)的運作原理,專門發(fā)表了一篇學術論文。
早前,谷歌就曾表示過,他們在谷歌翻譯中運用了神經網絡技術,但只限于實時視覺翻譯這個功能。前段時間,谷歌一名叫Jeff Dean的高級員工曾經告訴VentureBeat,谷歌已經在嘗試把越來越多的深度學習功能和機制融入到谷歌翻譯中。除此之外,谷歌的一位發(fā)言人在郵件中告訴VentureBeat,最新的神經機器翻譯是他們努力研發(fā)深度學習功能和機制的成果。
實際上,谷歌一直以來都在致力于將深度神經網絡融入它旗下越來越多的應用軟件中,其中包括Google Allo和Inbox by Gmail。這個功能可以幫助谷歌更加快捷、更加有效地處理它們獲取到的數據。
谷歌的神經機器翻譯(GNMT)對八層長的短時記憶遞歸神經網絡(LSTM-RNNs)的依賴性很強?!巴ㄟ^層間殘留聯系可以加強梯度流?!惫雀璧目茖W家在他們發(fā)表的學術論文中寫道。在圖像處理器的幫助下,神經網絡一旦變得足夠成熟,谷歌就可以依靠它尚未發(fā)布的張量處理單元進行數據處理。
雖然神經機器翻譯并不永遠是最佳之選,但是從谷歌的各種嘗試中我們不難發(fā)現,在某些情況下,神經機器翻譯還是有其過人之處的。
“人們對這個翻譯系統(tǒng)的評價顯示,與之前那個基于短語的翻譯系統(tǒng)相比,在翻譯多種語言時,神經學習翻譯系統(tǒng)的錯誤率已經降低了60%左右,其中包括英法互譯,英西互譯以及英漢互譯。附加實驗的結果顯示,翻譯系統(tǒng)的質量將和筆譯人員平均水準更加接近。”
在谷歌昨天發(fā)表的一篇博文中,Google Brain Team的研發(fā)科學家Quoc Le 和Mike Schuster提到,有了雙語評分員的幫助,在翻譯Wikipedia上的多語種樣句時,谷歌神經機器翻譯的錯誤率實際上已經降低了55%到85%。
盡管如此,這個系統(tǒng)還是不完美的?!吧窠洐C器翻譯還是會犯一些筆譯人員永遠都不可能犯的錯誤,比如遺漏了一些單詞、把一些常見的名字或是少見的專有名詞翻錯、對文章的語境缺乏整體把控等等。所以,我們還是有很大的進步空間。但不可否認的是,神經機器翻譯真的具有里程碑意義。”
via venturebeat
雷峰網原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知。