2
本文作者: 楊波 | 2016-09-28 08:13 |
據(jù)外媒報(bào)道,谷歌于昨日發(fā)布了網(wǎng)頁(yè)版本和移動(dòng)版本的谷歌翻譯。在漢譯英的過(guò)程中,谷歌翻譯會(huì)采用全新的神經(jīng)機(jī)器翻譯機(jī)制,而這個(gè)App每天要進(jìn)行一千八百萬(wàn)次這樣的翻譯。此外,谷歌針對(duì)這個(gè)神經(jīng)機(jī)器翻譯系統(tǒng)的運(yùn)作原理,專(zhuān)門(mén)發(fā)表了一篇學(xué)術(shù)論文。
早前,谷歌就曾表示過(guò),他們?cè)诠雀璺g中運(yùn)用了神經(jīng)網(wǎng)絡(luò)技術(shù),但只限于實(shí)時(shí)視覺(jué)翻譯這個(gè)功能。前段時(shí)間,谷歌一名叫Jeff Dean的高級(jí)員工曾經(jīng)告訴VentureBeat,谷歌已經(jīng)在嘗試把越來(lái)越多的深度學(xué)習(xí)功能和機(jī)制融入到谷歌翻譯中。除此之外,谷歌的一位發(fā)言人在郵件中告訴VentureBeat,最新的神經(jīng)機(jī)器翻譯是他們努力研發(fā)深度學(xué)習(xí)功能和機(jī)制的成果。
實(shí)際上,谷歌一直以來(lái)都在致力于將深度神經(jīng)網(wǎng)絡(luò)融入它旗下越來(lái)越多的應(yīng)用軟件中,其中包括Google Allo和Inbox by Gmail。這個(gè)功能可以幫助谷歌更加快捷、更加有效地處理它們獲取到的數(shù)據(jù)。
谷歌的神經(jīng)機(jī)器翻譯(GNMT)對(duì)八層長(zhǎng)的短時(shí)記憶遞歸神經(jīng)網(wǎng)絡(luò)(LSTM-RNNs)的依賴(lài)性很強(qiáng)?!巴ㄟ^(guò)層間殘留聯(lián)系可以加強(qiáng)梯度流。”谷歌的科學(xué)家在他們發(fā)表的學(xué)術(shù)論文中寫(xiě)道。在圖像處理器的幫助下,神經(jīng)網(wǎng)絡(luò)一旦變得足夠成熟,谷歌就可以依靠它尚未發(fā)布的張量處理單元進(jìn)行數(shù)據(jù)處理。
雖然神經(jīng)機(jī)器翻譯并不永遠(yuǎn)是最佳之選,但是從谷歌的各種嘗試中我們不難發(fā)現(xiàn),在某些情況下,神經(jīng)機(jī)器翻譯還是有其過(guò)人之處的。
“人們對(duì)這個(gè)翻譯系統(tǒng)的評(píng)價(jià)顯示,與之前那個(gè)基于短語(yǔ)的翻譯系統(tǒng)相比,在翻譯多種語(yǔ)言時(shí),神經(jīng)學(xué)習(xí)翻譯系統(tǒng)的錯(cuò)誤率已經(jīng)降低了60%左右,其中包括英法互譯,英西互譯以及英漢互譯。附加實(shí)驗(yàn)的結(jié)果顯示,翻譯系統(tǒng)的質(zhì)量將和筆譯人員平均水準(zhǔn)更加接近?!?/p>
在谷歌昨天發(fā)表的一篇博文中,Google Brain Team的研發(fā)科學(xué)家Quoc Le 和Mike Schuster提到,有了雙語(yǔ)評(píng)分員的幫助,在翻譯Wikipedia上的多語(yǔ)種樣句時(shí),谷歌神經(jīng)機(jī)器翻譯的錯(cuò)誤率實(shí)際上已經(jīng)降低了55%到85%。
盡管如此,這個(gè)系統(tǒng)還是不完美的?!吧窠?jīng)機(jī)器翻譯還是會(huì)犯一些筆譯人員永遠(yuǎn)都不可能犯的錯(cuò)誤,比如遺漏了一些單詞、把一些常見(jiàn)的名字或是少見(jiàn)的專(zhuān)有名詞翻錯(cuò)、對(duì)文章的語(yǔ)境缺乏整體把控等等。所以,我們還是有很大的進(jìn)步空間。但不可否認(rèn)的是,神經(jīng)機(jī)器翻譯真的具有里程碑意義。”
via venturebeat
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。