7
本文作者: 李尊 | 2016-10-12 16:43 |
前段時間,一則新聞幾乎刷遍了整個網(wǎng)絡(luò)。Google新發(fā)布了神經(jīng)機器翻譯(GNMT:Google Neural Machine Translation)系統(tǒng),并稱該系統(tǒng)使用了當(dāng)前最先進的訓(xùn)練技術(shù),能夠?qū)崿F(xiàn)到當(dāng)下機器翻譯質(zhì)量上最大的提升。
有從事翻譯職業(yè)的網(wǎng)友甚至這樣形容:
作為翻譯看到這個新聞的時候,我理解了18世紀紡織工人看到蒸汽機時的憂慮與恐懼。
這種看法未免有點杞人憂天。尤其是在業(yè)內(nèi)專家看來,機器翻譯的效果還遠未達到取代人類專家翻譯的水平。實際上,谷歌此次應(yīng)用的技術(shù)并非最新的“黑科技”。早在2015年百度就已經(jīng)發(fā)布了基于深度神經(jīng)網(wǎng)絡(luò)的端到端翻譯系統(tǒng),微軟的必應(yīng)翻譯也同樣使用神經(jīng)網(wǎng)絡(luò)技術(shù)來改善自身的翻譯質(zhì)量。 與傳統(tǒng)的基于短語的翻譯(PBMT)相比,基于神經(jīng)網(wǎng)絡(luò)的翻譯系統(tǒng)對整個輸入句子進行編碼,能夠更充分的利用上下文信息,生成較高質(zhì)量的譯文。
最近大家熱議的Google神經(jīng)機器翻譯目前只是在應(yīng)用在中譯英中,所以以下測試都是在中譯英部分下進行。分別從幾個角度來參看百度、Google、必應(yīng)等幾個翻譯軟件的實際使用效果如何:
復(fù)雜語句翻譯
1. 定語從句(用一個句子修飾一個名詞短語):
我沒有可以跟你說的事情。
從上至下依次為Google翻譯、百度翻譯、必應(yīng)翻譯
2. 多個修飾形容詞
從上至下依次為Google翻譯、百度翻譯、必應(yīng)翻譯
3. 長短句翻譯
從上至下依次為Google翻譯、百度翻譯、必應(yīng)翻譯
4. 俚語翻譯
從左至右依次為Google翻譯、百度翻譯、必應(yīng)翻譯
可以看到,在定語從句部分Google與百度的翻譯結(jié)果相差無幾,語句通順連貫,兩者比較的話Google翻譯的結(jié)果更為接近標準答案一些。另一方面,必應(yīng)翻譯的結(jié)果則與本意有所出入。
在多個形容詞部分,三者翻譯出了大概意思,但是遇到黃老板以及黃山這類在名詞與形容詞中易混淆的部分時,似乎百度翻譯要更為準確一點。
在長短句部分,Google翻譯與必應(yīng)翻譯都出現(xiàn)了同時翻譯兩次時態(tài)及動詞“have seen"的情況,雖然百度翻譯并未出現(xiàn)這種情形,但是其在兩個名詞之間并未翻出連接詞"and“,對語句理解有一點影響。
涉及到俚語翻譯部分時,Google翻譯幾乎完全是根據(jù)詞組翻譯出了字面的意思,而必應(yīng)則出現(xiàn)了奇怪的省略情況,語義并不連貫。相較之下,百度翻譯將原句引申含義也翻譯了出來,并保持了語句連貫與準確度。
口語化表達翻譯
1. 修飾詞,如:的、了、好
2. 省略與重復(fù)疊加短語句子
在口語化翻譯部分中,涉及到修飾詞部分,Google與百度翻譯大同小異,必應(yīng)翻譯與本意出入較大。
但是在重復(fù)疊加短語部分,從主觀上來看百度翻譯將”冒著“翻譯為”Take“,相比Google與必應(yīng)的”Brave“,其在語義通暢易讀以及連貫度上表現(xiàn)要更好一些。
1. 短段落
2. 長段落
在段落整體翻譯部分中,三者對于段落基本語義都翻譯出來了。其中Google翻譯在某些連接詞的翻譯上更為簡潔一些,而百度與必應(yīng)則會在某些位置增加一些連接詞匯。
但是在涉及到長短句、語氣詞、多重修飾詞部分,三者在某些地方都表現(xiàn)一般。
例如:“父親是一個胖子,走過去自然要費事些。”
Google譯為“Father is a fat man, go over the natural to be more trouble. ”
百度譯為“My father was a man, go to some trouble.”
必應(yīng)則譯為“ Father is a fat man, walk naturally want to bother about.”
三者從連貫性來看都不算太好,但是從語義上來看Google翻譯更為優(yōu)秀一些。
再如:“于是撲撲衣上的泥土,心里很輕松似的,過一會說,“我走了,到那邊來信!”
Google譯為“So flutter clothes on the soil, and my heart is very easy to like, after a while that, "I go; to the other side of the letter!””
百度譯為“Then suddenly the dirt on the clothes, he looked somewhat relieved and said after a while, "I will go over there; letter!"”
必應(yīng)則譯為“ Poop clothing and boots, felt very relaxed, one would say,"I'm leaving; to write! "”
此處三者的翻譯都不太好,從對應(yīng)詞組的翻譯來看,必應(yīng)翻譯的效果要好一些,但在缺少主語的情況下翻譯成“One”并不正確。Google翻譯直接理解將整個句子中的主體都默認是一個人,百度翻譯準確識別出了講話的是父親,即“He”,但其在從句部分結(jié)構(gòu)有錯誤。
1. 離線翻譯
在離線翻譯部分,從測試的語句來看,Google翻譯的效果勉強能看懂,百度需要先購買離線包才能進行翻譯,必應(yīng)則不提供離線翻譯功能。
2. 圖片翻譯
圖像翻譯部分使用今日頭條的統(tǒng)一頁面
從左至右依次為Google翻譯、百度翻譯、必應(yīng)翻譯
其中谷歌翻譯可以做到手機放在圖片前面,不做任何操作開始實時翻譯。按拍照按鈕后,涂抹想翻譯的部分,然后翻譯出相應(yīng)的結(jié)果。
相比谷歌翻譯,百度沒有放在圖片前面不做任何操作開始實時翻譯的功能。不過百度翻譯在按拍照按鈕后,也能涂抹想翻譯的部分翻譯出相應(yīng)的結(jié)果。但百度翻譯的個性化功能最全,有
實物翻譯
長句翻譯
菜單翻譯
單詞翻譯
四大類,且自定義功能最完善。
另外,百度翻譯提供的實物翻譯與菜單翻譯功能在某些場合也能派上用場。
必應(yīng)翻譯只能先拍照再進行翻譯,也無自定義功能選項。
3. 語音翻譯
在語音翻譯部分,正確的句子是:你好,我想打死李某。 Google和百度的翻譯效果差不多類似,必應(yīng)則不提供語音翻譯功能。
此外,Google翻譯提供多種語言的語音輸入功能,百度目前只提供中文、英文、粵語(Google翻譯中并未提供)語音輸入功能。兩者的語言識別輸入功能也都十分不錯,準確率很高且語句通順連貫。并且兩者都能以對話模式呈現(xiàn),相信在商務(wù)或者旅行過程中會帶來不少便利。
從上至下依次為Google翻譯、百度翻譯
從上面的各項對比中可以看到,采用了神經(jīng)機器系統(tǒng)的翻譯相比之前基于短語的翻譯確實要進步了許多。再也不是之前那種讀起來總感覺哪里不對的感覺,甚至有些翻譯結(jié)果已經(jīng)到了稍加修改勉強能用的地步。
但是具體到使用過程中,比如需要對復(fù)雜語句以及口語化表達進行翻譯時,大部分時候Google翻譯與百度翻譯的表現(xiàn)相對優(yōu)秀一些。不僅在流暢度、語義保持上效果相對優(yōu)秀,而且在句子錯誤率以及單詞錯誤率上也要相對少一些。
另外,在圖片翻譯部分,Google翻譯能做到實時翻譯的效果,且準確度不錯。百度翻譯雖然沒有實時翻譯的功能,但是其自定義功能最完善,且能選擇四大類個性化功能,針對性更強。
綜上所述,添加了神經(jīng)網(wǎng)絡(luò)的機器翻譯相較于往日的確不可同日而語了。在某些方面已經(jīng)隱隱約約接近人類翻譯的水準,所以有相關(guān)翻譯人員擔(dān)心也不算夸張。不過對于普通人而言,在有相關(guān)翻譯需求時,綜合詞語、段落準確率以及語義流暢度來看,百度翻譯目前是一個不錯的選擇。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。