7
本文作者: 李尊 | 2016-10-12 16:43 |
前段時(shí)間,一則新聞幾乎刷遍了整個(gè)網(wǎng)絡(luò)。Google新發(fā)布了神經(jīng)機(jī)器翻譯(GNMT:Google Neural Machine Translation)系統(tǒng),并稱該系統(tǒng)使用了當(dāng)前最先進(jìn)的訓(xùn)練技術(shù),能夠?qū)崿F(xiàn)到當(dāng)下機(jī)器翻譯質(zhì)量上最大的提升。
有從事翻譯職業(yè)的網(wǎng)友甚至這樣形容:
作為翻譯看到這個(gè)新聞的時(shí)候,我理解了18世紀(jì)紡織工人看到蒸汽機(jī)時(shí)的憂慮與恐懼。
這種看法未免有點(diǎn)杞人憂天。尤其是在業(yè)內(nèi)專家看來(lái),機(jī)器翻譯的效果還遠(yuǎn)未達(dá)到取代人類專家翻譯的水平。實(shí)際上,谷歌此次應(yīng)用的技術(shù)并非最新的“黑科技”。早在2015年百度就已經(jīng)發(fā)布了基于深度神經(jīng)網(wǎng)絡(luò)的端到端翻譯系統(tǒng),微軟的必應(yīng)翻譯也同樣使用神經(jīng)網(wǎng)絡(luò)技術(shù)來(lái)改善自身的翻譯質(zhì)量。 與傳統(tǒng)的基于短語(yǔ)的翻譯(PBMT)相比,基于神經(jīng)網(wǎng)絡(luò)的翻譯系統(tǒng)對(duì)整個(gè)輸入句子進(jìn)行編碼,能夠更充分的利用上下文信息,生成較高質(zhì)量的譯文。
最近大家熱議的Google神經(jīng)機(jī)器翻譯目前只是在應(yīng)用在中譯英中,所以以下測(cè)試都是在中譯英部分下進(jìn)行。分別從幾個(gè)角度來(lái)參看百度、Google、必應(yīng)等幾個(gè)翻譯軟件的實(shí)際使用效果如何:
復(fù)雜語(yǔ)句翻譯
1. 定語(yǔ)從句(用一個(gè)句子修飾一個(gè)名詞短語(yǔ)):
我沒(méi)有可以跟你說(shuō)的事情。
從上至下依次為Google翻譯、百度翻譯、必應(yīng)翻譯
2. 多個(gè)修飾形容詞
從上至下依次為Google翻譯、百度翻譯、必應(yīng)翻譯
3. 長(zhǎng)短句翻譯
從上至下依次為Google翻譯、百度翻譯、必應(yīng)翻譯
4. 俚語(yǔ)翻譯
從左至右依次為Google翻譯、百度翻譯、必應(yīng)翻譯
可以看到,在定語(yǔ)從句部分Google與百度的翻譯結(jié)果相差無(wú)幾,語(yǔ)句通順連貫,兩者比較的話Google翻譯的結(jié)果更為接近標(biāo)準(zhǔn)答案一些。另一方面,必應(yīng)翻譯的結(jié)果則與本意有所出入。
在多個(gè)形容詞部分,三者翻譯出了大概意思,但是遇到黃老板以及黃山這類在名詞與形容詞中易混淆的部分時(shí),似乎百度翻譯要更為準(zhǔn)確一點(diǎn)。
在長(zhǎng)短句部分,Google翻譯與必應(yīng)翻譯都出現(xiàn)了同時(shí)翻譯兩次時(shí)態(tài)及動(dòng)詞“have seen"的情況,雖然百度翻譯并未出現(xiàn)這種情形,但是其在兩個(gè)名詞之間并未翻出連接詞"and“,對(duì)語(yǔ)句理解有一點(diǎn)影響。
涉及到俚語(yǔ)翻譯部分時(shí),Google翻譯幾乎完全是根據(jù)詞組翻譯出了字面的意思,而必應(yīng)則出現(xiàn)了奇怪的省略情況,語(yǔ)義并不連貫。相較之下,百度翻譯將原句引申含義也翻譯了出來(lái),并保持了語(yǔ)句連貫與準(zhǔn)確度。
口語(yǔ)化表達(dá)翻譯
1. 修飾詞,如:的、了、好
2. 省略與重復(fù)疊加短語(yǔ)句子
在口語(yǔ)化翻譯部分中,涉及到修飾詞部分,Google與百度翻譯大同小異,必應(yīng)翻譯與本意出入較大。
但是在重復(fù)疊加短語(yǔ)部分,從主觀上來(lái)看百度翻譯將”冒著“翻譯為”Take“,相比Google與必應(yīng)的”Brave“,其在語(yǔ)義通暢易讀以及連貫度上表現(xiàn)要更好一些。
1. 短段落
2. 長(zhǎng)段落
在段落整體翻譯部分中,三者對(duì)于段落基本語(yǔ)義都翻譯出來(lái)了。其中Google翻譯在某些連接詞的翻譯上更為簡(jiǎn)潔一些,而百度與必應(yīng)則會(huì)在某些位置增加一些連接詞匯。
但是在涉及到長(zhǎng)短句、語(yǔ)氣詞、多重修飾詞部分,三者在某些地方都表現(xiàn)一般。
例如:“父親是一個(gè)胖子,走過(guò)去自然要費(fèi)事些?!?/p>
Google譯為“Father is a fat man, go over the natural to be more trouble. ”
百度譯為“My father was a man, go to some trouble.”
必應(yīng)則譯為“ Father is a fat man, walk naturally want to bother about.”
三者從連貫性來(lái)看都不算太好,但是從語(yǔ)義上來(lái)看Google翻譯更為優(yōu)秀一些。
再如:“于是撲撲衣上的泥土,心里很輕松似的,過(guò)一會(huì)說(shuō),“我走了,到那邊來(lái)信!”
Google譯為“So flutter clothes on the soil, and my heart is very easy to like, after a while that, "I go; to the other side of the letter!””
百度譯為“Then suddenly the dirt on the clothes, he looked somewhat relieved and said after a while, "I will go over there; letter!"”
必應(yīng)則譯為“ Poop clothing and boots, felt very relaxed, one would say,"I'm leaving; to write! "”
此處三者的翻譯都不太好,從對(duì)應(yīng)詞組的翻譯來(lái)看,必應(yīng)翻譯的效果要好一些,但在缺少主語(yǔ)的情況下翻譯成“One”并不正確。Google翻譯直接理解將整個(gè)句子中的主體都默認(rèn)是一個(gè)人,百度翻譯準(zhǔn)確識(shí)別出了講話的是父親,即“He”,但其在從句部分結(jié)構(gòu)有錯(cuò)誤。
1. 離線翻譯
在離線翻譯部分,從測(cè)試的語(yǔ)句來(lái)看,Google翻譯的效果勉強(qiáng)能看懂,百度需要先購(gòu)買離線包才能進(jìn)行翻譯,必應(yīng)則不提供離線翻譯功能。
2. 圖片翻譯
圖像翻譯部分使用今日頭條的統(tǒng)一頁(yè)面
從左至右依次為Google翻譯、百度翻譯、必應(yīng)翻譯
其中谷歌翻譯可以做到手機(jī)放在圖片前面,不做任何操作開始實(shí)時(shí)翻譯。按拍照按鈕后,涂抹想翻譯的部分,然后翻譯出相應(yīng)的結(jié)果。
相比谷歌翻譯,百度沒(méi)有放在圖片前面不做任何操作開始實(shí)時(shí)翻譯的功能。不過(guò)百度翻譯在按拍照按鈕后,也能涂抹想翻譯的部分翻譯出相應(yīng)的結(jié)果。但百度翻譯的個(gè)性化功能最全,有
實(shí)物翻譯
長(zhǎng)句翻譯
菜單翻譯
單詞翻譯
四大類,且自定義功能最完善。
另外,百度翻譯提供的實(shí)物翻譯與菜單翻譯功能在某些場(chǎng)合也能派上用場(chǎng)。
必應(yīng)翻譯只能先拍照再進(jìn)行翻譯,也無(wú)自定義功能選項(xiàng)。
3. 語(yǔ)音翻譯
在語(yǔ)音翻譯部分,正確的句子是:你好,我想打死李某。 Google和百度的翻譯效果差不多類似,必應(yīng)則不提供語(yǔ)音翻譯功能。
此外,Google翻譯提供多種語(yǔ)言的語(yǔ)音輸入功能,百度目前只提供中文、英文、粵語(yǔ)(Google翻譯中并未提供)語(yǔ)音輸入功能。兩者的語(yǔ)言識(shí)別輸入功能也都十分不錯(cuò),準(zhǔn)確率很高且語(yǔ)句通順連貫。并且兩者都能以對(duì)話模式呈現(xiàn),相信在商務(wù)或者旅行過(guò)程中會(huì)帶來(lái)不少便利。
從上至下依次為Google翻譯、百度翻譯
從上面的各項(xiàng)對(duì)比中可以看到,采用了神經(jīng)機(jī)器系統(tǒng)的翻譯相比之前基于短語(yǔ)的翻譯確實(shí)要進(jìn)步了許多。再也不是之前那種讀起來(lái)總感覺(jué)哪里不對(duì)的感覺(jué),甚至有些翻譯結(jié)果已經(jīng)到了稍加修改勉強(qiáng)能用的地步。
但是具體到使用過(guò)程中,比如需要對(duì)復(fù)雜語(yǔ)句以及口語(yǔ)化表達(dá)進(jìn)行翻譯時(shí),大部分時(shí)候Google翻譯與百度翻譯的表現(xiàn)相對(duì)優(yōu)秀一些。不僅在流暢度、語(yǔ)義保持上效果相對(duì)優(yōu)秀,而且在句子錯(cuò)誤率以及單詞錯(cuò)誤率上也要相對(duì)少一些。
另外,在圖片翻譯部分,Google翻譯能做到實(shí)時(shí)翻譯的效果,且準(zhǔn)確度不錯(cuò)。百度翻譯雖然沒(méi)有實(shí)時(shí)翻譯的功能,但是其自定義功能最完善,且能選擇四大類個(gè)性化功能,針對(duì)性更強(qiáng)。
綜上所述,添加了神經(jīng)網(wǎng)絡(luò)的機(jī)器翻譯相較于往日的確不可同日而語(yǔ)了。在某些方面已經(jīng)隱隱約約接近人類翻譯的水準(zhǔn),所以有相關(guān)翻譯人員擔(dān)心也不算夸張。不過(guò)對(duì)于普通人而言,在有相關(guān)翻譯需求時(shí),綜合詞語(yǔ)、段落準(zhǔn)確率以及語(yǔ)義流暢度來(lái)看,百度翻譯目前是一個(gè)不錯(cuò)的選擇。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。