Google 翻譯的“漢譯英”錯(cuò)誤率降低 60%，是怎么算出來(lái)的？

本文作者： haoxiaoru

2016-09-30 17:05

導(dǎo)語(yǔ)：尤其是那些當(dāng)初認(rèn)為機(jī)器在圍棋上戰(zhàn)勝不了人類(lèi)的人類(lèi)，現(xiàn)在又對(duì)“人工智能”過(guò)于樂(lè)觀了。

第一步。

從維基百科和新聞網(wǎng)站上，隨機(jī)選取 500 個(gè)中文句子，作為被評(píng)估內(nèi)容。

第二步。

Google 翻譯的“漢譯英”錯(cuò)誤率降低 60%，是怎么算出來(lái)的？

找人工翻譯，將500個(gè)句子翻譯為英文。

第三步。

Google 翻譯的“漢譯英”錯(cuò)誤率降低 60%，是怎么算出來(lái)的？

將舊的機(jī)器翻譯結(jié)果、新的機(jī)器翻譯結(jié)果（神經(jīng)網(wǎng)絡(luò)）、人工翻譯的結(jié)果、，這三份“考卷”，拿給熟練使用中英雙語(yǔ)的真人判卷員。

第四步。

Google 翻譯的“漢譯英”錯(cuò)誤率降低 60%，是怎么算出來(lái)的？

熟練使用中英雙語(yǔ)的真人判卷員，給每張考卷的每個(gè)句子，進(jìn)行打分。分?jǐn)?shù)為 0~6 的整數(shù)，0代表翻譯結(jié)果“狗屁不通”，6代表翻譯結(jié)果“精彩絕倫”。

第五步。

Google 翻譯的“漢譯英”錯(cuò)誤率降低 60%，是怎么算出來(lái)的？

出成績(jī)了。舊機(jī)器翻譯每個(gè)句子平均得分 3.694，新機(jī)器翻譯得到 4.263 分，人工翻譯得分 4.636 分。別忘了滿(mǎn)分是 6 分哦。

第六步。

分別計(jì)算，跟人工翻譯的水平相比，“誤差率”（錯(cuò)誤率）是多少。

舊機(jī)器翻譯：(4.636-3.694) / 4.636 = 20%
新機(jī)器翻譯：(4.636-4.263) / 4.636 = 8%

第七步。

算“錯(cuò)誤率”降低了多少。

（20%-8%）/ 20% = 12% / 20%= 60%

第八步。

算算“準(zhǔn)確率”提升了多少。

(4.263-3.694)/3.694 = 15%

第九步。

Google 翻譯的“漢譯英”錯(cuò)誤率降低 60%，是怎么算出來(lái)的？

為什么用戶(hù)興奮，媒體興奮，專(zhuān)家沒(méi)那么興奮？翻譯公司商鵲網(wǎng)CTO魏勇鵬告訴雷鋒網(wǎng)：

這里面兩個(gè)主要的“陷阱”：

1、從3.6提升到4.2，和從4.2提升到4.6，這兩個(gè)所需要付出的努力程度，后者可能是前者的10倍以上都不止，但Google就簡(jiǎn)單的線性計(jì)算為縮小了60%的差距。

2、中英的人工翻譯，得到的評(píng)分也就只是4.6，比英西的人要低得多，這點(diǎn)說(shuō)明用來(lái)作為基準(zhǔn)的“人”，未必是靠譜的，以它為基準(zhǔn)來(lái)評(píng)估，也未必是靠譜的。

其實(shí)還有第三點(diǎn)，別忘了卷子是 Google 自己出的。

注意用于做評(píng)測(cè)的數(shù)據(jù)是：500 randomly sampled sentences from Wikipedia and news websites。這些都是互聯(lián)網(wǎng)上語(yǔ)料最充足的內(nèi)容類(lèi)型。也就是機(jī)器最擅長(zhǎng)的內(nèi)容。

第十步。

Google 翻譯的“漢譯英”錯(cuò)誤率降低 60%，是怎么算出來(lái)的？

行業(yè)認(rèn)可的一種機(jī)器翻譯成績(jī)?cè)u(píng)估，是 WMT 的 BLEU Score 比賽。Google 這次發(fā)布的論文，也用了 BLEU Score 的分?jǐn)?shù)。雷鋒網(wǎng)沒(méi)找到漢譯英的部分，但是有英譯法的數(shù)據(jù)，從 37 分提升到 41.16 分。

第十一步。

很多人類(lèi)患上“圍棋”恐慌癥了。

Google 首次將神經(jīng)網(wǎng)絡(luò)技術(shù)，成功應(yīng)用到翻譯產(chǎn)品上，上線后使得翻譯質(zhì)量有了明顯提升。但是媒體報(bào)道中的標(biāo)題“錯(cuò)誤率降低 60%”，甚至某種語(yǔ)言是 “85%”，很容易讓普通人以為蒸汽機(jī)革命來(lái)了……事實(shí)上，微軟、百度等大公司之前也在翻譯產(chǎn)品中使用神經(jīng)網(wǎng)絡(luò)技術(shù)，但沒(méi)有引起大的傳播。

究其原因。一位不具名的評(píng)論者告訴雷鋒網(wǎng)，之前很多人看到 Google 的電腦在圍棋上戰(zhàn)勝了人類(lèi)，心理上受到了沖擊，自然而然認(rèn)為 Google 強(qiáng)大的人工智能技術(shù)，會(huì)顛覆很多行業(yè)。尤其是那些當(dāng)初認(rèn)為機(jī)器在圍棋上戰(zhàn)勝不了人類(lèi)的人類(lèi)，現(xiàn)在又對(duì)“人工智能”過(guò)于樂(lè)觀了。

第十二步。

Google 翻譯的“漢譯英”錯(cuò)誤率降低 60%，是怎么算出來(lái)的？

北京時(shí)間9月29日早上，論文作者之一，Google Brain 團(tuán)隊(duì)的陳智峰，通過(guò)遠(yuǎn)程視頻接受了 3 家中國(guó)媒體的采訪。他告訴雷鋒網(wǎng)，這次 Google 比較特別的地方在于，訓(xùn)練過(guò)程利用了大量的分布式計(jì)算，所以才能把語(yǔ)言模型很快訓(xùn)練出來(lái)?！安畈欢嘁恍瞧谔幚硪粋€(gè)方向的語(yǔ)言模型。但是 Google 有大概一萬(wàn)個(gè)語(yǔ)言的模型需要訓(xùn)練，既需要我們有巨大的資源投入，也在不停地改進(jìn)算法。 ”

對(duì)于機(jī)器翻譯取代人工翻譯的問(wèn)題。陳智峰認(rèn)為，規(guī)則的文本，比如醫(yī)學(xué)論文，比如時(shí)事新聞，大家更注重信息的傳達(dá)，在修辭方面或情感方面的傳達(dá)可以弱化一些?！皺C(jī)器翻譯就能夠很快地幫助你獲得信息，這是機(jī)器翻譯目前對(duì)人類(lèi)的主要幫助?！?/strong>

他說(shuō)，“目前來(lái)講，我覺(jué)得人與人之間的自然的溝通，通過(guò)機(jī)器翻譯還是有很大的工作需要做。做到真正能夠讓你感覺(jué)到跟你說(shuō)話(huà)的是個(gè)人，而不是機(jī)器，還是有很多年需要努力的?！?nbsp;

// 參考來(lái)源

論文 https://arxiv.org/abs/1609.08144
官方博客 https://research.googleblog.com/2016/09/a-neural-network-for-machine.html
樣例文檔 https://drive.google.com/file/d/0B4-Ig7UAZe3BSUYweVo3eVhNY3c/view?usp=sharing

// 雷鋒網(wǎng)專(zhuān)題報(bào)道

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

0人收藏

分享：

相關(guān)文章

Google翻譯神經(jīng)網(wǎng)絡(luò) 人工智能

支持108種語(yǔ)言的谷歌翻譯如何用AI讓翻譯質(zhì)量越來(lái)越好 ...

杉數(shù)科技添然——時(shí)序預(yù)測(cè)中深度學(xué)習(xí)介紹 | AI 研習(xí) ...

特朗普緊急發(fā)布《AI倡議》行政命令：一切為了美國(guó)能 ...

還在為英語(yǔ)學(xué)習(xí)發(fā)愁嗎？身為程序員的你可能需要這樣 ...

haoxiaoru

帥編輯

你猜猜猜

發(fā)私信

當(dāng)月熱門(mén)文章

最新文章

港中文 MMlab×美團(tuán)新研究：僅用一個(gè)模型，應(yīng)對(duì)多種視覺(jué)推理任務(wù)

對(duì)話(huà)Noitom Robotics CEO戴若犁：沒(méi)有人比我更適合解決機(jī)器人的數(shù)據(jù)問(wèn)題 | GAIR 2025

IDCC 2025：全球進(jìn)入算力效能競(jìng)爭(zhēng)期，商湯大裝置給出中國(guó)式解決方案

對(duì)話(huà)英諾王建明：機(jī)器人目前面臨的核心問(wèn)題是數(shù)據(jù) | GAIR 2025

金融智能體進(jìn)入規(guī)模落地期螞蟻數(shù)科被評(píng)綜合領(lǐng)導(dǎo)者

IDC MarketScape：商湯科技位居中國(guó)AI咨詢(xún)服務(wù)市場(chǎng)領(lǐng)導(dǎo)者類(lèi)別

熱門(mén)搜索

英特爾支付寶 Elon Musk CES 隱私軟銀 iPad Pro Pebble 央行陌陌 Nexus 7

Google 翻譯的“漢譯英”錯(cuò)誤率降低 60%，是怎么算出來(lái)的？

第二步。

第三步。

第四步。

第五步。

第六步。

第七步。

第八步。

第九步。

第十步。

第十一步。

第十二步。

Google 翻譯的“漢譯英”錯(cuò)誤率降低 60%，是怎么算出來(lái)的？

第四步。

第五步。

第六步。

第八步。

第九步。

第十二步。