0
本文作者: 叨叨 | 2018-01-12 16:40 | 專題:AI最佳掘金案列 |
從 2016 年到 2017 年,或許是翻譯行業(yè)的從業(yè)者們最人心惶惶的年頭。科技企業(yè)挾 AI 令“翻譯”,隔幾天就發(fā)布一個新數(shù)字,不斷推高機(jī)器翻譯的準(zhǔn)確程度,似乎這個行業(yè)已然成為“AI 替代人類”最早的炮灰。
機(jī)器翻譯的進(jìn)步,得益于神經(jīng)網(wǎng)絡(luò)的應(yīng)用。不過,即便比統(tǒng)計模型基礎(chǔ)上的機(jī)器翻譯大有進(jìn)步,神經(jīng)網(wǎng)絡(luò)翻譯(NMT)的質(zhì)量,其實也還遠(yuǎn)未達(dá)到專業(yè)人類譯員的水平,用鄒劍宇的話來說,只是“可讀”,能獲取一定信息,但如果想要商用,還是需要人類來做“譯后編輯”。
鄒劍宇是中文互聯(lián)網(wǎng)的第一代記者,1997年加入《三聯(lián)生活周刊》,見證了互聯(lián)網(wǎng)企業(yè)在中國發(fā)展的第一個十年。這個十年,不僅是搜狐、百度、阿里、騰訊、網(wǎng)易起步的十年,也是中國媒體界“編譯”的十年。在十年里,國內(nèi)媒體從業(yè)者們搞定了一件事,那就是在新聞(News)層面和國外實現(xiàn)了“語言的同步”。進(jìn)入第二個十年,鄒劍宇已經(jīng)選擇了翻譯。
在他看來,翻譯需求無處不在,但大部分有價值的英文內(nèi)容,還沒有被譯出來,比如比新聞(News)更高級的信息(Information),以及更深度的知識(Knowledge)。鄒劍宇給前來采訪的雷鋒網(wǎng)作者舉了一個實例:
現(xiàn)在還沒有看到誰有能力把近十年甚至從創(chuàng)刊起的《經(jīng)濟(jì)學(xué)人》或者《柳葉刀》譯成中文,如果翻譯出來,其價值巨大;如果再加上能搜索、檢索,其價值就大到無法想象。
巨大的翻譯需求,不能掩蓋這個行業(yè)“生意”的小。 “都是小公司,沒有大公司”,但鄒劍宇認(rèn)為這是機(jī)器翻譯的機(jī)會,也是他們的機(jī)會——“我們創(chuàng)業(yè)的時候(2013年),這一點看得很清楚,如果不跟上機(jī)器翻譯的趨勢,翻譯一定沒得做”。
從人工智能大火的今天往回看,這個趨勢毋庸置疑。人類翻譯受限于生物條件,生產(chǎn)力存在天花板,到了這個天花板,就無法再提高。這也是這個行業(yè)為什么沒有巨頭的核心原因,而當(dāng)神經(jīng)網(wǎng)絡(luò)翻譯出現(xiàn)之后,人類翻譯有了一個更好的選擇,那就是“譯后編輯”。
一個翻譯需求發(fā)出,先交給機(jī)器翻譯,譯后再由人類進(jìn)行編輯,經(jīng)過實踐之后,“譯后編輯”的做法可以將效率提升2-4倍,成本降低30%-80%,作為個人譯員收入提升,企業(yè)可以規(guī)?;l(fā)展,而需求發(fā)出單位能夠收到速度更快、術(shù)語準(zhǔn)確度更高、翻譯質(zhì)量更好的譯文。
經(jīng)過前期探索,在這種思路下,鄒劍宇和他的搭檔魏勇鵬創(chuàng)建了商鵲網(wǎng),詳細(xì)過程可參見雷鋒網(wǎng)另外一篇相關(guān)報道。商鵲網(wǎng)創(chuàng)立時,正是跨境電商最熱的時候,鄒劍宇順利成章就盯上了“這塊肥肉”,成為阿里巴巴的供應(yīng)商,做電商信息的翻譯。但這一次的嘗試,并沒有帶來太多效益,跨境電商的長鏈條、低利潤,處在末端的翻譯更分不了多少錢。
很快,商議之下,商鵲網(wǎng)重回魏勇鵬此前曾經(jīng)做過的專利翻譯業(yè)務(wù)。事實證明,“譯后編輯”的效果得到了客戶日本專利局的認(rèn)可,訂單從2014年的78萬件擴(kuò)大到了2015年的145萬件,而結(jié)構(gòu)化的“專利數(shù)據(jù)”,也把商鵲網(wǎng)的“專利翻譯引擎”打磨得很好。
雷鋒網(wǎng)了解到,近日商鵲網(wǎng)達(dá)成千萬元戰(zhàn)略資金投入,未來將著眼于投資、醫(yī)療、教育等領(lǐng)域的智能服務(wù)系統(tǒng)及跨境信息服務(wù)的建設(shè)。
除了很好地訓(xùn)練了機(jī)器翻譯模型,獲得了大量訂單,還有一個收獲就是得到了一整套基于“譯后編輯”模式下的譯員培訓(xùn)。
對于傳統(tǒng)翻譯業(yè)務(wù)而言,翻譯眾包公司接到訂單,需要組織大量譯員進(jìn)行翻譯,在翻譯前必須有一個“培訓(xùn)”的過程,了解背景知識、統(tǒng)一術(shù)語等等,才能讓翻譯效果有基礎(chǔ)的保證。而機(jī)器翻譯介入后,也改變了譯員培訓(xùn)和翻譯教育,這便是鄒劍宇的另一個產(chǎn)品——試譯寶。
簡單來說,試譯寶是一款基于機(jī)器翻譯的翻譯自動批改和輔助培訓(xùn)的在線產(chǎn)品,同時還加入了機(jī)器自動打分、譯文點評功能(包括老師點評、學(xué)生互評和自動點評),在一個產(chǎn)品中將“練習(xí)-評點-講解”統(tǒng)一起來,成為一體化的系統(tǒng)翻譯訓(xùn)練平臺。這個系統(tǒng)有兩端,分別是學(xué)生端和教師端。
在學(xué)生端,進(jìn)入規(guī)定的課程,就可以像答題一樣作答,英文材料下方會給出即時的機(jī)器翻譯結(jié)果,答題結(jié)束后可進(jìn)入“自評”,自評后就可以進(jìn)行提交,提交之后的結(jié)果會發(fā)送至教師端進(jìn)行線上批閱,同時也能收到機(jī)器打分和其他人的評論。
*答題
*自評
*提交和評點
而在教師端,則設(shè)置了創(chuàng)建題庫、檢索、批改等功能,界面友好,降低了教師備課的門檻,提升了其批改的效率,讓教和學(xué)有了更為良好的互動方式。
*分句批改
*批量點評
*成績統(tǒng)計
*考勤統(tǒng)計
在機(jī)器翻譯技術(shù)的輔助下,教師能在三個方面獲益頗豐:
1. 實現(xiàn)多種學(xué)生練習(xí)作業(yè)批改模式,如按人批改、按題批改、按知識點批改等;
2. 利用平臺教學(xué)資源,降低備課門檻,創(chuàng)新教學(xué)模式
3. 利用平臺積累的答題數(shù)據(jù),輔助科研和教研工作
該產(chǎn)品自2016年上線以來,目前已經(jīng)獲得了10萬用戶,并且成為北京語言大學(xué)第七屆國際口筆譯大賽唯一提交入口,并創(chuàng)下了歷年來筆譯類大賽報名人數(shù)之最。同時,也有不少專業(yè)院校采買該系統(tǒng),定制化之后成為學(xué)校專用的翻譯教學(xué)工具。
在近日,試譯寶也獲得了由雷鋒網(wǎng)頒發(fā)的“2018年度最佳試題評測獎”,是翻譯教育軟件第一次獲得互聯(lián)網(wǎng)及人工智能行業(yè)的獎項。
在采訪的最后,鄒劍宇向雷鋒網(wǎng)表示,翻譯行業(yè)想象空間巨大,但要做成一件事需要天時地利人和,試譯寶的作用就在“人”和“數(shù)據(jù)”上,抓住了這兩個點,就抓住了AI背景下的關(guān)鍵。實際上,機(jī)器翻譯也是AI屈指可數(shù)的可商用的領(lǐng)域,并且已經(jīng)逐漸從語言深入到了語義層,是技術(shù)進(jìn)化到強(qiáng)AI的一條可依循的路徑。
“這僅僅是一個開始”,鄒劍宇說。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。