0
本文作者: 李秀琴 | 2017-09-27 13:57 |
雷鋒網(wǎng):AI翻譯作為人工智能行業(yè)可連接數(shù)千萬個應用場景的服務之一,歷來都是「兵家必爭之地」。除了國外的谷歌、蘋果和微軟,國內(nèi)的BAT、科大訊飛和搜狗也在此展開了激烈競爭。那么,宣布「All in AI」之后的百度,近期在AI翻譯產(chǎn)業(yè)又有什么大動作?
近日,在日本舉行的第16屆機器翻譯峰會上,百度終于現(xiàn)場展示了一款在傳聞中存在很久的智能WiFi翻譯機。而這款產(chǎn)品的首次露面,也標志著百度正式加入科大訊飛、分音塔科技等企業(yè)開啟的AI翻譯機大戰(zhàn)陣營。
圖為第16屆機器翻譯峰會現(xiàn)場
據(jù)百度技術(shù)委員會吳華現(xiàn)場介紹,這款翻譯機可支持中英日等多種語言。在對話時,用戶只需選定互譯語言種類,按住說話鍵,翻譯機就能智能識別輸入語言的語種,且自動輸出對應語種的翻譯結(jié)果。
此外,百度智能翻譯機還具有WiFi路由器的功能,可支持80多個國家的移動數(shù)據(jù)流量,用戶開機便能自動連接4G網(wǎng)絡(luò),而不用像傳統(tǒng)翻譯機那樣使用APP進行網(wǎng)絡(luò)配對或插入SIM卡連接網(wǎng)絡(luò)。雷鋒網(wǎng)獲悉,百度這款翻譯機首先將面向日本和歐美等國旅游或出差的中國人出租或銷售,2018年春季將擴大到日本等市場。不過,目前具體上市時間和價格尚不得而知。
在此之前,市面上已經(jīng)有訊飛的曉譯翻譯機和分音塔科技的準兒翻譯機。曉譯翻譯機于2016年首次亮相,可支持中英、漢維等多語種翻譯。上市售價2999元,主要面向商務和旅游場景需求。就在近日,該款設(shè)備上線了中英離線翻譯功能。準兒翻譯機于2017年5月開始在京東眾籌,市場售價1299元,可支持中英日韓泰五個語種互譯。據(jù)了解,其主要面向境外旅游的需求群體,用戶在配合手機APP的情況下,可對菜單路牌宣傳冊等進行拍照翻譯,基本可解決境外旅游常見的語言困境。
相較無人機和掃地機器人,大家對AI翻譯機可能并沒有那么熟悉。AI翻譯機主要依賴于云端AI技術(shù)的支持,核心技術(shù)包括語音識別、自然語言理解、機器翻譯、語音合成技術(shù)等等,并通過深度學習可不斷增加翻譯語種和提升翻譯的精準度。
近兩年,隨著新一輪人工智能技術(shù)的發(fā)展,特別是在機器翻譯技術(shù)上取得的一系列突破,如谷歌去年發(fā)布的神經(jīng)網(wǎng)絡(luò)機器翻譯系統(tǒng),大大優(yōu)化了AI翻譯在人工譯員的思維模式和語法結(jié)構(gòu)的一致性,同時也加速了AI翻譯機行業(yè)的發(fā)展進程。
據(jù)科大訊飛發(fā)布的2017年中報數(shù)據(jù)顯示,其曉譯翻譯機在報告期內(nèi)就已銷售近6萬臺。科大訊飛人工智能研究院副院長王士進在接受雷鋒網(wǎng)采訪時也表示,『訊飛曉譯在發(fā)布之后一度斷貨』。而準兒翻譯機在京東眾籌期間,也實現(xiàn)了600%的預售成績。這些都力證了該市場的火爆程度。
盡管如此,自AI翻譯機推出以來,其還是和其他AI設(shè)備一樣,遭受了業(yè)界一定程度上的「非議」。除了高昂的價格讓一部分消費者望而卻步之外,一些業(yè)界人士認為,AI翻譯機現(xiàn)階段嚴重依賴網(wǎng)絡(luò),離線之后的設(shè)備的用戶體驗不太優(yōu)秀。同時也有一些人認為,AI翻譯機的很多功能非常雞肋。諸如「翻譯」、「查詢」、「對講機」等功能都能通過手機一一實現(xiàn),那還要翻譯機何用?
在綜合了網(wǎng)絡(luò)評價以及業(yè)內(nèi)人士的觀點之后,雷鋒網(wǎng)也精煉了四個問題,采訪了業(yè)界和學界的幾位大牛。
目前AI翻譯機在翻譯精準度上表現(xiàn)如何?
在王士進看來,『智能機器翻譯機在用戶配合時日??谡Z和旅游簡單應用場景已基本達到使用門檻,為人們出國旅行帶來很大方便。但在方言、復雜句式和環(huán)境噪聲嚴重,以及用戶配合度不夠的情況下,(翻譯)效果還需要繼續(xù)提升?!?/p>
出門問問算法工程師蔣玄羅也認為,『目前(AI翻譯機)精準度還可以』。但根據(jù)他的觀察,其認為翻譯機還存在兩個難點:
1) 對于現(xiàn)場口語的識別還不夠好。由于現(xiàn)場噪音、說話人方言、口語化表達等方式,會對語音識別和機器翻譯模型造成不小的挑戰(zhàn)。
2)對于實體翻譯不好。AI翻譯機更多是針對旅游場景,旅游場景必將面對大量的實體詞匯,而機器訓練領(lǐng)域和實際使用領(lǐng)域多少存在不一致性,所以實體翻譯還是非常具有挑戰(zhàn)性。
江蘇省人民政府外事辦公室副主任黃錫強在接受北京商報采訪時表達的看法和蔣玄羅部分一致,其認為,目前來看,人工智能翻譯的精準度還有待提高,特別是在文學作品的一些婉轉(zhuǎn)表達上,很難翻譯出很多言外之意。
中科院自動化研究所副研究員張家俊則認為,『目前翻譯機的精準度需要針對語言和領(lǐng)域來講,在漢語和英語之間的口語常用對話方面還是非常不錯的。不過,如果說話有口音或噪聲或者說話時間太長都會有問題,其他語言由于數(shù)據(jù)的關(guān)系可能效果不如漢英,需要提高。』
各公司在AI翻譯機上的核心競爭力主要表現(xiàn)在哪一技術(shù)上?
王士進向雷鋒網(wǎng)透露,『AI翻譯機涉及語音識別、語音合成和機器翻譯三個主要組成部分。現(xiàn)階段,語音合成技術(shù)已經(jīng)能滿足語音信息傳達需求,各家最大的技術(shù)競爭還是在于語音識別和機器翻譯,以及能否聯(lián)合優(yōu)化。此外,當前翻譯機應用門檻的突破很大程度上還依賴于深度學習的應用,而深度學習對計算復雜度提出了很高要求,在無網(wǎng)絡(luò)連接情況下語音識別、翻譯、合成怎么實現(xiàn)本地運行,對用戶使用便利與否也都非常關(guān)鍵?!?br/>
不過,在張家俊看來,『目前AI翻譯機在技術(shù)方面的核心競爭力基本沒有壁壘,主要還是數(shù)據(jù)、計算性能的優(yōu)化、語音識別合成翻譯的集成以及在硬件方面的設(shè)計?!?/p>
目前AI翻譯機在行業(yè)應用上,最大的技術(shù)壁壘表現(xiàn)在哪里?
王士進認為,『AI翻譯機目前主要應用在口語和旅游等日常交流場景。在行業(yè)應用上,首先需要積累較大規(guī)模的行業(yè)平行數(shù)據(jù)進行識別和翻譯模型自適應訓練學習;其次,行業(yè)應用一般對翻譯效果質(zhì)量要求更高,例如數(shù)字、人名地名、機構(gòu)名、行業(yè)術(shù)語等關(guān)鍵信息,如翻譯錯誤,會帶來嚴重影響。所以,就目前而言,如何提高這些信息的識別效果和翻譯效果也是需要攻克的難題?!?/p>
蔣玄羅告訴雷鋒網(wǎng),『AI翻譯機的核心競爭力在于ASR(Automatic Speech Recognition:自動語音識別)和機器翻譯的水平。這兩個都是非常高技術(shù)壁壘的東西。當然,從其硬件屬性來說,硬件的自我研發(fā)能力(或者跟外包硬件公司的協(xié)調(diào)能力)也是非常重要的。』
而在張家俊看來,其認為『最大的壁壘還是在數(shù)據(jù)上』。他向雷鋒網(wǎng)表示,目前幾乎所有翻譯技術(shù)都是基于數(shù)據(jù)驅(qū)動的,翻譯機在語言覆蓋度、口音敏感性以及合成的個性化方面都依賴于訓練數(shù)據(jù)。
AI對翻譯的顛覆能力,能取代人工翻譯嗎?
就這一問題,張家俊認為,『人工翻譯如果沒有創(chuàng)造成分,只是簡單的直譯和重復,這部分低級的翻譯會逐漸受到挑戰(zhàn),但大部分人工翻譯是創(chuàng)造性的,無法被AI翻譯取代?!?/p>
蔣玄羅則向雷鋒網(wǎng)表示,這一問題并『沒有非黑即白的答案』?!涸谀承┨囟▓鼍埃热鐚Ψg質(zhì)量要求不高,或者考慮到?jīng)]有足夠的預算請翻譯的情況下,AI翻譯機確實有其用武之地。』
傳神語聯(lián)網(wǎng)創(chuàng)始人何恩培接受北京商報時表示,外界過高地看待了人工智能對翻譯的顛覆能力,取代人工翻譯并不是一件明智的事情。
然而,聯(lián)想到百度CEO李彥宏在今年深圳IT領(lǐng)袖峰會上說的,未來翻譯這個職業(yè)將會被替代掉,接替者就是人工智能。此番業(yè)界和學界的觀點就更具理性。
雷鋒網(wǎng)結(jié)語
事實上,對于這些巨頭來說,AI翻譯機在其整體業(yè)務構(gòu)成中并不占據(jù)一個重要位置。但是,在人工智能的發(fā)展進程中,AI翻譯作為大眾最直接使用AI產(chǎn)品和最快速了解AI技術(shù)的一種形式,其對于各科技公司的重要性顯然不言而喻。
所以,我們也能看到,不論是國內(nèi)的BATJ、網(wǎng)易、搜狗等大型互聯(lián)網(wǎng)企業(yè),還是國外的谷歌、微軟、蘋果、Facebook等科技巨擘,都早在AI翻譯領(lǐng)域大有布局。而據(jù)相關(guān)數(shù)據(jù)顯示,2020年全球翻譯產(chǎn)業(yè)規(guī)模將達530億美元,如果能進一步實現(xiàn)場景化應用,該產(chǎn)業(yè)還將釋放更大的潛在需求。同時,結(jié)合不斷優(yōu)化的AI技術(shù),AI翻譯行業(yè)必將迎來紅利激增期。屆時,吃「蛋糕」的,也就是這些「先行者」了。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。