丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
業(yè)界 正文
發(fā)私信給王金旺
發(fā)送

0

智能語(yǔ)音技術(shù)如何拯救翻譯機(jī):翻譯機(jī)的技術(shù)抉擇和優(yōu)勝略汰

本文作者: 王金旺 2018-08-04 15:05
導(dǎo)語(yǔ):智能翻譯機(jī)的產(chǎn)品形態(tài)和翻譯能力仍待接受市場(chǎng)反饋和不斷提高。

智能語(yǔ)音技術(shù)如何拯救翻譯機(jī):翻譯機(jī)的技術(shù)抉擇和優(yōu)勝略汰

雷鋒網(wǎng)按:智能語(yǔ)音技術(shù)經(jīng)年之后的不斷完善,尤其是隨著語(yǔ)音識(shí)別準(zhǔn)確率的不斷提高,基于智能語(yǔ)音技術(shù)的智能硬件紛至沓來(lái),除了智能音箱一再受眾人追捧外,智能翻譯機(jī)也悄然逆襲,并入這條快車道。

不同于智能音箱因沒有明確的應(yīng)用場(chǎng)景備受詬病,智能翻譯機(jī)倒是有諸如商務(wù)會(huì)議、出國(guó)旅行等針對(duì)性較強(qiáng)的應(yīng)用場(chǎng)景,由此帶來(lái)的則是對(duì)深度學(xué)習(xí)算法更高的要求。

機(jī)器翻譯系統(tǒng):RNN、CNN、transformer

智能翻譯機(jī)的技術(shù)基礎(chǔ)說(shuō)到底還是智能語(yǔ)音技術(shù),這一點(diǎn)與智能音箱極為相似,其中,神經(jīng)網(wǎng)絡(luò)翻譯系統(tǒng)尤為關(guān)鍵,各大廠商紛紛針對(duì)這一系統(tǒng)進(jìn)行自研,諸如谷歌的GNMT、科大訊飛的INMT、搜狗的SNMT等。

用于機(jī)器翻譯的神經(jīng)網(wǎng)絡(luò)系統(tǒng)最為經(jīng)典的基礎(chǔ)技術(shù)可以歸為兩類——RNN(循環(huán)神經(jīng)網(wǎng)絡(luò))和CNN(卷積神經(jīng)網(wǎng)絡(luò))。主要區(qū)別在于兩類系統(tǒng)的執(zhí)行順序不同,采用RNN神經(jīng)網(wǎng)絡(luò)的機(jī)器翻譯系統(tǒng)是順序執(zhí)行任務(wù),在進(jìn)行翻譯工作時(shí),要對(duì)整個(gè)句子從左到右或從右到左依次執(zhí)行,精準(zhǔn)度較高,但無(wú)法充分應(yīng)用系統(tǒng)硬件GPU的并行運(yùn)算能力;采用CNN神經(jīng)網(wǎng)絡(luò)的機(jī)器翻譯系統(tǒng)則是并行執(zhí)行任務(wù),計(jì)算效率更高。 智能語(yǔ)音技術(shù)如何拯救翻譯機(jī):翻譯機(jī)的技術(shù)抉擇和優(yōu)勝略汰

CNN卷積傳輸示意圖

雖然采用CNN的系統(tǒng)的計(jì)算效率更高,但是在做機(jī)器翻譯時(shí)采用CNN的神經(jīng)網(wǎng)絡(luò)系統(tǒng)一直不如采用RNN的神經(jīng)網(wǎng)絡(luò)系統(tǒng),尤其是在翻譯精準(zhǔn)度上差強(qiáng)人意。因而,長(zhǎng)久以來(lái),諸多做翻譯機(jī)的公司雖然對(duì)RNN和CNN都在跟進(jìn)研究,但是各家產(chǎn)品中使用的翻譯系統(tǒng)仍是基于RNN架構(gòu)的較多。 

2017年5月,Facebook的FAIR團(tuán)隊(duì)提出一種使用全新CNN架構(gòu)的fairseq,官方給出的數(shù)據(jù)是比基于RNN架構(gòu)的機(jī)器翻譯系統(tǒng)的速度高出9倍,同時(shí),準(zhǔn)確性也是當(dāng)時(shí)最好的。這在當(dāng)時(shí)也一度被認(rèn)為是機(jī)器翻譯系統(tǒng)技術(shù)的一個(gè)轉(zhuǎn)折點(diǎn)。據(jù)雷鋒網(wǎng)了解,就在1個(gè)月后,谷歌在發(fā)表的《Attention is all you need》論文中提出了不使用CNN及RNN的transformer架構(gòu),官方表示采用該架構(gòu)的機(jī)器翻譯模型實(shí)際效果超越了當(dāng)時(shí)所有公開的機(jī)器翻譯模型。

 智能語(yǔ)音技術(shù)如何拯救翻譯機(jī):翻譯機(jī)的技術(shù)抉擇和優(yōu)勝略汰

在技術(shù)角逐的同時(shí),也不乏有科技公司的產(chǎn)品跟進(jìn)。例如搜狗于2017年7月上線了基于transformer的機(jī)器翻譯系統(tǒng)模型,在解決了transformer機(jī)器翻譯系統(tǒng)模型原生系統(tǒng)解碼器解碼速度慢的問(wèn)題后,將速度提升了8倍,并可以運(yùn)用到離線翻譯功能。

 智能語(yǔ)音技術(shù)如何拯救翻譯機(jī):翻譯機(jī)的技術(shù)抉擇和優(yōu)勝略汰

另外,技術(shù)之間各有優(yōu)勢(shì)也是必然的,尤其是在還沒有一個(gè)成熟的技術(shù)時(shí),做產(chǎn)品和技術(shù)研發(fā)適度整合多種技術(shù)也是必由之路。例如搜狗在跟進(jìn)transformer機(jī)器翻譯模型的同時(shí),仍然在用CNN做語(yǔ)音識(shí)別上的訓(xùn)練,搜狗語(yǔ)音交互技術(shù)中心研發(fā)總監(jiān)陳偉在參加對(duì)外活動(dòng)時(shí)曾提到:在做語(yǔ)音識(shí)別時(shí),搜狗用50層CNN結(jié)構(gòu)得到語(yǔ)音識(shí)別模型,基于此模型,訓(xùn)練離線語(yǔ)音識(shí)別模型。

產(chǎn)品形態(tài):手機(jī)、耳機(jī)和翻譯機(jī)

翻譯機(jī)的產(chǎn)品形態(tài)主要有三大類;翻譯機(jī)、翻譯手機(jī)和翻譯耳機(jī)。

智能語(yǔ)音技術(shù)如何拯救翻譯機(jī):翻譯機(jī)的技術(shù)抉擇和優(yōu)勝略汰

現(xiàn)在主流市場(chǎng)還是將翻譯機(jī)做成智能硬件單品,例如科大訊飛的曉譯、有道翻譯蛋等,但是市面上較為高端的翻譯機(jī)價(jià)格都在千元左右,科大訊飛的曉譯2.0價(jià)格標(biāo)定為2999元,這其實(shí)已接近市場(chǎng)上中高端手機(jī)的價(jià)格,因而,還是吸引了以智能翻譯機(jī)為主導(dǎo)功能的智能手機(jī)的入局。2018年6月,國(guó)內(nèi)糖果手機(jī)推出糖果S20,支持語(yǔ)音翻譯、拍照翻譯、104種語(yǔ)言、離線翻譯,提供24小時(shí)在線人工翻譯服務(wù),將翻譯機(jī)功能再度整合到手機(jī)中。

耳機(jī)類翻譯機(jī)最初在國(guó)外較為流行,如谷歌的Pixel Buds翻譯耳機(jī)、Waverley Lab的Pilot翻譯耳機(jī),通過(guò)藍(lán)牙與手機(jī)中的翻譯APP相連,硬件思路類似藍(lán)牙耳機(jī),這類產(chǎn)品更多地考慮到手機(jī)翻譯機(jī)帶來(lái)的便捷、禮儀、衛(wèi)生的問(wèn)題,解決了場(chǎng)景應(yīng)用中的一些尷尬局面。

具體各類翻譯機(jī)產(chǎn)品,雷鋒網(wǎng)整理如下表:

智能語(yǔ)音技術(shù)如何拯救翻譯機(jī):翻譯機(jī)的技術(shù)抉擇和優(yōu)勝略汰

智能翻譯機(jī)產(chǎn)品五花八門,也很難說(shuō)今后是否還會(huì)出現(xiàn)其他應(yīng)用形態(tài)。不過(guò)就應(yīng)用來(lái)看,由于要實(shí)現(xiàn)語(yǔ)音識(shí)別、語(yǔ)音合成、機(jī)器翻譯等對(duì)系統(tǒng)功耗和性能要求較高的功能,同時(shí)還要考慮語(yǔ)種、口音、噪音干擾等復(fù)雜的應(yīng)用場(chǎng)景,現(xiàn)在的智能翻譯機(jī)還沒有發(fā)展到能夠作為一項(xiàng)功能整合到手機(jī)或其他成熟的硬件形式中。正如科大訊飛創(chuàng)始人胡郁談及訊飛翻譯機(jī)與谷歌Pixel(手機(jī))相機(jī)圖片翻譯的不同時(shí)的解釋:谷歌更多從技術(shù)落地來(lái)考慮,這需要更強(qiáng)的處理器支持,并且也會(huì)增加手機(jī)的耗電量。

翻譯機(jī)的精準(zhǔn)度

精準(zhǔn)度是翻譯機(jī)的靈魂,也是對(duì)一個(gè)翻譯機(jī)的好壞最根本的考量。此前,就各大廠商自報(bào)成績(jī)單時(shí),科大訊飛的曉譯2.0發(fā)布時(shí),官方給出的準(zhǔn)確率是98%,搜狗官方公布最新的語(yǔ)音識(shí)別準(zhǔn)確率是97%。

各大廠商官方公布的準(zhǔn)確率確實(shí)很高,不過(guò)在實(shí)際應(yīng)用中還需要考慮諸如口音、口語(yǔ)及環(huán)境噪聲的問(wèn)題。剛好小編手上有曉譯2.0可供做翻譯測(cè)試,兩組測(cè)試結(jié)果如下:

英文原文:So really,both Linux and Git kind of arose almost as an unintended consequence of your desire not to have to work with many people.

識(shí)別/翻譯結(jié)果:So really,both limits and get kind of rose almost as an unintended consequence of your desire not to have to work with many people.(因此,實(shí)際上兩者的限制和得到種玫瑰幾乎作為一個(gè)意外的后果,你的愿望不需要與太多的人一起工作。)

智能語(yǔ)音技術(shù)如何拯救翻譯機(jī):翻譯機(jī)的技術(shù)抉擇和優(yōu)勝略汰

中文原文:gitHub是一個(gè)面向開源及私有軟件項(xiàng)目的托管平臺(tái),因?yàn)橹恢С謌it 作為唯一的版本庫(kù)格式進(jìn)行托管,故名gitHub。

識(shí)別/翻譯結(jié)果:給她是一個(gè)面向開源及自由軟件項(xiàng)目的托管平臺(tái),因?yàn)橹?span style="color: #FF0000;">是給他作為唯一的版本庫(kù)格式進(jìn)行托管,故名給他。(She is a hosting platform for open source and free software projects,because only for him as the only version of the library format for hosting,so named him.)

 智能語(yǔ)音技術(shù)如何拯救翻譯機(jī):翻譯機(jī)的技術(shù)抉擇和優(yōu)勝略汰

從結(jié)果來(lái)看,識(shí)別率還是很好的,只是在一些專業(yè)詞匯上還無(wú)法準(zhǔn)確識(shí)別;而翻譯結(jié)果準(zhǔn)確率夠高,口語(yǔ)化略顯不足。由此看來(lái),官方給出的語(yǔ)音識(shí)別準(zhǔn)確率不能完全用來(lái)衡量翻譯機(jī)產(chǎn)品的翻譯能力。

誰(shuí)是攪局者

正是近年來(lái)出國(guó)旅行備受推崇,外加智能語(yǔ)音技術(shù)得到一定突破,使得翻譯機(jī)的研發(fā)被提上日程。但是處于風(fēng)口的翻譯機(jī)在備受追捧的同時(shí),自然也少不了攪局者。

從產(chǎn)品形態(tài)來(lái)看,有耳機(jī),也有手機(jī),有基于手機(jī)APP的應(yīng)用,也有智能硬件單品。其中以智能硬件單品居多,其他產(chǎn)品形態(tài)更多則是一種嘗試,如無(wú)意外,整個(gè)產(chǎn)業(yè)現(xiàn)在的重心還是要回到智能硬件單品這一形式潛心做功能升級(jí)和技術(shù)研發(fā)。

從翻譯機(jī)的價(jià)格來(lái)看,跨度在百元到幾千元之間,一些沒有成型技術(shù)的團(tuán)隊(duì)加入智能語(yǔ)音系統(tǒng)的翻譯機(jī)的價(jià)格甚至尚不及一支功能簡(jiǎn)單的錄音筆,可想其產(chǎn)品架構(gòu)中軟硬件系統(tǒng)的性能會(huì)是怎樣的情形,同時(shí)也使得其很難再擁有足夠的資本繼續(xù)做技術(shù)研發(fā)和產(chǎn)品迭代。

智能語(yǔ)音技術(shù)如何拯救翻譯機(jī):翻譯機(jī)的技術(shù)抉擇和優(yōu)勝略汰

雷鋒網(wǎng)小結(jié)

大家看到智能翻譯機(jī)的時(shí)候經(jīng)常會(huì)認(rèn)為專業(yè)翻譯人員很快會(huì)面臨失業(yè)問(wèn)題,其實(shí)如此說(shuō)來(lái)為時(shí)尚早?,F(xiàn)在的翻譯機(jī)自身還存在諸多問(wèn)題有待解決,雖然解決出國(guó)旅行時(shí)的點(diǎn)餐、問(wèn)路已不是問(wèn)題,但是面對(duì)諸如商務(wù)會(huì)晤、技術(shù)論壇等更為專業(yè)的應(yīng)用場(chǎng)景,或是娛樂(lè)場(chǎng)所、賽事解說(shuō)等更為復(fù)雜的周圍環(huán)境及人文環(huán)境,智能翻譯機(jī)的實(shí)際應(yīng)用還是略顯吃力。

不過(guò)就技術(shù)角度來(lái)講,雖然諸多技術(shù)和產(chǎn)品紛紛涌入,而其實(shí),這也才剛剛開始。

產(chǎn)品是技術(shù)最好的檢驗(yàn)。語(yǔ)音技術(shù)正在經(jīng)歷著這樣的檢驗(yàn),經(jīng)過(guò)了智能音響的檢驗(yàn),這一輪是智能翻譯機(jī)的檢驗(yàn)。

智能翻譯機(jī)居當(dāng)下風(fēng)口,技術(shù)雛形雖然已有,但是機(jī)器翻譯系統(tǒng)的翻譯速度和翻譯準(zhǔn)確度還需要在整個(gè)AI大環(huán)境下繼續(xù)打磨,在翻譯匹配度、翻譯口語(yǔ)化能力、環(huán)境辨別能力,甚至具體產(chǎn)品形態(tài)上還需要繼續(xù)經(jīng)受市場(chǎng)用戶的各類反饋和研發(fā)團(tuán)隊(duì)的不斷改進(jìn)。

至于當(dāng)下市場(chǎng)中魚龍混雜的入局者,市場(chǎng)自然會(huì)進(jìn)行優(yōu)勝劣汰,剩下的終將會(huì)是最適合你的產(chǎn)品。

相關(guān)文章:

人工智能翻譯機(jī)內(nèi)斗!準(zhǔn)兒 VS 曉譯

智能語(yǔ)音助手+全息形象,會(huì)是下一個(gè)趨勢(shì)嗎

Facebook開源 PyTorch版 fairseq,準(zhǔn)確性最高、速度比循環(huán)神經(jīng)網(wǎng)絡(luò)快9倍

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

分享:
相關(guān)文章

主編

關(guān)注AIoT、機(jī)器人、智能硬件,新聞爆料、行業(yè)交流(注明公司、職位和名字)微信:18210039208
當(dāng)月熱門文章
最新文章
請(qǐng)?zhí)顚懮暾?qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說(shuō)