丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
業(yè)界 正文
發(fā)私信給李詩(shī)
發(fā)送

0

百度發(fā)布AI同傳,詳解人工同傳與機(jī)器同傳優(yōu)劣勢(shì)

本文作者: 李詩(shī) 2018-10-24 12:19
導(dǎo)語(yǔ):未來(lái)幾年,人工同傳與AI同傳將共存。

上個(gè)月,由于科大訊飛“AI同傳造假”事件,AI同傳被推上輿論的風(fēng)口浪尖。不過(guò),這件事顯然并沒(méi)有影響到AI同傳技術(shù)的發(fā)展,今天,百度正式公布自家的AI同傳。

在10月19日的百度大腦行業(yè)創(chuàng)新論壇上,雷鋒網(wǎng)編輯在現(xiàn)場(chǎng)就發(fā)現(xiàn)了百度的AI同傳。百度AI技術(shù)生態(tài)部總經(jīng)理喻友平在演講時(shí),左右兩邊的屏幕上實(shí)時(shí)呈現(xiàn)了中英文字幕,從現(xiàn)場(chǎng)效果來(lái)看,語(yǔ)音識(shí)別的準(zhǔn)確率很高,實(shí)時(shí)的機(jī)器翻譯也做得不錯(cuò),順利支持了整個(gè)演講。

人工同傳與機(jī)器同傳的優(yōu)劣勢(shì)

近年來(lái),AI的發(fā)展對(duì)人類(lèi)的職業(yè)造成很大的影響,不少領(lǐng)域的從業(yè)者都面臨著被AI替代的風(fēng)險(xiǎn)。據(jù)雷鋒網(wǎng)了解,AI已經(jīng)替代了一些工廠里機(jī)械化的工作,AI同傳的推出使得原本門(mén)檻較高的同傳領(lǐng)域也感受到了危機(jī)。

科大訊飛“AI同傳造假”事件引發(fā)大量關(guān)于人工同傳與AI同傳的討論,不少言論抨擊AI同傳目前技術(shù)尚未達(dá)到同傳要求,要替代人類(lèi)同傳還言之尚早。

AI同傳目前無(wú)法取代人工同傳,而推出AI同傳的公司也不會(huì)夸口自己要去取代人工同傳。從這場(chǎng)爭(zhēng)論中,我們其實(shí)更清楚地明白人工同傳和AI同傳各自的優(yōu)劣勢(shì)。

同聲傳譯,簡(jiǎn)稱(chēng)“同傳”,是指在不打斷講話者的條件下,將講話內(nèi)容不間斷的實(shí)時(shí)的翻譯給聽(tīng)眾。其最大的特點(diǎn)在于效率高,譯文與原文間隔一般3-4秒,聽(tīng)眾可以及時(shí)地獲取信息,被廣泛地應(yīng)用于國(guó)際會(huì)議、外交談判等重要場(chǎng)合。在百度看來(lái),目前機(jī)器同傳離人類(lèi)專(zhuān)家的水平仍然有較大差距。尤其是在重要會(huì)議如外交、商務(wù)等場(chǎng)合,必須依靠人類(lèi)同傳高質(zhì)量、專(zhuān)業(yè)的翻譯完成。

不過(guò)人工同傳也有一些劣勢(shì):

1)精力體力的挑戰(zhàn):與交替?zhèn)髯g不同的是,同傳需要邊聽(tīng)、邊記、邊翻,同步進(jìn)行,對(duì)譯員的要求極高。由于需要高度集中注意力,人類(lèi)同傳一般兩人一組,且每隔20多分鐘就要換人休息,對(duì)人的精力、體力都是極大的挑戰(zhàn)。

2)譯出率不高:據(jù)統(tǒng)計(jì),同傳譯員的譯出率一般在60%-70%左右。譯出率不高的原因,一般由于未聽(tīng)清或者難翻譯,人類(lèi)譯員通常會(huì)選擇性的忽略某些句子,保證總體上的準(zhǔn)確率和實(shí)時(shí)性。(譯出率:指實(shí)際翻譯的句子個(gè)數(shù)占演講者總句子個(gè)數(shù)的比例,比如演講者說(shuō)了100個(gè)句子,同傳實(shí)際翻譯了60個(gè)句子,則譯出率為60%。)

3)全球同傳譯員稀缺:由于苛刻的要求,全球同傳譯員稀缺,只有幾千人。與巨大的市場(chǎng)需求相比,人才嚴(yán)重短缺。且由于同傳譯員的稀缺性,高級(jí)同傳譯員價(jià)格不菲,一般會(huì)議難以承受。

相比之下機(jī)器同聲傳譯的優(yōu)勢(shì)有:機(jī)器最大的優(yōu)勢(shì)是不會(huì)因?yàn)槠>攵鴮?dǎo)致譯出率下降,能將所有“聽(tīng)到”的句子全部翻譯出來(lái),這使得機(jī)器的“譯出率”可以達(dá)到100%,遠(yuǎn)高于人類(lèi)譯員的60%-70%。同時(shí),在價(jià)格上也占有優(yōu)勢(shì)。

但是,機(jī)器同傳傳譯也有劣勢(shì):受限于語(yǔ)音識(shí)別及機(jī)器翻譯技術(shù),目前機(jī)器同傳的總體翻譯質(zhì)量與人類(lèi)相比還有較大差距。主要面臨以下挑戰(zhàn):

1)語(yǔ)音識(shí)別錯(cuò)誤:由于演講者的口音、語(yǔ)速以及會(huì)場(chǎng)的噪聲影響,語(yǔ)音識(shí)別通常會(huì)存在一定的錯(cuò)誤率,這錯(cuò)誤會(huì)在翻譯中進(jìn)一步放大。例如“我們?cè)诰频甏筇靡?jiàn)面吧”,如果“大堂”被錯(cuò)誤的是別為“大唐”,雖然只是錯(cuò)了一個(gè)字,但是就會(huì)導(dǎo)致翻譯完全錯(cuò)誤。解決這一問(wèn)題,需要從兩方面下功夫,一是高質(zhì)量的語(yǔ)音識(shí)別系統(tǒng),二是具有容錯(cuò)能力、高魯棒性的翻譯模型。

2)質(zhì)量與時(shí)延的平衡:同傳最具魅力的地方在于其低時(shí)延,這對(duì)于人類(lèi)也是一個(gè)極具挑戰(zhàn)性的任務(wù)。高質(zhì)量翻譯和低時(shí)延之間存在天然矛盾。要想獲得高質(zhì)量的翻譯,需要等待演講者更多的信息,時(shí)延就會(huì)變長(zhǎng)。如果追求低時(shí)延,需要在演講者還未說(shuō)完一句話的情況下,就開(kāi)始翻譯,會(huì)損失掉一些信息,造成翻譯質(zhì)量不高。這在中英、中日等詞序差異較大的語(yǔ)種中體現(xiàn)更為明顯。

例如在漢語(yǔ)句子中“布什總統(tǒng)在莫斯科會(huì)見(jiàn)普京”,漢語(yǔ)動(dòng)詞“會(huì)見(jiàn)”出現(xiàn)在句子末尾,而在翻譯為英語(yǔ)時(shí),需要將動(dòng)詞”meet”提前。

人類(lèi)語(yǔ)言中詞序的這種差異一直是人類(lèi)同聲傳譯員和可靠的同聲機(jī)器翻譯系統(tǒng)發(fā)展的主要障礙。目前,幾乎所有的“實(shí)時(shí)”翻譯系統(tǒng)仍然使用傳統(tǒng)的全句(即,非同時(shí)的)翻譯方法,造成至少一個(gè)句子的延遲,使得譯文與說(shuō)話者不同步。

3)小語(yǔ)種覆蓋難題:目前絕大多數(shù)的翻譯硬件,都局限在幾個(gè)大語(yǔ)種范圍內(nèi)。

4)讓實(shí)時(shí)語(yǔ)音翻譯或更大概念上的翻譯成為一種平臺(tái)化的資源:如何讓實(shí)時(shí)語(yǔ)音翻譯,或者更大概念上的翻譯,成為一種平臺(tái)化的資源,這既是各個(gè)公司產(chǎn)品商業(yè)化的考量,也是人工智能普惠化的終極目的。

百度AI同傳核心技術(shù)

AI同傳的核心技術(shù)是語(yǔ)音技術(shù)和機(jī)器翻譯技術(shù),機(jī)器同傳利用語(yǔ)音識(shí)別技術(shù)自動(dòng)識(shí)別演講者的講話內(nèi)容,將語(yǔ)音轉(zhuǎn)化為文字,然后調(diào)用機(jī)器翻譯引擎,將文字翻譯為目標(biāo)語(yǔ)言,顯示在大屏幕或者通過(guò)語(yǔ)音合成播放出來(lái)。

在機(jī)器同傳領(lǐng)域,百度聯(lián)合語(yǔ)音技術(shù)、機(jī)器翻譯技術(shù),從語(yǔ)音識(shí)別、翻譯質(zhì)量、時(shí)延、融合領(lǐng)域知識(shí)等四大方面推出了“一攬子”解決方案。

1) 高質(zhì)量語(yǔ)音識(shí)別系統(tǒng)

百度語(yǔ)音識(shí)別是采用的基于Deep Peak 2的中英文混合建模,包1749個(gè)上下文無(wú)關(guān)中文音節(jié)和1868個(gè)上下文無(wú)關(guān)英文音節(jié);區(qū)別于傳統(tǒng)的都采用上下文相關(guān)建模,基于Deep Peak 2的中英文混合建模采用的是上下文無(wú)關(guān)音素組合的建模單元,該建模單元具有數(shù)量少、泛化性能好、對(duì)噪聲魯棒等特點(diǎn)。具體而言,百度采用如下三個(gè)步驟實(shí)現(xiàn)上下無(wú)關(guān)音素建模單元的構(gòu)建:

1、基于“協(xié)同發(fā)音”的一級(jí)切分,發(fā)音和聽(tīng)覺(jué)領(lǐng)域知識(shí)check,刻畫(huà)“協(xié)同發(fā)音”導(dǎo)致的音素黏連物理特性;

2、基于“統(tǒng)計(jì)共現(xiàn)”的二級(jí)切分,中文N-Gram的分詞方案,同等黏連下等價(jià)于中文分詞;

3、基于數(shù)據(jù)驅(qū)動(dòng)的“中英文音節(jié)”綁定和多發(fā)音標(biāo)注方案,解決“B超”和“必超”、“大地”和“大D”類(lèi)的問(wèn)題。在模型結(jié)構(gòu)方面,我們采用底層CNN+多層LSTM+一層DNN的模型結(jié)構(gòu),并且采用CTC作為優(yōu)化準(zhǔn)則。該方案很好的解決了實(shí)際場(chǎng)景中遇到的中英文混合場(chǎng)景,同時(shí)能夠保持中文性能不降低,在國(guó)際化溝通日益頻繁引入的中文中混合有部分英文短語(yǔ)的場(chǎng)景得到良好解決。

百度發(fā)布AI同傳,詳解人工同傳與機(jī)器同傳優(yōu)劣勢(shì)

據(jù)雷鋒網(wǎng)了解,目前,語(yǔ)音識(shí)別技術(shù)已經(jīng)基本成熟,各家的語(yǔ)音識(shí)別能力相差不大。在雷鋒網(wǎng)看來(lái),AI同傳的技術(shù)難點(diǎn)在于機(jī)器翻譯如何實(shí)現(xiàn)實(shí)時(shí)翻譯,以及當(dāng)語(yǔ)音識(shí)別出現(xiàn)錯(cuò)誤時(shí),機(jī)器翻譯如何能夠容錯(cuò)。

人工智能領(lǐng)域,兩種語(yǔ)言的“即時(shí)互譯”是一項(xiàng)難以攻克的技術(shù)問(wèn)題,其主要原因在于源語(yǔ)言和目標(biāo)語(yǔ)言之間存在較大的詞序和語(yǔ)序差異。百度研發(fā)了具備預(yù)測(cè)能力和可控延遲的即時(shí)機(jī)器翻譯系統(tǒng),可實(shí)現(xiàn)兩種語(yǔ)言之間的高質(zhì)量、低延遲翻譯。這是自然語(yǔ)言處理方面的重大技術(shù)突破,將對(duì)機(jī)器即時(shí)筆譯和口譯的發(fā)展起到極大地推動(dòng)作用。

2) 高魯棒性翻譯模型

百度提出了“語(yǔ)音容錯(cuò)”的對(duì)抗訓(xùn)練翻譯模型,大幅提高了翻譯系統(tǒng)的魯棒性。一般的翻譯模型訓(xùn)練,數(shù)據(jù)質(zhì)量越高越好。百度提出的模型反其道而行之,根據(jù)語(yǔ)音識(shí)別模型常犯的錯(cuò)誤,在訓(xùn)練數(shù)據(jù)中有針對(duì)性的加入噪聲數(shù)據(jù),使得模型在接受到錯(cuò)誤的語(yǔ)音識(shí)別結(jié)果時(shí),也能夠在譯文中糾正過(guò)來(lái)。

與傳統(tǒng)的方法“偽造”噪音數(shù)據(jù)不同,百度模型的創(chuàng)新之處在于針對(duì)語(yǔ)音識(shí)別系統(tǒng)易犯的錯(cuò)誤產(chǎn)生噪聲數(shù)據(jù)。比如,語(yǔ)音識(shí)別系統(tǒng)將“大堂”錯(cuò)誤的識(shí)別為“大唐”,那么這就作為一對(duì)噪聲詞放到訓(xùn)練數(shù)據(jù)中,將源語(yǔ)言句子“我們?cè)诰频甏筇靡?jiàn)面吧”替換為“我們?cè)诰频甏筇埔?jiàn)面吧”,而保持目標(biāo)語(yǔ)言翻譯不變“Let's meet at the lobby of the hotel.”。并將這兩個(gè)句子同時(shí)用于訓(xùn)練。這樣得到的模型對(duì)于語(yǔ)音識(shí)別具有更強(qiáng)的容錯(cuò)能力。 實(shí)驗(yàn)結(jié)果表明,在中英方向上,該模型甚至達(dá)到與正確文本(意味著由語(yǔ)音識(shí)別造成的錯(cuò)誤基本被修正相媲美的效果。

3) 質(zhì)量與時(shí)延的平衡

為了降低時(shí)延,人類(lèi)譯員通常對(duì)演講內(nèi)容進(jìn)行合理預(yù)測(cè)。百度團(tuán)隊(duì)借鑒人類(lèi)同聲傳譯員的靈感來(lái)應(yīng)對(duì)這一挑戰(zhàn)。然而,與人類(lèi)譯員不同,該模型并不預(yù)測(cè)說(shuō)話人講話中的源語(yǔ)言單詞,而是直接預(yù)測(cè)翻譯中的目標(biāo)語(yǔ)言單詞,更重要的是,它把翻譯和預(yù)測(cè)融合在一個(gè)統(tǒng)一的“wait-k words”模型中。在這個(gè)模型中,在等待講話者開(kāi)始后的第K個(gè)字,就開(kāi)始翻譯。模型在每個(gè)步驟使用源語(yǔ)句的可用前綴(以及到目前為止的翻譯)來(lái)決定翻譯中的下一個(gè)單詞。在上述例子中,考慮到漢語(yǔ)前綴“布什總統(tǒng)在莫斯科”和迄今為止的英譯“President Bush”在漢語(yǔ)后面k=2個(gè)詞,系統(tǒng)精確地預(yù)測(cè)下一個(gè)翻譯詞是“會(huì)見(jiàn)”。在演講者還沒(méi)有說(shuō)出漢語(yǔ)動(dòng)詞之前,系統(tǒng)預(yù)測(cè)到布什很可能在莫斯科“遇見(jiàn)”某人(例如普京)。正如人類(lèi)口譯員需要事先熟悉說(shuō)話者的話題和風(fēng)格一樣,該模型也需要從大量的訓(xùn)練數(shù)據(jù)中進(jìn)行訓(xùn)練,這些訓(xùn)練數(shù)據(jù)具有相似的句子結(jié)構(gòu),以便以合理的準(zhǔn)確性進(jìn)行預(yù)測(cè)。

該模型一個(gè)顯著的優(yōu)點(diǎn)是其具有可調(diào)節(jié)性,達(dá)到質(zhì)量和時(shí)延的平衡。用戶可根據(jù)需要指定所需的延遲時(shí)間(比如,延遲一詞或延遲五詞)。如果是法語(yǔ)和西班牙語(yǔ)這種比較接近的語(yǔ)言,延遲可設(shè)置在比較低的水平,因?yàn)榫退闶侵鹪~翻譯的效果也很好。但是,對(duì)于英語(yǔ)和漢語(yǔ)這種差異較大的語(yǔ)言,以及英語(yǔ)和德語(yǔ)這種詞序不同的語(yǔ)言,延遲應(yīng)當(dāng)設(shè)置高一點(diǎn),以獲得更高的翻譯質(zhì)量。

4) 融合領(lǐng)域知識(shí)

人類(lèi)同傳譯員在接到一個(gè)同傳任務(wù)時(shí),都會(huì)做大量的功課,掌握所譯領(lǐng)域的術(shù)語(yǔ)詞匯、表達(dá)方式等。然而留給同傳譯員準(zhǔn)備的時(shí)間卻很有限,一般僅有幾天的時(shí)間,在一些術(shù)語(yǔ)量大、晦澀難懂的領(lǐng)域,對(duì)人類(lèi)譯員是一個(gè)極大的挑戰(zhàn)。

與人類(lèi)同傳準(zhǔn)備過(guò)程類(lèi)似,如果能將所譯領(lǐng)域的資料提前教給自動(dòng)同傳系統(tǒng),那么整體的翻譯質(zhì)量將有非常大的提高。模仿人類(lèi)同傳的準(zhǔn)備過(guò)程,百度提出了快速融合領(lǐng)域知識(shí)策略。

百度發(fā)布AI同傳,詳解人工同傳與機(jī)器同傳優(yōu)劣勢(shì)

該策略原理如下:依托百度海量的互聯(lián)網(wǎng)大數(shù)據(jù),首先訓(xùn)練得到通用的翻譯模型,該模型具有通用的翻譯能力;進(jìn)一步的,如果接到某一個(gè)領(lǐng)域的同傳翻譯任務(wù),該系統(tǒng)收集領(lǐng)域數(shù)據(jù)并在通用模型的基礎(chǔ)上進(jìn)行增強(qiáng)訓(xùn)練,得到領(lǐng)域增強(qiáng)模型,在該領(lǐng)域翻譯質(zhì)量上超過(guò)通用模型;最后,將該領(lǐng)域術(shù)語(yǔ)庫(kù)加到解碼過(guò)程進(jìn)行強(qiáng)制解碼,使得術(shù)語(yǔ)翻譯準(zhǔn)確可靠。在多個(gè)領(lǐng)域的實(shí)驗(yàn)表明,領(lǐng)域優(yōu)化后的系統(tǒng)可以穩(wěn)定的獲得6個(gè)百分點(diǎn)以上的BLEU值提升。(BLEU值是機(jī)器翻譯領(lǐng)域國(guó)際通用評(píng)估指標(biāo),通常1個(gè)百分點(diǎn)的提升即被認(rèn)為是顯著提升)。

該方法模擬人類(lèi)同傳準(zhǔn)備過(guò)程,且優(yōu)勢(shì)明顯, 準(zhǔn)備過(guò)程短,只需要將領(lǐng)域數(shù)據(jù)在通用模型基礎(chǔ)上進(jìn)行訓(xùn)練,數(shù)小時(shí)即可得到優(yōu)化后的模型,術(shù)語(yǔ)詞典生效時(shí)間更是縮小到秒級(jí),大大提升了效率。

百度發(fā)布AI同傳,詳解人工同傳與機(jī)器同傳優(yōu)劣勢(shì)

 AI同傳與人工同傳共存

在百度看來(lái),在未來(lái)多年里,機(jī)器和人類(lèi)即時(shí)翻譯員將同時(shí)并存。人類(lèi)翻譯員的專(zhuān)業(yè)服務(wù)仍將存在大量需求,特別是需要連貫、精準(zhǔn)翻譯的高端場(chǎng)合。即時(shí)翻譯的需求很高,但人類(lèi)翻譯員卻十分緊俏。因此機(jī)器的介入,能讓即時(shí)翻譯服務(wù)更加普及。該技術(shù)可打開(kāi)實(shí)現(xiàn)會(huì)議即時(shí)翻譯、隱藏字幕等多種應(yīng)用的大門(mén),在即將到來(lái)的百度世界大會(huì)上也將現(xiàn)場(chǎng)展示。

目前的技術(shù),機(jī)器同傳離人類(lèi)專(zhuān)家的水平仍然有較大差距。尤其是在重要會(huì)議如外交、商務(wù)等場(chǎng)合,必須依靠人類(lèi)同傳高質(zhì)量、專(zhuān)業(yè)的翻譯完成?,F(xiàn)階段,機(jī)器同傳可以作為人類(lèi)同傳的輔助手段或者有效補(bǔ)充,例如有大量的會(huì)議,聘請(qǐng)專(zhuān)業(yè)同傳費(fèi)用太高或者沒(méi)有相關(guān)領(lǐng)域的同傳譯員,此時(shí)可以借助于機(jī)器同傳完成。會(huì)議舉辦方、演講者、聽(tīng)眾充分認(rèn)識(shí)到機(jī)器同傳的優(yōu)勢(shì)和局限性,容忍機(jī)器犯錯(cuò),就可以達(dá)成共識(shí),促進(jìn)交流。



雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知

分享:
相關(guān)文章

編輯

關(guān)注AI業(yè)界、NLP、VR、AR技術(shù)與產(chǎn)品。采訪報(bào)道、行業(yè)交流請(qǐng)加微信“Hanass”
當(dāng)月熱門(mén)文章
最新文章
請(qǐng)?zhí)顚?xiě)申請(qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說(shuō)