丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
人工智能 正文
發(fā)私信給任然
發(fā)送

0

揭秘搜狗同傳黑科技:它憑什么成為國(guó)際會(huì)議標(biāo)配?

本文作者: 任然 2018-05-30 18:14
導(dǎo)語(yǔ):國(guó)際會(huì)議“御用”同傳是怎樣煉成的

5月29日~30日,2018第六屆TopDigital創(chuàng)新發(fā)布盛典暨創(chuàng)新獎(jiǎng)?lì)C獎(jiǎng)典禮在上海舉行。TopDigital追蹤數(shù)字技術(shù)浪潮下的創(chuàng)新發(fā)展,覆蓋TMT(Technology/Media/Telecom)、ABC(AI/Big Data/Cloud Computing)、大文創(chuàng)、泛金融等行業(yè)領(lǐng)域,吸引了來(lái)自國(guó)內(nèi)外數(shù)百家企業(yè)和上千名專(zhuān)業(yè)人士參與。

作為國(guó)際大會(huì),如何讓不同語(yǔ)言文化的參會(huì)者實(shí)現(xiàn)無(wú)障礙溝通是大會(huì)的基本。雷鋒網(wǎng)了解到,作為此次峰會(huì)的合作伙伴,搜狗將全程提供人工智能同傳展示。

揭秘搜狗同傳黑科技:它憑什么成為國(guó)際會(huì)議標(biāo)配?

國(guó)際會(huì)議“御用”的搜狗同傳

在國(guó)內(nèi)外專(zhuān)家和企業(yè)的高端對(duì)話中,搜狗的人工智能同傳提供了強(qiáng)力的支持,讓與會(huì)者無(wú)需擔(dān)心語(yǔ)言問(wèn)題。會(huì)場(chǎng)兩側(cè)屏幕上以中英雙語(yǔ)實(shí)時(shí)展示嘉賓發(fā)言內(nèi)容,翻譯速度幾乎與嘉賓發(fā)言速度一致。雙語(yǔ)字幕不僅能讓與會(huì)者高效直觀的獲取演講內(nèi)容,實(shí)時(shí)文字記錄也能為會(huì)后的資料整理節(jié)省大量的時(shí)間。

自2016年誕生以來(lái),搜狗同傳已經(jīng)支持了數(shù)百場(chǎng)國(guó)內(nèi)外會(huì)議,多次應(yīng)用于GMIC、中國(guó)車(chē)聯(lián)網(wǎng)博覽會(huì)、世界電信和信息大會(huì)、全球人工智能技術(shù)大會(huì)等前沿國(guó)際科技大會(huì),成為國(guó)際頂端會(huì)議的標(biāo)配。

揭秘搜狗同傳黑科技:它憑什么成為國(guó)際會(huì)議標(biāo)配?

2017年,由中國(guó)計(jì)算機(jī)學(xué)會(huì)(CCF)主辦,雷鋒網(wǎng)、香港中文大學(xué)(深圳)承辦的全球人工智能與機(jī)器人峰會(huì)(CCF-GAIR)上,搜狗同傳也作為合作伙伴為大會(huì)提供同傳支持。

據(jù)了解,搜狗同傳不僅能流暢地記錄、翻譯內(nèi)容,還能很好地識(shí)別詞語(yǔ)和句子的停頓。這種復(fù)雜的同傳工作難度極大,需要覆蓋語(yǔ)音斷句、語(yǔ)音識(shí)別、文本斷句、機(jī)器翻譯等多個(gè)技術(shù)維度,才能構(gòu)成穩(wěn)定可靠的臨場(chǎng)表現(xiàn)。

揭秘搜狗同傳黑科技:它憑什么成為國(guó)際會(huì)議標(biāo)配?

不同于傳統(tǒng)的機(jī)器翻譯,實(shí)時(shí)翻譯技術(shù)包括語(yǔ)音識(shí)別、機(jī)器翻譯兩個(gè)大方向,還有一些細(xì)節(jié)優(yōu)化與系統(tǒng)調(diào)優(yōu)。搜狗同傳將語(yǔ)音識(shí)別與機(jī)器翻譯技術(shù)結(jié)合在了一起,希望提供從聽(tīng)到說(shuō)、能理解會(huì)思考的能力。

揭秘搜狗同傳四大黑科技

搜狗的翻譯團(tuán)隊(duì)在自然語(yǔ)言處理和深度學(xué)習(xí)方面有非常深厚的積累,與谷歌GNMT的八層結(jié)構(gòu)相比,搜狗同傳的神經(jīng)網(wǎng)絡(luò)精簡(jiǎn)為五層,在效率上可獲得不小的提高。

揭秘搜狗同傳黑科技:它憑什么成為國(guó)際會(huì)議標(biāo)配?

在搜狗同傳的技術(shù)框架中,語(yǔ)音斷句算法通過(guò)能量檢測(cè)和基于深度學(xué)習(xí)模型的方式,對(duì)語(yǔ)音信號(hào)進(jìn)行語(yǔ)音和靜音的判斷,這樣可以跳過(guò)對(duì)靜音片段的處理以提升解碼效率,同時(shí)語(yǔ)音片斷可以分割成多句并行識(shí)別,大大提高語(yǔ)音識(shí)別的效率。

語(yǔ)音識(shí)別部分,搜狗同傳使用了CLDNN+CTC結(jié)合的聲學(xué)模型和RNNLM語(yǔ)言模型,把經(jīng)過(guò)語(yǔ)音斷句后的片段,通過(guò)聲學(xué)模型和語(yǔ)言模型轉(zhuǎn)化成文本,保證識(shí)別輸出結(jié)果更加通順、流暢,符合正常的發(fā)言習(xí)慣。

揭秘搜狗同傳黑科技:它憑什么成為國(guó)際會(huì)議標(biāo)配?

而在語(yǔ)音識(shí)別和翻譯之間,最關(guān)鍵的橋梁則是文本斷句,這個(gè)模塊是搜狗的語(yǔ)音同傳技術(shù)可以應(yīng)用的重要原因。文本斷句通過(guò)內(nèi)容平滑技術(shù)去掉無(wú)意義詞語(yǔ),使句子變得通順,然后通過(guò)規(guī)則和模型兩種方法進(jìn)行語(yǔ)句劃分并加標(biāo)點(diǎn)。

搜狗用到了雙向 GRU 技術(shù)構(gòu)建編碼端的結(jié)構(gòu)。通過(guò) attention 機(jī)制在源端和目標(biāo)端文本間進(jìn)行對(duì)齊并生成當(dāng)前時(shí)刻的句子級(jí)向量表示,并送至解碼端,解碼端逐詞解碼輸出翻譯結(jié)果。

揭秘搜狗同傳黑科技:它憑什么成為國(guó)際會(huì)議標(biāo)配?

搜狗同傳將語(yǔ)音識(shí)別與機(jī)器翻譯技術(shù)結(jié)合在了一起,采用端到端的神經(jīng)網(wǎng)絡(luò)翻譯技術(shù),通過(guò)編碼端獲取源端句子的分布式表示,利用注意力模型聚焦源端,使用循環(huán)神經(jīng)網(wǎng)絡(luò)生成翻譯結(jié)果,翻譯的結(jié)果相比傳統(tǒng)機(jī)器翻譯大約能高出30%~40%。

搜狗同傳還創(chuàng)新性地將許多自然語(yǔ)言處理門(mén)類(lèi)中非翻譯任務(wù)的方法用于機(jī)器翻譯中,通過(guò)向神經(jīng)網(wǎng)絡(luò)添加額外的機(jī)器學(xué)習(xí)模塊來(lái)提升質(zhì)量,點(diǎn)對(duì)點(diǎn)解決神經(jīng)機(jī)器翻譯中的具體問(wèn)題。

揭秘搜狗同傳黑科技:它憑什么成為國(guó)際會(huì)議標(biāo)配?

例如,搜狗同傳使用了如下四類(lèi)技巧來(lái)提升模型質(zhì)量:

  1. 用命名實(shí)體標(biāo)注模型(NER)和神經(jīng)網(wǎng)絡(luò)實(shí)體翻譯器對(duì)人名的罕見(jiàn)詞進(jìn)行翻譯;

  2. 多模型集成(ensemble)來(lái)給出最優(yōu)翻譯結(jié)果;

  3. 重打分/重排序(rescore or rerank)機(jī)制選出最優(yōu)翻譯;

  4. 采用了Geoffrey Hinton團(tuán)隊(duì)提出的網(wǎng)絡(luò)層正則化(layer normalization)技術(shù),提高模型訓(xùn)練效率,同時(shí)改善模型的翻譯質(zhì)量。

揭秘搜狗同傳黑科技:它憑什么成為國(guó)際會(huì)議標(biāo)配?

除此之外,機(jī)器翻譯的最終效果不僅和算法相關(guān),還和數(shù)據(jù)密不可分。對(duì)同傳來(lái)說(shuō),人們希望以更加自然、接近人和人交互的方式來(lái)進(jìn)行,同時(shí)也希望翻譯引擎能更多的理解人的語(yǔ)言需求,在合成時(shí)的語(yǔ)言表達(dá)更加自然。

搜狗作為一家搜索公司積累的龐大語(yǔ)料庫(kù),對(duì)機(jī)器翻譯效果的提升有很大幫助。根據(jù)搜狗方面給出的預(yù)測(cè)數(shù)據(jù),目前搜狗語(yǔ)音識(shí)別的準(zhǔn)確率為97%,支持最快每秒400字的高速聽(tīng)寫(xiě),語(yǔ)音輸入日頻次高達(dá)3.4億次,搜狗語(yǔ)音翻譯的準(zhǔn)確率則可以達(dá)到90%。

AI將助力同傳服務(wù)普及

實(shí)現(xiàn)全人類(lèi)之間的順暢交流一直是人類(lèi)的夢(mèng)想,如今人工智能讓人們看到了實(shí)現(xiàn)這一夢(mèng)想的希望,這也是AI翻譯讓大眾持續(xù)興奮、讓技術(shù)公司和研究人員保持動(dòng)力的最大原因。

回想一年之前,人們還自信地認(rèn)為AI取代傳統(tǒng)人工同聲傳譯“為時(shí)尚早”,但在短短一年時(shí)間里,搜狗同傳就已經(jīng)支持了數(shù)百場(chǎng)國(guó)內(nèi)外會(huì)議,多次應(yīng)用于前沿國(guó)際科技大會(huì),成為國(guó)際頂端會(huì)議的標(biāo)配,充分展示了國(guó)內(nèi)企業(yè)在人工智能技術(shù)領(lǐng)域的發(fā)展和實(shí)力。

揭秘搜狗同傳黑科技:它憑什么成為國(guó)際會(huì)議標(biāo)配?

搜狗同傳是AI技術(shù)落地實(shí)際應(yīng)用的優(yōu)秀案例,在本次大會(huì)的亮相更是反映出AI技術(shù)在應(yīng)對(duì)全球跨語(yǔ)言交流、提高人類(lèi)工作效率方面所具有的巨大潛力,為與會(huì)的各界人士對(duì)未來(lái)人工智能技術(shù)的普遍應(yīng)用帶來(lái)信心和期待。

相信在未來(lái),搜狗同傳會(huì)在更多領(lǐng)域大展身手,帶動(dòng)翻譯行業(yè)產(chǎn)生新的質(zhì)變。


現(xiàn)在關(guān)注“雷鋒網(wǎng)”微信公眾號(hào)(leiphone-sz),回復(fù)關(guān)鍵詞【2018】,隨機(jī)抽送價(jià)值 3999 元的參會(huì)門(mén)票 3 張

相關(guān)文章:

揭秘:搜狗語(yǔ)音實(shí)時(shí)翻譯是怎么煉成的

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

揭秘搜狗同傳黑科技:它憑什么成為國(guó)際會(huì)議標(biāo)配?

分享:
相關(guān)文章

編輯

觀點(diǎn)離經(jīng)叛道的骨灰級(jí)硬件愛(ài)好者
當(dāng)月熱門(mén)文章
最新文章
請(qǐng)?zhí)顚?xiě)申請(qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說(shuō)