阿里國(guó)際發(fā)布首個(gè)大規(guī)模商用翻譯大模型，效果超Google、DeepL等

本文作者： nebula

2024-10-16 14:05

導(dǎo)語(yǔ)：阿里國(guó)際翻譯大模型達(dá)成大規(guī)模商用，效果和成本全面領(lǐng)先業(yè)界。

在AI調(diào)用量最高的場(chǎng)景之一——機(jī)器翻譯，阿里國(guó)際的AI團(tuán)隊(duì)有了新進(jìn)展。

10月16日，阿里國(guó)際副總裁、AI負(fù)責(zé)人張凱夫在接受彭博社專訪時(shí)表示，阿里國(guó)際最新研發(fā)的Marco翻譯大模型，支持中、英、日、韓、西、法等15種全球主流語(yǔ)種。目前已在阿里國(guó)際AI官網(wǎng)Aidge上發(fā)布，面向全球用戶開(kāi)放使用。

基于目前廣泛使用的開(kāi)源評(píng)測(cè)數(shù)據(jù)集Flores，Marco翻譯大模型在BLEU自動(dòng)評(píng)測(cè)指標(biāo)上，領(lǐng)先于市面上的標(biāo)桿翻譯產(chǎn)品，如Google翻譯、DeepL、GPT-4等。這意味著，Marco的AI翻譯能力總體已經(jīng)超越全球競(jìng)爭(zhēng)對(duì)手，成為行業(yè)第一。

阿里國(guó)際發(fā)布首個(gè)大規(guī)模商用翻譯大模型，效果超Google、DeepL等

圖：根據(jù)公開(kāi)榜單數(shù)據(jù)的測(cè)評(píng)結(jié)果

Marco的主要優(yōu)勢(shì)就是由大語(yǔ)言模型驅(qū)動(dòng)，能夠基于語(yǔ)境進(jìn)行精準(zhǔn)翻譯，而不是根據(jù)字面意思，造成哭笑不得的歧義?！澳愕膶氊愓诼飞稀保粫?huì)再被翻譯成“Your baby is on the way”。以“尊嘟喜歡”這一網(wǎng)絡(luò)用語(yǔ)為例，一些AI翻譯產(chǎn)品會(huì)將這句話翻譯為“Zundu likes it”,而在Marco大模型中，這句話非常地道地翻譯為“I really like it”。

如何實(shí)現(xiàn)這一效果呢？據(jù)介紹，Marco翻譯大模型通過(guò)面向多語(yǔ)言的數(shù)據(jù)篩選技術(shù)，如多語(yǔ)種混合語(yǔ)料甄別、多維度數(shù)據(jù)質(zhì)量評(píng)估，獲得高質(zhì)量、大規(guī)模的多語(yǔ)言數(shù)據(jù)，再結(jié)合多語(yǔ)言的混合專家、參數(shù)擴(kuò)張方法，從而保證主導(dǎo)語(yǔ)言（如中、英）性能不下降的情況下，提升其他語(yǔ)種的質(zhì)量。同時(shí)，通過(guò)模型量化和加速、多模型規(guī)約等優(yōu)化策略，大幅降低大模型的服務(wù)成本，甚至與傳統(tǒng)小模型相比，成本也具有優(yōu)勢(shì)。

目前，Marco翻譯大模型已實(shí)現(xiàn)大規(guī)模商用。得益于阿里國(guó)際在跨境電商領(lǐng)域多年的積累，Marco在跨境電商領(lǐng)域的表現(xiàn)尤為亮眼。對(duì)于個(gè)人用戶來(lái)說(shuō)，Marco能夠根據(jù)上下文提供高質(zhì)量的翻譯和良好的可讀性，甚至支持不同的翻譯風(fēng)格，滿足多樣化的翻譯需求。

根據(jù)媒體公開(kāi)報(bào)道，阿里國(guó)際在去年成立了AI團(tuán)隊(duì)，過(guò)去一年在40多個(gè)場(chǎng)景里測(cè)試了AI能力，幫助50萬(wàn)中小商家、對(duì)1億款商品進(jìn)行優(yōu)化。商家的AI需求也不斷增長(zhǎng)，近半年的數(shù)據(jù)顯示，平均每?jī)蓚€(gè)月，商家對(duì)于AI的調(diào)用量就翻1倍，AI的調(diào)用量已經(jīng)突破日均1億次。

雷峰網(wǎng)(公眾號(hào)：雷峰網(wǎng))

雷峰網(wǎng)版權(quán)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

0人收藏

相關(guān)文章

nebula

運(yùn)營(yíng)

發(fā)私信

當(dāng)月熱門文章

阿里國(guó)際發(fā)布首個(gè)大規(guī)模商用翻譯大模型，效果超Google、DeepL等

阿里國(guó)際發(fā)布首個(gè)大規(guī)模商用翻譯大模型，效果超Google、DeepL等