Alexa又添新技能：用純正的播音員聲音讀新聞

本文作者：張莉

2018-11-25 19:20

導(dǎo)語(yǔ)：亞馬遜正在使用AI開發(fā)新的Alexa講話風(fēng)格。

亞馬遜的Alexa又在繼續(xù)學(xué)習(xí)新技能，將可以被用于進(jìn)行專業(yè)的新聞解讀，幾周后，具有“播音員風(fēng)格”的聲音即會(huì)被內(nèi)置于Alexa中。

9月初，亞馬遜智能家居副總裁Daniel Rausch在IFA大會(huì)上公布了Alexa的各項(xiàng)數(shù)據(jù)：全球范圍內(nèi)，Alexa已經(jīng)擁有50,000個(gè)技能，與20,000種設(shè)備兼容，并與超過3,500個(gè)品牌合作。

據(jù)雷鋒網(wǎng)了解，在2018年年初，Alexa的公布數(shù)據(jù)還只有4，000種設(shè)備，1,200個(gè)品牌。幾個(gè)月時(shí)間，各方數(shù)據(jù)上漲都很快。

Alexa又添新技能：用純正的播音員聲音讀新聞

雷鋒網(wǎng)注：NTTS技術(shù)和傳統(tǒng)的TTS技術(shù)對(duì)比

亞馬遜稱，Alexa新的語(yǔ)音運(yùn)用了公司開發(fā)的 NTTS（neural text-to-speech）技術(shù)，這種新一代語(yǔ)音合成技術(shù)可以更快地使用機(jī)器學(xué)習(xí)來生成富有表現(xiàn)力的聲音。

目前，Alexa使用的是銜接語(yǔ)音合成（concatenative speech synthesis），這種方法已經(jīng)存在了幾十年。該技術(shù)將語(yǔ)音樣本分解成獨(dú)立的聲音音素，然后縫合在一起形成新的單詞和句子。

Alexa又添新技能：用純正的播音員聲音讀新聞

雷鋒網(wǎng)注：銜接語(yǔ)音合成示意圖

固然，銜接語(yǔ)音合成效果不錯(cuò)，但新的融入AI技術(shù)的方法正在將其迅速迭代。去年10月，谷歌為其谷歌助手采用了一種新型語(yǔ)音合成方法，該方法使用了DeepMind AI實(shí)驗(yàn)室最新開發(fā)的機(jī)器學(xué)習(xí)技術(shù)。

亞馬遜稱，未來幾周內(nèi)將把Alexa的聲音切換成使用神經(jīng)語(yǔ)音合成的新語(yǔ)音(完整的新聞播音員的聲音)。

播音員說話的聲音來自于現(xiàn)實(shí)生活中新聞?lì)l道的錄音音頻片段，然后使用了機(jī)器學(xué)習(xí)技術(shù)識(shí)別模仿，使機(jī)器可以像播音員一樣讀新聞。

亞馬遜的AI語(yǔ)音負(fù)責(zé)人Trevor Wood表示，這種方法更容易捕獲人類講話風(fēng)格的細(xì)節(jié)?！斑@其間的細(xì)微差別很難用語(yǔ)言描述，但顯然，使用AI技術(shù)，以數(shù)據(jù)驅(qū)動(dòng)，可以比人類更有效地捕捉和模擬這些細(xì)節(jié)”。

值得注意的是，亞馬遜說，他們只花了幾個(gè)小時(shí)來訓(xùn)練Alexa的“新聞播音員”聲音，這表明未來亞馬遜應(yīng)該還會(huì)為Alexa開發(fā)出一系列的人類聲音風(fēng)格。

到目前為止，亞馬遜已經(jīng)添加了Alexa耳語(yǔ)模式，再加上幾周內(nèi)將更新的“新聞播音員”聲音，我們有望在2019年聽到Alexa模仿更多的不同風(fēng)格的聲音。

via: The Verge

亞馬遜推出Auto SDK，欲將Alexa引入更多車載系統(tǒng)中

Alexa新的數(shù)據(jù)里程碑：50000個(gè)技能、20000種設(shè)備、3500個(gè)品牌

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

0人收藏

相關(guān)文章

張莉

主筆

本人微信：15010591263

發(fā)私信

當(dāng)月熱門文章