0
本文作者: 包永剛 | 2019-08-21 17:00 |
雷鋒網(wǎng)消息,Hot chips 31(2019)正在美國(guó)舊金山舉行,峰會(huì)第二天阿里巴巴帶來(lái)了《Ouroboros: A WaveNet Inference Engine for TTS Applications on Embedded Devices》的演講,并發(fā)布了新一代AI語(yǔ)音FPGA芯片技術(shù)Ouroboros。
阿里巴巴稱(chēng),這是業(yè)界首款專(zhuān)用于語(yǔ)音合成算法的 AI FPGA芯片結(jié)構(gòu)設(shè)計(jì),能將語(yǔ)音生成算法的計(jì)算效率提高百倍以上。
根據(jù)阿里達(dá)摩院掃地僧的說(shuō)法,用AI語(yǔ)音合成算法WaveNet生成1秒語(yǔ)音,CPU和GPU需要50秒的計(jì)算時(shí)間,但Ouroboros在FPGA環(huán)境下只要 0.3秒。?Ouroboros的一大突破,是用端上定制硬件加速技術(shù)替代云端服務(wù)器,避免了對(duì)網(wǎng)絡(luò)連接和云端服務(wù)的強(qiáng)依賴(lài)性。
針對(duì) ASIC 實(shí)現(xiàn)的性能仿真預(yù)估表明,Ouroboros 的設(shè)計(jì)可以實(shí)時(shí)運(yùn)行 WaveNet 等業(yè)界先進(jìn)的文字轉(zhuǎn)語(yǔ)音(TTS,Text-to-Speech)算法 ,實(shí)現(xiàn)實(shí)時(shí)語(yǔ)音合成。
另?yè)?jù)了解,Ouroboros 技術(shù)同樣適用于達(dá)摩院于今年 7 月發(fā)布的新一代的語(yǔ)音合成算法KAN-TTS。該算法將商用系統(tǒng)里的合成語(yǔ)音與原始語(yǔ)音的相似度提高到97%以上。
還有消息指出,Ouroboros 技術(shù),同樣適用于達(dá)摩院于今年 7 月發(fā)布的新一代的語(yǔ)音合成算法KAN-TTS。該算法將商用系統(tǒng)里的合成語(yǔ)音與原始語(yǔ)音的相似度提高到97%以上。Ouroboros芯片技術(shù)除了語(yǔ)音合成之外,還將支持AI語(yǔ)音識(shí)別?;贠uroboros研發(fā)完整的語(yǔ)音AI芯片,有望率先在天貓精靈上落地。
雷鋒網(wǎng)注意到,與阿里其它近來(lái)發(fā)布的其他芯片產(chǎn)品一樣,這個(gè)產(chǎn)品的命名也很有特色。Ouroboros中文是銜尾蛇,是一個(gè)古代流傳下來(lái)的符號(hào),形象為一條蛇(或龍)吞食自己的尾巴,結(jié)果形成一個(gè)圓環(huán)(有時(shí)亦會(huì)展示成扭紋形,即“∞”),其名字涵義為“自我吞食者”。這個(gè)符號(hào)一直都有很多不同的象征意義,而當(dāng)中最為人接受的是“無(wú)限大”、“循環(huán)”等。雷鋒網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。