0
本文作者: Penny | 2014-12-19 15:04 |
近日,百度對外宣布,他們開發(fā)出了一種深度語音識別系統(tǒng)“百度Deep Speech”。
該系統(tǒng)是由前谷歌研究員、斯坦福大學(xué)教授、人工智能專家吳恩達(dá)(Andrew Ng)及10名百度研究團(tuán)隊(duì)共同開發(fā)出來的。
據(jù)悉,百度Deep Speech能夠以一種非常原始形式來模仿人大腦新皮層中的神經(jīng)活動(dòng),因此深度學(xué)習(xí)系統(tǒng)就能夠識別出數(shù)字形式的聲音、圖片等數(shù)據(jù)。其在汽車內(nèi)、人群中等噪音環(huán)境下的表現(xiàn)尤其突出,出錯(cuò)率要比谷歌Speech API、Wit.AI、微軟Bing Speech、蘋果Dictation低10%多。
吳恩達(dá)并未透露百度何時(shí)會將這項(xiàng)語音識別技術(shù)整合到百度搜索和其他服務(wù)中。不過,外界猜測,百度可能會在明年某個(gè)時(shí)候?qū)eep Speech技術(shù)整合到百度Cool Box小服務(wù)中。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。