丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
業(yè)界專題 正文
發(fā)私信給張馳
發(fā)送

0

語(yǔ)音識(shí)別領(lǐng)域的GitHub:Wit.ai讓每個(gè)公司擁有自己的“Siri”

本文作者: 張馳 2014-10-16 17:50
導(dǎo)語(yǔ):Wit.ai能將開(kāi)發(fā)者的語(yǔ)音樣本集合起來(lái),幫助開(kāi)發(fā)語(yǔ)音及自然語(yǔ)言識(shí)別系統(tǒng),Lebrun認(rèn)為他們的成果在嘗試和廣度上能與蘋(píng)果和Google一較高下。這一平臺(tái)也反映了一種趨勢(shì),即隨著無(wú)屏幕的可穿戴設(shè)備的興趣,越來(lái)越多的開(kāi)發(fā)者會(huì)使用語(yǔ)音交互技術(shù)。

語(yǔ)音識(shí)別領(lǐng)域的GitHub:Wit.ai讓每個(gè)公司擁有自己的“Siri”

即便對(duì)蘋(píng)果和Google這樣的公司來(lái)說(shuō),語(yǔ)音識(shí)別也很難,兩家公司都收集了大量實(shí)時(shí)語(yǔ)音數(shù)據(jù),幫助開(kāi)發(fā)Siri和Google Now的算法,但效果不盡如人意。對(duì)小公司來(lái)說(shuō),打造語(yǔ)音識(shí)別應(yīng)用就更加困難了,而且它們往往無(wú)法收集到大量的真實(shí)語(yǔ)音數(shù)據(jù)。而這就是Alexandre Lebrun的工作。

他創(chuàng)辦的Wit.ai能將開(kāi)發(fā)者的語(yǔ)音樣本集合起來(lái),幫助開(kāi)發(fā)語(yǔ)音及自然語(yǔ)言識(shí)別系統(tǒng),Lebrun認(rèn)為他們的成果在嘗試和廣度上能與蘋(píng)果和Google一較高下。這一平臺(tái)也反映了一種趨勢(shì),即隨著無(wú)屏幕的可穿戴設(shè)備的興趣,越來(lái)越多的開(kāi)發(fā)者會(huì)使用語(yǔ)音交互技術(shù)。

目前,Wit.ai已經(jīng)吸引了數(shù)千開(kāi)發(fā)者,而本周三它在種子輪中融資了300萬(wàn)美元。

發(fā)現(xiàn)問(wèn)題

事實(shí)上,Wit.ai脫胎于Lebrun之前創(chuàng)立的公司VirtuOz,該公司專為AT&T等公司開(kāi)發(fā)語(yǔ)音識(shí)別系統(tǒng)。但在工作中,Lebrun發(fā)現(xiàn)每開(kāi)發(fā)一個(gè)新系統(tǒng),一切都要重新開(kāi)始。對(duì)每一個(gè)項(xiàng)目,他們都要收集新的語(yǔ)音樣本以訓(xùn)練系統(tǒng)。雖然各項(xiàng)目的語(yǔ)音指令集有重疊的部分,但VirtuOz無(wú)法將一位客戶的樣本用于另一位客戶項(xiàng)目。

結(jié)果是,語(yǔ)音識(shí)別效果并不完美,在體驗(yàn)上也十分糟糕。更重要的是,由于語(yǔ)音識(shí)別系統(tǒng)的設(shè)置費(fèi)用相當(dāng)高,服務(wù)商都不會(huì)解決小公司或開(kāi)發(fā)者的需求。

去年,Lebrun將VirtuOz賣給了開(kāi)發(fā)出Siri的語(yǔ)音識(shí)別公司Nuance,然后創(chuàng)立了Wit.ai。

語(yǔ)音識(shí)別領(lǐng)域的GitHub:Wit.ai讓每個(gè)公司擁有自己的“Siri”

如何運(yùn)作?

一般而言,語(yǔ)音識(shí)別系統(tǒng)的開(kāi)發(fā)會(huì)從“語(yǔ)法”(想要計(jì)算機(jī)識(shí)別的語(yǔ)句的集合)開(kāi)始,然后開(kāi)發(fā)者會(huì)使用盡可能多的語(yǔ)句發(fā)音樣本“訓(xùn)練”計(jì)算機(jī),讓其識(shí)別語(yǔ)法。由于用戶指令各異,同一需求有多種表達(dá)方式,所以語(yǔ)法要盡可能多。

Wit.ai所做的是讓公司共享語(yǔ)法和訓(xùn)練數(shù)據(jù),就像GitHub讓軟件開(kāi)發(fā)者共享代碼一樣。開(kāi)發(fā)者能對(duì)GitHub上的代碼進(jìn)行更改,而Wit.ai上的語(yǔ)法也能用于開(kāi)發(fā)不同的應(yīng)用。

Wit.ai的商業(yè)模式也與GitHub相同,用戶會(huì)免費(fèi)分享數(shù)據(jù)。不過(guò)為了保護(hù)隱私,用于訓(xùn)練系統(tǒng)的音頻記錄不能共享,而不愿共享語(yǔ)法或數(shù)據(jù)的公司可以付費(fèi)使用該公司服務(wù)。

免費(fèi)

與Wit.ai一樣,現(xiàn)在有越來(lái)越多的公司和項(xiàng)目能幫助開(kāi)發(fā)者在各自的應(yīng)用上布署語(yǔ)音識(shí)別系統(tǒng),其中有開(kāi)源項(xiàng)目Julius和CMU Sphinx,也有Google的語(yǔ)音轉(zhuǎn)文本服務(wù)。Lebrun希望通過(guò)免費(fèi)獲取更多的語(yǔ)法和訓(xùn)練數(shù)據(jù),最終根據(jù)這些數(shù)據(jù)開(kāi)發(fā)的系統(tǒng)能與蘋(píng)果及Google匹敵。

Wit.ai的一個(gè)問(wèn)題是,所有音頻都要通過(guò)互聯(lián)網(wǎng)傳輸?shù)焦镜姆?wù)器,這意味著使用時(shí)會(huì)出現(xiàn)延時(shí),甚至隱私問(wèn)題。不過(guò),Lebrun表現(xiàn),現(xiàn)在已經(jīng)有了一個(gè)混合版本,能直接在客戶端工作。

via wired

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

分享:
相關(guān)文章

專業(yè)寫(xiě)瞎

不受意識(shí)控制地報(bào)道那些讓人感動(dòng)的產(chǎn)品技術(shù)和事件......zhchsimons@gmail.com ;微信:nksimons;《腦洞》公眾號(hào):hackmind
當(dāng)月熱門(mén)文章
最新文章
請(qǐng)?zhí)顚?xiě)申請(qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說(shuō)