丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
業(yè)界專題 正文
發(fā)私信給張馳
發(fā)送

0

語音識別領域的GitHub:Wit.ai讓每個公司擁有自己的“Siri”

本文作者: 張馳 2014-10-16 17:50
導語:Wit.ai能將開發(fā)者的語音樣本集合起來,幫助開發(fā)語音及自然語言識別系統,Lebrun認為他們的成果在嘗試和廣度上能與蘋果和Google一較高下。這一平臺也反映了一種趨勢,即隨著無屏幕的可穿戴設備的興趣,越來越多的開發(fā)者會使用語音交互技術。

語音識別領域的GitHub:Wit.ai讓每個公司擁有自己的“Siri”

即便對蘋果和Google這樣的公司來說,語音識別也很難,兩家公司都收集了大量實時語音數據,幫助開發(fā)Siri和Google Now的算法,但效果不盡如人意。對小公司來說,打造語音識別應用就更加困難了,而且它們往往無法收集到大量的真實語音數據。而這就是Alexandre Lebrun的工作。

他創(chuàng)辦的Wit.ai能將開發(fā)者的語音樣本集合起來,幫助開發(fā)語音及自然語言識別系統,Lebrun認為他們的成果在嘗試和廣度上能與蘋果和Google一較高下。這一平臺也反映了一種趨勢,即隨著無屏幕的可穿戴設備的興趣,越來越多的開發(fā)者會使用語音交互技術。

目前,Wit.ai已經吸引了數千開發(fā)者,而本周三它在種子輪中融資了300萬美元。

發(fā)現問題

事實上,Wit.ai脫胎于Lebrun之前創(chuàng)立的公司VirtuOz,該公司專為AT&T等公司開發(fā)語音識別系統。但在工作中,Lebrun發(fā)現每開發(fā)一個新系統,一切都要重新開始。對每一個項目,他們都要收集新的語音樣本以訓練系統。雖然各項目的語音指令集有重疊的部分,但VirtuOz無法將一位客戶的樣本用于另一位客戶項目。

結果是,語音識別效果并不完美,在體驗上也十分糟糕。更重要的是,由于語音識別系統的設置費用相當高,服務商都不會解決小公司或開發(fā)者的需求。

去年,Lebrun將VirtuOz賣給了開發(fā)出Siri的語音識別公司Nuance,然后創(chuàng)立了Wit.ai。

語音識別領域的GitHub:Wit.ai讓每個公司擁有自己的“Siri”

如何運作?

一般而言,語音識別系統的開發(fā)會從“語法”(想要計算機識別的語句的集合)開始,然后開發(fā)者會使用盡可能多的語句發(fā)音樣本“訓練”計算機,讓其識別語法。由于用戶指令各異,同一需求有多種表達方式,所以語法要盡可能多。

Wit.ai所做的是讓公司共享語法和訓練數據,就像GitHub讓軟件開發(fā)者共享代碼一樣。開發(fā)者能對GitHub上的代碼進行更改,而Wit.ai上的語法也能用于開發(fā)不同的應用。

Wit.ai的商業(yè)模式也與GitHub相同,用戶會免費分享數據。不過為了保護隱私,用于訓練系統的音頻記錄不能共享,而不愿共享語法或數據的公司可以付費使用該公司服務。

免費

與Wit.ai一樣,現在有越來越多的公司和項目能幫助開發(fā)者在各自的應用上布署語音識別系統,其中有開源項目Julius和CMU Sphinx,也有Google的語音轉文本服務。Lebrun希望通過免費獲取更多的語法和訓練數據,最終根據這些數據開發(fā)的系統能與蘋果及Google匹敵。

Wit.ai的一個問題是,所有音頻都要通過互聯網傳輸到公司的服務器,這意味著使用時會出現延時,甚至隱私問題。不過,Lebrun表現,現在已經有了一個混合版本,能直接在客戶端工作。

via wired

雷峰網原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知。

分享:
相關文章

專業(yè)寫瞎

不受意識控制地報道那些讓人感動的產品技術和事件......zhchsimons@gmail.com ;微信:nksimons;《腦洞》公眾號:hackmind
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
立即設置 以后再說