1
或許不少Siri用戶都遇到過像上圖一樣的尷尬。如何讓Siri,Alexa,Cortana這些語音助手更加聽話?一家叫Cypher的公司正在用深度學(xué)習(xí)來試圖成為這些語音助手的好助手。
John Walker 四年前創(chuàng)立 Cypher 公司時,他有一個簡單的目標(biāo):讓每個人都能清楚地聽到通話聲音。因此,Walker 就針對智能手機(jī)就開發(fā)了一個軟件。這一軟件融合了深度神經(jīng)網(wǎng)絡(luò),在外音嘈雜的情況下,也清楚地聽到對方的通話聲音。
為證明出這款軟件的強(qiáng)大,Cypher 的銷售主管 Yoon 曾在紐約市繁華的街頭,給正坐在辦公室的 Walker 打電話。當(dāng) Yoon 打開了 Cypher 的測試軟件,他的通話聲音就變得非常的清楚,就像是坐在辦公室打電話一樣。Cypher公司表示這一軟件可以消除 99% 的嘈音,但通話聲音會延遲 24 毫秒(而人類能感覺到時間延遲則是在200毫秒)。
為保證通話聲音的清楚,Cypher 的軟件會首先使用算法將說話人的聲音記錄下來。因?yàn)樗腥祟愓Z言都包含元音,都是由鼻腔,舌頭以及牙齒共同協(xié)調(diào)發(fā)出的,而電鉆發(fā)出的聲音就于此完全不同,進(jìn)行這一區(qū)分十分地簡單。只要軟件按照這一方法識別出了人類的聲音,就會完全屏蔽掉其他所有的聲音。這與其他軟件有所不同,其他軟件是先識別除噪音,然后再將其排除。但是噪音種類眾多,十分不易分辨和排除。
深度神經(jīng)網(wǎng)絡(luò)在從大量的數(shù)據(jù)中提取出有效的信息方面表現(xiàn)十分出色。高通的高級產(chǎn)品經(jīng)理 Sy Choudhury表示,現(xiàn)在許多的創(chuàng)業(yè)公司都開始將神經(jīng)網(wǎng)絡(luò)與智能手機(jī)相結(jié)合,并進(jìn)行相應(yīng)的研究。
但這一條路對Cypher來說走得一場艱難。對 Cypher 而言,目前的難點(diǎn)不在于如何提高軟件的質(zhì)量,而是在于如何推銷。Cypher 希望該款軟件的良好表現(xiàn)能吸引手機(jī)廠商,將其裝在智能手機(jī)內(nèi)。但是目前消費(fèi)者更加關(guān)注手機(jī)的攝像質(zhì)量和電池的續(xù)航能力。
于是Cypher 轉(zhuǎn)而從成本上下功夫,希望能將這一軟件裝到手機(jī)的內(nèi)部系統(tǒng)中替代去除噪音干擾的硬件。按此進(jìn)行計算每部手機(jī)大概能節(jié)省 50 美分到 1 美元。但是這一點(diǎn)也并未引起手機(jī)制造商們的關(guān)注。Cypher 曾和 LG,華為,三星都商談過,但是卻一直沒有達(dá)成協(xié)議。Ronan de Renesse,Ovum 公司的銷售策略分析師,他表示手機(jī)制造商們的旗艦機(jī)型成本大概會在 200~400 美元左右,所以每一臺手機(jī)節(jié)省 50 美分,對他們來說并沒有什么吸引力。
但是,現(xiàn)在 Cypher 又想出一個新的銷售方向,它與科技巨頭們進(jìn)行商談,希望將這一軟件安裝到他們的語音助手(如Ok Google,Siri和Contana等)當(dāng)中去。這樣即使是在嘈雜的廚房發(fā)出指令,也能很好地傳達(dá)。最近 Cypher 與亞馬遜達(dá)成了協(xié)議,并將他們的軟件安裝到 Amazon Echo 的語音助手Alexa當(dāng)中。經(jīng)測試,安裝了這一軟件的Alexa在特定問題的查詢識別準(zhǔn)確率提升了116%。
按Cypher的說法,該軟件將大幅提升Alexa等語音助手在廚房燈嘈雜環(huán)境中的表現(xiàn),幫助其更好的理解用戶指令。但對Cypher來說,其客戶是否會將背景噪聲當(dāng)成影響語音助手表現(xiàn)的重要原因還有待進(jìn)一步的觀察。
Via IEEE Spectrum
相關(guān)閱讀:
前Google高級管理科學(xué)家林德康回國創(chuàng)業(yè),做了一款你沒見過的語音助手
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。