4
本文作者: 程弢 | 2016-11-06 09:23 |
今年5月,一家名為Waverly Labs的創(chuàng)業(yè)公司推出了一款名為Pilot的智能耳機,這是全球第一款把翻譯功能在耳機上實現(xiàn)的產(chǎn)品,它可以打破語言不通的溝通障礙,幫助用戶實時翻譯不同語言。目前,Pilot智能耳機在IndieGogo的眾籌金額已經(jīng)超過了300萬美元,預(yù)計產(chǎn)品會在明年5月上市。
在HWtrek舉辦的全球創(chuàng)新與制造對接大會上,Waverly Labs創(chuàng)始人Andrew Ochoa來到了現(xiàn)場,并且向大家介紹了Pilot智能耳機的最新消息。
實際上,這款產(chǎn)品一經(jīng)曝光就在全球范圍內(nèi)賺足了眼球,它曾一度被網(wǎng)友們成為“撩妹神器”。當(dāng)然吸引大家的不僅僅是酷炫的功能,其背后集成的技術(shù)才是讓大家集體膜拜的主要原因。
據(jù)Andrew Ochoa介紹,Pilot智能耳機的硬件包含了雙重降噪的迷你麥克風(fēng)以及過濾周邊噪音與雜音的模塊,它采用了語音識別、機器翻譯以及語音合成等技術(shù),除了生產(chǎn)制造在深圳之外,所有設(shè)計研發(fā)都是在美國完成的,目前還在手板打樣階段。
其原理也比普通的語音識別產(chǎn)品復(fù)雜,當(dāng)用戶聽到句子后可傳輸?shù)绞謾C中,在手機完成計算翻譯后,再通過無線通信實時反饋到另一個耳機中。
Pilot智能耳機內(nèi)置的麥克風(fēng)能在良好的環(huán)境下(噪音和干擾足夠小)接收到準(zhǔn)確的信號,麥克風(fēng)接收到信號之后,系統(tǒng)能將這段音頻信號轉(zhuǎn)換成文本信息,然后這些被翻譯完成的文本內(nèi)容再次轉(zhuǎn)換成用戶預(yù)先設(shè)置的母語音頻信號,最后從手機傳回到Pilot智能耳機當(dāng)中。
Andrew Ochoa還談到了這款產(chǎn)品的進度,自五月首次曝光后,Pilot并沒有迎來大的升級,大的更新可能要等到明年。目前這款產(chǎn)品支持五種語言,分別是英語、法語、意大利語、葡萄牙語和西班牙語,他們還計劃明年上線技術(shù)門檻更高的中文翻譯功能。
Andrew Ochoa還表示,目前這款產(chǎn)品的識別準(zhǔn)確率是80%(據(jù)了解,一般情況下做到95%以上才是一款合格的產(chǎn)品。),而且功能也會有一定的延遲,可提升的空間很大。
然而,盡管Pilot早已走紅,但這款產(chǎn)品以及Waverly Labs團隊在現(xiàn)場仍然引起了一些觀眾的質(zhì)疑。
據(jù)了解,Waverly Labs成立于2014年,目前團隊只有9個人,而按照Andrew Ochoa的說法,語音識別、機器翻譯以及語音合成等技術(shù)都完全由這9人開發(fā)而成。按照常理這樣一款產(chǎn)品需要強大的技術(shù)團隊才能完成,這是現(xiàn)場觀眾提出質(zhì)疑的主要原因。
有業(yè)內(nèi)人士認(rèn)為上述技術(shù)是否真的是Waverly Labs自主研發(fā)值得考究,他說能做語音識別的公司很少會自己做C端的產(chǎn)品,做C端產(chǎn)品的基本都是用大公司的成熟技術(shù)。
搜狗語音交互中心語音技術(shù)部負(fù)責(zé)人陳偉也向雷鋒網(wǎng)表達(dá)了類似的觀點,“如果產(chǎn)品要做到可用,語音識別、機器翻譯以及語音合成等學(xué)科都不是9個人所能完成的?!?/p>
所以,有兩種情況可以解釋W(xué)averly Labs研發(fā)出Pilot:團隊成員都有機器豐富的經(jīng)驗,有現(xiàn)成的技術(shù)積累;另一種可能就是拿開源搭個系統(tǒng),但這種效果就一般。
另外,Waverly Labs還表示目前Pilot需要在手機App上完成翻譯,但下一代產(chǎn)品可以直接通過耳機完成,這一功能看似很酷炫,但算不算“黑科技”呢?
陳偉表示,如果這款產(chǎn)品是基于云端的,那其實放在耳機上難度不大,而且也應(yīng)該是云端實現(xiàn)功能。
耳機如果可以聯(lián)網(wǎng),那么無論是識別、合成、翻譯都可以在服務(wù)器上部署,通過網(wǎng)絡(luò)連接后臺服務(wù),后臺服務(wù)的運算能力是夠的,所以耳機需要做的事情很少;因為狹小的耳機空間內(nèi)能夠承載的運算能力很有限,如果把所有服務(wù)放在耳機,而無需聯(lián)網(wǎng),這是非常難的。
目前還不知道Waverly Labs打算如何突破這一難題,但如果這類產(chǎn)品能夠研發(fā)成功,那就真的是帶上一款耳機就可走遍全世界了。
實際上,像谷歌、Nuance以及國內(nèi)的搜狗和科大訊飛等企業(yè)鮮有直接做面向C端的細(xì)分品類,他們更愿意向終端企業(yè)提供技術(shù)支持,或者與第三方合作推出類似的產(chǎn)品,例如科大訊飛和京東合作的叮咚音箱,搜狗語音和四維圖新共同推出的車機。
但對嘗試做C端在線翻譯產(chǎn)品的企業(yè)來說,在獲得語音識別的技術(shù)支持后,他們面臨的最大問題就是如何控制產(chǎn)品的成本。
據(jù)現(xiàn)場業(yè)內(nèi)人士透露,如果集成的是第三方的語音識別技術(shù),那么用戶使用的過程中,每識別一次都會產(chǎn)生費用。以Nuance為例,如果沒有深度合作,每調(diào)用一次需要支付0.008美元。因此,這類語音識別終端產(chǎn)品到消費者手中會不斷的產(chǎn)生費用,如果產(chǎn)品定價太低就很難實現(xiàn)盈利,定價太高消費者就很難接受了。
WaverlyLabs Pilot智能耳機的售價是299美元,這顯然比大多數(shù)國內(nèi)消費者的心理價位要高出一截。
中國消費者可接受的價位在800-1000元之間,貴了賣不出去,便宜了沒盈利。
這個價格區(qū)間基本沒有留給企業(yè)留太多的余地。因此,他們不得不效仿其它智能終端行業(yè),來選擇用更廉價的硬件方案來控制成本。另外,除了簡單粗暴的壓低成本之外,他們也在摸索一些新的盈利模式,例如在APP中增加一些增值服務(wù)。
國內(nèi)企業(yè)更多的是走低價上量的策略,而國外企業(yè)如Waverly Labs瞄準(zhǔn)的更像是極客市場,不過隨身翻譯終端還是一種全新的產(chǎn)品形態(tài),未來這個市場有多大仍是個未知數(shù),這樣的風(fēng)險是所有玩家必須承擔(dān)的。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。