7
昨天云知聲在京舉行了年度品牌發(fā)布會,除了宣布與華為進行合作這個儀式,大屏幕一直在播放其互聯(lián)網(wǎng)客戶這一年對云之聲的反饋,唱吧陳華、Ucloud季昕華、酷我音樂雷鳴、亮風(fēng)臺廖春元、小優(yōu)劉雪楠、有巢智能皮振興、學(xué)多多符悅、爽哥英語Jason等我們熟悉的30多個創(chuàng)業(yè)者面孔,讓坐在下面的媒體朋友們以為來了個互聯(lián)網(wǎng)新銳CEO的一個大集結(jié)。
而云知聲CEO黃偉則重點回顧了自家在這一年取得了什么進展:
? 升級LSTM深度學(xué)習(xí)技術(shù)
? 語音方面,在IOT方面延生了 遠講識別和降噪技術(shù)、低功耗喚醒和識別技術(shù)、車載噪聲和回聲消除技術(shù)
? 語義方面,將解析領(lǐng)域擴充至60+
? 發(fā)布面向家居的完整解決方案
? 在車載終端后市場份額做到第一
? 在口語評測方向成立子公司
? 開始和華為、高通、海爾這些大公司取得合作。
會上,我們看到年初以開放、親近互聯(lián)網(wǎng)自居的云知聲開始更多地和大廠商合作,以及在智能硬件遭遇寒冬的情況下,依然逆勢推出面向IOT領(lǐng)域的完整解決方案,會后雷鋒網(wǎng)采訪了CEO黃偉,問他如此布局的原因。
黃偉:目前智能家居和車載,跟手機比的話,存量確實不大,但這是一個新興的市場,它未來的容量會超越互聯(lián)網(wǎng),最近國內(nèi)有很多芯片收購的案子其實都跟硬件聯(lián)網(wǎng)息息相關(guān)。
從行業(yè)布局的角度看,今天的量小,并不代表未來的量小,而且跟硬件相關(guān)的,越是看著很艱苦的工作,越是要提前做,就像今年的O2O,除了一線的BAT,有價值的恰恰是那些干過苦活臟活累活的58同城美團等,這也是在硬件還沒起來的時候,我們要去做IOT布局的考慮和原因。
另外,我想說的是,跟硬件相關(guān)的語音識別第一個考慮的是成本,之前亞馬遜icon音響有個9個麥克風(fēng),就像9個信息源一樣,可能要一個非常powerful的CPU放上算法把聲學(xué)噪音消除掉,但是光處理所有跟聲學(xué)相關(guān)的部件就要100美金以上,但廠商最多能承受10多美金的水準(zhǔn),所以要等以后做到3-4美金的成本,智能硬件才會更好地普及。
黃偉:其實是因為技術(shù)獲得認(rèn)可后,我們被對方選擇的,和華為高通全志的合作,他們的行業(yè)標(biāo)準(zhǔn)制定者是有利于提升我們的技術(shù)水平的,他們的量非常大。
來的人我們既需要高通華為這樣的大客戶,也需要創(chuàng)新性的小客戶。
因為大客戶往往是穩(wěn)健保守的,創(chuàng)新性產(chǎn)品往往是創(chuàng)業(yè)公司來承擔(dān),小的公司沒錢的時候,不會硬性說你先給我錢,對于一些好的團隊和好產(chǎn)品方向也會給與一些支持。
黃偉:每個公司有自己的基因和主業(yè),百度在08年之前就開始跟中科學(xué)合作,08年后就組建了自己的團隊,還請來了吳恩達博士;微信下面有自己專門的語音識別團隊;訊飛可能更多地關(guān)注政府、金融或者運營商。
作為一家創(chuàng)業(yè)公司,我們自己的定位是一家技術(shù)驅(qū)動的互聯(lián)網(wǎng)公司,我記得二零零幾年初的時候,這個領(lǐng)域的博士畢業(yè)生工作是不太好找的,甚至是要轉(zhuǎn)行的,但最近人工智能整個領(lǐng)域都在蠢蠢欲動:
這個領(lǐng)域技術(shù)積累很重要,但我們更相信技術(shù)到方案的快速落地比較重要,在提供的技術(shù)性能不變的情況下,保持高效率,低成本這可以說是我們作為一個創(chuàng)業(yè)公司近兩年快速突圍一直在努力的東西。
另外雖說競爭對手都很強大,但是公司再大,每個Team獲取的資源是相對有限的,隨著時間的推移,大家都各自會奔向各自要深耕的垂直領(lǐng)域。
除了云知聲,BAT、科大訊飛等廠家都普遍使用了DNN算法,對于云之聲升級的LSTM算法,
黃偉表示:
DNN是一個前向操作,對時間軸是沒有記憶的,但LSTM具有記憶能力,對時間軸可以進行建模,對大數(shù)據(jù)的描述和解析能力會更強。
(對此,記者問了思必馳CEO高始興對LSTM算法的看法—— “相對于DNN,可以學(xué)習(xí)長時和短時兩種上下文信息,本質(zhì)是一種遞歸網(wǎng)絡(luò),用的好的話,聲學(xué)可以提升相對15%(不是絕對提升),相應(yīng)地計算量也會更大”,高始興如是說。)
相對于科大訊飛的十多年布局,云知聲成立之初一直以互聯(lián)網(wǎng)公司自居,借著親民形象俘獲了不少硬創(chuàng)公司的支持,在新興垂直領(lǐng)域,比如家居、車載取得了一定的成果,甚至在科大訊飛布局的在線教育也搶得了一杯羹,而從會上發(fā)布的合作商名單來看,其在大公司領(lǐng)域也開始窮追猛趕,但是目前語音識別公司間的競爭并不像外部想的那樣你死我活。
語音識別作為一項應(yīng)用技術(shù),而不是產(chǎn)品,在生活中的應(yīng)用領(lǐng)域非常之多、非常之細,如果要問兩者間的區(qū)別
“科大更封閉一些,云之聲更開放”
科大訊飛的人士如此回應(yīng)說。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。