7
昨天云知聲在京舉行了年度品牌發(fā)布會(huì),除了宣布與華為進(jìn)行合作這個(gè)儀式,大屏幕一直在播放其互聯(lián)網(wǎng)客戶這一年對(duì)云之聲的反饋,唱吧陳華、Ucloud季昕華、酷我音樂雷鳴、亮風(fēng)臺(tái)廖春元、小優(yōu)劉雪楠、有巢智能皮振興、學(xué)多多符悅、爽哥英語(yǔ)Jason等我們熟悉的30多個(gè)創(chuàng)業(yè)者面孔,讓坐在下面的媒體朋友們以為來了個(gè)互聯(lián)網(wǎng)新銳CEO的一個(gè)大集結(jié)。
而云知聲CEO黃偉則重點(diǎn)回顧了自家在這一年取得了什么進(jìn)展:
? 升級(jí)LSTM深度學(xué)習(xí)技術(shù)
? 語(yǔ)音方面,在IOT方面延生了 遠(yuǎn)講識(shí)別和降噪技術(shù)、低功耗喚醒和識(shí)別技術(shù)、車載噪聲和回聲消除技術(shù)
? 語(yǔ)義方面,將解析領(lǐng)域擴(kuò)充至60+
? 發(fā)布面向家居的完整解決方案
? 在車載終端后市場(chǎng)份額做到第一
? 在口語(yǔ)評(píng)測(cè)方向成立子公司
? 開始和華為、高通、海爾這些大公司取得合作。
會(huì)上,我們看到年初以開放、親近互聯(lián)網(wǎng)自居的云知聲開始更多地和大廠商合作,以及在智能硬件遭遇寒冬的情況下,依然逆勢(shì)推出面向IOT領(lǐng)域的完整解決方案,會(huì)后雷鋒網(wǎng)采訪了CEO黃偉,問他如此布局的原因。
黃偉:目前智能家居和車載,跟手機(jī)比的話,存量確實(shí)不大,但這是一個(gè)新興的市場(chǎng),它未來的容量會(huì)超越互聯(lián)網(wǎng),最近國(guó)內(nèi)有很多芯片收購(gòu)的案子其實(shí)都跟硬件聯(lián)網(wǎng)息息相關(guān)。
從行業(yè)布局的角度看,今天的量小,并不代表未來的量小,而且跟硬件相關(guān)的,越是看著很艱苦的工作,越是要提前做,就像今年的O2O,除了一線的BAT,有價(jià)值的恰恰是那些干過苦活臟活累活的58同城美團(tuán)等,這也是在硬件還沒起來的時(shí)候,我們要去做IOT布局的考慮和原因。
另外,我想說的是,跟硬件相關(guān)的語(yǔ)音識(shí)別第一個(gè)考慮的是成本,之前亞馬遜icon音響有個(gè)9個(gè)麥克風(fēng),就像9個(gè)信息源一樣,可能要一個(gè)非常powerful的CPU放上算法把聲學(xué)噪音消除掉,但是光處理所有跟聲學(xué)相關(guān)的部件就要100美金以上,但廠商最多能承受10多美金的水準(zhǔn),所以要等以后做到3-4美金的成本,智能硬件才會(huì)更好地普及。
黃偉:其實(shí)是因?yàn)榧夹g(shù)獲得認(rèn)可后,我們被對(duì)方選擇的,和華為高通全志的合作,他們的行業(yè)標(biāo)準(zhǔn)制定者是有利于提升我們的技術(shù)水平的,他們的量非常大。
來的人我們既需要高通華為這樣的大客戶,也需要?jiǎng)?chuàng)新性的小客戶。
因?yàn)榇罂蛻敉欠€(wěn)健保守的,創(chuàng)新性產(chǎn)品往往是創(chuàng)業(yè)公司來承擔(dān),小的公司沒錢的時(shí)候,不會(huì)硬性說你先給我錢,對(duì)于一些好的團(tuán)隊(duì)和好產(chǎn)品方向也會(huì)給與一些支持。
黃偉:每個(gè)公司有自己的基因和主業(yè),百度在08年之前就開始跟中科學(xué)合作,08年后就組建了自己的團(tuán)隊(duì),還請(qǐng)來了吳恩達(dá)博士;微信下面有自己專門的語(yǔ)音識(shí)別團(tuán)隊(duì);訊飛可能更多地關(guān)注政府、金融或者運(yùn)營(yíng)商。
作為一家創(chuàng)業(yè)公司,我們自己的定位是一家技術(shù)驅(qū)動(dòng)的互聯(lián)網(wǎng)公司,我記得二零零幾年初的時(shí)候,這個(gè)領(lǐng)域的博士畢業(yè)生工作是不太好找的,甚至是要轉(zhuǎn)行的,但最近人工智能整個(gè)領(lǐng)域都在蠢蠢欲動(dòng):
這個(gè)領(lǐng)域技術(shù)積累很重要,但我們更相信技術(shù)到方案的快速落地比較重要,在提供的技術(shù)性能不變的情況下,保持高效率,低成本這可以說是我們作為一個(gè)創(chuàng)業(yè)公司近兩年快速突圍一直在努力的東西。
另外雖說競(jìng)爭(zhēng)對(duì)手都很強(qiáng)大,但是公司再大,每個(gè)Team獲取的資源是相對(duì)有限的,隨著時(shí)間的推移,大家都各自會(huì)奔向各自要深耕的垂直領(lǐng)域。
除了云知聲,BAT、科大訊飛等廠家都普遍使用了DNN算法,對(duì)于云之聲升級(jí)的LSTM算法,
黃偉表示:
DNN是一個(gè)前向操作,對(duì)時(shí)間軸是沒有記憶的,但LSTM具有記憶能力,對(duì)時(shí)間軸可以進(jìn)行建模,對(duì)大數(shù)據(jù)的描述和解析能力會(huì)更強(qiáng)。
(對(duì)此,記者問了思必馳CEO高始興對(duì)LSTM算法的看法—— “相對(duì)于DNN,可以學(xué)習(xí)長(zhǎng)時(shí)和短時(shí)兩種上下文信息,本質(zhì)是一種遞歸網(wǎng)絡(luò),用的好的話,聲學(xué)可以提升相對(duì)15%(不是絕對(duì)提升),相應(yīng)地計(jì)算量也會(huì)更大”,高始興如是說。)
相對(duì)于科大訊飛的十多年布局,云知聲成立之初一直以互聯(lián)網(wǎng)公司自居,借著親民形象俘獲了不少硬創(chuàng)公司的支持,在新興垂直領(lǐng)域,比如家居、車載取得了一定的成果,甚至在科大訊飛布局的在線教育也搶得了一杯羹,而從會(huì)上發(fā)布的合作商名單來看,其在大公司領(lǐng)域也開始窮追猛趕,但是目前語(yǔ)音識(shí)別公司間的競(jìng)爭(zhēng)并不像外部想的那樣你死我活。
語(yǔ)音識(shí)別作為一項(xiàng)應(yīng)用技術(shù),而不是產(chǎn)品,在生活中的應(yīng)用領(lǐng)域非常之多、非常之細(xì),如果要問兩者間的區(qū)別
“科大更封閉一些,云之聲更開放”
科大訊飛的人士如此回應(yīng)說。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。