0
本文作者: 劉芳平 | 2018-05-09 12:06 |
2016 年,云知聲 CEO 黃偉接受雷鋒網(wǎng)專訪時透露了公司的品牌升級方向————從智能語音公司,到物聯(lián)網(wǎng)人工智能服務(wù)商。
而實現(xiàn)這種轉(zhuǎn)型,在產(chǎn)品層面上云知聲提出了“云端芯”的概念,通過芯片將終端和云端連接起來。黃偉對雷鋒網(wǎng)表示,云知聲的人工智能產(chǎn)品包括以下三塊:
AI 芯,目前你可以將其理解成連網(wǎng)的麥克風;
AIUI,用戶與終端之間的交互方式,目前主要就是語音;
AI Service,云端服務(wù)。
云知聲要做的,是將 AI 芯放進從家電到汽車的各種產(chǎn)品里,讓它們都能連網(wǎng)并進行通過語音交互,并連接至云端服務(wù)。
2017 年 8 月,云知聲宣布獲 3 億元戰(zhàn)略投資,融資目的之一就是加大人工智能專用芯片 UniOne 的研發(fā)力度,進一步完善以“云端芯”為核心的產(chǎn)品開發(fā)和商業(yè)落地。
現(xiàn)在,云知聲自行設(shè)計的 AI 芯片終于將在 5 月 16 日對外發(fā)布。在正式發(fā)布前,雷鋒網(wǎng)對 UniOne 芯片的研發(fā)負責人,IoT 事業(yè)部副總裁李霄寒進行了專訪,對其造芯之路進行深入解讀。
云知聲 IoT 事業(yè)部副總裁李霄寒
對云知聲來說,造芯不是目的,而是手段。人工智能時代,廠商的競爭力在于其向客戶提供解決方案的能力,而芯片正是解決方案的重要一環(huán)。
李霄寒告訴雷鋒網(wǎng),云知聲設(shè)計自己的芯片是一件水到渠成的事,“我們先用一個通用型的方案,去拓展、打磨這個產(chǎn)品,然后找到我們的客戶和應(yīng)用場景。然后,我們再做芯片,去替代原有的產(chǎn)品?!睂Ρ戎?,一些公司是先設(shè)計出芯片再去找客戶和應(yīng)用場景。
而所謂“造芯”,并非是將設(shè)計、研發(fā)、生產(chǎn)整個流程都做了,“我們不光要涉及到芯片的設(shè)計,還要涉及到整個上面的系統(tǒng),包括相關(guān)的云端服務(wù)和算法”,李霄寒對雷鋒網(wǎng)透露,芯片及方案開發(fā)團隊有四五十人。
之所以投入的人力并不龐大,是因為云知聲只抓最核心的設(shè)計部分,包括用于 AI 加速的 NPU、用于信號處理的 DSP 以及其它一些 know-how,其它一些核心模塊都采用 IP 復用的方式,這也是當下許多芯片設(shè)計所用的方法。
UniOne 并不是一款芯片,而是一個產(chǎn)品系列,并讓每一款產(chǎn)品在特別的場景下做到極致,“我們會有一系列的芯片,比如第一款芯片解決智能家居領(lǐng)域里面的多模態(tài)交互問題,第二款芯片解決車載環(huán)境下的一些交互,或者是別的需求,會把它這個方向做到極致。”李霄寒告訴雷鋒網(wǎng)。
以下為李霄寒與雷鋒網(wǎng)的對話實錄,雷鋒網(wǎng)進行了不改變原意的整理。
李霄寒:我負責這邊的研發(fā)平臺和整個的產(chǎn)品化,我們有個 AI Labs 由 CTO 梁家恩負責,它輸出核心引擎。
我底下有若干個團隊,從終端、芯片、云平臺、測試到系統(tǒng)應(yīng)用都覆蓋,我們負責根據(jù)產(chǎn)品的需求,把技術(shù)加上一些產(chǎn)品化的工作做成最終的產(chǎn)品。
雷鋒網(wǎng):芯片這塊有多大投入?
李霄寒:我們不像傳統(tǒng)芯片公司那樣,設(shè)計、驗證,然后后端等。我們不光要涉及到芯片的設(shè)計,還要涉及到整個上面的系統(tǒng),因為我們不是只提供一個芯片就拉倒,還有解決方案以及相關(guān)的云端服務(wù)和算法。
在這上面的人力投入大概四五十人。
雷鋒網(wǎng):在造芯的整個流程中你們主要做哪些方面?哪些是跟第三方合作的?
李霄寒:我們抓最核心的設(shè)計部分,現(xiàn)在的芯片設(shè)計很多是采用 IP 復用的方式。像 DDR、ADC,還有 CPU,很多都可以直接復用現(xiàn)有的 IP。
我們是做 AI 加速,也就是 NPU 的部分,還有 DSP,以及一些其它的 know-how。其它的部分盡可能復用。
雷鋒網(wǎng):IVM 和 UniOne 芯片有什么不同?
李霄寒:IVM 不是一個芯片產(chǎn)品,它是一個板卡,基于通用方案來交給客戶的一個解決方案。
比方說,我們會購買第三方符合我們具體產(chǎn)品需求的 CPU,以及相應(yīng)的降噪 DSP,把軟件裝進去,然后在上面做優(yōu)化,同時設(shè)計一個硬件的 PCB,作為最終的產(chǎn)品,這就是 IVM。
這個產(chǎn)品做了有 3、4 年的時間,像格力、美的、長虹都是我們的客戶。
UniOne 是基于我們之前的一些行業(yè) know-how,包括對算法,對 AI 層面的 know-how,我們覺得可以相應(yīng) IVM 的東西變成一顆 SoC。它可以在性能、功耗、價格方面全面的超越原來的 IVM 產(chǎn)品。
所以我們的路子是先用一個通用型的方案,去拓展、打磨這個產(chǎn)品,然后去找到客戶和應(yīng)用場景。然后再做芯片去替代原有的產(chǎn)品。這跟一些其它的公司不一樣,有些公司是先設(shè)計出芯片出來,再去找客戶。
對我們來講,客戶也好,渠道也好,產(chǎn)品形態(tài)也好,這些都是現(xiàn)成的,都是被打磨過的,從 IVM 進化到 UniOne是一個非常自然的選擇。
雷鋒網(wǎng):是說你們已經(jīng)發(fā)展到了一定程度,有這樣的市場存在,然后發(fā)現(xiàn)有這個需求,所以才做芯片?
李霄寒:這不是完全等價的,我剛才只是講了一個自下而上的微觀路徑,其實是有個自上而下的宏觀路徑:
從物聯(lián)網(wǎng) AI 的發(fā)展大勢上來判斷,它是一個跟手機和移動互聯(lián)網(wǎng)都不一樣的平臺,因為它的產(chǎn)品形態(tài)多樣化,各個場景是非常碎片化的。
所以,它需要一個硬件的解決方案。
另外,隨著 AI 的發(fā)展,物聯(lián)網(wǎng)的 AI 一定需要邊緣算力,不同場景對 AI 的算力需求也是不一樣的。
所以,原來的這種通用方案是不能解決物聯(lián)網(wǎng)的 AI 問題,必須要有專用的物聯(lián)網(wǎng) AI 芯片來打開這個市場。這是從宏觀層面上去考慮這件事情,跟我們以前做過什么事情沒有關(guān)系,這也是我們在 3 年前就在考慮的事。
這是一個自上而下的分析路徑,IVM 到 UniOne 是一個自下而上的路徑。這 2 個路徑殊途同歸,都是在說,我們需要一個甚至一系列的物聯(lián)網(wǎng) AI 芯片,來解決物聯(lián)網(wǎng)各個場景下的人工智能問題。
李霄寒:不同的 AI 芯片之間是有很大差異的,像面向自動駕駛的 ADAS 圖像芯片,和更加偏物聯(lián)網(wǎng)或者人機交互的芯片,在整個芯片的制程、功能設(shè)計、性能和功耗方面,期待都是不一樣的。
所以,AI 芯片的需求是差異化。對于我們來講,長遠來說肯定是瞄準整個物聯(lián)網(wǎng),所以 UniOne 本身是一個產(chǎn)品系列,不是一款芯片,是面向物聯(lián)網(wǎng)的一系列芯片。
現(xiàn)在這個時間點我們從現(xiàn)有的市場、算法和場景去去切入。比方說,原來 IVM 的既有市場,像智能家居,在芯片出來之后,可以實現(xiàn)無縫替換,客戶那邊可能什么都不需要改,直接用新的芯片替換原來那個板子上的老芯片就可以了。
所以,對于客戶來講,更新?lián)Q代的成本是非常低的,他只感覺到了性能的提升,功耗和價格的下降。
另外一方面,第一款芯片的出來,可以讓我們切入之前嘗試過但沒有大規(guī)模的上量的一些場景,比方說智能音箱。
今年上半年這一版主要是面向語音交互的,同時保留了多模態(tài)的一些擴展,但是目前的我們 solution 主要是面向語音的。
智能燃氣灶
雷鋒網(wǎng):越專用的 AI 芯片可以做到的能效比就越高,越通用的話在能效比上會有所犧牲?咱們這邊是怎么進行平衡的?
李霄寒:我覺得,做一款好的 AI 芯片需要 3 個關(guān)鍵要素:
第一,需要對算法有足夠的了解,對算法要有 know-how。如果你拿到的是比較普通的算法,可能你的優(yōu)化也是比較普通的,如果你的 know-how 比較多,那可能優(yōu)化可以做的比較精細。
第二,需要對芯片重視,要能夠設(shè)計芯片,把它做出來,能夠給出比較好的架構(gòu)。我們經(jīng)過 3 年的打磨已經(jīng)完全具備了這方面的能力。
第三,很多人會忽略的一點,就是對應(yīng)用的 know-how。做芯片不是軍備競賽,不是說效能比越高,或者說關(guān)鍵參數(shù),主頻、制程越高越好。計算力并不是越高越好,而是要滿足場景的需求。
就像做軍品和民用的產(chǎn)品一樣,做軍品相對還容易一點,因為很多情況下不用考慮成本,但是做民用的東西要考慮平衡。
對云知聲來講的,我們有優(yōu)勢的一點是之前通過通用的產(chǎn)品,針對產(chǎn)品形態(tài)和市場做了比較深的一些打磨。所以我們對市場的產(chǎn)品和用戶了解是比較深刻的,基于以上 3 個要素去設(shè)計芯片就可以做到比較好的平衡。
有一些公司可能會缺一兩個要素,那么它做出來的產(chǎn)品可能會有點偏,比如性能很好但功耗很高,或者性能功耗比非常不錯,但價格很貴。
雷鋒網(wǎng):UniOne 會針對不同場景做專門優(yōu)化嗎?
李霄寒:會的,像家居、車載都會做到極致優(yōu)化,但是我們不是拿一款芯片來解決所有的問題。
我們會有一系列的芯片,比方說第一款芯片解決智能家居領(lǐng)域里面的多模態(tài)交互問題,第二款的芯片解決車載環(huán)境下的一些交互或是別的需求,會把這個方向做到極致。
后面還有其它的一些東西出來,但整個是統(tǒng)一的 AI 框架,不斷去演進,然后在不同的場景里有不同的分支。
雷鋒網(wǎng):為什么云知聲要自己做而不是跟其它廠商合作定制芯片呢?
李霄寒:AI 芯片的整體架構(gòu)還遠沒有成熟,并不是說像 CPU 一樣,采購誰的都一樣,沒必要自己去重復發(fā)明一個 CPU。我們面臨的問題和 PC 上的 CPU 問題是完全不一樣的。
現(xiàn)在從整個產(chǎn)品定義,到里面的架構(gòu)都是在一個探索階段,沒有標準化,你去找一個合作伙伴的話,很可能最后做出來的東西不能夠滿足場景的需求。這也是為什么我們堅決要自己做。
而且我們在這方面有比較大的優(yōu)勢,因為我們做了 2 年多將近 3 年的時間,團隊已經(jīng)從算法到應(yīng)用到芯片都打磨出來了。后面做芯片的迭代,架構(gòu)以及整體方案的演進,成本是比較低的。
所以,對于我們來講,肯定是還是選擇自己做,勝過跟別人去合作。
雷鋒網(wǎng):芯片團隊和算法等團隊是怎么合作的?
李霄寒:我們基本上是坐在一塊,做降噪的,做喚醒的、識別的,甚至包括語音合成的,所有跟 AI 相關(guān)的這些算法的同事,都是在一個環(huán)境里面工作。
他們之間會互相分享,做算法的人會了解芯片的一些知識,做芯片的人會了解算法的一些架構(gòu),互相會做一些滲透。
只有雙方互相有比較深的了解,才能做出一個相對定制,但又不是那種死的,具有一定的靈活性的架構(gòu),這對于產(chǎn)品的成功是非常關(guān)鍵的。
雷鋒網(wǎng):除了語音,你們還會做其它領(lǐng)域嗎,比如視覺?
李霄寒:視覺我們已經(jīng)在做了,從語音交互這個切入點來看,其實我們最終是要設(shè)計一個擬人化的東西,但是人的感官是遠遠不只是耳朵的,視覺也占了很大的一部分。
我們會迅速的從語音交互,轉(zhuǎn)向多模態(tài)交互,甚至把交互可能都會去掉,就是多模態(tài)的 AI。
雷鋒網(wǎng):UniOne 推出后,接下來芯片方面的規(guī)劃是什么?
李霄寒:當前這款芯片是從類 IVM 的一套東西著手,緊接著我們會往車的方向走,因為車這塊是一個非常巨大的市場。而且對芯片的需求是蠻高的,這是接下來必須要做的。
還有就是往多模態(tài)的方向走,把更多的傳感器集成進來,讓這個語音交互變的不那么單薄,更像一個真人,這是我們今年的研發(fā)規(guī)劃。
同時,在體系架構(gòu)上面會繼續(xù)演進,之前的體系架構(gòu)做的會相對保守,因為這是我們的第一款芯片,要保證它能夠量產(chǎn),但這不代表戰(zhàn)略是保守的,我們的芯片戰(zhàn)略是比較激進的。
現(xiàn)在關(guān)注“雷鋒網(wǎng)”微信公眾號(leiphone-sz),回復關(guān)鍵詞【2018】,隨機抽送價值 3999 元的參會門票 3 張
相關(guān)文章:
云知聲獲3億元戰(zhàn)略投資,將加大AI芯片研發(fā)
云知聲發(fā)布“Pandora”語音中控方案,產(chǎn)品智能化只需6個月
云知聲 CEO 黃偉:堅持才會有收獲,今年的營收將突破 9 位數(shù)
2 步讓你開發(fā)出“中國版 Echo”,云知聲要做“中國版 Alexa” | AWE 2017
云知聲 AI 芯:跟一臺抽油煙機展開“對話”,是一種怎樣的體驗?
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。