0
本文作者: 肖漫 | 2019-07-16 18:46 | 專題:CCF-GAIR 2019 |
雷鋒網(wǎng)按:7 月 12 日-7 月 14 日,2019 第四屆全球人工智能與機(jī)器人峰會(CCF-GAIR 2019)于深圳正式召開。峰會由中國計(jì)算機(jī)學(xué)會(CCF)主辦,雷鋒網(wǎng)、香港中文大學(xué)(深圳)承辦,深圳市人工智能與機(jī)器人研究院協(xié)辦,得到了深圳市政府的大力指導(dǎo),是國內(nèi)人工智能和機(jī)器人學(xué)術(shù)界、工業(yè)界及投資界三大領(lǐng)域的頂級交流博覽盛會,旨在打造國內(nèi)人工智能領(lǐng)域極具實(shí)力的跨界交流合作平臺。
語音技術(shù)的演進(jìn)和 IoT 時(shí)代的到來將會發(fā)生有趣的碰撞,芯片的進(jìn)步會提升了二者的結(jié)合。在 CCF-GAIR 2019 AI 芯片專場,深聰智能 CTO 朱澄宇帶來了關(guān)于端側(cè)芯片的分享,演講主題為《端側(cè)專用芯片-- AI 算法的理想載體》。
深聰智能 CTO 朱澄宇
朱澄宇在演講時(shí)表示,語音技術(shù)的演進(jìn)和 IoT 時(shí)代的到來某種程度上可以說是一種天作之合,這兩個(gè)技術(shù)必定是未來十年增長的亮點(diǎn),特別是在芯片領(lǐng)域。
他同時(shí)指出,如果使用第三方通用芯片,產(chǎn)品研發(fā)與 AI 市場需求、AI 算法、AI 數(shù)據(jù)不能形成閉環(huán),如果沒有閉環(huán)就不能形成生態(tài),不利于把這塊蛋糕做大,這些問題的存在讓思必馳最終決定成立一家公司專門做芯片。
值得注意的是,朱澄宇強(qiáng)調(diào),思必馳做芯片不是趕時(shí)髦,而是出于市場需求、技術(shù)以及算法能力三方面因素,具有長遠(yuǎn)規(guī)劃。
雷鋒網(wǎng)此前報(bào)道,思必馳在今年一月份發(fā)布了第一代 AI 語音芯片 TAIHANG。關(guān)于思必馳芯片的功耗,朱澄宇在會后接受雷鋒網(wǎng)采訪時(shí)表示:“相比通用芯片,思必馳芯片能降低 5 到 10 倍的能源消耗?!?/p>
他在演講中提到,思必馳芯片+算法的軟硬結(jié)合方案將會給用戶帶來非常好的體驗(yàn),不僅能夠聽得清和聽得懂,還有很高的識別率和快速的反應(yīng),能夠?qū)崿F(xiàn)非常低的功耗。不僅如此,軟硬結(jié)合的方案也具備多種接口,可以做很多擴(kuò)展。更重要的是,與通用芯片相比,因?yàn)椴恍枰浦?,能夠讓產(chǎn)品更快上市。
據(jù)了解,思必馳第二代芯片將解決本地語音識別的問題,增加安全、聲紋特性,會采取更深度的融合,從算法到基礎(chǔ) IP 都做專門的優(yōu)化,達(dá)到更好的目的。再下一代芯片,會考慮多模態(tài)以及進(jìn)行存儲、工藝、封裝的優(yōu)化。
另外,朱澄宇還在采訪中表示,思必馳芯片業(yè)務(wù)采用“芯片+算法”方案。他還說道,不擔(dān)心思必馳芯片的落地,因?yàn)樗急伛Y的芯片一開始就是照著落地來的,是看到了 AI 芯片的市場,清楚客戶的需求而進(jìn)行的研發(fā)。
雷鋒網(wǎng)了解到,思必馳的芯片當(dāng)前已經(jīng)有在洽談的合作伙伴。
目前,深聰智能(雷鋒網(wǎng)注:深聰智能是思必馳與中芯國際下屬投資公司中芯聚源成立的合資公司)第一代自研芯片已經(jīng)量產(chǎn),這是否意味著思必馳會減少 AI 語音芯片的購買?朱澄宇對雷鋒網(wǎng)表示,盡管目前思必馳已經(jīng)自研芯片,但并不會減少對其它芯片的購買。他提到:“市場是需要共同開拓的,思必馳做芯片的目的不是為了競爭,而是看到芯片市場方向?!?/strong>對于首次推出芯片,他表示想要覆蓋盡可能多的用戶群,嘗試盡可能多的領(lǐng)域,且今后會推出更多版本,更加精準(zhǔn)定位市場。
最后,關(guān)于芯片的后續(xù)發(fā)展,朱澄宇在采訪中表示,深聰智能依然會根據(jù)實(shí)際需求以及算法能力,腳踏實(shí)地一步步往前走,慢慢定義下一代芯片,在算法上進(jìn)行優(yōu)化,把效果做得更好,能耗更低。
另外,他還表示,目前深聰智能依然以思必馳的芯片為主,但同時(shí),深聰智能是一家開放的公司,關(guān)于與其它算法公司的合作,深聰智能也將持開放態(tài)度。
以下是朱澄宇在 CCF-GAIR 大會上的演講內(nèi)容,雷鋒網(wǎng)對其進(jìn)行了不改變原意的編輯整理:
很高興有機(jī)會跟大家分享思必馳以及思必馳下屬公司深聰對 AI 芯片的想法,也分享一下我們目前的成果,我這邊的題目是《端側(cè)專用芯片-- AI 算法的理想載體》。
現(xiàn)在已經(jīng)到了人機(jī)語音交互與 IoT 時(shí)代,我們應(yīng)該怎么走?先看一下人機(jī)語音交互,我以前一直是做芯片的,做了二十多年。做人機(jī)語音交互,特別是做 IoT 的芯片,其實(shí)是第一回。從傳統(tǒng)的角度來說,做芯片習(xí)慣問帶寬有多少,人講話要從芯片帶寬的角度來說是很低很低的,大概只有幾 bit,這是很低的頻率。
為什么這個(gè)東西這么重要?我們可以看到,人與人的交互不光是你字面上講的幾句話,很多時(shí)候還包括深層次的含義。如果從人機(jī)語音交互整個(gè)過程來看,首先要聽得清,因?yàn)闀懈鞣N各樣的場景,比如說有很多的噪聲、有很多人同時(shí)在講話,所以要知道你關(guān)注的對象在講什么,先聽清楚;二是要聽明白、聽得懂講什么;三是理解它的意義。
很多時(shí)候,我們講話有表情,而且還有其他的含義在里面。在人與人交流、機(jī)器與人交流的時(shí)候也要有合理的識別,還要用合適的方式可以表達(dá)出來,因?yàn)槿烁?、人跟機(jī)器語音方面的交互不是一個(gè)來回,而是多輪次的交流。用人的聲音表達(dá)出來,人機(jī)領(lǐng)域的交互還是非常廣泛的。最近十多年來人機(jī)語音交互取得了很大的進(jìn)展,很大程度也受益于 AI 技術(shù)的發(fā)展,特別是這幾年,人機(jī)語音交互逐漸走向成熟。
今天上午演講嘉賓也講到,未來十年是 IoT、AIoT 的時(shí)代,基本上平??吹降?、使用的物件都會聯(lián)網(wǎng)。早上我聽到一個(gè)嘉賓說,平均一個(gè)人有一百多樣?xùn)|西受你控制。那么問題來了,那么多東西受我控制,我怎么控制它?比如說用手機(jī)控制,一百多樣?xùn)|西,我要翻半天,我還不一定找到我想要的東西。所以大家覺得語音是最自然的方式,可以對將來所有要控制的端側(cè)器件控制最最自然的方式進(jìn)行交互。
語音技術(shù)的演進(jìn)和 IoT 時(shí)代的到來,這兩個(gè)正好發(fā)生了有趣的碰撞,某種程度上可以說是一種天作之合,這兩個(gè)技術(shù)必定是未來十年增長的亮點(diǎn),特別是在芯片這塊。呼應(yīng)一下包教授(雷鋒網(wǎng)注:中科院計(jì)算所包云崗)剛才講的,我們也是看到軟件定義芯片時(shí)代的來臨。我們可以看到,AI 的技術(shù)離不開芯片的發(fā)展。
AI 在上世紀(jì)六十年代就已經(jīng)開始提出,期間也經(jīng)歷了幾起幾落。在低潮的時(shí)候,我聽說很多學(xué)校里的學(xué)生、教授都不好意思說自己是做 AI 的,因?yàn)榇蠹矣X得 AI 沒有前途。隨著芯片技術(shù)的發(fā)展,特別是摩爾定律,芯片的 Computing Power 以指數(shù)級的增加挽救了 AI,當(dāng)然 AI 也不斷有新的技術(shù)出來;兩方面同時(shí)的演進(jìn)讓 AI 的技術(shù)逐漸可以開始落地、可以真正的應(yīng)用。
剛才包教授提到了 ICC 的會,我每年也去,我也看到同樣的趨勢。以前在會里唱主角的都是傳統(tǒng)芯片公司,英特爾、TI 等是會上的主角。近幾年,我們看到主角慢慢在轉(zhuǎn)換,除了傳統(tǒng)的芯片公司,一類是包教授說的學(xué)校,另外一類就是互聯(lián)網(wǎng)公司,包括 Google、Microsoft、亞馬遜。隨著 AI 的發(fā)展,不斷有更多軟件、算法公司進(jìn)入芯片行業(yè),為芯片行業(yè)帶來新的活力。
這是思必馳以及深聰對于做芯片的看法。思必馳傳統(tǒng)是一家算法公司,不斷把算法移植到不同的芯片、不同的平臺上,在移植的過程中有很多用起來不方便、不爽的地方。其實(shí)是看到了三個(gè)問題,如果用第三方通用的芯片:
算法不能形成閉環(huán)。有的時(shí)候算法跟芯片之間不能有非常好的默契,要么芯片覺得缺個(gè)角、要么內(nèi)存不夠,或者不得不選擇更加高端的芯片,這樣成本又會升高,會有這樣的問題。
跟 AI 的數(shù)據(jù)不能形成閉環(huán)。如果沒有閉環(huán)就不能形成生態(tài),不利于把這塊蛋糕做大。
市場。芯片公司對于最終的用戶不是直接的用戶,導(dǎo)致對市場的存在以及市場的預(yù)判就會差一點(diǎn)。不像軟件公司、算法公司,因?yàn)槭侵苯涌蛻魰泻芏噙@方面的信息。
這些問題的存在驅(qū)使思必馳決定成立一家公司專門做芯片,這是思必馳和深聰?shù)牟季?。思必馳是語音、算法全鏈路的布局,現(xiàn)在芯片進(jìn)來以后,可以說把整個(gè)產(chǎn)業(yè)鏈全部打通,專注地利用算法做專用的芯片,把算法和芯片融合在一起,同時(shí)為客戶帶來最好的體驗(yàn)和最好的價(jià)值。我們也可以通過定制化的架構(gòu),逐漸取代第三方的通用架構(gòu),后面我也會講到采用專用的架構(gòu)在成本、功耗方面會帶來很大的好處。
前面幾位嘉賓也講到,設(shè)計(jì)芯片隨著代工廠、EDA 工具以及 IP 廠商的存在,現(xiàn)在門檻也在逐漸的降低,所以一旦芯片有好的架構(gòu)、有好的定義,后面的執(zhí)行相對來說難度沒以前那么高。
在行業(yè)里,做芯片一般分為云端和邊緣端側(cè),思必馳選擇的是端側(cè)。這邊有一個(gè)圖,我跟大家講一下,最早大家知道電腦都是共用的計(jì)算資源,后來發(fā)展成為 PC。最近十幾二十年,Mobile Computing 又放到云端,我們可以看到 2020 年之后趨勢又慢慢會移到端側(cè)。雖然大家一直在說云端、公有、共享,但從人的本性來說,這些共有、共享并不屬于人的本性,人還是希望是本地化,公有和共享只是在資源不足情況下的權(quán)宜之計(jì)。
Computing Power 是很珍貴的,不可能個(gè)人擁有,隨著摩爾定律的發(fā)展,可以逐漸發(fā)生改變。后來出現(xiàn)了 Mobile,因?yàn)樗墓╇姟Ⅲw積所限 Computing Power 不夠,會逐漸發(fā)生改變。包教授講到通過軟硬結(jié)合的方法,里面還是有成百上千倍的空間,可以把 Computing Power 提高。端側(cè)的容量大、另外是實(shí)施性好、可靠性強(qiáng),這是我們看好的方向,也是我們做芯片的側(cè)重點(diǎn)。
下面花點(diǎn)時(shí)間講一下我們在這方面的芯片方案。就像前面講到的,我們的芯片不僅是芯片,而是芯片+算法整合的方案。如果你們從我們公司買芯片,不光會買到芯片,里面也會內(nèi)帶思必馳的算法。
從用戶的角度會看到有一個(gè)非常良好的體驗(yàn);如果是語音交互的話,大家會關(guān)注能不能聽得清,有噪聲聽不聽得清,我們的方案在這方面都有非常好的表現(xiàn)。另外是聽不聽得懂,我們有很高的識別率和很快的反應(yīng),一叫它就能有反應(yīng)。在你不希望跟他講話的時(shí)候,他跟你講話,這也是比較嚇人的。
二是比較低的功耗。因?yàn)閼?yīng)用的場景不光是插電的,而且是 mobile 的,所以只有低功耗的芯片、低功耗的方案才能做到。外面的音響做不到低功耗,它是一直插電,摸起來還有點(diǎn)熱,而我們的方案基本上可以做到用電池操作。
三是成本。我們芯片的成本和算法是匹配的,跟通用芯片相比也會有點(diǎn)優(yōu)勢。另外是時(shí)間成本,要開發(fā)具備語音交互的設(shè)備,我們的算法和芯片是集成在一起,不需要到系統(tǒng)上移植,可以比競爭對手更早地上市。
四是實(shí)用性。我們有多種的接口,還可以做很多的擴(kuò)展,這是我們芯片+算法的方案,可以為大家?guī)砹己玫捏w驗(yàn)。我們的目標(biāo)是讓身邊所有的設(shè)備都可以用語音進(jìn)行交互,使用我們的方案就可以達(dá)到這個(gè)目的。
我們做芯片不是短期的趕時(shí)髦,我們也有長遠(yuǎn)的規(guī)劃。我們的第一代芯片量產(chǎn)的同時(shí)也會有下一代、再下一代的規(guī)劃。我們的角度更希望從能力的方面定義我們的芯片和方案。
第一代芯片,解決關(guān)鍵字和指令的識別。比如說你喊一聲你好小樂,打開空調(diào),他會做一些反應(yīng),這是第一代芯片的能力。剛才說到軟硬融合,軟件一直到硬件,某種程度是從左邊到右邊,它是整個(gè)一條鏈路,從最左邊的語音算法開始,算法基本上是一堆共識,下一個(gè)是 C 代碼,下面是芯片架構(gòu),是不是用 DSP,是不是用 ARM 的 CPU。再就是它的物理實(shí)現(xiàn),下面就有基礎(chǔ) IP 存儲、工藝、封裝。第一代芯片主要是實(shí)現(xiàn)關(guān)鍵字和指令的識別,我們的語音融合方式也是比較淺。
第二代芯片,我們要解決本地語音識別、安全特征、聲紋,我們會采取更深度的融合,從算法到基礎(chǔ) IP 都做專門的優(yōu)化,達(dá)到更好的目的。更下一代芯片就是多模態(tài),甚至我們也會考慮用到存儲、工藝、封裝的優(yōu)化。
稍微花點(diǎn)時(shí)間講一下對下面十年的展望,我們會看到什么?一方面是會有一些很美好的想象;另一方面,我們也會看到,AI 各方面的技術(shù)的應(yīng)用場景也并不那么令人愉悅。以前我們假設(shè)科學(xué)技術(shù)的進(jìn)步一定是給人類帶來更美好的生活,現(xiàn)在我們到了這個(gè)十字路口,下面未必是這樣,有可能在一些場景下帶來一些負(fù)面作用。比如說,教室里每個(gè)人都會被監(jiān)控的話,明年可能這家公司會推出一個(gè) APP 將辦公室也會變成可監(jiān)控的;或是后年推出一個(gè)東西,會議室也變成這樣。我想,這不是我們想要的東西。
上個(gè)月國家出臺了新一代人工智能治理原則,希望大家做的時(shí)候關(guān)注這一塊。我們作為研發(fā)者、使用者要有高度的社會責(zé)任和自律意識,大家上下班一天很辛苦,回家的時(shí)候也可以想想我做的事到底讓人類的生活更加美好、更加方便,還是我做的事情騷擾別人,讓別人更難受。最后,還是希望大家多思考,做對的事情,就像父母說“明知道不對的事情不要做”,努力捍衛(wèi)人類的一點(diǎn)尊嚴(yán)。
我就講到這里,謝謝!
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。
本專題其他文章