0
11 月 6 日,全球 AI 芯片領(lǐng)域的第一家獨角獸創(chuàng)業(yè)公司寒武紀召開了該公司成立以來的首場發(fā)布會,這次發(fā)布會的主題是“智能時代的引領(lǐng)者”,可以看到寒武紀的自我定位。
在本次發(fā)布會上,寒武紀 CEO 陳天石介紹了三款全新的智能處理器 IP 終端產(chǎn)品:面向低功耗場景視覺應(yīng)用的寒武紀 1H8、擁有更廣泛通用性和更高性能的寒武紀 1H16 和面向智能駕駛領(lǐng)域的 1M。
據(jù)雷鋒網(wǎng)了解,寒武紀早在 2016 年就發(fā)布了全球首款深度學習專用處理器——寒武紀 1A 處理器。它是國際上首個商用深度學習處理器產(chǎn)品,能夠集成到終端 SoC 芯片,每秒可處理 160 億個虛擬神經(jīng)元,每秒峰值運算能力達 2 萬億虛擬突觸;在人工智能應(yīng)用上達到了四核 CPU 25 倍以上的性能和 50 倍以上的能效。
這款處理器被用于華為麒麟 970 手機芯片中。根據(jù)華為官方給出的 4 個比例,它擁有極佳的功耗表現(xiàn):其性能 6.25 倍于 CPU、4 倍于 GPU;NPU 的效能 50 倍于 CPU、6.25 倍于 GPU。不僅如此,這款處理器在應(yīng)用場景中表現(xiàn)也非常出色,在用 NPU 識別 1000 張圖片的過程中,NPU 的整體功耗只在 0.3-0.7W 之間浮動,實際的電池消耗僅為 0.19%(4000mAh 電池)。換句話說:如果電量充足,NPU 完全可以利用一塊電池實現(xiàn) 50W 張照片的識別。
陳天石表示,與寒武紀 1A 相比,三款新品在功耗、能效比、成本開銷方面進行了優(yōu)化,性能消耗比再次實現(xiàn)飛躍式的提升,適用范圍覆蓋了圖像識別、安防監(jiān)控、智能駕駛、無人機、語音識別、自然語言處理等各個重點應(yīng)用領(lǐng)域。
除了面向終端的智能處理器 IP 系列,寒武紀還發(fā)布面向云端的高性能智能處理器產(chǎn)品線;而在本次發(fā)布會上首先亮相的是將在 2018 年發(fā)布寒武紀 MLU 100 和寒武紀 MLU 200,這兩款芯片主要應(yīng)用于服務(wù)器端的智能處理需求,分別偏重于推理和訓練兩個用途。
據(jù)雷鋒網(wǎng)了解,2017 年 10 月 24 日,在中科曙光 2017 智能峰會上,曙光公司專門為人工智能市場開發(fā)、設(shè)計的專用服務(wù)器 “Phaneron”就搭載了寒武紀的產(chǎn)品。Phaneron 主要的業(yè)務(wù)場景是面向深度學習的在線推理業(yè)務(wù)環(huán)境,它用到的就是寒武紀的高性能處理芯片。
此外,為了區(qū)別于之前的神經(jīng)網(wǎng)絡(luò)處理器(NPU),寒武紀將云端芯片產(chǎn)品線命名為機器學習處理器(MLU);這就意味著寒武紀未來將支持多樣化的機器學習應(yīng)用,而非僅僅是深度學習。
當下,軟硬件結(jié)合已經(jīng)成為人工智能芯片領(lǐng)域的發(fā)展趨勢;而寒武紀也不出意外地發(fā)布了一款專門為開發(fā)者打造的寒武紀人工智能軟件平臺 Cambricon NeuWare,該平臺支持 TensorFlow、Caffe、MXNet 等多種主流機器學習框架。
該軟件平臺包含開發(fā)、調(diào)試和調(diào)優(yōu)三大部分,可以同時支持云端和終端的智能處理。雷鋒網(wǎng)了解到,該軟件平臺構(gòu)建在寒武紀發(fā)明的人工智能專用指令集支撐之上;由此,寒武紀擁有了一個軟硬件結(jié)合的平臺,形成了一個完整的基于底層指令集的生態(tài),可以方便開發(fā)者進行跨平臺應(yīng)用遷移,能夠為云和端一體的人工智能處理打下基礎(chǔ)。
在發(fā)布會上,來自華為海思、阿里巴巴、聯(lián)想、科大訊飛、中科曙光、ARM、曠視科技、地平線等人工智能領(lǐng)域的合作伙伴也一同參與,并對智能產(chǎn)品的發(fā)展進行了交流。其中聯(lián)想高級副總裁賀志強在會場表示,聯(lián)想已經(jīng)在與寒武紀進行合作,探討將寒武紀的 IP 芯片用于智能手機前置攝像頭識別的可能性。
在發(fā)布會上,寒武紀 CEO 陳天石表示,寒武紀將力爭在 3 年之后占有中國高性能智能芯片市場 30% 的份額,并使得全世界 10 億臺以上的智能終端設(shè)備集成寒武紀終端智能處理器;如果這兩個目標能夠?qū)崿F(xiàn),寒武紀將“初步支撐起中國主導的國際智能產(chǎn)業(yè)生態(tài)”。
另外,陳天石還表示,未來人工智能方法將在視覺、語音、自然語言、數(shù)據(jù)分析、經(jīng)濟金融等各位應(yīng)用方面大顯身手,這就要求未來超級計算機、數(shù)據(jù)中心、智能手機、嵌入式設(shè)備等要進一步智能化,而寒武紀機器學習處理器有望成為這些設(shè)備的標配。
從陳天石這番話,我們能夠看出寒武紀的野心。實際上,經(jīng)歷了數(shù)輪融資之后,寒武紀在財務(wù)實力上也支撐得起這樣的野心。
寒武紀在成立之初獲得來自中科院的數(shù)千萬元天使輪融資,之后在 2016 年 8 月獲得來自元禾原點、科大訊飛、涌鏵投資的 Pre-A 輪融資。今年 8 月 18 日,寒武紀科技宣布完成 A 輪 1 億美元融資;領(lǐng)投方為國投創(chuàng)業(yè),阿里巴巴、聯(lián)想、國科投資、中科圖靈加入,原 Pre-A 輪投資方,元禾原點創(chuàng)投、涌鏵投資繼續(xù)跟投。在 A 輪融資完成之后,寒武紀的估值超過 10 億美元,正式成為全球 AI 芯片領(lǐng)域的第一家獨角獸創(chuàng)業(yè)公司。
陳天石此前接受雷鋒網(wǎng)獨家專訪時表示,“隨著社會逐漸從信息時代過渡到智能時代,AI芯片將是支撐智能計算不可或缺的載體。復(fù)雜的深度學習網(wǎng)絡(luò)計算需求很高,這就需要有更多更強大的計算資源。”
GPU 是目前主流的AI計算平臺,但是其基本框架結(jié)構(gòu)畢竟不是為了 AI 所設(shè)計的,效率受到很多限制。FPGA 雖然迭代快,可以再短期內(nèi)滿足一定的計算需求,但從計算速度和能耗比來說,和專用的 AI 芯片還是有差距的。目前還有很多公司和高校也在引用跟蹤我們前期的成果,研制深度學習專用的 ASIC(比如谷歌 TPU)。
理想中的 AI 芯片應(yīng)當是一種新型的處理器,能具有廣闊的應(yīng)用面(包括語音、語義、圖像、視頻、自然語言多模態(tài)處理能力),同時具備遠超 CPU 和 GPU 的效率。要想達到這一目標,必須要有一套新的 AI 指令集,利用指令進行靈活處理,才有可能在 AI 芯片上把各種算法應(yīng)用都能支持得又快又好。我們?nèi)ツ晏岢隽藝H上首個 AI 指令集,就是朝這個方向的努力。
對于中國在 AI 芯片領(lǐng)域的未來發(fā)展機會,陳天石也表示,
其實芯片的成敗,除了本身的效率之外,生態(tài)是非常關(guān)鍵的環(huán)節(jié)。過去信息產(chǎn)業(yè),軟硬件生態(tài)都是建立在 ARM 和 x86 指令集之上的。不遵從這些英美的指令集,芯片做得再好,沒有配套應(yīng)用和軟件,也很難在市場上獲得成功。而未來的智能時代,可能格局會發(fā)生巨大變化,會出現(xiàn)新的AI生態(tài)。
中國有最大的 AI 市場,也由寒武紀等一批公司和院校有好的技術(shù),完全有可能影響國際 AI 生態(tài)發(fā)展。這里面的核心還是 AI 指令集。沒有 AI 指令集,AI 芯片應(yīng)當如何規(guī)范化設(shè)計,AI 軟件如何和底層硬件交互,都是無根之木。這也是為什么我們提出了國際上首個 AI 指令集。
如果從國家硬實力發(fā)展角度看,應(yīng)當對業(yè)界進行引導和規(guī)范,把國產(chǎn) AI 指令集樹立為產(chǎn)業(yè)的標準。只要國產(chǎn) AI 指令集立住了,中國主導世界 AI 產(chǎn)業(yè)的機會可能就到來了。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。