丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
芯片 正文
發(fā)私信給包永剛
發(fā)送

0

首發(fā) | 全新類別AI芯片量產,清微的可重構芯片將成市場主流?

本文作者: 包永剛 2019-06-27 19:14
導語:本月,清微智能的首款可重構計算架構AI芯片量產,這種被稱為全新類別的AI芯片的技術獨特性在哪?以清微產品為代表的數據流驅動芯片能否成為AI芯片市場的主流?

AI的浪潮讓科技巨頭們也紛紛布局AI芯片,也讓芯片領域再現多年未見的創(chuàng)業(yè)熱潮。不過,摩爾定律的放緩以及經典的馮諾依曼架構瓶頸讓AI芯片的進一步提升面臨挑戰(zhàn),這也在很大程度影響AI的發(fā)展和落地。因此,AI芯片架構的創(chuàng)新對于AI發(fā)展意義重大。

本月,清微智能的首款可重構計算架構AI芯片量產,這種被稱為全新類別的AI芯片的技術獨特性在哪?以清微產品為代表的數據流驅動芯片能否成為AI芯片市場的主流?

首發(fā) | 全新類別AI芯片量產,清微的可重構芯片將成市場主流?

可重構芯片為什么是全新類別?

可重構的概念早在20世紀60年代就被提出,但經過半個多世紀才終于獲得突破。據悉,可重構芯片最早的技術源頭可追溯到20世紀80年代末誕生的高層次綜合理論和方法。2006年,意識到可重構計算架構對于提升芯片算力、降低功耗的巨大優(yōu)勢,魏少軍教授牽頭成立了清華大學可重構計算研究團隊。成立至今的十多年,魏少軍教授一直帶領的團隊進行可重構計算的研發(fā)。

魏少軍教授此前接受雷鋒網采訪時表示,可重構計算架構芯片不屬于CPU、GPU、FPGA、ASIC,它是全新類別芯片。

但是,由于可重構芯片具備軟件、硬件雙編程的特性,無論是在國內還是國外,可重構芯片很多時候被誤解成FPGA。

魏少軍近日撰文詳細介紹了可重構芯片的技術原理,他以軟件和硬件的可編程性兩個軸構建坐標圖說明了可重構芯片的獨特性。第一象限可以歸納為動態(tài)可重構的芯片,有時稱為RCP(Reconfigurable Computing Processor,可重構計算處理器)或CGRA(Coarse grained Reconfigurable Architecture,粗粒度可重構架構)等,其特點是軟件硬件都可以編程、混合粒度、芯片的硬件功能隨軟件的變化而變化,應用改變軟件、軟件再改變硬件。

而且它與CPU等處理器有很多類似的地方,開發(fā)者不需要底層芯片設計知識。這類芯片與ASIC一樣,具備很好的能量效率和計算效率等。顯然,這種芯片的屬性分類與以前不同,不可以將其與FPGA等混為一談。

首發(fā) | 全新類別AI芯片量產,清微的可重構芯片將成市場主流?

動態(tài)可重構芯片的屬性分類

可重構計算架構的優(yōu)勢

清微創(chuàng)始人CEO王博接受雷鋒網采訪時更具體地解釋了這一架構以及相比其他傳統芯片的優(yōu)勢。他表示,CGRA計算架構通過空域硬件結構組織不同粒度和不同功能的計算資源,通過硬件運行時配置,調整硬件功能,根據數據流的特點,讓功能配置好的硬件資源互連形成相對固定的計算通路,從而以接近“專用電路”的方式進行數據驅動下的計算。

首發(fā) | 全新類別AI芯片量產,清微的可重構芯片將成市場主流?

可重構陣列在不同時刻可以配置成為不同的功能,進而進行數據驅動的ASIC計算

當算法和應用變換時,再次通過配置,使硬件重構為不同的計算通路去執(zhí)行。

首發(fā) | 全新類別AI芯片量產,清微的可重構芯片將成市場主流?

可重構陣列的PE在不同時刻可以配置成為不同的功能

王博進一步表示,CGRA最大的優(yōu)勢體現在兩方面,一是沒有傳統指令驅動的計算架構取指和譯碼操作的延時和能耗開銷,二是在計算過程中以接近“專用電路”的方式執(zhí)行。對比來看,CGRA的計算能效平均可達CPU計算架構的1000倍以上、是GPU計算架構的100~1000倍、是FPGA計算架構的100倍以上,相比NPU能夠有10倍以上的性能提升,CGRA基于配置方式執(zhí)行,執(zhí)行效率可以和ASIC相當,但是靈活性遠遠好于ASIC。

此外,CGRA架構算力可以彈性擴展,適用于從云端到邊緣端對高能效和靈活性有綜合要求的場景。

可重構架構優(yōu)勢突出為何今年才量產?

前面已經提到,魏少軍教授早在2006年就牽頭成立了清華大學可重構計算研究團隊。2015年,可重構芯片因為第三次AI熱潮也開始受到關注。2017年6月,清華大學可重構計算研究團隊的第一代人工智能芯片Thinker-Ⅰ推出,并獲2017 ACM/IEEE ISLPED會議設計競賽獎。研究團隊還在ISCA 2018發(fā)表了中國唯一第一作者論文。

到了2018年7月,北京清微智能科技有限公司在在北京中關村注冊成立,基于十多年的技術積累,200多項技術專利,清微智能在不到一年的時間就成功量產了首款可重構芯片TX210,這款語音SoC芯片可以應用于智能手機、可穿戴智能設備、小家電、大家電、玩具、車載等場景。

從2006年清華大學可重構計算研究團隊開始研究,到2015年AI芯片創(chuàng)業(yè)熱潮開啟,為何可重構架構的商用等到了2018年清微智能的成立?王博表示:“我之前一直在做智能硬件相關的產品,2017年,我當時所在公司為一款人臉識別智能門鎖尋找芯片時,發(fā)現市場上根本找不到特別合適的產品,其實當時心里就存下了一個想法——為什么市面上會沒有好用的芯片,困難在什么地方?因為跟清華大學微電子學研究所的尹首一教授也是舊相識,后來藉由種種機會,有過幾次比較深入的溝通,也了解到他們所研究的這項技術對于芯片產業(yè)的意義研究AI芯片,當初的那個想法逐漸成型,并最終和尹老師他們一起在2018年成立清微智能。希望借助清華大學這支團隊十多年的技術積累,結合我在AI領域的商業(yè)落地的經驗,將可重構計算芯片商業(yè)化?!?/p>

顯然,可重構架構芯片的商用化背后很重要的推動力就是眾多電池供電的智能設備對低功耗AI芯片的需求。僅看智能音箱市場,根據市場研究公司Strategy Analytics發(fā)布的報告,2018年第四季度植入AI的智能音箱出貨量從第三季度的2260萬臺增長到3850萬臺,增幅達95%,超過整個2017年的出貨總量。報告還預測,2019年全球AIoT市場規(guī)模為51億美元,到2024年,這一數字將增長至162億美元,復合年增長率為26.0%。

王博順勢從AI芯片的需求方轉變提供方,發(fā)揮可重構芯片的優(yōu)勢。

首發(fā) | 全新類別AI芯片量產,清微的可重構芯片將成市場主流?

清微TX210

量產的可重構芯片究竟如何?

王博指出,清微的可重構芯片主要分為三個維度,從MAC層面支持不同的位寬重構,到執(zhí)行單元層面支持不同算子重構,再到陣列層面支持不同功能重構。因此,清微的可重構芯片既可以是“樂高”層級的可重構,也可以是“面粉”層級的可重構。并且,配置過程運行速度非常快,動態(tài)重構的時間都是在納秒級,在運行的過程中是無縫執(zhí)行,客戶根本感覺不到芯片的架構在實時切換,同時初始的配置也會很快,配置本身開銷很小。

清微智能CTO歐陽鵬也透露,在可重構計算更低能耗和更強靈活性的基礎上,清微在具體的芯片設計上又做了兩方面深化。他表示:“我們的AI芯片支持從1bit-16bit的混合精度計算,同時,不同的神經網絡層可以采用不同的精度表示,可實現實時切換精度。在具體實現過程中,可重構模式動態(tài)重組計算資源和帶寬,根據精度表示,讓計算資源和帶寬接近滿負荷進行計算,從而將混合精度網絡下的計算資源和帶寬的利用率逼近極限,高效支持多種混合精度的神經網絡?!?/p>

“另外一方面,人工智能算法,除了神經網絡中卷積層,全連接層等邏輯,還有非神經網絡計算邏輯。傳統AI芯片架構強調了神經網絡邏輯的計算效率,卻忽視了非神經網絡邏輯的計算效率。清微的AI芯片針對神經網絡部分和非神經網絡均進行了計算效率考慮。針對非神經網絡處理邏輯,從算法數據流圖進行空間映射,以接近ASIC效率計算。同時,通過配置形成不同的電路結構來動態(tài)處理不同非神經網絡計算邏輯,在保證靈活性前提下,計算效率有極大提升?!?歐陽鵬進一步表示。

雷鋒網了解到,具備上述特性的清微TX210采用TSMC40ULP工藝,支持WLCSP和QFN兩種產品封裝,多級喚醒模式也很大程度降低了芯片功耗,工作功耗為mW級,VAD功耗僅uW級。同時,TX210結構靈活,支持多比特DNN神經網絡,可以支持1-16bit位寬的神經網絡計算,也支持FFT/MEL FILTER等。還有一個顯著特點就是用極小的芯片面積支持豐富的接口和電源管理。

首發(fā) | 全新類別AI芯片量產,清微的可重構芯片將成市場主流?

清微TX210 參數

除了硬件,清微也能在算法方面有所布局,采取自研+與科研院所合作的思路。目前清微與中科院、清華大學、喬治理工大學等開展了深入合作。自研方面,清微在算法壓縮,量化以及硬件友好化設計方面有長期的積累。

軟件方面,CGRA軟件開發(fā)平臺兼容通用的TensorFlow/Caffe/MEXNET等AI框架,用戶無需改變他們的編程環(huán)境和習慣,軟件開發(fā)平臺可以自動完成轉換、解析、編譯、生成等過程,給用戶提供友好的開發(fā)支持。

雖然用戶可以實現無縫遷移,但王博還表示:“我們有一套自己的編譯平臺,用戶可以從其它的框架直接遷移到我們芯片里。但我們內部還會做一些包括量化、壓縮等與芯片相關的優(yōu)化工作。”

王博強調,可重構芯片能否達到非常高的能效值,很大一部分決定于軟件、工具鏈優(yōu)化、調度的好壞。

根據清微的說法,采用算法+芯片的協同設計優(yōu)化,TX210在典型信噪比下,喚醒識別率95%,誤識別率小于24小時一次。據悉,TX210正式上市前,清微已與一些大型的互聯網公司,智能手機及家電廠商建立了合作關系。

雷鋒網了解到,除了語音芯片,清微智能在下半年還會發(fā)布面向圖像識別的低功耗視覺芯片,面向智能家居、智能安防和新零售等領域。

王博認為,可重構芯片的商業(yè)化,不僅可以替代現有的產品,還能夠擴展現有產品的應用場景,更好地滿足低功耗AI芯片市場的需求。隨著我們產品在邊緣端的落地,基于CGRA軟硬件工具鏈以及生態(tài)也不斷完善,未來我們也會將CGRA架構算力可擴展、高能效、靈活的優(yōu)勢拓展至云端市場。

據王博介紹,在可重構云端芯片方面,核心團隊在5年前就開始做技術預研和芯片驗證,面向云端人工智能算法的推理、訓練、數據分析、數據庫操作等應用。這些成果有助于清微快速進入對算力、靈活性、功耗以及生態(tài)要求更高的服務器和云計算市場。

數據流AI芯片或成未來主流

不過,目前CPU、GPU、FPGA、ASIC在AI芯片市場激烈競爭,哪一種芯片能夠成為最大的受益者還難以得出結論。可重構計算架構芯片在市場落地中優(yōu)勢如何?王博指出,可重構技術可以很大程度的延長芯片的生命周期。目前終端的AI算法還在不斷演進,應用也非常碎片化。而基于可重計算構架的芯片具有低功耗、靈活、高效的優(yōu)勢,如果有新的神經網絡算法出來,可重構芯片在很長時間內也能支持,并且是以接近ASIC的功耗滿足需求。不需要針對新的應用重新流片,能夠大大節(jié)省成本。

更為重要的是,可重構芯片代表的是采用的是數據驅動下的空域執(zhí)行模式,區(qū)別于CPU、GPU、NPU諾依曼架構的時域計算模式,數據流驅動的芯片從架構上就可以避免了馮諾依曼架構的限制。

首發(fā) | 全新類別AI芯片量產,清微的可重構芯片將成市場主流?

“指令驅動”的時域計算模式 v.s. “數據驅動、動態(tài)重構”的空間計算模式

王博用通俗的方式解釋數據流驅動的芯片,數據流直白的理解就像水流一樣,在流動過程中直接把計算完成,不用等待,非常高效。對比指令驅動的方式,因為它需要取值、譯碼、存在開銷,同時,這種方式使得中間的數據流被不斷打斷,執(zhí)行效率低。

王博認為,數據流驅動的芯片在未來將會在AI以及對算力需求比較大的領域將成為主流。他表示:“因為這些場景需要的是強算力而非強邏輯,數據流驅動芯片特別適合。而之所以可重構芯片和數據流驅動的芯片直到近年來才受到了比較多的關注,可能是因為學界和工業(yè)界的人之前都想讓它去完全替代馮諾依曼架構。但如今AI讓大家回歸理性,認識到計算密集型的場景最適合數據流驅動的芯片,我們也看到現在數據流驅動的芯片業(yè)都是圍繞密集計算?!?/p>

不過,想要真正發(fā)揮可重構架構的優(yōu)勢,讓數據流驅動的芯片成為主流仍需解決一些問題。王博指出,如果理解了可重構的原理,不同的人都可以把各個PE以某種形式連接起來,關鍵是如何連接這些PE能更加靈活,編譯器的設計怎么能更加的提高效率,同時,數據流驅動的芯片同樣需要提升數據訪存效率的問題。清微的優(yōu)勢就在于有清華大學微電子學研究所多年的研究作為基礎,我們的編譯系統非常完善,這是我們的軟件的優(yōu)勢。因此,我們能夠在可重構架構硬件優(yōu)勢的基礎上結合完善的軟件,最大程度發(fā)揮可重構架構芯片的優(yōu)勢。

雷鋒網小結

AI作為一個新的領域,無論是芯片還是算法都區(qū)別于傳統的數字、模擬等芯片,由此帶來的機會也催生了AI芯片的創(chuàng)業(yè)熱潮。在競爭還不夠充分的AI芯片市場,AI芯片的Benchmark發(fā)布不久、AI算法的飛速演進,應用沒有標準,這么多的尚未確定也是AI芯片初創(chuàng)公司的機會所在。

但正如王博接受采訪時所說:“芯片研發(fā)是一個特別需要積累的過程,一款成熟的芯片要考慮功耗、發(fā)熱以及量產等各方面的問題,除了技術的更迭速度,還要經受市場的考驗,用‘十億起步,十年結果‘形容一點不為過?!笔畠|的成本投入以及十年的時間是芯片公司成功的要素,但將技術的獨特性轉換為產品的優(yōu)勢同樣是吸引用戶的關鍵。

作為一種新類別的AI芯片,清微量產的可重構語音芯片能否推動相關應用市場的爆發(fā),我們拭目以待。我們也期待數據流驅動的芯片更好地滿足密集計算場景需求,與馮諾依曼架構芯片一起加速AI的普及。

相關文章:

AI芯片公司清微智能獲億元天使輪融資,可重構計算加速走向產業(yè)化

專訪清微智能尹首一:理想的計算應該是架構隨著軟件變

雷峰網原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知。

分享:
相關文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
立即設置 以后再說