丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
芯片 正文
發(fā)私信給包永剛
發(fā)送

0

首發(fā) | 全新類別AI芯片量產(chǎn),清微的可重構(gòu)芯片將成市場主流?

本文作者: 包永剛 2019-06-27 19:14
導(dǎo)語:本月,清微智能的首款可重構(gòu)計(jì)算架構(gòu)AI芯片量產(chǎn),這種被稱為全新類別的AI芯片的技術(shù)獨(dú)特性在哪?以清微產(chǎn)品為代表的數(shù)據(jù)流驅(qū)動(dòng)芯片能否成為AI芯片市場的主流?

AI的浪潮讓科技巨頭們也紛紛布局AI芯片,也讓芯片領(lǐng)域再現(xiàn)多年未見的創(chuàng)業(yè)熱潮。不過,摩爾定律的放緩以及經(jīng)典的馮諾依曼架構(gòu)瓶頸讓AI芯片的進(jìn)一步提升面臨挑戰(zhàn),這也在很大程度影響AI的發(fā)展和落地。因此,AI芯片架構(gòu)的創(chuàng)新對于AI發(fā)展意義重大。

本月,清微智能的首款可重構(gòu)計(jì)算架構(gòu)AI芯片量產(chǎn),這種被稱為全新類別的AI芯片的技術(shù)獨(dú)特性在哪?以清微產(chǎn)品為代表的數(shù)據(jù)流驅(qū)動(dòng)芯片能否成為AI芯片市場的主流?

首發(fā) | 全新類別AI芯片量產(chǎn),清微的可重構(gòu)芯片將成市場主流?

可重構(gòu)芯片為什么是全新類別?

可重構(gòu)的概念早在20世紀(jì)60年代就被提出,但經(jīng)過半個(gè)多世紀(jì)才終于獲得突破。據(jù)悉,可重構(gòu)芯片最早的技術(shù)源頭可追溯到20世紀(jì)80年代末誕生的高層次綜合理論和方法。2006年,意識(shí)到可重構(gòu)計(jì)算架構(gòu)對于提升芯片算力、降低功耗的巨大優(yōu)勢,魏少軍教授牽頭成立了清華大學(xué)可重構(gòu)計(jì)算研究團(tuán)隊(duì)。成立至今的十多年,魏少軍教授一直帶領(lǐng)的團(tuán)隊(duì)進(jìn)行可重構(gòu)計(jì)算的研發(fā)。

魏少軍教授此前接受雷鋒網(wǎng)采訪時(shí)表示,可重構(gòu)計(jì)算架構(gòu)芯片不屬于CPU、GPU、FPGA、ASIC,它是全新類別芯片。

但是,由于可重構(gòu)芯片具備軟件、硬件雙編程的特性,無論是在國內(nèi)還是國外,可重構(gòu)芯片很多時(shí)候被誤解成FPGA。

魏少軍近日撰文詳細(xì)介紹了可重構(gòu)芯片的技術(shù)原理,他以軟件和硬件的可編程性兩個(gè)軸構(gòu)建坐標(biāo)圖說明了可重構(gòu)芯片的獨(dú)特性。第一象限可以歸納為動(dòng)態(tài)可重構(gòu)的芯片,有時(shí)稱為RCP(Reconfigurable Computing Processor,可重構(gòu)計(jì)算處理器)或CGRA(Coarse grained Reconfigurable Architecture,粗粒度可重構(gòu)架構(gòu))等,其特點(diǎn)是軟件硬件都可以編程、混合粒度、芯片的硬件功能隨軟件的變化而變化,應(yīng)用改變軟件、軟件再改變硬件。

而且它與CPU等處理器有很多類似的地方,開發(fā)者不需要底層芯片設(shè)計(jì)知識(shí)。這類芯片與ASIC一樣,具備很好的能量效率和計(jì)算效率等。顯然,這種芯片的屬性分類與以前不同,不可以將其與FPGA等混為一談。

首發(fā) | 全新類別AI芯片量產(chǎn),清微的可重構(gòu)芯片將成市場主流?

動(dòng)態(tài)可重構(gòu)芯片的屬性分類

可重構(gòu)計(jì)算架構(gòu)的優(yōu)勢

清微創(chuàng)始人CEO王博接受雷鋒網(wǎng)采訪時(shí)更具體地解釋了這一架構(gòu)以及相比其他傳統(tǒng)芯片的優(yōu)勢。他表示,CGRA計(jì)算架構(gòu)通過空域硬件結(jié)構(gòu)組織不同粒度和不同功能的計(jì)算資源,通過硬件運(yùn)行時(shí)配置,調(diào)整硬件功能,根據(jù)數(shù)據(jù)流的特點(diǎn),讓功能配置好的硬件資源互連形成相對固定的計(jì)算通路,從而以接近“專用電路”的方式進(jìn)行數(shù)據(jù)驅(qū)動(dòng)下的計(jì)算。

首發(fā) | 全新類別AI芯片量產(chǎn),清微的可重構(gòu)芯片將成市場主流?

可重構(gòu)陣列在不同時(shí)刻可以配置成為不同的功能,進(jìn)而進(jìn)行數(shù)據(jù)驅(qū)動(dòng)的ASIC計(jì)算

當(dāng)算法和應(yīng)用變換時(shí),再次通過配置,使硬件重構(gòu)為不同的計(jì)算通路去執(zhí)行。

首發(fā) | 全新類別AI芯片量產(chǎn),清微的可重構(gòu)芯片將成市場主流?

可重構(gòu)陣列的PE在不同時(shí)刻可以配置成為不同的功能

王博進(jìn)一步表示,CGRA最大的優(yōu)勢體現(xiàn)在兩方面,一是沒有傳統(tǒng)指令驅(qū)動(dòng)的計(jì)算架構(gòu)取指和譯碼操作的延時(shí)和能耗開銷,二是在計(jì)算過程中以接近“專用電路”的方式執(zhí)行。對比來看,CGRA的計(jì)算能效平均可達(dá)CPU計(jì)算架構(gòu)的1000倍以上、是GPU計(jì)算架構(gòu)的100~1000倍、是FPGA計(jì)算架構(gòu)的100倍以上,相比NPU能夠有10倍以上的性能提升,CGRA基于配置方式執(zhí)行,執(zhí)行效率可以和ASIC相當(dāng),但是靈活性遠(yuǎn)遠(yuǎn)好于ASIC。

此外,CGRA架構(gòu)算力可以彈性擴(kuò)展,適用于從云端到邊緣端對高能效和靈活性有綜合要求的場景。

可重構(gòu)架構(gòu)優(yōu)勢突出為何今年才量產(chǎn)?

前面已經(jīng)提到,魏少軍教授早在2006年就牽頭成立了清華大學(xué)可重構(gòu)計(jì)算研究團(tuán)隊(duì)。2015年,可重構(gòu)芯片因?yàn)榈谌蜛I熱潮也開始受到關(guān)注。2017年6月,清華大學(xué)可重構(gòu)計(jì)算研究團(tuán)隊(duì)的第一代人工智能芯片Thinker-Ⅰ推出,并獲2017 ACM/IEEE ISLPED會(huì)議設(shè)計(jì)競賽獎(jiǎng)。研究團(tuán)隊(duì)還在ISCA 2018發(fā)表了中國唯一第一作者論文。

到了2018年7月,北京清微智能科技有限公司在在北京中關(guān)村注冊成立,基于十多年的技術(shù)積累,200多項(xiàng)技術(shù)專利,清微智能在不到一年的時(shí)間就成功量產(chǎn)了首款可重構(gòu)芯片TX210,這款語音SoC芯片可以應(yīng)用于智能手機(jī)、可穿戴智能設(shè)備、小家電、大家電、玩具、車載等場景。

從2006年清華大學(xué)可重構(gòu)計(jì)算研究團(tuán)隊(duì)開始研究,到2015年AI芯片創(chuàng)業(yè)熱潮開啟,為何可重構(gòu)架構(gòu)的商用等到了2018年清微智能的成立?王博表示:“我之前一直在做智能硬件相關(guān)的產(chǎn)品,2017年,我當(dāng)時(shí)所在公司為一款人臉識(shí)別智能門鎖尋找芯片時(shí),發(fā)現(xiàn)市場上根本找不到特別合適的產(chǎn)品,其實(shí)當(dāng)時(shí)心里就存下了一個(gè)想法——為什么市面上會(huì)沒有好用的芯片,困難在什么地方?因?yàn)楦迦A大學(xué)微電子學(xué)研究所的尹首一教授也是舊相識(shí),后來藉由種種機(jī)會(huì),有過幾次比較深入的溝通,也了解到他們所研究的這項(xiàng)技術(shù)對于芯片產(chǎn)業(yè)的意義研究AI芯片,當(dāng)初的那個(gè)想法逐漸成型,并最終和尹老師他們一起在2018年成立清微智能。希望借助清華大學(xué)這支團(tuán)隊(duì)十多年的技術(shù)積累,結(jié)合我在AI領(lǐng)域的商業(yè)落地的經(jīng)驗(yàn),將可重構(gòu)計(jì)算芯片商業(yè)化?!?/p>

顯然,可重構(gòu)架構(gòu)芯片的商用化背后很重要的推動(dòng)力就是眾多電池供電的智能設(shè)備對低功耗AI芯片的需求。僅看智能音箱市場,根據(jù)市場研究公司Strategy Analytics發(fā)布的報(bào)告,2018年第四季度植入AI的智能音箱出貨量從第三季度的2260萬臺(tái)增長到3850萬臺(tái),增幅達(dá)95%,超過整個(gè)2017年的出貨總量。報(bào)告還預(yù)測,2019年全球AIoT市場規(guī)模為51億美元,到2024年,這一數(shù)字將增長至162億美元,復(fù)合年增長率為26.0%。

王博順勢從AI芯片的需求方轉(zhuǎn)變提供方,發(fā)揮可重構(gòu)芯片的優(yōu)勢。

首發(fā) | 全新類別AI芯片量產(chǎn),清微的可重構(gòu)芯片將成市場主流?

清微TX210

量產(chǎn)的可重構(gòu)芯片究竟如何?

王博指出,清微的可重構(gòu)芯片主要分為三個(gè)維度,從MAC層面支持不同的位寬重構(gòu),到執(zhí)行單元層面支持不同算子重構(gòu),再到陣列層面支持不同功能重構(gòu)。因此,清微的可重構(gòu)芯片既可以是“樂高”層級的可重構(gòu),也可以是“面粉”層級的可重構(gòu)。并且,配置過程運(yùn)行速度非??欤瑒?dòng)態(tài)重構(gòu)的時(shí)間都是在納秒級,在運(yùn)行的過程中是無縫執(zhí)行,客戶根本感覺不到芯片的架構(gòu)在實(shí)時(shí)切換,同時(shí)初始的配置也會(huì)很快,配置本身開銷很小。

清微智能CTO歐陽鵬也透露,在可重構(gòu)計(jì)算更低能耗和更強(qiáng)靈活性的基礎(chǔ)上,清微在具體的芯片設(shè)計(jì)上又做了兩方面深化。他表示:“我們的AI芯片支持從1bit-16bit的混合精度計(jì)算,同時(shí),不同的神經(jīng)網(wǎng)絡(luò)層可以采用不同的精度表示,可實(shí)現(xiàn)實(shí)時(shí)切換精度。在具體實(shí)現(xiàn)過程中,可重構(gòu)模式動(dòng)態(tài)重組計(jì)算資源和帶寬,根據(jù)精度表示,讓計(jì)算資源和帶寬接近滿負(fù)荷進(jìn)行計(jì)算,從而將混合精度網(wǎng)絡(luò)下的計(jì)算資源和帶寬的利用率逼近極限,高效支持多種混合精度的神經(jīng)網(wǎng)絡(luò)?!?/p>

“另外一方面,人工智能算法,除了神經(jīng)網(wǎng)絡(luò)中卷積層,全連接層等邏輯,還有非神經(jīng)網(wǎng)絡(luò)計(jì)算邏輯。傳統(tǒng)AI芯片架構(gòu)強(qiáng)調(diào)了神經(jīng)網(wǎng)絡(luò)邏輯的計(jì)算效率,卻忽視了非神經(jīng)網(wǎng)絡(luò)邏輯的計(jì)算效率。清微的AI芯片針對神經(jīng)網(wǎng)絡(luò)部分和非神經(jīng)網(wǎng)絡(luò)均進(jìn)行了計(jì)算效率考慮。針對非神經(jīng)網(wǎng)絡(luò)處理邏輯,從算法數(shù)據(jù)流圖進(jìn)行空間映射,以接近ASIC效率計(jì)算。同時(shí),通過配置形成不同的電路結(jié)構(gòu)來動(dòng)態(tài)處理不同非神經(jīng)網(wǎng)絡(luò)計(jì)算邏輯,在保證靈活性前提下,計(jì)算效率有極大提升?!?歐陽鵬進(jìn)一步表示。

雷鋒網(wǎng)了解到,具備上述特性的清微TX210采用TSMC40ULP工藝,支持WLCSP和QFN兩種產(chǎn)品封裝,多級喚醒模式也很大程度降低了芯片功耗,工作功耗為mW級,VAD功耗僅uW級。同時(shí),TX210結(jié)構(gòu)靈活,支持多比特DNN神經(jīng)網(wǎng)絡(luò),可以支持1-16bit位寬的神經(jīng)網(wǎng)絡(luò)計(jì)算,也支持FFT/MEL FILTER等。還有一個(gè)顯著特點(diǎn)就是用極小的芯片面積支持豐富的接口和電源管理。

首發(fā) | 全新類別AI芯片量產(chǎn),清微的可重構(gòu)芯片將成市場主流?

清微TX210 參數(shù)

除了硬件,清微也能在算法方面有所布局,采取自研+與科研院所合作的思路。目前清微與中科院、清華大學(xué)、喬治理工大學(xué)等開展了深入合作。自研方面,清微在算法壓縮,量化以及硬件友好化設(shè)計(jì)方面有長期的積累。

軟件方面,CGRA軟件開發(fā)平臺(tái)兼容通用的TensorFlow/Caffe/MEXNET等AI框架,用戶無需改變他們的編程環(huán)境和習(xí)慣,軟件開發(fā)平臺(tái)可以自動(dòng)完成轉(zhuǎn)換、解析、編譯、生成等過程,給用戶提供友好的開發(fā)支持。

雖然用戶可以實(shí)現(xiàn)無縫遷移,但王博還表示:“我們有一套自己的編譯平臺(tái),用戶可以從其它的框架直接遷移到我們芯片里。但我們內(nèi)部還會(huì)做一些包括量化、壓縮等與芯片相關(guān)的優(yōu)化工作?!?/p>

王博強(qiáng)調(diào),可重構(gòu)芯片能否達(dá)到非常高的能效值,很大一部分決定于軟件、工具鏈優(yōu)化、調(diào)度的好壞。

根據(jù)清微的說法,采用算法+芯片的協(xié)同設(shè)計(jì)優(yōu)化,TX210在典型信噪比下,喚醒識(shí)別率95%,誤識(shí)別率小于24小時(shí)一次。據(jù)悉,TX210正式上市前,清微已與一些大型的互聯(lián)網(wǎng)公司,智能手機(jī)及家電廠商建立了合作關(guān)系。

雷鋒網(wǎng)了解到,除了語音芯片,清微智能在下半年還會(huì)發(fā)布面向圖像識(shí)別的低功耗視覺芯片,面向智能家居、智能安防和新零售等領(lǐng)域。

王博認(rèn)為,可重構(gòu)芯片的商業(yè)化,不僅可以替代現(xiàn)有的產(chǎn)品,還能夠擴(kuò)展現(xiàn)有產(chǎn)品的應(yīng)用場景,更好地滿足低功耗AI芯片市場的需求。隨著我們產(chǎn)品在邊緣端的落地,基于CGRA軟硬件工具鏈以及生態(tài)也不斷完善,未來我們也會(huì)將CGRA架構(gòu)算力可擴(kuò)展、高能效、靈活的優(yōu)勢拓展至云端市場。

據(jù)王博介紹,在可重構(gòu)云端芯片方面,核心團(tuán)隊(duì)在5年前就開始做技術(shù)預(yù)研和芯片驗(yàn)證,面向云端人工智能算法的推理、訓(xùn)練、數(shù)據(jù)分析、數(shù)據(jù)庫操作等應(yīng)用。這些成果有助于清微快速進(jìn)入對算力、靈活性、功耗以及生態(tài)要求更高的服務(wù)器和云計(jì)算市場。

數(shù)據(jù)流AI芯片或成未來主流

不過,目前CPU、GPU、FPGA、ASIC在AI芯片市場激烈競爭,哪一種芯片能夠成為最大的受益者還難以得出結(jié)論??芍貥?gòu)計(jì)算架構(gòu)芯片在市場落地中優(yōu)勢如何?王博指出,可重構(gòu)技術(shù)可以很大程度的延長芯片的生命周期。目前終端的AI算法還在不斷演進(jìn),應(yīng)用也非常碎片化。而基于可重計(jì)算構(gòu)架的芯片具有低功耗、靈活、高效的優(yōu)勢,如果有新的神經(jīng)網(wǎng)絡(luò)算法出來,可重構(gòu)芯片在很長時(shí)間內(nèi)也能支持,并且是以接近ASIC的功耗滿足需求。不需要針對新的應(yīng)用重新流片,能夠大大節(jié)省成本。

更為重要的是,可重構(gòu)芯片代表的是采用的是數(shù)據(jù)驅(qū)動(dòng)下的空域執(zhí)行模式,區(qū)別于CPU、GPU、NPU諾依曼架構(gòu)的時(shí)域計(jì)算模式,數(shù)據(jù)流驅(qū)動(dòng)的芯片從架構(gòu)上就可以避免了馮諾依曼架構(gòu)的限制。

首發(fā) | 全新類別AI芯片量產(chǎn),清微的可重構(gòu)芯片將成市場主流?

“指令驅(qū)動(dòng)”的時(shí)域計(jì)算模式 v.s. “數(shù)據(jù)驅(qū)動(dòng)、動(dòng)態(tài)重構(gòu)”的空間計(jì)算模式

王博用通俗的方式解釋數(shù)據(jù)流驅(qū)動(dòng)的芯片,數(shù)據(jù)流直白的理解就像水流一樣,在流動(dòng)過程中直接把計(jì)算完成,不用等待,非常高效。對比指令驅(qū)動(dòng)的方式,因?yàn)樗枰≈?、譯碼、存在開銷,同時(shí),這種方式使得中間的數(shù)據(jù)流被不斷打斷,執(zhí)行效率低。

王博認(rèn)為,數(shù)據(jù)流驅(qū)動(dòng)的芯片在未來將會(huì)在AI以及對算力需求比較大的領(lǐng)域?qū)⒊蔀橹髁鳌?/strong>他表示:“因?yàn)檫@些場景需要的是強(qiáng)算力而非強(qiáng)邏輯,數(shù)據(jù)流驅(qū)動(dòng)芯片特別適合。而之所以可重構(gòu)芯片和數(shù)據(jù)流驅(qū)動(dòng)的芯片直到近年來才受到了比較多的關(guān)注,可能是因?yàn)閷W(xué)界和工業(yè)界的人之前都想讓它去完全替代馮諾依曼架構(gòu)。但如今AI讓大家回歸理性,認(rèn)識(shí)到計(jì)算密集型的場景最適合數(shù)據(jù)流驅(qū)動(dòng)的芯片,我們也看到現(xiàn)在數(shù)據(jù)流驅(qū)動(dòng)的芯片業(yè)都是圍繞密集計(jì)算?!?/p>

不過,想要真正發(fā)揮可重構(gòu)架構(gòu)的優(yōu)勢,讓數(shù)據(jù)流驅(qū)動(dòng)的芯片成為主流仍需解決一些問題。王博指出,如果理解了可重構(gòu)的原理,不同的人都可以把各個(gè)PE以某種形式連接起來,關(guān)鍵是如何連接這些PE能更加靈活,編譯器的設(shè)計(jì)怎么能更加的提高效率,同時(shí),數(shù)據(jù)流驅(qū)動(dòng)的芯片同樣需要提升數(shù)據(jù)訪存效率的問題。清微的優(yōu)勢就在于有清華大學(xué)微電子學(xué)研究所多年的研究作為基礎(chǔ),我們的編譯系統(tǒng)非常完善,這是我們的軟件的優(yōu)勢。因此,我們能夠在可重構(gòu)架構(gòu)硬件優(yōu)勢的基礎(chǔ)上結(jié)合完善的軟件,最大程度發(fā)揮可重構(gòu)架構(gòu)芯片的優(yōu)勢。

雷鋒網(wǎng)小結(jié)

AI作為一個(gè)新的領(lǐng)域,無論是芯片還是算法都區(qū)別于傳統(tǒng)的數(shù)字、模擬等芯片,由此帶來的機(jī)會(huì)也催生了AI芯片的創(chuàng)業(yè)熱潮。在競爭還不夠充分的AI芯片市場,AI芯片的Benchmark發(fā)布不久、AI算法的飛速演進(jìn),應(yīng)用沒有標(biāo)準(zhǔn),這么多的尚未確定也是AI芯片初創(chuàng)公司的機(jī)會(huì)所在。

但正如王博接受采訪時(shí)所說:“芯片研發(fā)是一個(gè)特別需要積累的過程,一款成熟的芯片要考慮功耗、發(fā)熱以及量產(chǎn)等各方面的問題,除了技術(shù)的更迭速度,還要經(jīng)受市場的考驗(yàn),用‘十億起步,十年結(jié)果‘形容一點(diǎn)不為過?!笔畠|的成本投入以及十年的時(shí)間是芯片公司成功的要素,但將技術(shù)的獨(dú)特性轉(zhuǎn)換為產(chǎn)品的優(yōu)勢同樣是吸引用戶的關(guān)鍵。

作為一種新類別的AI芯片,清微量產(chǎn)的可重構(gòu)語音芯片能否推動(dòng)相關(guān)應(yīng)用市場的爆發(fā),我們拭目以待。我們也期待數(shù)據(jù)流驅(qū)動(dòng)的芯片更好地滿足密集計(jì)算場景需求,與馮諾依曼架構(gòu)芯片一起加速AI的普及。

相關(guān)文章:

AI芯片公司清微智能獲億元天使輪融資,可重構(gòu)計(jì)算加速走向產(chǎn)業(yè)化

專訪清微智能尹首一:理想的計(jì)算應(yīng)該是架構(gòu)隨著軟件變

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

分享:
相關(guān)文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個(gè)人簡介
為了您的賬戶安全,請驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請驗(yàn)證您的郵箱
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄