0
本文作者: 奕欣 | 2018-06-27 10:29 |
雷鋒網(wǎng) AI 科技評論消息,6 月 18 日至 22 日,2018 國際超大規(guī)模集成電路研討會(2018 Symposia on VLSI Technology and Circuits,簡稱 VLSI)在美國檀香山召開。雷鋒網(wǎng)了解到,VLSI 國際研討會始于 1987 年,是全球先進(jìn)半導(dǎo)體與集成電路領(lǐng)域的頂級會議,與 ISSCC 和 IEDM 并稱微電子技術(shù)領(lǐng)域的「奧林匹克盛會」。
清華大學(xué) Thinker 團(tuán)隊在此次會議上發(fā)表了兩款極低功耗 AI 芯片(Thinker-II 和 Thinker-S)的相關(guān)論文,分別在「機器學(xué)習(xí)處理器」分會場(C4)和「機器人與機器學(xué)習(xí)應(yīng)用」分會場(C13)進(jìn)行了報告。此外,Thinker-S 芯片受邀在大會的 DEMO Session 進(jìn)行了現(xiàn)場演示。論文作者包括:尹首一,歐陽鵬,楊建勛、鄭時軒、陸天翼、宋丹丹、李秀冬、劉雷波、魏少軍等。
Shouyi Yin, Peng Ouyang, Jianxun Yang, Tianyi Lu, Xiudong Li, Leibo Liu, Shaojun Wei, An ultra-high energy-efficient reconfigurable processor for deep neural networks with binary/ternary weights in 28nm CMOS, Symposia on VLSI Technology and Circuits, Honolulu, USA, 2018.
Thinker-II 芯片報告現(xiàn)場
Shouyi Yin, Peng Ouyang, Shixuan Zheng, Dandan Song, Xiudong Li, Leibo Liu, Shaojun Wei, A 141 uW, 2.46 pJ/Neuron Binarized Convolutional Neural Network based Self-learning Speech Recognition Processor in 28nm CMOS, Symposia on VLSI Technology and Circuits, Honolulu, USA, 2018.
Thinker-S 芯片報告現(xiàn)場
近年來,深度學(xué)習(xí)的突破性發(fā)展帶動了機器視覺、語音識別以及自然語言處理等領(lǐng)域的進(jìn)步,引起了學(xué)術(shù)界和工業(yè)界極大的開發(fā)熱情和研究興趣。然而,由于深度神經(jīng)網(wǎng)絡(luò)巨大的存儲開銷和計算需求,功耗成為 Deploy AI Everywhere 的主要障礙,人工智能算法在移動設(shè)備、可穿戴設(shè)備和 IoT 設(shè)備中的廣泛應(yīng)用受到了制約。
為克服上述瓶頸,清華大學(xué) Thinker 團(tuán)隊對神經(jīng)網(wǎng)絡(luò)低位寬量化方法、計算架構(gòu)和電路實現(xiàn)進(jìn)行了系統(tǒng)研究,提出了支持低位寬網(wǎng)絡(luò)高能效計算的可重構(gòu)架構(gòu),設(shè)計了神經(jīng)網(wǎng)絡(luò)通用計算芯片 Thinker-II 和語音識別芯片 Thinker-S。Thinker-II 芯片運行在 200MHz 時,其功耗僅為 10 毫瓦;Thinker-S 芯片的最低功耗達(dá)到 141 微瓦,其峰值能效達(dá)到 90TOPs/W。這兩款芯片有望在電池供電設(shè)備和自供能 IoT 設(shè)備中廣泛應(yīng)用。
Thinker-Ⅱ芯片中設(shè)計了兩種二值/三值卷積優(yōu)化計算方法及硬件架構(gòu),大幅降低了算法復(fù)雜度、有效去除了冗余計算。此外,針對由稀疏化帶來的負(fù)載不均衡問題,設(shè)計了層次化均衡調(diào)度機制,通過軟硬件協(xié)同的兩級任務(wù)調(diào)度,有效提升了資源利用率。Thinker-II 芯片采用 28nm 工藝,通過架構(gòu)和電路級重構(gòu),支持神經(jīng)網(wǎng)絡(luò)通用計算。
Thinker-II 芯片總體架構(gòu)
Thinker-S 芯片中設(shè)計了一種基于二值卷積神經(jīng)網(wǎng)絡(luò)和用戶自適應(yīng)的語音識別框架,同時利用語音信號處理的特點,提出了時域數(shù)據(jù)復(fù)用、近似計算和權(quán)值規(guī)整化等優(yōu)化技術(shù),大幅度優(yōu)化了神經(jīng)網(wǎng)絡(luò)推理計算。Thinker-S 芯片采用 28nm 工藝,單次推理計算中每個神經(jīng)元上消耗的能量最低僅為 2.46 皮焦。
Thinker-S 芯片總體架構(gòu)
Thinker-II 演示系統(tǒng)
Thinker-S 在 VLSI 2018 大會現(xiàn)場演示
清華大學(xué) Thinker 團(tuán)隊近年來設(shè)計了 Thinker 系列人工智能芯片,相關(guān)成果相繼發(fā)表在 VLSI Symposia、ISCA、IEEE JSSC 等頂尖學(xué)術(shù)會議和期刊上,受到了學(xué)術(shù)界和工業(yè)界的廣泛關(guān)注。此次的研究成果,專注于滿足移動設(shè)備、嵌入式設(shè)備以及物聯(lián)網(wǎng)中人工智能計算需求,有望在電池供電以及自供能智能設(shè)備中獲得廣泛應(yīng)用,向著 Deploy AI everywhere 的目標(biāo)更進(jìn)一步。
雷鋒網(wǎng)推薦閱讀:
斬獲ISCA 2018中國唯一一作論文,清華大學(xué)Thinker團(tuán)隊提出AI計算芯片的存儲優(yōu)化新方法
清華大學(xué)博士生涂鋒斌:設(shè)計神經(jīng)網(wǎng)絡(luò)硬件架構(gòu)時,我們在思考些什么?(上) | 硬創(chuàng)公開課總結(jié)
清華大學(xué)博士生涂鋒斌:設(shè)計神經(jīng)網(wǎng)絡(luò)硬件架構(gòu)時,我們在思考些什么?(下) | 硬創(chuàng)公開課總結(jié)
在 6 月 29 日至 7 月 1 日舉行的 CCF-GAIR 2018 上,清華大學(xué)微電子所所長魏少軍教授將作為 AI 芯片專場的學(xué)術(shù)嘉賓蒞臨現(xiàn)場做大會報告。
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。