AIGC “一夜爆紅”，我們需要什么樣的AI芯片？

本文作者：吳優(yōu)

2023-03-06 15:08

導(dǎo)語(yǔ)：AI芯片的分工方式正在發(fā)生改變。

AI繪畫(huà)和ChatGPT的火爆，再一次引發(fā)行業(yè)內(nèi)對(duì)AI的火熱討論。

ChatGPT僅僅推出兩個(gè)月，月活用戶就已經(jīng)突破了1億，成為史上用戶增長(zhǎng)速度最快的消費(fèi)級(jí)應(yīng)用程序，文生圖（text-to-image）也在僅僅兩個(gè)月內(nèi)就從外國(guó)網(wǎng)友和中國(guó)極客手中的小眾黑科技快速移植到普通用戶都能觸手可及的小程序和手機(jī)APP中。

AI以嶄新的應(yīng)用形式又一次刺激人類對(duì)科技的想象，但這些讓人興奮應(yīng)用的體驗(yàn)感依然沒(méi)有想象中絲滑，例如AI繪畫(huà)會(huì)畫(huà)出與主題完全不相干的圖片，ChatGPT也時(shí)常一本正經(jīng)地胡說(shuō)八道。

技術(shù)更新誕生新的應(yīng)用，而新應(yīng)用出現(xiàn)的問(wèn)題往往又倒逼技術(shù)的升級(jí)更新，AIGC勢(shì)必也會(huì)在AI芯片領(lǐng)域掀起新的浪潮。

現(xiàn)象級(jí)AI引發(fā)范式變革，芯片算力需求井噴

如何理解AIGC？即一種AI生成式內(nèi)用技術(shù)，讓AI完成原本只有人類才能做到的原創(chuàng)性工作，可以將其理解為是從PGC（專業(yè)生成）轉(zhuǎn)向UGC（用戶生成）之后的又一次內(nèi)容生成的范式轉(zhuǎn)移。

事實(shí)上早在2014年，對(duì)抗生成網(wǎng)絡(luò)GAN（Gemerative）就已經(jīng)能夠利用現(xiàn)有樣本生成新圖像，例如給GAN模型喂入大量的人臉數(shù)據(jù)，便能生成真假難辨的人臉照片，比較常見(jiàn)的應(yīng)用是我們?cè)诙桃曨l平臺(tái)中見(jiàn)到的“假笑特效”、“老人特效”、“讓老照片動(dòng)起來(lái)”等視頻特效，但這一波不足以讓AIGC概念爆火。

直到有大模型、可控性、多模態(tài)等技術(shù)為AIGC賦能，AIGC才愈發(fā)走向成熟，終于有了更加出色的應(yīng)用表現(xiàn)。

需要強(qiáng)調(diào)的是，對(duì)于AI而言，如何理解用戶輸入語(yǔ)言的含義是運(yùn)作的關(guān)鍵，而AI對(duì)人類語(yǔ)言的理解主要基于被喂入的數(shù)據(jù)——被喂入的數(shù)據(jù)越多，理解能力越強(qiáng)，即模型越大，理解能力越強(qiáng)。這一點(diǎn)在ChatGPT上也得到了證明，其友好對(duì)話能力也是基于較新的GPT-3.5這一大規(guī)模的通用語(yǔ)言模型，通過(guò)對(duì)來(lái)自四面八方的大量文本進(jìn)行訓(xùn)練，從而產(chǎn)生類似人類的反應(yīng)。

不巧的是，AIGC對(duì)大模型的訴求與GAN有許多相悖之處，例如GAN需要一個(gè)特定的數(shù)據(jù)集而不是大量的數(shù)據(jù)集進(jìn)行學(xué)習(xí)，不能實(shí)現(xiàn)泛化使用。業(yè)界在嘗試基于GAN做文生圖的技術(shù)也時(shí)常出現(xiàn)描述文本缺失、分辨率低、難以理解高層次語(yǔ)義信息等問(wèn)題。

不過(guò)這些問(wèn)題在后來(lái)出現(xiàn)的Diffusion+ CLIP的技術(shù)結(jié)合中得到解決，前者通過(guò)多步生成圖片，且每一步都是一個(gè)自編碼器，從而保證訓(xùn)練的穩(wěn)定性，后者負(fù)責(zé)圖文匹配驗(yàn)證，以確保生成的圖片能夠符合文字描述。

探討支撐AIGC發(fā)展的主要技術(shù)，可以發(fā)現(xiàn)，無(wú)論是AI繪畫(huà)還是ChatGPT的爆火，主要都是得益于深度學(xué)習(xí)模型方面的創(chuàng)新，不斷創(chuàng)新的算法、預(yù)訓(xùn)練模型以及多模態(tài)等技術(shù)的融合推動(dòng)了AIGC的變革，其所產(chǎn)生的商業(yè)價(jià)值潛力巨大。

2023年2月1日， Open AI率先一步嘗試商業(yè)化，推出了名為ChatGPT Plus的訂閱服務(wù)，每月收費(fèi)20美元，訂閱的用戶可以獲得全天候的服務(wù)，并在高峰時(shí)段享有優(yōu)先訪問(wèn)權(quán)，用戶不僅能夠提前使用新功能，同時(shí)應(yīng)用的響應(yīng)時(shí)間也會(huì)更快。Open AI 預(yù)計(jì)2023年，ChatGPT將實(shí)現(xiàn)2億美元的營(yíng)收。而這也引發(fā)了一大批互聯(lián)網(wǎng)公司對(duì)ChatGPT的布局，繼谷歌獻(xiàn)上Bard之后，華為、百度、騰訊、阿里巴巴等頭部企業(yè)也都紛紛表示，已經(jīng)擁有在研對(duì)標(biāo)ChatGPT相關(guān)的模型及產(chǎn)品，致力于打造中國(guó)版ChatGPT。

2018年谷歌發(fā)布了基于Transformer機(jī)器學(xué)習(xí)方法的自然語(yǔ)言處理與訓(xùn)練模型BERT，人工智能就進(jìn)入大模型參數(shù)的預(yù)訓(xùn)練模型時(shí)代，當(dāng)下的預(yù)訓(xùn)練模型參數(shù)數(shù)量、訓(xùn)練數(shù)據(jù)模型正在按照每年300倍的趨勢(shì)增長(zhǎng)，而人工智能硬件算力增長(zhǎng)速度與模型計(jì)算量的增長(zhǎng)速度存在萬(wàn)倍差距。ChatGPT的出現(xiàn)與商業(yè)變現(xiàn)，意味著模型計(jì)算量的增長(zhǎng)速度將進(jìn)一步加快，芯片算力需求出現(xiàn)井噴，不僅是對(duì)AI訓(xùn)練芯片單點(diǎn)算力需求的提升，還包括對(duì)算力定制化、多元化需求的提升，甚至對(duì)數(shù)據(jù)傳輸速度也提出了更高的要求。

IDC預(yù)計(jì)，到2025年人工智能芯片市場(chǎng)規(guī)模將達(dá)到726億美元。目前每臺(tái)人工智能服務(wù)商普遍配置2個(gè)GPU，未來(lái)18個(gè)月，GPU、ASIC和FPGA的搭載率均會(huì)上升。通用性遞減、專用性增強(qiáng)是AI芯片的主要發(fā)展方向。國(guó)際大廠將越來(lái)越重視打造從云端訓(xùn)練到終端響應(yīng)的全套AI芯片生態(tài)體系。

AI芯片分工生變，云端推理加速轉(zhuǎn)移

據(jù)外媒semianalysis報(bào)道，ChatGPT每天在計(jì)算硬件方面的運(yùn)營(yíng)成本為694444美元，Open AI需要大約3617臺(tái)HGX A100服務(wù)器（28936個(gè)GPU）為ChatGPT提供服務(wù)。真正需要用云端芯片進(jìn)行推理的需求增加，云端無(wú)法承受如此龐大的數(shù)據(jù)和工作量，如果能夠?qū)I云端芯片的處理工作向邊緣側(cè)轉(zhuǎn)移，或許將為大模型的訓(xùn)練和推理釋放更多的計(jì)算空間。

與此同時(shí)，用戶需求也在改變著典型的AI芯片分工方式，一方面消費(fèi)者希望保護(hù)個(gè)人數(shù)據(jù)隱私，即將終端數(shù)據(jù)保留在終端設(shè)備上，另一方面，消費(fèi)者又需要可靠的數(shù)據(jù)，并即時(shí)獲得處理結(jié)果，數(shù)據(jù)不斷從邊緣側(cè)產(chǎn)生，AI處理的重心正在持續(xù)向邊緣轉(zhuǎn)移。

AIGC “一夜爆紅”，我們需要什么樣的AI芯片？

因此，將推理工作轉(zhuǎn)移至邊緣側(cè)終端完成也成為不少企業(yè)為之努力的目標(biāo)和趨勢(shì)。高通就在推升終端側(cè)的推理能力方面有著出色表現(xiàn)。

雷峰網(wǎng)了解到，高通正在采取不同的方式實(shí)現(xiàn)終端側(cè)的學(xué)習(xí)能力，對(duì)包括小樣本學(xué)習(xí)、無(wú)監(jiān)督持續(xù)學(xué)習(xí)、聯(lián)邦學(xué)習(xí)和低復(fù)雜度的終端側(cè)訓(xùn)練等方向的研究，且已經(jīng)取得了一些成效。

通過(guò)小樣本學(xué)習(xí)，在關(guān)鍵詞識(shí)別方面，AI能夠“看完”某一人的筆跡或書(shū)面文字之后快速進(jìn)行辨認(rèn)，也能在用戶錄入數(shù)據(jù)時(shí)進(jìn)行局部模型適應(yīng)，憑借少量樣本數(shù)據(jù)和數(shù)據(jù)標(biāo)記能力，提升關(guān)鍵詞識(shí)別能力。

在聯(lián)邦學(xué)習(xí)方面，云端創(chuàng)造的模型被下發(fā)到邊緣側(cè)終端之后，基于一定程度的離線學(xué)習(xí)，終側(cè)端就可以根據(jù)消費(fèi)者實(shí)際情況調(diào)整模型，由于終端側(cè)學(xué)習(xí)的過(guò)程會(huì)產(chǎn)生噪音，因此還能將其回傳到云端進(jìn)一步提升模型的泛化能力。在實(shí)際的應(yīng)用場(chǎng)景中，如果一輛汽車(chē)不斷在多個(gè)國(guó)家的不同路況上行駛，云端模型就可以持續(xù)進(jìn)行適應(yīng)，假以時(shí)日模型經(jīng)過(guò)優(yōu)化，就能打造出更加優(yōu)秀的自動(dòng)駕駛汽車(chē)模型。

為了讓AI在終側(cè)端發(fā)揮最大作用，高通也有針對(duì)性的技術(shù)創(chuàng)新。

例如，高通支持INT4的精度推理。INT4相比INT8能夠?qū)崿F(xiàn)60% 的能效提升和90%的AI推理速度提升，如果從INT8轉(zhuǎn)化到INT4、或從浮點(diǎn)計(jì)算轉(zhuǎn)化到整數(shù)計(jì)算，在同樣的算力下能夠處理更多的數(shù)據(jù)。如果將32位浮點(diǎn)模型轉(zhuǎn)化為INT4模型，能效甚至能夠提升到64倍。

智能終端性能升級(jí)成必然，高通已賦能20億終端

提升邊緣側(cè)處理能力已經(jīng)成為全民所需，高通已經(jīng)在這一方面取得了不少突破性成果，且將不少AI算法應(yīng)用到了影像和圖形處理等功能中，為業(yè)界提供了一條發(fā)展思路。

首先，高通專注統(tǒng)一技術(shù)路線圖進(jìn)行產(chǎn)品開(kāi)發(fā)，涵蓋了邊緣AI、前沿的視覺(jué)效果和視覺(jué)技術(shù)、圖形和游戲技術(shù)、新穎的多媒體效果、極快處理速度，以及5G連接能力等特性。高通將這些技術(shù)進(jìn)行規(guī)?；瘮U(kuò)展，從耳機(jī)等較低復(fù)雜度的產(chǎn)品到汽車(chē)等高復(fù)雜度的產(chǎn)品。這些AI技術(shù)中包括了自然語(yǔ)言處理、面部識(shí)別等不同的能力。

AIGC “一夜爆紅”，我們需要什么樣的AI芯片？

其次，高通的AI引擎已經(jīng)賦能20億終端。高通的AI引擎包含圖形處理單元、CPU、以及更關(guān)鍵的Hexagon處理器，其中Hexagon處理器又包含標(biāo)量、向量和張量處理器，這些處理器能夠很好地與神經(jīng)網(wǎng)絡(luò)模型的不同部分實(shí)現(xiàn)匹配?；鶞?zhǔn)測(cè)試顯示，高通AI引擎在自然語(yǔ)言處理、目標(biāo)檢測(cè)等模型方面都實(shí)現(xiàn)了一定的性能優(yōu)化。

另外，高通還在芯片子系統(tǒng)中集成了一個(gè)小型“始終在線”小引擎，稱之為高通傳感器中樞，能同時(shí)處理多路數(shù)據(jù)流，包括傳感器、語(yǔ)音和音頻、連接和始終感知的攝像頭等。這一傳感器中樞通過(guò)AI性能的提升已經(jīng)具備識(shí)別隱患聲音的能力，例如能夠?qū)Π胍箓鱽?lái)的玻璃破碎聲記下監(jiān)測(cè)和預(yù)警。

高通還開(kāi)發(fā)了具有高度可擴(kuò)展性的硬件架構(gòu)，針對(duì)應(yīng)用需求進(jìn)行擴(kuò)展開(kāi)發(fā)，例如高通的驍龍移動(dòng)平臺(tái)，通常會(huì)配置一個(gè)Hexagon處理器實(shí)例；但如果擴(kuò)展到計(jì)算等其他業(yè)務(wù)時(shí)，也可以使用兩個(gè)Hexagon處理器實(shí)例；面向汽車(chē)、云和邊緣，則可以使用多個(gè)Hexagon處理器實(shí)例來(lái)提高算力。

AIGC “一夜爆紅”，我們需要什么樣的AI芯片？

AIGC“一夜爆紅”，高通依然發(fā)揮自己在智能終端領(lǐng)域的長(zhǎng)處與優(yōu)勢(shì)，通過(guò)技術(shù)創(chuàng)新持續(xù)提升著終端AI芯片的處理能力，或許，在絕大多數(shù)AI芯片公司選擇在云端持續(xù)加碼時(shí)，重視邊側(cè)端的推理計(jì)算能力更能創(chuàng)造一個(gè)具有顛覆性的未來(lái)。（雷峰網(wǎng)(公眾號(hào)：雷峰網(wǎng))）

技術(shù)壁壘這么多，AIGC 憑什么爆火？

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

0人收藏

相關(guān)文章