丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
芯片 正文
發(fā)私信給吳優(yōu)
發(fā)送

0

AIGC “一夜爆紅”,我們需要什么樣的AI芯片?

本文作者: 吳優(yōu) 2023-03-06 15:08
導(dǎo)語:AI芯片的分工方式正在發(fā)生改變。

AIGC “一夜爆紅”,我們需要什么樣的AI芯片?

AI繪畫和ChatGPT的火爆,再一次引發(fā)行業(yè)內(nèi)對AI的火熱討論。

ChatGPT僅僅推出兩個月,月活用戶就已經(jīng)突破了1億,成為史上用戶增長速度最快的消費級應(yīng)用程序,文生圖(text-to-image)也在僅僅兩個月內(nèi)就從外國網(wǎng)友和中國極客手中的小眾黑科技快速移植到普通用戶都能觸手可及的小程序和手機APP中。

AI以嶄新的應(yīng)用形式又一次刺激人類對科技的想象,但這些讓人興奮應(yīng)用的體驗感依然沒有想象中絲滑,例如AI繪畫會畫出與主題完全不相干的圖片,ChatGPT也時常一本正經(jīng)地胡說八道。

技術(shù)更新誕生新的應(yīng)用,而新應(yīng)用出現(xiàn)的問題往往又倒逼技術(shù)的升級更新,AIGC勢必也會在AI芯片領(lǐng)域掀起新的浪潮。

現(xiàn)象級AI引發(fā)范式變革,芯片算力需求井噴

如何理解AIGC?即一種AI生成式內(nèi)用技術(shù),讓AI完成原本只有人類才能做到的原創(chuàng)性工作,可以將其理解為是從PGC(專業(yè)生成)轉(zhuǎn)向UGC(用戶生成)之后的又一次內(nèi)容生成的范式轉(zhuǎn)移。

事實上早在2014年,對抗生成網(wǎng)絡(luò)GAN(Gemerative)就已經(jīng)能夠利用現(xiàn)有樣本生成新圖像,例如給GAN模型喂入大量的人臉數(shù)據(jù),便能生成真假難辨的人臉照片,比較常見的應(yīng)用是我們在短視頻平臺中見到的“假笑特效”、“老人特效”、“讓老照片動起來”等視頻特效,但這一波不足以讓AIGC概念爆火。

直到有大模型、可控性、多模態(tài)等技術(shù)為AIGC賦能,AIGC才愈發(fā)走向成熟,終于有了更加出色的應(yīng)用表現(xiàn)。

需要強調(diào)的是,對于AI而言,如何理解用戶輸入語言的含義是運作的關(guān)鍵,而AI對人類語言的理解主要基于被喂入的數(shù)據(jù)——被喂入的數(shù)據(jù)越多,理解能力越強,即模型越大,理解能力越強。這一點在ChatGPT上也得到了證明,其友好對話能力也是基于較新的GPT-3.5這一大規(guī)模的通用語言模型,通過對來自四面八方的大量文本進行訓(xùn)練,從而產(chǎn)生類似人類的反應(yīng)。

不巧的是,AIGC對大模型的訴求與GAN有許多相悖之處,例如GAN需要一個特定的數(shù)據(jù)集而不是大量的數(shù)據(jù)集進行學(xué)習(xí),不能實現(xiàn)泛化使用。業(yè)界在嘗試基于GAN做文生圖的技術(shù)也時常出現(xiàn)描述文本缺失、分辨率低、難以理解高層次語義信息等問題。

不過這些問題在后來出現(xiàn)的Diffusion+ CLIP的技術(shù)結(jié)合中得到解決,前者通過多步生成圖片,且每一步都是一個自編碼器,從而保證訓(xùn)練的穩(wěn)定性,后者負責(zé)圖文匹配驗證,以確保生成的圖片能夠符合文字描述。

探討支撐AIGC發(fā)展的主要技術(shù),可以發(fā)現(xiàn),無論是AI繪畫還是ChatGPT的爆火,主要都是得益于深度學(xué)習(xí)模型方面的創(chuàng)新,不斷創(chuàng)新的算法、預(yù)訓(xùn)練模型以及多模態(tài)等技術(shù)的融合推動了AIGC的變革,其所產(chǎn)生的商業(yè)價值潛力巨大。

2023年2月1日, Open AI率先一步嘗試商業(yè)化,推出了名為ChatGPT Plus的訂閱服務(wù),每月收費20美元,訂閱的用戶可以獲得全天候的服務(wù),并在高峰時段享有優(yōu)先訪問權(quán),用戶不僅能夠提前使用新功能,同時應(yīng)用的響應(yīng)時間也會更快。Open AI 預(yù)計2023年,ChatGPT將實現(xiàn)2億美元的營收。而這也引發(fā)了一大批互聯(lián)網(wǎng)公司對ChatGPT的布局,繼谷歌獻上Bard之后,華為、百度、騰訊、阿里巴巴等頭部企業(yè)也都紛紛表示,已經(jīng)擁有在研對標(biāo)ChatGPT相關(guān)的模型及產(chǎn)品,致力于打造中國版ChatGPT。

2018年谷歌發(fā)布了基于Transformer機器學(xué)習(xí)方法的自然語言處理與訓(xùn)練模型BERT,人工智能就進入大模型參數(shù)的預(yù)訓(xùn)練模型時代,當(dāng)下的預(yù)訓(xùn)練模型參數(shù)數(shù)量、訓(xùn)練數(shù)據(jù)模型正在按照每年300倍的趨勢增長,而人工智能硬件算力增長速度與模型計算量的增長速度存在萬倍差距。ChatGPT的出現(xiàn)與商業(yè)變現(xiàn),意味著模型計算量的增長速度將進一步加快,芯片算力需求出現(xiàn)井噴,不僅是對AI訓(xùn)練芯片單點算力需求的提升,還包括對算力定制化、多元化需求的提升,甚至對數(shù)據(jù)傳輸速度也提出了更高的要求。

IDC預(yù)計,到2025年人工智能芯片市場規(guī)模將達到726億美元。目前每臺人工智能服務(wù)商普遍配置2個GPU,未來18個月,GPU、ASIC和FPGA的搭載率均會上升。通用性遞減、專用性增強是AI芯片的主要發(fā)展方向。國際大廠將越來越重視打造從云端訓(xùn)練到終端響應(yīng)的全套AI芯片生態(tài)體系。

AI芯片分工生變,云端推理加速轉(zhuǎn)移

據(jù)外媒semianalysis報道,ChatGPT每天在計算硬件方面的運營成本為694444美元,Open AI需要大約3617臺HGX A100服務(wù)器(28936個GPU)為ChatGPT提供服務(wù)。真正需要用云端芯片進行推理的需求增加,云端無法承受如此龐大的數(shù)據(jù)和工作量,如果能夠?qū)I云端芯片的處理工作向邊緣側(cè)轉(zhuǎn)移,或許將為大模型的訓(xùn)練和推理釋放更多的計算空間。

與此同時,用戶需求也在改變著典型的AI芯片分工方式,一方面消費者希望保護個人數(shù)據(jù)隱私,即將終端數(shù)據(jù)保留在終端設(shè)備上,另一方面,消費者又需要可靠的數(shù)據(jù),并即時獲得處理結(jié)果,數(shù)據(jù)不斷從邊緣側(cè)產(chǎn)生,AI處理的重心正在持續(xù)向邊緣轉(zhuǎn)移。

AIGC “一夜爆紅”,我們需要什么樣的AI芯片?

因此,將推理工作轉(zhuǎn)移至邊緣側(cè)終端完成也成為不少企業(yè)為之努力的目標(biāo)和趨勢。高通就在推升終端側(cè)的推理能力方面有著出色表現(xiàn)。

雷峰網(wǎng)了解到,高通正在采取不同的方式實現(xiàn)終端側(cè)的學(xué)習(xí)能力,對包括小樣本學(xué)習(xí)、無監(jiān)督持續(xù)學(xué)習(xí)、聯(lián)邦學(xué)習(xí)和低復(fù)雜度的終端側(cè)訓(xùn)練等方向的研究,且已經(jīng)取得了一些成效。

通過小樣本學(xué)習(xí),在關(guān)鍵詞識別方面,AI能夠“看完”某一人的筆跡或書面文字之后快速進行辨認,也能在用戶錄入數(shù)據(jù)時進行局部模型適應(yīng),憑借少量樣本數(shù)據(jù)和數(shù)據(jù)標(biāo)記能力,提升關(guān)鍵詞識別能力。

在聯(lián)邦學(xué)習(xí)方面,云端創(chuàng)造的模型被下發(fā)到邊緣側(cè)終端之后,基于一定程度的離線學(xué)習(xí),終側(cè)端就可以根據(jù)消費者實際情況調(diào)整模型,由于終端側(cè)學(xué)習(xí)的過程會產(chǎn)生噪音,因此還能將其回傳到云端進一步提升模型的泛化能力。在實際的應(yīng)用場景中,如果一輛汽車不斷在多個國家的不同路況上行駛,云端模型就可以持續(xù)進行適應(yīng),假以時日模型經(jīng)過優(yōu)化,就能打造出更加優(yōu)秀的自動駕駛汽車模型。

為了讓AI在終側(cè)端發(fā)揮最大作用,高通也有針對性的技術(shù)創(chuàng)新。

例如,高通支持INT4的精度推理。INT4相比INT8能夠?qū)崿F(xiàn)60% 的能效提升和90%的AI推理速度提升,如果從INT8轉(zhuǎn)化到INT4、或從浮點計算轉(zhuǎn)化到整數(shù)計算,在同樣的算力下能夠處理更多的數(shù)據(jù)。如果將32位浮點模型轉(zhuǎn)化為INT4模型,能效甚至能夠提升到64倍。

智能終端性能升級成必然,高通已賦能20億終端

提升邊緣側(cè)處理能力已經(jīng)成為全民所需,高通已經(jīng)在這一方面取得了不少突破性成果,且將不少AI算法應(yīng)用到了影像和圖形處理等功能中,為業(yè)界提供了一條發(fā)展思路。

首先,高通專注統(tǒng)一技術(shù)路線圖進行產(chǎn)品開發(fā),涵蓋了邊緣AI、前沿的視覺效果和視覺技術(shù)、圖形和游戲技術(shù)、新穎的多媒體效果、極快處理速度,以及5G連接能力等特性。高通將這些技術(shù)進行規(guī)?;瘮U展,從耳機等較低復(fù)雜度的產(chǎn)品到汽車等高復(fù)雜度的產(chǎn)品。這些AI技術(shù)中包括了自然語言處理、面部識別等不同的能力。

AIGC “一夜爆紅”,我們需要什么樣的AI芯片?

其次,高通的AI引擎已經(jīng)賦能20億終端。高通的AI引擎包含圖形處理單元、CPU、以及更關(guān)鍵的Hexagon處理器,其中Hexagon處理器又包含標(biāo)量、向量和張量處理器,這些處理器能夠很好地與神經(jīng)網(wǎng)絡(luò)模型的不同部分實現(xiàn)匹配。基準(zhǔn)測試顯示,高通AI引擎在自然語言處理、目標(biāo)檢測等模型方面都實現(xiàn)了一定的性能優(yōu)化。

另外,高通還在芯片子系統(tǒng)中集成了一個小型“始終在線”小引擎,稱之為高通傳感器中樞,能同時處理多路數(shù)據(jù)流,包括傳感器、語音和音頻、連接和始終感知的攝像頭等。這一傳感器中樞通過AI性能的提升已經(jīng)具備識別隱患聲音的能力,例如能夠?qū)Π胍箓鱽淼牟A扑槁曈浵卤O(jiān)測和預(yù)警。

高通還開發(fā)了具有高度可擴展性的硬件架構(gòu),針對應(yīng)用需求進行擴展開發(fā),例如高通的驍龍移動平臺,通常會配置一個Hexagon處理器實例;但如果擴展到計算等其他業(yè)務(wù)時,也可以使用兩個Hexagon處理器實例;面向汽車、云和邊緣,則可以使用多個Hexagon處理器實例來提高算力。

AIGC “一夜爆紅”,我們需要什么樣的AI芯片?

AIGC“一夜爆紅”,高通依然發(fā)揮自己在智能終端領(lǐng)域的長處與優(yōu)勢,通過技術(shù)創(chuàng)新持續(xù)提升著終端AI芯片的處理能力,或許,在絕大多數(shù)AI芯片公司選擇在云端持續(xù)加碼時,重視邊側(cè)端的推理計算能力更能創(chuàng)造一個具有顛覆性的未來。(雷峰網(wǎng)(公眾號:雷峰網(wǎng))

相關(guān)文章:

中國需要自己的ChatGPT!中文在線攜手瀾舟科技加碼布局AIGC賽道

技術(shù)壁壘這么多,AIGC 憑什么爆火?

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知

分享:
相關(guān)文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說