0
本文作者: nebula | 2024-06-28 14:11 |
6月27日,高通公司AI產(chǎn)品技術(shù)中國區(qū)負(fù)責(zé)人萬衛(wèi)星出席上海MWC世界移動(dòng)通信大會(huì)期間舉辦的中國移動(dòng)終端合作峰會(huì),并發(fā)表主題演講“擁抱AI賦能終端創(chuàng)新的未來”,分享高通公司正在如何通過領(lǐng)先產(chǎn)品和解決方案賦能終端側(cè)生成式AI發(fā)展。
通過強(qiáng)大的NPU性能和高通AI引擎的異構(gòu)計(jì)算設(shè)計(jì),高通公司在支持終端側(cè)生成式AI用例處理方面獨(dú)具優(yōu)勢(shì),其最新的第三代驍龍8移動(dòng)平臺(tái)和驍龍X Elite計(jì)算平臺(tái)已經(jīng)賦能市場(chǎng)推出了多款出色的AI手機(jī)、AI PC產(chǎn)品,正在引領(lǐng)終端側(cè)生成式AI體驗(yàn)的飛速發(fā)展。此外,高通公司還在通過靈活可擴(kuò)展的軟件工具解決方案,賦能應(yīng)用開發(fā)者和大模型廠商面向廣泛的終端品類打造AI應(yīng)用和進(jìn)行模型優(yōu)化,推動(dòng)生成式AI在終端側(cè)的規(guī)?;瘮U(kuò)展。
以下為演講全文:
大家好,我是高通公司萬衛(wèi)星,很榮幸能夠代表高通公司參加中國移動(dòng)終端合作峰會(huì),今天我分享的主題是“擁抱AI賦能終端創(chuàng)新的未來”。同時(shí),我也會(huì)與大家分享高通公司的AI產(chǎn)品和解決方案正在如何助力AI,尤其是生成式AI在終端側(cè)的規(guī)?;瘮U(kuò)展。
我們認(rèn)為,終端側(cè)生成式AI的時(shí)代已經(jīng)到來。我們?cè)谥悄苁謾C(jī)領(lǐng)域的最新旗艦產(chǎn)品第三代驍龍8,以及我們面向PC市場(chǎng)推出的最新平臺(tái)驍龍X Elite,已經(jīng)賦能了諸多的AI手機(jī)和AI PC,為消費(fèi)者帶來了非常豐富的生成式AI體驗(yàn)。
在今年2月份的MWC巴塞羅那期間,高通帶來了全球首個(gè)在Android手機(jī)上運(yùn)行的大型多模態(tài)語言模型(LMM)技術(shù)展示。我們?cè)诖钶d第三代驍龍8的參考設(shè)計(jì)上運(yùn)行了基于圖像和文本輸入、超過70億參數(shù)的大語言和視覺助理大模型(LLaVa),能夠與AI助手生成關(guān)于圖像的多輪對(duì)話。具有語言理解和視覺理解能力的多模態(tài)大模型能夠賦能諸多用例,例如識(shí)別和討論復(fù)雜的視覺圖案、物體和場(chǎng)景。多模態(tài)模型的能力將極大的提高我們的產(chǎn)品優(yōu)勢(shì),也將為現(xiàn)實(shí)生活中的一些應(yīng)用場(chǎng)景帶來非常大的幫助,例如視覺障礙人士或?qū)⒛軌蚶么祟愑美诔鞘兄羞M(jìn)行導(dǎo)航。
隨著生成式AI模型的發(fā)展,我們發(fā)現(xiàn)一些生成式AI模型的體量正在不斷縮小,而他們?cè)谔囟ù怪鳖I(lǐng)域的能力卻正在變得越來越強(qiáng)。舉例來說,Llama3 80億參數(shù)版本在解決某些垂類應(yīng)用的能力上,已經(jīng)超過了去年發(fā)布的高達(dá)1750億參數(shù)的GPT-3.5 Turbo。
面向豐富的生成式AI和傳統(tǒng)AI用例,高通將AI能力貫穿到整個(gè)SoC的設(shè)計(jì)中,打造了具備異構(gòu)計(jì)算架構(gòu)的高通AI引擎,不僅集成通用的硬件加速單元CPU、GPU,同時(shí)也集成了面向高算力和低功耗工作負(fù)載需求的專用神經(jīng)網(wǎng)絡(luò)處理器NPU。對(duì)于一些需要始終在線的應(yīng)用,包括攝像頭、傳感器和語音喚醒等,高通AI引擎也有支持超低功耗的傳感器中樞。
高通公司在去年10月驍龍峰會(huì)上發(fā)布的第三代驍龍8,其所搭載的高算力低功耗的高通Hexagon NPU帶來了諸多提升,首先我們進(jìn)行了微架構(gòu)升級(jí),以實(shí)現(xiàn)進(jìn)一步的性能提升;第二,為了實(shí)現(xiàn)更好的功耗控制,我們?yōu)镠exagon NPU配備了加速器專用電源;我們還集成了升級(jí)的微切片推理技術(shù),這一技術(shù)在第二代驍龍8上率先推出,我們?cè)诘谌旪?上做了進(jìn)一步的升級(jí),能夠在垂直深度上對(duì)算子做融合,更加充分地利用驍龍平臺(tái)的硬件算力。此外,我們還引入更大的帶寬進(jìn)入張量加速器,并實(shí)現(xiàn)了更高的主頻??傮w來講,高通Hexagon NPU在設(shè)計(jì)上聚焦兩點(diǎn):極致峰值性能、以及針對(duì)生成式AI進(jìn)行專門的軟硬件優(yōu)化。
接下來我想為大家介紹我們?nèi)绾纬浞掷酶咄ˋI引擎的異構(gòu)計(jì)算能力,實(shí)現(xiàn)虛擬化身AI助手這一用例。首先,高通AI引擎的傳感器中樞能夠運(yùn)行ASR模塊,負(fù)責(zé)將用戶的語音信號(hào)轉(zhuǎn)化成文本信號(hào)。然后,大語言模型再基于ASR的文本輸入生成文本回復(fù),這部分工作負(fù)載可以跑在具備高算力的NPU上。之后,大模型輸出的文本回復(fù)可以對(duì)接到跑在CPU上的TTS模塊,轉(zhuǎn)化成語音信號(hào)。同時(shí)為了讓虛擬化身實(shí)現(xiàn)實(shí)時(shí)交互,還需要同步在GPU上進(jìn)行圖形渲染等操作。這些復(fù)雜的工作負(fù)載充分釋放了異構(gòu)計(jì)算系統(tǒng)中各個(gè)處理器的能力,通過共同協(xié)作為消費(fèi)者打造了出色的用戶體驗(yàn)。
除了提供領(lǐng)先的AI硬件之外,高通還提供了跨操作系統(tǒng)、跨終端的靈活可擴(kuò)展的高通AI軟件棧(Qualcomm AI Stack)。高通AI軟件棧目前支持所有主流的AI框架,同時(shí)提供對(duì)高通和第三方runtime的支持。此外,高通AI軟件棧也為合作伙伴和開發(fā)者提供了非常豐富的加速工具庫,其中包括編譯器、分析器、調(diào)試器等,讓他們能夠在驍龍平臺(tái)上更加高效和靈活地進(jìn)行模型開發(fā)、優(yōu)化和部署。
高通AI軟件棧支持我們幾乎所有產(chǎn)品線的豐富產(chǎn)品組合,這意味著在驍龍平臺(tái)上的模型優(yōu)化工作可以非常方便地?cái)U(kuò)展到其他類型的終端產(chǎn)品上。除了硬件軟件之外,高通也搭建了強(qiáng)大的AI生態(tài)系統(tǒng),目前已經(jīng)支持廣泛的海內(nèi)外終端側(cè)生成式AI模型,其中包括圖像模型、語言模型、甚至多模態(tài)模型。
作為終端側(cè)AI的引領(lǐng)者,驍龍平臺(tái)已經(jīng)成為終端側(cè)AI的首選合作平臺(tái)。高通公司有著超過15年的AI研發(fā)投入,我們?yōu)樾袠I(yè)提供領(lǐng)先的軟硬件解決方案,包括前面介紹的全面靈活的軟件工具。憑借我們領(lǐng)先的解決方案,高通已經(jīng)跨不同產(chǎn)品線,賦能數(shù)十億臺(tái)終端設(shè)備。我們也將能力開放給生態(tài)合作伙伴,讓他們能夠在驍龍平臺(tái)上更加高效、便捷地打造AI應(yīng)用和進(jìn)行模型優(yōu)化。
第三代驍龍8已經(jīng)賦能了諸多的當(dāng)前旗艦智能手機(jī)和用例。目前眾多主流手機(jī)品牌的旗艦產(chǎn)品已經(jīng)為消費(fèi)者打造了豐富的生成式AI用例,以賦能娛樂、創(chuàng)作和生產(chǎn)力等體驗(yàn),包括AI照片編輯、照片生成、以及實(shí)時(shí)翻譯轉(zhuǎn)譯、寫作助手等。同時(shí),驍龍X系列PC平臺(tái)也已經(jīng)賦能了諸多的Windows 11 AI PC產(chǎn)品。就在今天,我們還正式宣布了中國移動(dòng)終端公司、小米、當(dāng)紅齊天和高通四方攜手,打造了國內(nèi)首款基于Xiaomi 14 Pro、應(yīng)用于XR領(lǐng)域的5G Advanced(5G-A)高頻萬兆測(cè)試平臺(tái),并率先將其應(yīng)用于當(dāng)紅齊天的多并發(fā)、大空間XR競技游戲業(yè)務(wù)。
最后,我想從SoC這個(gè)角度展望一下終端側(cè)生成式AI的未來演進(jìn)趨勢(shì)。2023年,終端側(cè)支持的生成式AI模型基本都是基于單一模態(tài),比如文生文、文生圖或者圖生圖。今年大家可以看到,我們已經(jīng)支持多模態(tài)的生成式AI模型在終端側(cè)離線運(yùn)行。未來,多模態(tài)模型會(huì)更多地和用戶的終端側(cè)個(gè)人信息相結(jié)合,為用戶提供更加情境化、實(shí)時(shí)化和個(gè)性化的服務(wù)?;谶@些更加強(qiáng)大的多模態(tài)模型所演化出的具身智能,在未來也非常有可能完整的在終端側(cè)運(yùn)行。
雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。