0
本文作者: 包永剛 | 2024-10-24 08:57 |
2023年高通驍龍峰會(huì)自研的Oryon CPU首次亮相時(shí),超越x86陣營(yíng)里的最強(qiáng)者,也力壓當(dāng)時(shí)最強(qiáng)的蘋果M2 Max處理器。
即便在x86陣營(yíng)以及蘋果2024款PC處理器發(fā)布之后,首代Oryon CPU的性能依舊處于領(lǐng)先地位,讓高通CEO安蒙在2024高通驍龍峰會(huì)說的:“高通一直是引領(lǐng)無線產(chǎn)業(yè)的發(fā)展的公司,如今我們將高通轉(zhuǎn)型為一家面向新AI處理時(shí)代的連接計(jì)算公司?!?/strong>的說法更有說服力。
本周高通驍龍峰會(huì)正式發(fā)布的搭載第二代Oryon CPU的驍龍8至尊版,性能的大幅提升,有一些對(duì)同行實(shí)現(xiàn)了降維打擊的意味。
驍龍8至尊版是唯一在Geekbench單線程測(cè)試中超過3,200分的Android SoC,在Speedometer上超越了所有Android競(jìng)品,也是業(yè)界唯一一款在任何操作系統(tǒng)上都能在Geekbench多線程測(cè)試中突破10,000大關(guān)、在安兔兔測(cè)試中突破300萬大關(guān)的移動(dòng)SoC。
一邊是領(lǐng)先手機(jī)領(lǐng)域的競(jìng)爭(zhēng)對(duì)手,另一邊大幅增強(qiáng)了汽車市場(chǎng)的競(jìng)爭(zhēng)力。搭載專為汽車定制Oryon CPU的驍龍座艙至尊版平臺(tái)和Snapdragon Ride至尊版,CPU性能提升高達(dá)3倍。
“Oryon是完成我們整個(gè)SoC的最后一塊拼圖?!?/strong>高通技術(shù)公司高級(jí)副總裁兼手機(jī)業(yè)務(wù)總經(jīng)理 Christoper Patrick在驍龍峰會(huì)上說。
Oryon CPU顯然成為了高通保持在手機(jī)市場(chǎng)領(lǐng)導(dǎo)力,提升在智能汽車市場(chǎng)競(jìng)爭(zhēng)力,以及突破PC市場(chǎng)的核心之一。
此時(shí)再回看2021年高通收購(gòu)NUVIA,很難不感嘆高通的戰(zhàn)略水平以及技術(shù)實(shí)力的高超。
當(dāng)然,“重構(gòu)”作為2024年高通驍龍峰會(huì)的主題,Oryon CPU并非唯一的主角,驍龍8至尊版全面升級(jí)的NPU、GPU以及AI ISP都值得特別關(guān)注。
Oryon CPU對(duì)高通的戰(zhàn)略價(jià)值
即便我們已經(jīng)進(jìn)入了AI時(shí)代,AI能力是所有計(jì)算公司都重點(diǎn)強(qiáng)調(diào)的能力,但不要忽略CPU的重要性。
如果把手機(jī)SoC比喻成一個(gè)交響樂團(tuán), CPU是指揮家的角色,指揮每個(gè)音符、每個(gè)節(jié)奏、每個(gè)樂器創(chuàng)作出完美的AI交響樂。
CPU對(duì)于管理系統(tǒng)層面的處理至關(guān)重要,它能執(zhí)行來自應(yīng)用程序、操作系統(tǒng)和用戶輸入的指令,確保運(yùn)行流暢快速,也可以運(yùn)行高端游戲、視頻編輯軟件、AR體驗(yàn)、AI和機(jī)器學(xué)習(xí)以及安全等復(fù)雜應(yīng)用。
過去數(shù)代驍龍?zhí)幚砥鞯腃PU是采用Arm的IP,對(duì)于當(dāng)時(shí)的高通這是一個(gè)非常合適的選擇。
轉(zhuǎn)變發(fā)生在2020年,蘋果發(fā)布的基于Arm架構(gòu)自研的初代M系列PC處理器強(qiáng)大的性能震撼業(yè)界,這對(duì)高通是一個(gè)啟發(fā)。
2021年,高通以14億美元收購(gòu)了NUVIA,開啟了從頭開始設(shè)計(jì)一款CPU。
高通技術(shù)公司手機(jī)、計(jì)算和XR事業(yè)群總經(jīng)理阿力克斯·卡圖贊(Alex Katouzian)表示,“高通之所以收購(gòu)NUVIA,是希望能夠我們自己設(shè)計(jì)出適用于手機(jī)、PC、汽車等多個(gè)領(lǐng)域的CPU架構(gòu)?!?/strong>
對(duì)于高通,自研CPU必須考量投入產(chǎn)出比,如果只是為手機(jī)和PC從頭開始設(shè)計(jì)全新的CPU可能還欠缺些許吸引力,那加上汽車市場(chǎng),自研CPU的投入產(chǎn)出比預(yù)期就會(huì)十分理想。
“汽車對(duì)于算力的需求還在不斷增長(zhǎng)。這也是我們收購(gòu)NUVIA的必要原因之一?!卑⒘怂埂た▓D贊說。
雖然高通驍龍8155在2021年初高通收購(gòu)NUVIA的時(shí)候還未被眾多消費(fèi)者熟知,但智能汽車座艙功能的快速迭代,讓高通座艙處理器的CPU面臨挑戰(zhàn)。
有手機(jī)、PC這兩個(gè)全球出貨量最大的兩個(gè)市場(chǎng)作為支撐,再加上需求不斷增加的汽車市場(chǎng),讓高通有足夠的動(dòng)力自研CPU。
2023年讓初代Oryon CPU在PC上亮相是一個(gè)絕佳的策略,不僅可以達(dá)到讓高通的PC處理器達(dá)到一鳴驚人的效果吸引注意,還能用這個(gè)對(duì)高通營(yíng)收占比不大的產(chǎn)品線先驗(yàn)證性能強(qiáng)大的Oryon CPU。
接著,2024年Oryon CPU推向高通最熟悉的手機(jī)市場(chǎng),經(jīng)過PC市場(chǎng)驗(yàn)證的Oryon CPU,用到手機(jī)上幾乎就是降維打擊。
2025年Oryon CPU再開始用到對(duì)性能和安全性要求更高的汽車市場(chǎng),高通自研CPU不僅成為了其業(yè)務(wù)的重要支撐,也非常好的服務(wù)其公司戰(zhàn)略。
阿力克斯·卡圖贊在峰會(huì)期間透露,“Oryon CPU是每年都會(huì)更新,因?yàn)闀?huì)應(yīng)用在手機(jī)、汽車、PC等領(lǐng)域,面向PC的驍龍?zhí)幚砥饔?jì)劃每?jī)赡旮乱淮!?/strong>
“Oryon CPU的迭代和微架構(gòu)并非嚴(yán)格綁定關(guān)系,兩者會(huì)以各自的節(jié)奏迭代,同時(shí)也取決于產(chǎn)品線。第二代Oryon CPU就是專為移動(dòng)場(chǎng)景打造,在第一代Oryon CPU微架構(gòu)的基礎(chǔ)上重新設(shè)計(jì),兩者有很大的相似性,但第二代更實(shí)用且有更出色的能效?!卑⒘怂埂た▓D贊對(duì)雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))表示。
全面重構(gòu)的驍龍8至尊版,性能跨代提升
CPU微架構(gòu)和內(nèi)存系統(tǒng)大升級(jí)
此時(shí)更容易理解驍龍8至尊版性能大幅提升的源頭。
相比第三代驍龍8商用手機(jī),驍龍8至尊版商用機(jī)在室溫環(huán)境下測(cè)試,單線程和多線程基準(zhǔn)測(cè)試中性能有高達(dá)45%的大幅性能提升,能效提升也高達(dá)44%。
同樣相比第三代驍龍8,Oryon CPU在Chrome瀏覽器上的性能提升超過62%。
“在整個(gè)Android生態(tài)系統(tǒng)中處于領(lǐng)先地位,這是一個(gè)跨代際的提升。“阿力克斯·卡圖贊表示,“能效也提高了44%,這是驍龍的與眾不同之處?!?/p>
“高通Oryon CPU正是拼圖的最后一塊。我們從頭開始打造IP,這種方式賦予了我們對(duì)CPU的完全自主權(quán)。讓我們能夠直接定義和定制所有處理通道的配置,不需要任何外部依賴?!备咄夹g(shù)公司產(chǎn)品管理總監(jiān)Manju Varma表示。
第二代Oryon CPU有兩個(gè)最高主頻高達(dá)4.32GHz的超級(jí)內(nèi)核,適合應(yīng)對(duì)需要更快響應(yīng)速度的密集型應(yīng)用,以及6個(gè)Oryon性能內(nèi)核負(fù)責(zé)運(yùn)行最密集型的應(yīng)用程序,同時(shí)具有極高能效,沒有任何一個(gè)傳統(tǒng)意義上的效率內(nèi)核。
“多年來,我們已經(jīng)減少了效率內(nèi)核的數(shù)量,最終用亂序性能內(nèi)核取而代之,它們能夠提供最佳性能和功耗組合,這是驍龍8至尊版能面向?qū)嶋H用例樹立性能新標(biāo)桿的原因?!盡anju Varma解釋。
值得注意的是,驍龍8至尊版超級(jí)內(nèi)核CPU的最高主頻4.32GHz已經(jīng)超越了驍龍X Elite最高3.8GHz的主頻,性能也超越了競(jìng)品的PC CPU性能,這種設(shè)計(jì)的考量是什么?
“展示驍龍8至尊版CPU和PC競(jìng)品CPU的性能對(duì)比,更多是為了展現(xiàn)我們CPU設(shè)計(jì)的先進(jìn)性,從第一代到第二代Oryon CPU我們的內(nèi)核是逐年提升?!卑⒘怂埂た▓D贊進(jìn)一步表示,“PC和手機(jī)運(yùn)行多線程任務(wù)的方式不同,在手機(jī)上是盡可能壓榨頻率,以更少數(shù)量的核心支持多線程任務(wù);而在PC上則會(huì)降低頻率,同時(shí)引入更多數(shù)量的核心來支持多線程任務(wù)。”
“當(dāng)我們提高CPU頻率時(shí),總是會(huì)有與之相匹配的功耗降低,在延長(zhǎng)電池續(xù)航的同時(shí),實(shí)現(xiàn)性能增強(qiáng)?!卑⒘怂埂た▓D贊說,“對(duì)我們而言,每瓦特性能比單純的性能和頻率更重要。”
擁有高主頻還不是Oryon能夠大放異彩的全部原因,第二代Oryon CPU還大幅改進(jìn)了內(nèi)存架構(gòu)。
驍龍8至尊版Oryon CPU的每個(gè)叢集都擁有12MB的二級(jí)緩存,總計(jì)24MB緊密耦合的專用緩存是移動(dòng)領(lǐng)域最大的緩存。同時(shí)也大幅提升了一級(jí)緩存。
提升緩存大小能帶來更強(qiáng)處理能力的同時(shí)會(huì)帶來時(shí)延增加的問題,“經(jīng)過精心設(shè)計(jì)并采用先進(jìn)的緩存一致性協(xié)議,可顯著降低時(shí)延,提高整體性能并實(shí)現(xiàn)更低功耗。”Manju Varma表示。
考慮到生成式AI對(duì)內(nèi)存的高度依賴,驍龍8至尊版也配備目前業(yè)界最高速的10.7Gbps的LPDDR5內(nèi)存。
第二代高通Oryon CPU的微架構(gòu)和內(nèi)存系統(tǒng)升級(jí)帶來了更快的應(yīng)用啟動(dòng)速度、無縫的多任務(wù)處理和先進(jìn)的生成式AI功能,還有視頻渲染速度將大幅提升,這讓游戲成為了最大的受益用例。
首創(chuàng)切片架構(gòu)Adreno GPU
驍龍8至尊版能夠處理高要求游戲工作負(fù)載,包括CPU密集型物理模擬。憑借Oryon CPU,將能夠體驗(yàn)到戰(zhàn)斗對(duì)可破壞環(huán)境的影響,以及環(huán)境中的湍急水流、衣袂飄飄、翠綠花園、微風(fēng)拂塵。
另外,利用驍龍8至尊版的全部CPU內(nèi)核, Oryon CPU能在5毫秒時(shí)延內(nèi)處理超過1000個(gè)物體破壞和碰撞的情景。
“我們的Adreno GPU也經(jīng)過完全重新設(shè)計(jì),最大限度地提高性能和能效,這對(duì)移動(dòng)游戲至關(guān)重要?!卑⒘怂埂た▓D贊分享,對(duì)比第三代驍龍8商用智能手機(jī),對(duì)于圖形密集型游戲,驍龍8至尊版性能將提升40%,功耗降低40%,光追性能提升35%。
得益于驍龍8至尊版首創(chuàng)的切片架構(gòu)Adreno GPU,充分考慮了手游玩家需求,全新高通Adeno GPU能夠提供基于著色處理器的獨(dú)立內(nèi)核,能實(shí)現(xiàn)更佳工作分配和并發(fā)性能。
通過擴(kuò)展性能提供更高的時(shí)鐘頻率,當(dāng)渲染復(fù)雜場(chǎng)景時(shí),可以直接在GPU上存儲(chǔ)12MB數(shù)據(jù),減少向驍龍8至尊版DDR發(fā)送的圖形數(shù)據(jù),帶來更銳麗的圖像和更流暢的游戲體驗(yàn),實(shí)現(xiàn)更長(zhǎng)久的持續(xù)游戲體驗(yàn)。
即將在12月發(fā)布的《超級(jí)房車賽:傳奇(Grid Legends)》移動(dòng)版將獨(dú)家支持高通自適應(yīng)性能引擎4.0,這一引擎能引擎將提高終端能效,提供穩(wěn)定的終端性能。
驍龍8至尊版還提供了更多下一代游戲體驗(yàn)。虛幻引擎5的Nanite解決方案首次在移動(dòng)端運(yùn)行,目前僅在驍龍平臺(tái)上提供支持,在終端側(cè)渲染栩栩如生的環(huán)境。
基于全新設(shè)計(jì)的GPU,在網(wǎng)易《永劫無間》手游極致畫質(zhì)下,與前代平臺(tái)相比,驍龍8至尊版的平均幀數(shù)提升22幀,幀率穩(wěn)定性提升43%。
這一游戲是首個(gè)游戲內(nèi)終端側(cè)大語言模型,玩家可以用語音口令與AI隊(duì)友互動(dòng),幫助玩家優(yōu)化構(gòu)筑、協(xié)調(diào)即將到來的作戰(zhàn)行動(dòng),向新玩家提供策略來幫助學(xué)習(xí)游戲。
此時(shí)就不得不提再次進(jìn)化的包含CPU、GPU、NPU的異構(gòu)架構(gòu)高通AI引擎。
Hexagon NPU更好地支持多模態(tài)大模型
“如果Oryon CPU是一個(gè)出色的指揮家,負(fù)責(zé)同時(shí)運(yùn)行多個(gè)應(yīng)用,負(fù)責(zé)啟動(dòng)所有AI工作負(fù)載,處理繁重負(fù)載任務(wù)。那Hexagon NPU就是那個(gè)令人驚嘆的小提琴手,它將在AI最激烈的演奏高潮成為舞臺(tái)中央的焦點(diǎn)。”高通技術(shù)公司產(chǎn)品管理高級(jí)總監(jiān)Siddhika Nevrekar這樣形容。
與第三代驍龍8相比,全新架構(gòu)的Hexagon NPU性能提升45%,能效提升45%。結(jié)合全面提升的CPU和GPU,驍龍8至尊版能夠跨所有核心動(dòng)態(tài)管理AI負(fù)載。
NPU性能的大幅提升來自一系列重大改進(jìn),包括提升了所有加速器內(nèi)核的吞吐量,實(shí)現(xiàn)更快的AI推理性能。增加的標(biāo)量?jī)?nèi)核數(shù)量可以支持更長(zhǎng)內(nèi)容,達(dá)到4k上下文窗口,增加的向量?jī)?nèi)核可以加強(qiáng)對(duì)大語言模型和傳統(tǒng)AI的支持。
MLPerf基準(zhǔn)測(cè)試顯示,驍龍8至尊版的性能在所有模型上都超過了第三代驍龍8,基礎(chǔ)基礎(chǔ)大語言模型上的token生成速率提升了高達(dá)100%,目前業(yè)界流行的一些大語言模型上,驍龍8至尊版的處理速度達(dá)到超過70 tokens/s,可以加速AI助手運(yùn)行速度。
“在高通AI引擎的性能合奏中,這次我們引入了更多藝術(shù)家,其中一位就是內(nèi)存并發(fā)性。正如交響樂中的音樂家一起完美合奏,AI和計(jì)算機(jī)視覺工作負(fù)載現(xiàn)在可以同時(shí)訪問一個(gè)內(nèi)存空間并協(xié)同工作,創(chuàng)造流暢有趣的體驗(yàn)。”Siddhika Nevrekar補(bǔ)充表示。
這也是為了更好支持AI智能體。AI智能體底層依靠多種先進(jìn)AI模型支持,包括自動(dòng)語音識(shí)別(ASR)、大語言模型(LLM)、大視覺模型(LVM)和全新多模態(tài)大模型(LMM)。
“每個(gè)模型都是各自領(lǐng)域的專家,它們能夠協(xié)同工作,為用戶提供無縫的個(gè)性化服務(wù)?!盨iddhika Nevrekar說,“這些模型在高通AI引擎的不同內(nèi)核上運(yùn)行,它們像訓(xùn)練有素的團(tuán)隊(duì)一樣運(yùn)作,確保一切任務(wù)都能流暢高效地運(yùn)行,這就是異構(gòu)計(jì)算的魔力?!?/p>
為了充分發(fā)揮高通AI引擎的強(qiáng)大,高通也改進(jìn)了AI軟件。高通第一次能夠讓開發(fā)者驍龍8至尊版上利用高通AI Hub測(cè)試最新模型。
高通也與眾多合作伙伴一起推動(dòng)端側(cè)AI的發(fā)展,最新的合作是與騰訊混元合作,基于驍龍8至尊版移動(dòng)平臺(tái),共同推動(dòng)了騰訊混元大模型7B和3B版本的終端側(cè)部署。
智譜在GLM4v-mini上創(chuàng)建了基于多模態(tài)大模型的AI助手, GLM-4V端側(cè)視覺大模型能夠?qū)崿F(xiàn)令人驚嘆的處理能力,以超過70 tokens/秒的速度在基于驍龍8至尊版的終端側(cè)高速運(yùn)行。
AI ISP與NPU直連,視頻也能有消除功能
全新升級(jí)的NPU讓視頻AI也成為了可能。
“以前,ISP會(huì)先處理圖像,然后發(fā)送到NPU進(jìn)行后處理?!卑⒘怂埂た▓D贊介紹,“現(xiàn)在,處理管線將更加緊密配合。NPU可以直接訪問RAW原生傳感器數(shù)據(jù),在4K60fps下實(shí)現(xiàn)基于AI的實(shí)時(shí)增強(qiáng)。”
高通同樣為驍龍8至尊版重新設(shè)計(jì)了ISP,升級(jí)為AI ISP,性能全面提升,ISP吞吐量提高了近35%,能效提升高達(dá)25%。升級(jí)后的強(qiáng)大性能支持用戶利用多達(dá)三個(gè)4800萬像素傳感器同時(shí)進(jìn)行拍攝。
高通技術(shù)公司產(chǎn)品市場(chǎng)資深經(jīng)理Carina Affinito說,“我們還升級(jí)了關(guān)鍵組件,帶來更好的單幀逐行HDR對(duì)齊、時(shí)域降噪和自動(dòng)對(duì)焦硬件。面向3A——即自動(dòng)對(duì)焦、自動(dòng)白平衡和自動(dòng)曝光,還新增了AI輔助的增強(qiáng)功能。這些意味著圖像質(zhì)量的全面提升?!?/p>
充分利用Hexagon NPU可以在4K 60fps下進(jìn)行實(shí)時(shí)處理的特性,高通將先進(jìn)的AI算法直接引入圖像和視頻處理管線的核心,高通稱之為“Insight AI”,可以將攝影提升到全新高度。
其中一個(gè)功能無限語義分割支持對(duì)圖像進(jìn)行超過250層語義識(shí)別和分割,分割完成后可以對(duì)膚色和天空實(shí)時(shí)識(shí)別并修正;另一個(gè)功能是AI補(bǔ)光,可以在視頻通話或者直播時(shí)添加虛擬可移動(dòng)光源。
高通也與虹軟合作,展示了全新寵物攝影特性套件,手機(jī)能自動(dòng)對(duì)焦跟蹤寵物的眼睛,拍出最好的照片。
除了照片,驍龍8至尊版的AI ISP結(jié)合NPU也能將照片的消除功能用于視頻,并且全部在終端側(cè)運(yùn)行。
與去年一樣,驍龍8至尊版的首發(fā)將會(huì)是小米。
驍龍汽車平臺(tái)在高通內(nèi)部地位更高
2024年的高通驍龍峰會(huì)罕見的用了一天的峰會(huì)來重點(diǎn)介紹驍龍數(shù)字地盤,包括全新的驍龍座艙至尊版平臺(tái)和Snapdragon Ride至尊版平臺(tái)。
與驍龍8至尊版一樣,全新的驍龍汽車平臺(tái)同樣采用專為汽車定制的高通Oryon CPU。
高通技術(shù)公司汽車、行業(yè)解決方案和云事業(yè)群總經(jīng)理Nakul Duggal告訴雷峰網(wǎng),“為汽車定制的Oryon CPU主要是在安全性方面進(jìn)行增強(qiáng),提供更高的安全系數(shù)?!?/strong>
與前代頂級(jí)平臺(tái)相比,全新平臺(tái)的CPU速度旨實(shí)現(xiàn)在提升至3倍,AI性能旨在實(shí)現(xiàn)性能提升至最高12倍。
值得注意的是,高通為軟件定義汽車提供靈活性和可擴(kuò)展性,汽車制造商可以選擇在同一SoC上無縫運(yùn)行數(shù)字座艙和智能駕駛功能。也就是說驍龍座艙至尊版平臺(tái)和Snapdragon Ride至尊版平臺(tái)有許多相同的IP,且具備擴(kuò)展性。
Nakul Duggal認(rèn)為靈活的架構(gòu)是高通發(fā)展艙駕一體的優(yōu)勢(shì)所在。
另外,新的平臺(tái)滿足汽車安全標(biāo)準(zhǔn)ASIL-D,支持超過40個(gè)多模態(tài)傳感器,包括多達(dá)20個(gè)高分辨率攝像頭,實(shí)現(xiàn)360度全方位覆蓋和車內(nèi)監(jiān)測(cè)。
驍龍座艙至尊版平臺(tái)和Snapdragon Ride至尊版平臺(tái)將于2025年出樣,理想汽車和梅賽德斯-奔馳公司將會(huì)率先在量產(chǎn)車型中采用驍龍至尊版平臺(tái)。
高通也宣布了與谷歌達(dá)成多年戰(zhàn)略合作,提供先進(jìn)生成式AI賦能的解決方案以打造安全的先進(jìn)數(shù)字化車內(nèi)體驗(yàn)。
從PC到手機(jī)再到汽車,高通自研的Oryon CPU充分支撐了高通公司的新戰(zhàn)略,也讓高通轉(zhuǎn)型成為計(jì)算和連接的領(lǐng)導(dǎo)者。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。