0
本文作者: 包永剛 | 2024-12-23 10:21 |
作者|包永剛
編輯|王 川
最近一兩個(gè)月發(fā)布的新一代的旗艦手機(jī),散發(fā)著全新的AI味。
10月29日,首款搭載全新驍龍8至尊版的小米15/15 Pro發(fā)布,語(yǔ)音助理小愛同學(xué)變身為AI超級(jí)小愛。
緊隨其后發(fā)布的搭載驍龍8至尊版的旗艦手機(jī),榮耀Magic 7系列的YOYO助理?yè)u身一變成了YOYO智能體。一加13的小布助手進(jìn)化成為超級(jí)小布助手。
就像鼠標(biāo)的誕生改變了計(jì)算機(jī)界面的交互方式,智能手機(jī)的誕生帶來(lái)了全新的觸控交互界面,如今生成式AI也正在帶來(lái)一場(chǎng)新的終端交互變革。
“我想給大家展示這一愿景:生成式AI將從根本上改變應(yīng)用程序和用戶體驗(yàn),而這正是驍龍現(xiàn)在以及未來(lái)的核心關(guān)注點(diǎn)之一。”高通公司總裁兼CEO安蒙(Cristiano Amon)在2024高通驍龍峰會(huì)上分享,“我們所熟悉的體驗(yàn)即將發(fā)生變化,并且將轉(zhuǎn)變?yōu)楦尤菀捉邮芎屠斫獾姆绞健?strong>這不是某一個(gè)殺手級(jí)應(yīng)用,而是每一個(gè)應(yīng)用的體驗(yàn)都將改變。”
在11月的科技盛會(huì)Web Summit上,安蒙也再次強(qiáng)調(diào)了高通公司對(duì)生成式AI未來(lái)的看法,他強(qiáng)調(diào),生成式AI就是新的UI,它將作為新的交互方式服務(wù)于我們周圍所有的計(jì)算終端,AI賦能的智能體將成為行業(yè)應(yīng)對(duì)和把握機(jī)遇的關(guān)鍵。正如觸控界面的變革讓手機(jī)成為了新的計(jì)算空間,在生成式AI的變革里,汽車、XR等更多邊緣終端也將成為新的計(jì)算空間,迎接生成式AI的時(shí)代,這也是高通已經(jīng)明確的戰(zhàn)略方向。“AI是新的UI,以APP為中心的體驗(yàn)正在改變”,安蒙表示。
深入了解驍龍8至尊版以及驍龍數(shù)字底盤強(qiáng)大的AI引擎正在自下而上,從硬件到軟件革新終端的體驗(yàn),將會(huì)對(duì)混合AI的未來(lái)更加期待。
AI讓手機(jī)開始「更具人味」
全新旗艦手機(jī)上智能助理的集體升級(jí),可能會(huì)被視為營(yíng)銷噱頭,但具體看看常用功能的新升級(jí),就能品味到生成式AI時(shí)代手機(jī)的“AI味”。
先看小米AI超級(jí)小愛的改變,全新的AI字幕功能支持全局實(shí)時(shí)翻譯,看國(guó)外影片有實(shí)時(shí)字幕,開國(guó)外會(huì)議有同聲傳譯。還有AI識(shí)音支持全局聲音轉(zhuǎn)錄,能夠區(qū)分不同說話人并生成摘要。AI寫作是一個(gè)全局文字工具,支持一步潤(rùn)色改寫。
常用功能有了新玩法,并且全局可用,這些都得益于手機(jī)系統(tǒng)層級(jí)支持了AI。
榮耀YOYO智能體同樣是平臺(tái)級(jí)AI,比如只需要一句“關(guān)閉應(yīng)用通知”、“點(diǎn)杯奶茶”,以往手動(dòng)需要好幾步的操作,一句話就能讓手機(jī)自動(dòng)從系統(tǒng)底層調(diào)動(dòng)不同應(yīng)用,完成任務(wù)。
手機(jī)的AI功能更智能,應(yīng)用范圍更廣,手機(jī)變得越來(lái)越有生成式AI的味道。
“人們現(xiàn)在已經(jīng)習(xí)慣于以應(yīng)用程序?yàn)橹行牡捏w驗(yàn)。”安蒙說,“現(xiàn)在每個(gè)應(yīng)用程序和用例都可能面臨改變,AI的出現(xiàn)讓機(jī)器可以理解人類的語(yǔ)言,所以我們熟悉的使用體驗(yàn)將被徹底重新定義。”
那什么樣的生成式AI殺手級(jí)應(yīng)用可以顛覆手機(jī)體驗(yàn)?
安蒙對(duì)此表示,“很多頗具殺手級(jí)潛力的應(yīng)用還未出現(xiàn),但當(dāng)下的轉(zhuǎn)變正在發(fā)生。我堅(jiān)信生成式AI就是未來(lái),只是沒有人能給出具體的時(shí)機(jī)。”
手機(jī)朝智能體進(jìn)化的過程,就可能出現(xiàn)殺手級(jí)應(yīng)用。
“目前已發(fā)布的智能手機(jī)中,還尚未實(shí)現(xiàn)真正的智能體處理,市場(chǎng)上現(xiàn)有的應(yīng)用是比較優(yōu)秀的智能語(yǔ)音助手?!备咄夹g(shù)公司高級(jí)副總裁兼技術(shù)規(guī)劃和邊緣解決方案業(yè)務(wù)總經(jīng)理馬德嘉(Durga Malladi)在驍龍8至尊版剛發(fā)布時(shí)表示,“兩者的區(qū)別在于,智能體能夠執(zhí)行更加復(fù)雜的任務(wù),尤其是那些指令不明確的任務(wù)。例如,智能體需要自行選擇合適的模型執(zhí)行處理任務(wù)?!?/p>
手機(jī)智能體實(shí)現(xiàn)的核心——多模態(tài)和異構(gòu)計(jì)算
手機(jī)智能體的實(shí)現(xiàn),就需要手機(jī)自下而上,從硬件到軟件的全面革新。
多模態(tài)大模型是實(shí)現(xiàn)智能體的關(guān)鍵
馬德嘉分享了一個(gè)例子,拿起手機(jī)說“今晚幫我訂一個(gè)墨西哥菜餐廳,距離不要太遠(yuǎn),評(píng)分要高,到店時(shí)間預(yù)計(jì)晚上7點(diǎn)30到8點(diǎn)30之間,還得是我過去三個(gè)月沒有去過的餐廳?!?/p>
要回答這個(gè)問題,智能體會(huì)要調(diào)用各種不同的模型來(lái)進(jìn)行處理。首先,理解所提出的問題。其次,如果要挑選一家距離不遠(yuǎn)的餐廳,要知道現(xiàn)在的位置信息。最后還要滿足“過去三個(gè)月內(nèi)沒去過的餐廳”,需要基于用戶的個(gè)人知識(shí)圖譜,存儲(chǔ)在終端側(cè)的用戶情境信息(例如喜歡的飲食、鍛煉習(xí)慣、過往偏好等)作為個(gè)人知識(shí)圖譜,幫助手機(jī)更好地理解用戶意圖。
“智能體本質(zhì)是一個(gè)能處理非常復(fù)雜任務(wù)的規(guī)劃器,與智能體交互的方式要結(jié)合語(yǔ)音、文本、圖像等等?!瘪R德嘉進(jìn)一步表示,“要進(jìn)行智能體規(guī)劃,多模態(tài)能力將起到非常大的幫助,所以智能體必須要有多模態(tài)的支持。”
早在今年2月,高通AI研究就演示了全球首個(gè)在Android手機(jī)上運(yùn)行的多模態(tài)大模型。同時(shí)還演示了搭載驍龍X Elite的Windows PC上運(yùn)行超70億參數(shù)的多模態(tài)大模型,可接受文本和環(huán)境音頻輸入(如音樂、交通環(huán)境音頻等),并基于音頻內(nèi)容生成多輪對(duì)話。
上個(gè)月,高通推出了高通AI規(guī)劃器。通過理解與本地情境信息相融合的個(gè)人偏好,高通AI規(guī)劃器能夠?qū)⑦@些知識(shí)整合進(jìn)生成式AI助手中,為用戶提供有意義的個(gè)性化回復(fù)和行動(dòng)。
當(dāng)然,借助多模態(tài)模型,高通AI規(guī)劃器支持多種終端交互模態(tài),包括文本、視覺和語(yǔ)音。
高通技術(shù)公司手機(jī)、計(jì)算和XR事業(yè)群總經(jīng)理阿力克斯·卡圖贊(Alex Katouzian)說,“智能手機(jī)助手可以支持多模態(tài)和智能體功能,意味著它可以見你所見,聞你所聞,理解你周圍的世界。這確保它能夠在不提示其他應(yīng)用程序的情況下處理滿足用戶的個(gè)人需求、完全在終端上運(yùn)行以保證數(shù)據(jù)安全和隱私,并即時(shí)響應(yīng)用戶請(qǐng)求?!?/p>
高通AI規(guī)劃器將成為高通AI軟件棧的重要部分,軟件的進(jìn)化也需要硬件全面升級(jí)實(shí)現(xiàn)更好支持。
計(jì)算效率和內(nèi)存大幅升級(jí)的高通AI引擎
2015年推出的驍龍820集成了首個(gè)高通AI引擎,這是一個(gè)異構(gòu)計(jì)算引擎,此后高通的AI引擎緊跟AI技術(shù)的發(fā)展和市場(chǎng)需求持續(xù)升級(jí)。
2018年高通Hexagon DSP升級(jí)成為Hexagon NPU,早于行業(yè)對(duì)于NPU的關(guān)注,高通的異構(gòu)AI引擎也升級(jí)為CPU、GPU、NPU的組合。
今年推出的驍龍8至尊版,高通AI引擎再次全方位升級(jí)。
特別值得關(guān)注的是被稱為高通自研芯片最后一塊拼圖的高通Oryon CPU首次集成到移動(dòng)平臺(tái)。
高通的首代自研Oryon CPU搭載在PC平臺(tái)驍龍X Elite上,在今年Microsoft Build上首批搭載高通Oryon CPU的Windows 11 AI+ PC宣布之后,高通便迅速成為了一匹黑馬,成為了AI PC領(lǐng)域的標(biāo)桿,Oryon CPU幫助高通在從一家無(wú)線連接公司轉(zhuǎn)型為連接+計(jì)算公司的道路上實(shí)現(xiàn)了進(jìn)一步的飛躍。
驍龍8至尊版上的高通第二代自研Oryon CPU,室溫環(huán)境下相比第三代驍龍8,CPU的單線程和多線程基準(zhǔn)測(cè)試中性能有高達(dá)45%的大幅性能提升,能效提升也高達(dá)44%。第二代Oryon CPU跨代際的性能提升,對(duì)多任務(wù)處理、時(shí)延關(guān)鍵型任務(wù)、生產(chǎn)力應(yīng)用、初始化AI工作負(fù)載都有顯著的提升。
將第二代Oryon CPU引入高通AI引擎,就像交響樂團(tuán)加入了一位出色的指揮家,負(fù)責(zé)啟動(dòng)所有AI工作負(fù)載,處理繁重負(fù)載任務(wù),讓AI引擎的其他組件可以專注于特定的AI任務(wù)。
全面升級(jí)的Hexagon NPU就像是交響樂團(tuán)里令人驚嘆的小提琴手。全新架構(gòu)的Hexagon NPU性能提升45%,能效提升45%。
為了支持生成式AI和多模態(tài)模型,實(shí)現(xiàn)更快推理,Hexagon NPU增加了更多內(nèi)核,更多標(biāo)量?jī)?nèi)核可以支持更長(zhǎng)內(nèi)容,達(dá)到4k上下文窗口,更多的向量?jī)?nèi)核可以加強(qiáng)對(duì)大語(yǔ)言模型和傳統(tǒng)AI的支持。
處理效率大幅提升還不足夠,內(nèi)存也是限制生成式AI在終端運(yùn)行的主要因素。
“要在手機(jī)上直接運(yùn)行一個(gè)100億參數(shù)的模型,不進(jìn)行任何壓縮,至少需要占用20GB內(nèi)存,所以模型的壓縮和量化都非常重要?!瘪R德嘉表示,“我們現(xiàn)在已經(jīng)支持不同數(shù)據(jù)精度的量化技術(shù),通過多種量化技術(shù)可以縮小模型。去年在端側(cè)運(yùn)行大模型還是一個(gè)挑戰(zhàn),今天對(duì)我們而言就變得相對(duì)簡(jiǎn)單,并且我們還在持續(xù)改進(jìn)?!?/p>
第二代Oryon CPU大幅改進(jìn)的內(nèi)存架構(gòu)也讓驍龍8至尊版能符合邊緣AI的需求。
全新的Oryon CPU每個(gè)叢集都擁有12MB的二級(jí)緩存,總計(jì)24MB緊密耦合的專用緩存是智能手機(jī)領(lǐng)域最大的CPU緩存。同時(shí),在每個(gè)超級(jí)內(nèi)核和性能內(nèi)核中,高通還大幅提升了一級(jí)緩存。另外,考慮到生成式AI高度依賴內(nèi)存,驍龍8至尊版配備目前最高速的10.7Gbps LPDDR5x內(nèi)存。
高通AI引擎的內(nèi)存并發(fā)性,讓AI和計(jì)算機(jī)視覺工作負(fù)載可以同時(shí)訪問一個(gè)內(nèi)存空間,也將端側(cè)AI的性能和可能性進(jìn)一步提升。
還有首創(chuàng)的切片架構(gòu)Adreno GPU,性能將提升40%,功耗降低40%,也是全新AI引擎中重要的組成部分。
驍龍8至尊版AI引擎的全面升級(jí),讓驍龍8至尊版的大模型處理性能全面超越第三代驍龍8,基礎(chǔ)大語(yǔ)言模型的token生成速率提升高達(dá)100%,在目前業(yè)界流行的一些大語(yǔ)言模型上,驍龍8至尊版的處理速度達(dá)到超過70 tokens/s,是業(yè)界的領(lǐng)先水平。
當(dāng)然,將全面升級(jí)的高通AI引擎與驍龍8至尊版全新設(shè)計(jì)的AI-ISP,GPU相結(jié)合,也讓新一代旗艦手機(jī)突破了影像和游戲性能的上限,并帶來(lái)了更多智能手機(jī)AI應(yīng)用的可能。
比如榮耀Magic 7系列上的AI消除、AI擴(kuò)圖、AI風(fēng)格、人臉修復(fù)的魔法修圖功能。還有小米15系列上的告知拍攝內(nèi)容就能自動(dòng)匹配功能模式或參數(shù),告訴修圖方向就可以自動(dòng)調(diào)整圖像。以及一加13上AI去反光、AI消除、AI去拖影的AI拯救廢片功能。
同樣搭載驍龍8至尊版的真我GT7 Pro上的AI大神輔助2.0功能,讓AI成為游戲里全隊(duì)的最佳輔助。
汽車是新的計(jì)算空間
生成式AI是計(jì)算領(lǐng)域的一次重大變革,它將改變智能手機(jī)時(shí)代的布局,改變操作系統(tǒng)和應(yīng)用商店的角色,改變計(jì)算的角色。
安蒙說,“汽車行業(yè)正經(jīng)歷前所未有的重大變革。當(dāng)前汽車成為了全新計(jì)算空間。我們除了為汽車帶來(lái)全新屏幕和數(shù)字座艙,生成式AI也為汽車帶來(lái)變革?!?/p>
驍龍數(shù)字底盤解決方案已經(jīng)成為汽車行業(yè)的重要資產(chǎn)之一,高通與幾乎所有的汽車制造商都有合作關(guān)系。
全新發(fā)布的驍龍座艙至尊版平臺(tái)和Snapdragon Ride至尊版使驍龍數(shù)字底盤的性能也全面升級(jí)。
驍龍座艙至尊版集成的NPU,性能比上代旗艦驍龍座艙SoC提升高達(dá)12倍,支持transformer加速和端到端網(wǎng)絡(luò)架構(gòu)而設(shè)計(jì),能支持大型基礎(chǔ)模型。
利用其中的基礎(chǔ)模型之一,通過檢索增強(qiáng)生成(RAG)可以實(shí)現(xiàn)車輛預(yù)防性維護(hù)等用例——AI助手可利用在汽車手冊(cè)上進(jìn)行訓(xùn)練的模型,針對(duì)屏幕上的未知圖標(biāo)進(jìn)行答案檢索。
“我們將見證一場(chǎng)由AI驅(qū)動(dòng)的革命?!闭绨裁伤f,這也是為何許多企業(yè)也在著眼于并深信這一充滿變革的未來(lái),并基于驍龍平臺(tái)與高通合作的原因。
高通一直致力于推動(dòng)平臺(tái)AI能力的開放化,確保所有開發(fā)者都能基于高通和驍龍平臺(tái)面向不同終端打造AI應(yīng)用和能力。今年年初,高通推出了高通AI Hub。高通AI Hub上目前已經(jīng)有數(shù)百個(gè)面向高通和驍龍平臺(tái)優(yōu)化的前沿開源AI模型,已經(jīng)獲得領(lǐng)先的開發(fā)者生態(tài)的認(rèn)可。
驍龍峰會(huì)期間,高通還宣布了與OpenAI、Meta、騰訊混元、智譜、Mistral AI、Tech Mahindra等一系列業(yè)界領(lǐng)先AI企業(yè)的進(jìn)一步合作,以共同打造一個(gè)繁榮的邊緣側(cè)AI生態(tài),加速生成式AI為廣泛終端帶來(lái)的體驗(yàn)變革。雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。