丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
業(yè)界 正文
發(fā)私信給郭思
發(fā)送

0

大模型在手機上運行的預言,被高通提前實現(xiàn)了

本文作者: 郭思 2023-06-29 14:30
導語:高通推出混合AI,讓大模型會在手機上運行的預言提前變成現(xiàn)實

大模型在手機上運行的預言,被高通提前實現(xiàn)了

尖子生不交「廢卷」。 

作者 | 郭思 

 編輯 | 陳彩嫻

 2023年4月,中國AI布道人陸奇在演講中表示,未來是一個模型無處不在的時代,他更是堅定地預言有一天大模型會在手機上運行。

 兩個月后,一則關于高通演示Stable Diffusion的視頻在網(wǎng)上流傳。 視頻中,操作人員在一部沒有聯(lián)網(wǎng)的安卓手機上使用了Stable Diffusion 來生成 AI 圖像,整個生成時間不超過 15 秒,整個過程完全在終端進行,但是生成效果卻沒打一點折扣。 

 陸奇關于大模型會在手機上運行的預言,被高通提前變成了現(xiàn)實。

 大模型在手機上運行的預言,被高通提前實現(xiàn)了

 一份另辟蹊徑的AI答卷 

數(shù)據(jù)顯示,目前已有超過 3000 個可用的生成式 AI 應用和特性,幾乎所有全球科技大公司都在積極布局AI大模型。 然而大模型的成敗,高度依賴算力支撐。一個人工智能大模型,通常得用數(shù)萬億個單詞訓練,參數(shù)量也“飆升”到了上萬億。

 以GPT為例,OpenAI在2018年推出的GPT參數(shù)為1.17億,預訓練數(shù)據(jù)量為5GB,而GPT-3參數(shù)量達1750億,預訓練數(shù)據(jù)量達45TB,在模型訓練階段??偹懔ο募s為3640 PF-days,總訓練成本為1200萬美元。國內的華為“盤古”大模型參數(shù)最多可達1.085萬億,阿里達摩院M6最新參數(shù)已從萬億躍遷至10萬億。

 一個共識其實已經(jīng)形成:誰能解決算力成本,誰便擁有優(yōu)先話語權。 

 對此,科學行業(yè)眾多「優(yōu)等生」集中開卷,更好的算法,更高能效的芯片,成為主流路線。而高通這個長久以來專注于芯片的「尖子生」卻默默提交了一份另辟蹊徑的答卷——混合AI。 

 混合AI聚焦的是對于AI計算的降本增效: 

 終端和云端協(xié)同工作,在適當?shù)膱鼍昂蜁r間下分配 AI 計算的工作負載,以提供更好的體驗,并高效利用資源,這便是混合AI。

 這一理論可以用章魚這種動物來闡釋。章魚擁有巨量的神經(jīng)元,60%分布在章魚的八條腿上,僅有40%在大腦,因此它的觸角有獨立思考能力且反應敏捷,在捕獵時異常靈巧迅速,腕足之間配合極好,從不會纏繞打結。 章魚的大腦相當于我們常說的云,而觸角則相當于邊緣端也就是手機電子設備等終端。 章魚狩獵時物體最靠近哪邊,便使用那個觸角。 

 對于一個AI任務,混合AI這個章魚會根據(jù)模型和查詢需求的復雜度等因素,來決定將這個任務丟給哪個觸角來處理最快最高效。有時候可能需要A觸角,有時候需要A+B觸角一起,有時候得丟給大腦,一切根據(jù)處理任務的復雜來決定。 

 例如,如果模型大小、提示(prompt)和生成長度小于某個限定值,并且能夠提供可接受的精確度,推理即可完全在終端側進行。如果是更復雜的任務,模型則可以跨云端和終端運行。 

 除此之外,混合 AI 還能支持模型在終端側和云端同時運行,也就是在終端側運行輕量版模型時,在云端并行處理完整模型的多個標記(token),并在需要時更正終端側的處理結果。這能極大限度地解決能耗和成本問題。 

大模型在手機上運行的預言,被高通提前實現(xiàn)了

隱私方面,這個章魚也處理得得心應手,直接從源頭減少數(shù)據(jù)運輸過程,隱私泄露的問題便不復存在。 高通指出,混合 AI 架構中有一個“隱私模式”,當用戶利用終端側 AI 向聊天機器人輸入健康問題或創(chuàng)業(yè)想法等敏感話題時,這個模式會自動開啟。

  一種無可比擬的AI實力 

人世間數(shù)百萬個閑暇的小時流逝過去,方始出現(xiàn)一個真正的歷史性時刻,對一個問題數(shù)千種同質思考,出現(xiàn)了一絲細微的變化,這便是創(chuàng)新的源頭。

 但高通的AI實力并不僅限于提出一個創(chuàng)新性理念,它的AI王國早已通過具體的落地地基得以搭建。 與以往的邊緣計算一樣,混合AI概念十分前衛(wèi),但要完美落地,仍需要滿足多方條件。

 硬件上,AI端側需要使用計算能力強和存儲容量大的終端設備,算法上,為了將AI模型部署到邊緣設備上,需要優(yōu)化算法,使其能夠適應較小的計算資源和存儲空間。同時AI端側需要有高質量的本地數(shù)據(jù)來幫助進行推理。 

 這三點,卻恰恰好是高通的綜合優(yōu)勢。 

 數(shù)據(jù)顯示,搭載高通 AI 引擎的終端設備產(chǎn)品出貨量已超過 20 億,高通以極低功耗提供業(yè)界領先的終端側 AI 性能,提供完美硬件。 

 在算法上,高通有一批專門的研究團隊從事神經(jīng)網(wǎng)絡架構開發(fā)和調整工作。 拿最火的視頻產(chǎn)業(yè)舉例,主流視頻算法做法是用卷積神經(jīng)網(wǎng)絡處理視頻,但這其實是一個計算量巨大的任務。卷積處理圖像時需要——將圖像完整地“掃”一遍,有時會浪費巨大的算力,但真正的視頻,往往存在大量變化不大的場景。 針對這一問題,高通推出的FrameExit 模型由多個級聯(lián)分類器組成,可以隨著視頻幀的復雜度,來改變模型所用的神經(jīng)元數(shù)量。

 簡而言之,F(xiàn)rameExit就是一個會偷懶的計算模型,有點類似于一個高效的管理者,深諳資源調配之道。當看到視頻前后幀差異大的時候,AI會用整個模型計算;前后幀差異小的時候,則只用模型的一部分計算。相比于其他模型,這種方法最高甚至能提升5倍的性能,與此同時,神經(jīng)網(wǎng)絡檢測的精確度也大幅增加。

 在軟件方面,高通推出的 AI 軟件棧將各種AI軟件產(chǎn)品整合到一個軟件包,這對于AI工作者而言便是一個能滿足各種需求的AI"淘寶"。 里面有琳瑯滿目的主流AI 框架(TensorFlow、PyTorch、ONNX等),亦集成了推理軟件開發(fā)包(SDK),基礎的實時操作系統(tǒng)(RTOS)、系統(tǒng)接口和驅動程序以及廣泛的操作系統(tǒng)和用于部署和監(jiān)控的基礎設施;小打襪子,大到冬衣,用戶都可以在淘寶解決,同理,從模型設計到優(yōu)化、部署和分析,這一系列完整工作,開發(fā)者都可以在高通AI 軟件棧里完成。

 更有意思的是,在高通AI 軟件棧開發(fā)出的大模型可以在不同地方使用,同時可以與混合AI部署相結合,「黃金長矛」和「勝利之盾」同時握在高通之手,生成式AI規(guī)?;瘮U展與普及,指日可待。 

 一場由來已久的AI布局 

從時間維度上而言,高通對 AI 的布局其實由來已久。 

 2013年,高通Zeroth 處理器發(fā)布,采用了仿生自生物大腦的神經(jīng)元架構,能夠不依賴編程、而是通過反復的“觀察”和“自學習”,實現(xiàn)程序、性能的自我進化。 

 回顧整個高通AI的布局,Zeroth是重要節(jié)點,卻僅僅只是一個開始。 

 2015年,高通在世界移動大會(MEC)上展示了照片分類和手寫識別應用、同年與阿姆斯特丹大學建立聯(lián)合研究實驗室,并發(fā)布了第一代人工智能產(chǎn)品(驍龍820)。驍龍820集成了首個專門面向移動平臺的高通AI引擎,支持圖像、音頻和傳感器的運算。

 2016年,為了在各類設備上實現(xiàn)基于深度學習的軟件開發(fā),高通為驍龍系列移動處理器開發(fā)了“神經(jīng)處理引擎”(NPE),并為其發(fā)布了SDK(開發(fā)工具包),這個SDK的發(fā)布,可以讓軟件開發(fā)者更好地利用移動端芯片的深度學習能力。一經(jīng)發(fā)布,便被FaceBook(現(xiàn)Meta)等知名企業(yè)相中,通過高通NPE,F(xiàn)aceBook的照片和直播視頻中的現(xiàn)實增強功能性能提升了5倍。 

 2019年,高通正式發(fā)布驍龍865移動平臺,支持許多移動端的新老應用,包括AI實時語音翻譯、人像留色、背景虛化、AI一鍵多拍、夜景拍攝與人像智能識別。

 2022年,高通在AI生態(tài)上再推利器,推出高通AI軟件棧(Qualcomm AI Stack),為開發(fā)者提供了一個絕佳平臺(上文已有詳細闡述)。而此次高通白皮書發(fā)布,混合式的AI的提出再次讓我們看到了高通在AI布局上的決心和其長遠的規(guī)劃。

大模型在手機上運行的預言,被高通提前實現(xiàn)了

一家擁有全球基因的硬件公司在算力成本上的范式創(chuàng)新,這種突破性在AI賽道上已經(jīng)屬于前無古人,也很有可能成為一種里程碑式的存在。

 同時,它留下的想象空間也是巨大的。 

 這種想象空間源于高通不斷自我革新的突破精神。

 另一個層面,眾多早已扎根的應用領域,加上高通在硬件領域的優(yōu)勢,會進一步擴大高通AI布局的外延。 “我們的 AI 能力賦能一系列廣泛的產(chǎn)品,包括手機、汽車、XR、PC 和物聯(lián)網(wǎng)?!备咄ò灼缡钦f。 比如,在汽車領域,高通推出了 5 納米工藝制程打造的首款可擴展自動駕駛 SoC 平臺。本田、梅賽德斯、雷諾、沃爾沃等數(shù)十家廠商都搭載了這個平臺。 

 未來,AI將賦能更加智能的人車交互體驗,比如在高通數(shù)字座艙里,用戶可以體驗到真正意義上的“和自己的車對話”。你可以告訴你的車:“導航帶我去機場,但是在去機場的路上,我要找個地方吃個漢堡,再找個地方喝某種口味的咖啡,順便把我之前干洗的衣服取了?!睂τ谶@一切要求,「貼心管家」AI都將能高效完成。 “因為與其他商用終端不同,在汽車里出現(xiàn)任何一個小錯誤都可能帶來非常嚴重的后果。所以我們在確保提供最佳體驗的同時,也要確保極高的準確性?!备咄夹g公司產(chǎn)品管理高級副總裁兼AI負責人Ziad Asghar表示。

 與此同時,結合搭載高通平臺的各項設備,混合AI在保護用戶隱私的基礎上,可以應用于包括高通AI引擎支持的全球40%的手機、高通16000 家的客戶相關的物聯(lián)網(wǎng)設備、65 款采用高通驍龍平臺的 XR 終端及未來其他的智能設備等,推動高通實現(xiàn)在AI領域的無界延展。

 混合AI讓「大模型在終端上運行」這件事從將來時變成了進行時。 高通在一定程度上,也會從一家傳統(tǒng)芯片企業(yè),成為AI領域極具潛力的黑馬。 翻開高通的白皮書的最后一頁,對于混合AI,高通總結道,憑借具備前瞻性的早期研究和產(chǎn)品開發(fā)投入,目前驍龍平臺能夠支持參數(shù)超過 10 億的生成式 AI 模型,并即將支持 100 億或更多參數(shù)的模型。 

 高度凝練,只說數(shù)據(jù),正如高通多年以來呈現(xiàn)在大眾眼前的形象。在現(xiàn)今的環(huán)境下,或許對于AI行業(yè)而言,只有高度凝練的“真”,才能不負這個時代。如果我們把科技企業(yè)放在這樣一個維度上要求,對于高通混合AI即將帶來的顛覆,這一次或許值得期待。 

 白皮書鏈接:https://www.qualcomm.cn/        【雷峰網(wǎng)】 【雷峰網(wǎng)】 【雷峰網(wǎng)(公眾號:雷峰網(wǎng))



雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉載。詳情見轉載須知。

分享:
相關文章
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設置密碼以方便用郵箱登錄
立即設置 以后再說