丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
芯片 正文
發(fā)私信給陳致遠
發(fā)送

0

性能是其它AI PC的60倍,英偉達如何變革端側AI?

本文作者: 陳致遠 2024-01-09 18:04
導語:截至今日,英偉達已擁有超過1億臺RTX AI PC和工作站的用戶。

2024年,AI PC無疑是消費級市場中最受關注的焦點,同時端側大模型及生成式AI的熱度仍在持續(xù)上升。隨著越來越多AI PC新品的發(fā)布,PC產業(yè)正在迎來一場新的革命。

而這場革命中必然少不了英偉達。就在今日,英偉達于CES 2024中發(fā)布了GeForce RTX 40 SUPER系列產品,并正式對外宣布已優(yōu)化的軟件、庫及工具。

英偉達新的軟硬件產品不僅將為游戲玩家?guī)砣碌腁I游戲體驗,還將推動端側生成式AI的普及。

性能是其它AI PC的60倍,英偉達如何變革端側AI?

RTX 40 SUPER系列發(fā)布,英偉達加入AI PC主戰(zhàn)場

AI PC,是指具備集成軟硬件混合式智能學習與推理能力的計算機。

但目前業(yè)內對AI PC的定義仍較為模糊,以西南證券的研究報告為例,其將AI PC定義為:在架構設計上,AI PC最重要的是嵌入了AI芯片,形成“CPU+GPU+NPU”的異構方案。

不過,英偉達在不使用NPU的情況下,仍能讓PC表現出優(yōu)異的性能,其表示:“以宏碁、華碩、戴爾、惠普、聯想、微星等合作伙伴發(fā)布全新RTX AI筆記本電腦為例,與使用NPU相比,RTX AI筆記本電腦的性能可提升20-60倍?!?/p>

不過無論AI PC該如何被定義,在這一波浪潮中,產品性能才是王道,擁有創(chuàng)造和運行生成式AI的生態(tài)才是標準。這點也可以從其新款RTX 40 SUPER系列產品看出。

雷峰網(公眾號:雷峰網)了解到,本次發(fā)布性能最高的GeForce RTX 4080 SUPER,在AI工作負載方面,生成視頻的速度比RTX 3080 Ti快1.5倍,生成圖像的速度比RTX 3080 Ti快1.7倍。SUPER GPU的Tensor Core可提供最高可達836 AI TOPS。

而新發(fā)布的GeForce RTX 4070 Ti SUPER則是擁有更多核心,顯存容量增至 16GB,顯存位寬為256 bits。比RTX 3070 Ti快1.6倍,打開DLSS 3后,比RTX 3070 Ti快2.5 倍。而RTX 4070 SUPER,則是核心數量比RTX 4070多20%,使其僅使用RTX 3090的一小部分功耗就實現了超越RTX 3090的性能,借助DLSS 3,它的性能領先優(yōu)勢將擴大到1.5倍。

性能是其它AI PC的60倍,英偉達如何變革端側AI?

基于強大的AI性能,英偉達的GeForce GPU將給包括游戲玩家在內的用戶帶來全新的AI體驗。

游戲玩家的全新體驗和端側AI的全面普及

英偉達推出了NVIDIA ACE(Avatar Cloud Engine)微服務,它使用生成式AI讓游戲NPC變得更真實,旨在增強用戶與游戲NPC之間的交互。具體表現為,用戶以自然語言對游戲NPC說話后,NPC并無預設回復,而是由大模型生成NPC的反應、回復內容、語音、口型、神態(tài)。背后的大模型可以運行在云上,也可以運行在PC端。

同時,英偉達發(fā)布了NVIDIA RTX Remix,用于創(chuàng)建經典游戲RTX重制版的平臺。測試版將于本月底發(fā)布,提供生成式AI工具,可將經典游戲中的基本紋理轉化物理精準的4K高精度材質。

幀率提升方面,NVIDIA DLSS 3支持幀生成技術(Frame Generation),可利用AI將幀率提高到原生渲染的4倍,據了解,這將用于已發(fā)布的14款全新RTX游戲中的十幾款游戲中,包括《地平線:西之絕境》(Horizon Forbidden West)、Pax Dei和《龍之信條 2》(Dragon’s Dogma 2)等。

AI開發(fā)者也可以充分利用端側強大的AI能力,讓生成式AI無處不在。

英偉達月底即將上線NVIDIA AI Workbench工具包,允許開發(fā)者在PC或工作站上快速創(chuàng)建、測試和自定義預訓練的生成式AI模型和LLM,并且項目可擴展到數據中心、公有云或NVIDIA DGX Cloud等,然后再回到PC或工作站上的本地RTX系統進行推理和輕量定制。該工具還簡化了對Hugging Face、GitHub和NVIDIA NGC等流行存儲庫的訪問。

性能是其它AI PC的60倍,英偉達如何變革端側AI?

NVIDIA AI Foundation Models and Endpoints(包括RTX加速的AI模型和軟件開發(fā)工具包)有了新的進展。目前英偉達與惠普達成合作,將其集成到惠普AI Studio中,這是一個集成化的數據科學平臺,簡化AI模型的開發(fā)。這將使用戶能跨PC和云輕松搜索、導入和部署優(yōu)化后的模型。并且,為PC使用場景構建AI模型之后,開發(fā)者可使用NVIDIA TensorRT對其進行優(yōu)化,以充分利用RTX GPU的Tensor Core。

英偉達通過TensorRT-LLM for Windows將TensorRT擴展到基于文本的應用,目前最新更新現已發(fā)布,將Phi-2加入不斷增長的PC預優(yōu)化模型列表,與其他backend相比推理速度提升5倍;另一方面,TensorRT擴展更新版的發(fā)布,令加速Stable Diffusion XL (SDXL) Turbo和LCM的性能提升了60%。

英偉達還宣布了一項為AI愛好者而設計的技術Demo——Chat with RTX。據了解,這項服務或將作為開源參考項目于月底發(fā)布,讓用戶通過"檢索增強生成retrieval-augmented generation(RAG)",可將PC LLM連接到自己的數據。該Demo由TensorRT-LLM 加速,使用戶快速與自己的筆記、文檔和其他內容進行交互。  

雷峰網原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知。

分享:
相關文章
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
立即設置 以后再說