丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
芯片 正文
發(fā)私信給楊依婷
發(fā)送

0

AI算力新十年:技術革新、生態(tài)協(xié)同與商業(yè)閉環(huán),共探“下一個寒武紀”之路 | GAIR 2025

本文作者: 楊依婷   2025-12-15 11:15
導語:在算力成為基礎設施的時代,究竟什么樣的技術路徑、生態(tài)戰(zhàn)略和商業(yè)邏輯,能夠穿越周期,占據(jù)未來價值鏈的頂端?

作者 | 楊依婷 劉伊倫

編輯 | 包永剛

2025年12月13日,GAIR 2025「AI 算力新十年」專場在深圳·博林天瑞喜來登酒店正式啟幕。

作為國內前沿技術與產(chǎn)業(yè)變革的重要風向標,GAIR大會歷經(jīng)七屆積淀,見證并推動了中國 AI 產(chǎn)業(yè)從算法突破、硬件迭代,到商業(yè)落地的完整過程。本屆論壇直面智能體系的底層核心——算力,從架構、生態(tài)、工具鏈到產(chǎn)業(yè)化落地,探尋未來十年的關鍵變量。

上午場以「誰是下一個寒武紀」為主題,六位來自產(chǎn)、學、研、投等多個維度的嘉賓依次登臺,以不同視角揭示國產(chǎn)算力的現(xiàn)狀與未來——這不僅是在探尋一家明星企業(yè),更是在追問:

在算力成為基礎設施的時代,究竟什么樣的技術路徑、生態(tài)戰(zhàn)略和商業(yè)邏輯,能夠穿越周期,占據(jù)未來價值鏈的頂端?

從最底層的芯片架構哲學,到最頂層的應用落地挑戰(zhàn),一幅更立體、更清晰、也更具方向感的圖景,正在這場大會中緩緩展開。

深圳理工大學算力微電子學院院長唐志敏:通過軟件定義算力,才能打破芯片技術壁壘

AI算力新十年:技術革新、生態(tài)協(xié)同與商業(yè)閉環(huán),共探“下一個寒武紀”之路 | GAIR 2025

首位登場演講的嘉賓是深圳理工大學算力微電子學院院長,龍芯 CPU、海光 CPU 創(chuàng)始人唐志敏。深耕微電子與算力領域三十余載,唐志敏院長親歷了中國自主芯片從無到有、從弱到強的攻堅歷程,更在算力芯片(XPU)的體系結構、軟件生態(tài)與產(chǎn)業(yè)發(fā)展領域有著深厚積淀,對于算力時代下芯片技術突破瓶頸、產(chǎn)業(yè)生態(tài)構建難點,有著獨到且深刻的洞察。

唐志敏院長在大會上帶來了關于《XPU的未來——軟件定義成敗》的主題演講,從算力時代XPU發(fā)展的核心痛點切入,系統(tǒng)剖析軟件生態(tài)對算力芯片產(chǎn)業(yè)的決定性作用。

“我們不僅創(chuàng)造了‘算力’,還為它賦予了國際表達——computility?!碧浦久糸_篇點明,算力正在向“水、電般的公共事業(yè)”進化。他進一步延伸,隨著生成式AI的爆發(fā),算力衍生出“訓力”(快速訓練大模型的能力)與“推力”(基于大模型輸出結果的能力),甚至幽默展望:“未來會不會出現(xiàn)‘演力’,直接把金庸小說變成電視???”這些鮮活的概念,既是技術趨勢的提煉,更傳遞出中國科技界對定義未來的主動思考。

“當前算力芯片的發(fā)展,像在爬一座越來越陡峭的山,技術迭代速度卻越來越慢?!碧浦久粢孕蜗蟮谋扔髦赋龊诵拿埽阂环矫妫柖煞啪弻е翪PU等傳統(tǒng)處理器發(fā)展受限;另一方面,生成式AI對算力的需求呈指數(shù)級增長。

為應對這一矛盾,學術界與工業(yè)界正推動“異構計算”(CPU+XPU),但新問題隨之而來——“我們有了很多種樂器,卻沒有統(tǒng)一的樂譜”,編程復雜度激增、軟件兼容性差成為新瓶頸。

“生態(tài)是繞不開的命題?!碧浦久粢詳?shù)據(jù)佐證:X86架構歷經(jīng)四五十年沉淀,其軟件生態(tài)壁壘極高,ARM雖在手機領域稱雄,卻在服務器市場屢屢碰壁;RISC-V雖被視為“破局者”,但商業(yè)化之路同樣艱難。

他特別強調指令系統(tǒng)的重要性:“英特爾持續(xù)向X86架構中添加新指令,正是生態(tài)競爭的關鍵動作。”談及自主創(chuàng)新案例,他舉例:“我們在研發(fā)海光CPU時,阿里云為何優(yōu)先選擇英特爾?因為軟件優(yōu)化的積累,才是用戶選擇的核心。”

唐志敏強調,當前算力性能突破需跨學科交叉與軟件深度優(yōu)化雙輪驅動。他以Linpack測試為例,指出應用軟件性能提升難度遠超硬件迭代,通過軟硬件協(xié)同優(yōu)化,在現(xiàn)有制程限制下實現(xiàn)算力效能最大化。“中國半導體受全球趨勢及制程限制,必須通過軟件定義算力,打破傳統(tǒng)軟硬件隔閡?!?/p>

針對GPGPU發(fā)展現(xiàn)狀,唐志敏警示部分產(chǎn)品已偏離GPU本質功能。他以生成式AI場景為例,說明圖形渲染、著色等基礎能力的重要性:"將小說轉化為電視劇,既需要GPT的內容生成,也依賴GPU的視覺呈現(xiàn)。" 同時,他分析系統(tǒng)廠商自研芯片浪潮時指出,蘋果的成功在于通過自研CPU實現(xiàn)產(chǎn)品增值與全棧軟件掌控,而"未能提升產(chǎn)品溢價的自研芯片終將面臨市場挑戰(zhàn)"。

在架構創(chuàng)新層面,唐志敏明確反對指令系統(tǒng)碎片化:"現(xiàn)有指令系統(tǒng)足以支撐架構創(chuàng)新,RISC-V應成為產(chǎn)業(yè)統(tǒng)一標準。"他認為,計算芯片產(chǎn)業(yè)正呈現(xiàn)螺旋式發(fā)展,未來將回歸融合異構特性的CPU中心化架構,而RISC-V的包容性可有效整合CPU、GPU及AI處理器特性,通過開源體系突破生態(tài)壁壘。

“套用三國定律來理解芯片生態(tài),就是分久必合、合久必分,以前是以CPU為中心,現(xiàn)在就是去中心化的異構計算,CPU和XPU聯(lián)合起來,但也會面臨很多問題,我們希望在將來回歸到以CPU為中心的大一統(tǒng),總體就說一個否定之否定的過程?!碧浦久粼洪L最后總結稱。

劉方明教授:國產(chǎn)算力驅動大模型需破解體系化挑戰(zhàn),生態(tài)應從“野蠻生長”走向集約與開放

AI算力新十年:技術革新、生態(tài)協(xié)同與商業(yè)閉環(huán),共探“下一個寒武紀”之路 | GAIR 2025

面向AI大模型和智能體興起的機遇和挑戰(zhàn),第二位演講嘉賓劉方明教授作了題為《國產(chǎn)算力驅動的大模型體系化挑戰(zhàn):全生命周期工具鏈與示范應用》的主題報告。

首先,劉方明教授分析了當前大模型的發(fā)展趨勢。他指出,當前算力中心和芯片等AI Infrastructure需要智算應用驅動,全球范圍內大模型數(shù)量和智能體應用已呈爆發(fā)式增長。

但他同時觀察到一種新動向:“隨著DeepSeek的推出,全球模型有從‘百模大戰(zhàn)’向‘十模爭鋒’的收斂趨勢?!?/p>

針對國內大模型發(fā)展生態(tài),他指出當前仍面臨“野蠻生長”帶來的多重挑戰(zhàn):國產(chǎn)模型能力存在差距、開源率低、工具鏈缺乏體系化、評測標準不統(tǒng)一以及價值對齊合規(guī)安全仍需技術保障。

他進一步介紹了鵬城實驗室作為國家實驗室的獨特定位——“保底線”,致力于在極端情況下保障國產(chǎn)算力主權和模型的自主可控。

“現(xiàn)在模型正逐漸走向集約化路線,不是只比誰規(guī)模大、暴力出奇跡了,而是看誰能用最少的數(shù)據(jù)、最少的算力、最少的能耗做出好用的模型。”劉方明尤其強調了范式的轉變。

鵬城實驗室在發(fā)布了2000億參數(shù)的大語言模型后,又推出了33B和2B參數(shù)的中小尺寸模型,并將2B參數(shù)模型全過程開源,包括所有數(shù)據(jù)和數(shù)據(jù)配比、權重和訓練環(huán)節(jié),方便用戶復現(xiàn)和使用。

最后,他重申了“用以致善”的理念:“好的模型、算力、芯片、硬件是靠用出來的。”目前,鵬城實驗室正與氣象、金融、文博、生態(tài)環(huán)境、智能制造等行業(yè)合作,推動大模型在典型場景中的示范應用,以實踐驅動國產(chǎn)算力與大模型全生命周期體系的成熟。

燧原科技聯(lián)合創(chuàng)始人兼首席生態(tài)官李星宇:國產(chǎn)算力行業(yè)將迎來淘汰賽,軟件生態(tài)是關鍵勝負手

AI算力新十年:技術革新、生態(tài)協(xié)同與商業(yè)閉環(huán),共探“下一個寒武紀”之路 | GAIR 2025

燧原科技聯(lián)合創(chuàng)始人兼首席生態(tài)官、芯片行業(yè)資深專家李星宇,在大會上帶來題為《時不我待,破局國產(chǎn)AI算力技術生態(tài)》的主題演講。

作為國產(chǎn)AI算力領域的深耕者與實踐者,李星宇親歷了國產(chǎn)算力芯片從技術攻堅到商業(yè)化落地的全歷程,在算力硬件創(chuàng)新、軟件生態(tài)構建與產(chǎn)業(yè)場景融合等領域有著豐富經(jīng)驗。

李星宇拋出一組關鍵數(shù)據(jù):“今年全球算力投資資本支出預計將超過4600億美金,超過美國登月計劃的總投入。”他解釋,當前全球頂級互聯(lián)網(wǎng)公司在AI領域的大部分資本支出(CapEx)用于算力采購,中國市場同樣如此,BAT等互聯(lián)網(wǎng)大廠占據(jù)了68%以上的份額。

從商業(yè)化應用看,AI正加速滲透至AI編程、數(shù)字IP內容領域。李星宇提到,“AIGC在數(shù)字人、游戲、影視行業(yè)今年國內產(chǎn)值預計超1000億,全球數(shù)字內容生成市場規(guī)模已近500億美金,加上AI編程領域、虛擬交互這三大場景構成了當前AI商業(yè)化的主戰(zhàn)場?!?/p>

而在這三大主戰(zhàn)場背后,GPU作為核心算力載體,其競爭的勝負手早已超出硬件性能本身,延伸至生態(tài)層面?!败浖鷳B(tài)是GPU硬件行業(yè)的勝負手?!?/p>

而中國的表現(xiàn)令全球矚目。李星宇強調,“中國已成為大模型領域的開源生態(tài)領導者。HuggingFace Top10模型中,9個來自中國公司。更關鍵的是,在實際商業(yè)化場景中,中國開源模型生成的Token量已超過全球其他開源模型總和。

談及技術演進,李星宇指出,軟硬結合,AI算法需求驅動計算架構持續(xù)創(chuàng)新,數(shù)據(jù)格式的創(chuàng)新和優(yōu)化帶來了算力性能的提升,從FP32到FP16再到FP8和FP4,每一次迭代都需要硬件架構的支持和軟件生態(tài)的集成優(yōu)化。

硬件層面,技術棧的范圍從單芯片加速向超大規(guī)模系統(tǒng)工程演進,在單芯片架構層面,需要CPU和XPU整個異構系統(tǒng)的軟硬件協(xié)同優(yōu)化,綜合標量、向量和張量計算,更高效率支持算法的工程創(chuàng)新,如PD分離、MLA、MTP等。軟件層面,更需要深度擁抱開源軟件生態(tài),如DeepSeek,Qwen,ChatGLM3等,借助生態(tài)的力量充分釋放硬件的算力。集群層面,要解決超高速互聯(lián)技術、系統(tǒng)分級存儲、以及液冷等挑戰(zhàn)。

“國產(chǎn)算力行業(yè)將迎來淘汰賽?!崩钚怯钪毖?,由于系統(tǒng)級產(chǎn)品研發(fā)需海量資金投入,今年國內算力企業(yè)正全力沖擊資本市場,預計未來一年A股和港股至少6家公司沖刺上市。資金和技術儲備不足、生態(tài)布局薄弱的企業(yè)或將加速出局。得益于豐富的商業(yè)化應用場景,燧原的產(chǎn)品迭代獲得了堅實支撐,國民級爆款應用已經(jīng)用到了燧原的算力。

“破局國產(chǎn)算力技術生態(tài),是一場技術、商業(yè)與人才的長跑”,李星宇最后總結道,擁抱開源,構建開放、統(tǒng)一的技術體系,避免“煙囪式”發(fā)展、凝聚生態(tài)合力;綁定場景,與“AI+場景”深度綁定,以商業(yè)化場景打磨技術棧;培育人才,從社區(qū)和高校源頭入手,將國產(chǎn)AI算力技術棧融入人才培養(yǎng)體系。

摩爾線程副總裁王華:萬卡集群+智能工具鏈,破解大模型訓練效率與穩(wěn)定性難題

AI算力新十年:技術革新、生態(tài)協(xié)同與商業(yè)閉環(huán),共探“下一個寒武紀”之路 | GAIR 2025

隨后,摩爾線程副總裁王華作了題為《基于國產(chǎn)GPU集群的大規(guī)模訓練實踐》的主題演講,系統(tǒng)介紹了大模型訓練當前面臨的挑戰(zhàn)、摩爾線程的軟件棧指出以及提升訓練效率的關鍵技術與工具。

王華開宗明義地介紹了萬卡甚至更大規(guī)模的集群的必要性。他以Kimi、GPT-5、Grok等模型為例,揭示其計算量已超過了的102? FLOPs量級。在此背景下,集群規(guī)模成為壓縮訓練時間的核心變量。

一組對比數(shù)據(jù)直觀而震撼:對于某個特定大模型,千卡集群需耗時173天,而在萬卡集群上,即便模型浮點運算利用率(MFU)會從40%降至30%,訓練時間也能被大幅壓縮至23天。

“對于大模型來說,訓練非常關鍵?,F(xiàn)在模型的競爭非常激烈,一些算法實驗希望快速驗證效果,而完成訓練的時間越短越好,最好不要超過1個月?!蓖跞A強調道。

那么,如何系統(tǒng)性地駕馭這個龐大而復雜的生命周期?王華隨后分享了摩爾線程的“全棧應對之道”。

在軟件生態(tài)上,摩爾線程提供了從Model Studio一站式平臺、深度融合的MT-MegatronLM與DeepSpeed框架、適配國產(chǎn)GPU的Torch-MUSA與MT-TransformerEngine,到底層MUSA計算庫及KuaE集群平臺的全棧支持。

此外,摩爾線程還構建了一套貫穿訓練前、中、后期的智能工具體系,旨在將不可控的風險轉化為可管理、可自動恢復的常規(guī)操作。

在訓練啟動前,SimuMax 支持訓練資源規(guī)劃與時間估算,并可驗證優(yōu)化效果;起飛檢查對計算、網(wǎng)絡、存儲及軟件環(huán)境進行全面診斷,保障集群健康。

訓練過程中,慢節(jié)點檢測系統(tǒng)實時定位硬件或通信異常;針對隱蔽的靜默數(shù)據(jù)錯誤,通過硬件監(jiān)控與重運行(Re-Run)等措施防范;Hang問題可通過定位源頭節(jié)點并自動重啟恢復;面對 Inf/NaN 異常,系統(tǒng)可自動檢測并通過重運行或更換節(jié)點處置。

同時,分布式 Profiling 系統(tǒng)提供從輕量級實時洞察到全鏈路深度分析的能力,支撐持續(xù)性能調優(yōu)。

展望未來,摩爾線程以“為美好世界加速”為愿景,正致力于通過全功能GPU與全棧軟件能力的深度融合,為這場AI算力的極限挑戰(zhàn)提供堅實、高效且智能的基礎設施。

云天勵飛技術副總裁羅憶:2025年是AI芯片消耗關鍵拐點,推理芯片消耗或將超過訓練芯片

AI算力新十年:技術革新、生態(tài)協(xié)同與商業(yè)閉環(huán),共探“下一個寒武紀”之路 | GAIR 2025

云天勵飛技術副總裁羅憶,在大會上帶來題為《芯智AI筑基,普惠點亮未來》的主題演講。

作為深耕AI芯片與智能生態(tài)領域的資深從業(yè)者,羅憶見證了人工智能從技術突破到規(guī)?;瘧玫难葸M歷程,在算力芯片架構創(chuàng)新、AI推理技術路線探索與產(chǎn)業(yè)生態(tài)落地等方面有著深厚積累。

羅憶指出,AI產(chǎn)業(yè)正從“模型訓練”向“推理應用”加速切換。2025年,AI芯片消耗將迎來重要轉折,推理芯片消耗量或將超過訓練芯片。這一判斷源于企業(yè)端推理需求的爆發(fā):谷歌日調用量已達43萬億Token,字節(jié)跳動近期或突破40萬億,云廠商如谷歌、亞馬遜等已加速自研推理芯片以應對需求。

針對大模型應用的“經(jīng)濟學困境”,羅憶強調成本優(yōu)化是關鍵。當前萬億參數(shù)模型面臨算力、帶寬等成本的“幾何級增長”,需通過稀疏化、蒸餾化、量化優(yōu)化等技術降低門檻,推動AI從“高成本探索”走向“規(guī)?;栈荨薄?/p>

談及中國AI發(fā)展路徑,羅憶總結為“數(shù)據(jù)飛輪”模式: 應用生產(chǎn)數(shù)據(jù)-數(shù)據(jù)訓練算法-算法定義芯片-芯片賦能規(guī)?;瘧?。區(qū)別于美國通過政策強推技術突破的路徑,中國以“人工智能+”計劃為核心,依托千行百業(yè)的場景落地反哺技術迭代,逐步縮短與美國在AI產(chǎn)業(yè)鏈上的差距。

在國產(chǎn)AI推理芯片方面,羅憶提出三個發(fā)展方向:軟件生態(tài)兼容,以平衡算法迭代與算力利用率;突破存儲技術瓶頸,支持3D memory技術;異構計算與優(yōu)化性價比,目標在未來三到五年內讓百萬Token成本降至1元以內。

云天勵飛作為國產(chǎn)AI芯片代表,已完成芯片架構升級,實現(xiàn)全流程國產(chǎn)工藝轉型,構建起覆蓋端邊云的產(chǎn)品矩陣。

IO資本創(chuàng)始合伙人趙占祥:大模型算力突圍需摒棄“單點追趕”,以系統(tǒng)級架構與工藝創(chuàng)新開辟多元化中國路徑

AI算力新十年:技術革新、生態(tài)協(xié)同與商業(yè)閉環(huán),共探“下一個寒武紀”之路 | GAIR 2025

論壇的最后一位嘉賓,是來自IO資本的創(chuàng)始合伙人趙占祥,他專注于硬科技與半導體領域的早期及成長期投資,會上發(fā)表了題為《大模型時代,國產(chǎn)AI芯片破局的幾種新技術路線》 的演講。

趙占祥在演講伊始,就將話題聚焦于當前的核心制約——在美國對華出口管制不斷升級,瞄準先進計算與先進制造產(chǎn)業(yè)鏈的背景下,未來我們怎樣在工藝受限的情況下超過英偉達?

“只能靠新的技術路徑?!壁w占祥給出了他的答案。

面對從先進制程、HBM到先進封裝的全面限制,國內已涌現(xiàn)出一批從架構革新、工藝融合、系統(tǒng)優(yōu)化入手的創(chuàng)新企業(yè),其路徑呈現(xiàn)出多元化特征。趙占祥從云端AI芯片、邊緣AI芯片、端側AI芯片、loT末端AI芯片以及先進封裝等不同方向,分享了不同企業(yè)的創(chuàng)新路線。

在數(shù)據(jù)中心的AI芯片,部分企業(yè)摒棄了對單卡算力的盲目追求,轉而構建更高效的系統(tǒng)。例如,TPU路線通過打造大規(guī)模超節(jié)點、省去交換機和HBM,在集群層面追求更高性價比;以太網(wǎng)互聯(lián)網(wǎng)方案可以做到百萬卡的分布式集群,允許丟包,可擴展性更高。

在邊緣AI芯片方向,隨著桌面級AI應用(如AI NAS、AI攝像頭)的井噴,專為這些場景設計的LPU架構等應運而生,它們通過3D DRAM堆疊等技術,在有限功耗和成本下實現(xiàn)驚人的內存帶寬。

在端側AI芯片方向,主要針對手機以及各種智算終端,存算一體與近存計算成為關鍵。無論是將計算單元嵌入存儲芯片的3D-CIM架構,還是在LPDDR內存中集成處理能力的PIM方案,目標都是在手機有限的面積和功耗預算內,流暢運行數(shù)10億參數(shù)的大模型。

“3D DRAM,要靠先進封裝”。趙占祥強調,大算力芯片正在向三維架構變革,這使得先進封裝及其檢測設備不再是配角,而是決定性能和良率的核心。

更進一步,趙占祥直言:“光電合封,是下一代AI算力的基石?!蹦芤詳?shù)量級優(yōu)勢提升集成度、降低功耗,是突破現(xiàn)有電氣互聯(lián)瓶頸的關鍵方向。

“中國真正強的是,我們可以把應用做好,有工程師紅利,我們在各個領域都有不同的定制化方案和創(chuàng)新的解決路線?!壁w占祥的洞察揭示了此次芯片創(chuàng)新浪潮的驅動力——不是單一技術的顛覆,而是在廣泛的應用需求牽引下,通過多條技術路徑的并進,系統(tǒng)性構建自主的AI算力生態(tài)。

“誰是下一個寒武紀?”——這場思辨在討論中暫告段落,答案并未指向某個具體名字,卻清晰揭示出:追問本身,遠比答案更重要。

本次論壇的意義,正在于將這一具體追問,拓展為對產(chǎn)業(yè)未來的系統(tǒng)性審思——從技術路徑的抉擇、生態(tài)模式的構建,到商業(yè)邏輯的沉淀。

尋找的過程,即是建構的過程。

我們或許尚未見到最終的引領者,卻已在思辨中凝聚了共識,辨明了前行的方向與必須夯實的基石。

這份對前沿的探索與對創(chuàng)新的篤行,正是驅動產(chǎn)業(yè)持續(xù)進化的根本動力。

我們期待,以此論壇為新的起點,產(chǎn)學研投各界能凝聚更廣泛的共識,形成更強大的合力。

智算新時代的帷幕已然拉開,關于技術路徑、產(chǎn)業(yè)格局與未來定義的探討仍將延續(xù),讓我們懷抱這份期待,在未來征程中,再次相聚,共見分曉。

雷峰網(wǎng)(公眾號:雷峰網(wǎng))

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉載。詳情見轉載須知。

分享:
相關文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設置密碼以方便用郵箱登錄
立即設置 以后再說