0
本文作者: Nemo | 2025-05-19 18:13 |
5月19日消息,全球頂級網(wǎng)絡(luò)技術(shù)會議SIGCOMM近日發(fā)布2025年度論文入選名單,騰訊云提交的兩項創(chuàng)新技術(shù)方案獲得收錄,分別解決了云計算和大模型訓(xùn)練中的網(wǎng)絡(luò)技術(shù)難題。
騰訊云研發(fā)的FORNAX技術(shù)通過硬件與軟件協(xié)同,成功破解傳統(tǒng)云網(wǎng)絡(luò)流量激增時的卡頓問題。傳統(tǒng)方案依賴軟件管理硬件數(shù)據(jù)轉(zhuǎn)發(fā)規(guī)則,容易在流量高峰時出現(xiàn)延遲和故障。FORNAX通過軟硬協(xié)同,讓硬件具備自主感知流量變化能力,結(jié)合智能糾錯機制,實現(xiàn)異常情況秒級響應(yīng)。該技術(shù)已穩(wěn)定運行兩年多,支撐數(shù)十億用戶流量,保持硬件故障零宕機記錄。
針對AI大模型所需的超大規(guī)模GPU集群,騰訊云推出星脈網(wǎng)絡(luò)方案。通過優(yōu)化網(wǎng)絡(luò)架構(gòu),實現(xiàn)單機柜6.4萬塊GPU高效互聯(lián),全集群支持51.2萬GPU組網(wǎng)。同時創(chuàng)新電源管理和散熱方案,提升設(shè)備密度并降低能耗。配套的智能監(jiān)控系統(tǒng)可將故障定位時間從數(shù)天縮短到分鐘級。該技術(shù)已應(yīng)用于騰訊混元大模型、騰訊元寶等業(yè)務(wù),也服務(wù)了大量的企業(yè)客戶。
不久前,星脈團隊針對DeepSeek開源的DeepEP通信框架進行深度優(yōu)化,使其在多種網(wǎng)絡(luò)環(huán)境下均實現(xiàn)顯著性能提升。相關(guān)技術(shù)方案也獲得了DeepSeek公開致謝。
SIGCOMM是計算機網(wǎng)絡(luò)領(lǐng)域最高水平學(xué)術(shù)會議,歷史上推動了TCP/IP、SDN、P4可編程網(wǎng)絡(luò)等里程碑網(wǎng)絡(luò)技術(shù)的誕生。SIGCOMM論文被引用率極高,常成為教科書案例。此次入選,標(biāo)志著騰訊云在云網(wǎng)絡(luò)和AI基礎(chǔ)設(shè)施領(lǐng)域達到國際領(lǐng)先水平。
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。