0
騰訊混元圖像 3.0 發(fā)布僅僅一周,就開啟了全球“霸榜“模式。
10月5日,國際大模型競技場LMArena最新文生圖榜單顯示,混元圖像 3.0在全球26個大模型中,高居第一位。這一結(jié)果來自全球所有用戶的“盲測”,這也標志著混元在多模態(tài)生成方面達到全球領(lǐng)先水平。
LMArena官方社交平臺也第一時間發(fā)文祝賀:“文生圖排行榜大洗牌!騰訊混元圖像3.0登頂競技場——同時被評為最佳綜合文生圖模型與最佳開源文生圖模型。這款圖像生成模型已超越Seedream 4,以及代號"nano-banana"的Gemini 2.5 Flash Image Preview。重大突破,恭喜騰訊混元。”
9 月初,騰訊混元開源的圖像2.1已是當(dāng)時效果最佳的開源生圖模型。此次混元圖像3.0更上一層樓,首次奪得文生圖榜單冠軍,超越眾多頂級閉源模型,展現(xiàn)出強大的技術(shù)實力。
LMArena是美國加州大學(xué)伯克利分校推出的創(chuàng)新AI模型評估平臺,評測核心方法是基于人類真實偏好的“盲測”機制,讓用戶對不同AI模型的回答進行匿名投票,衡量模型的表現(xiàn)。用戶輸入問題后,平臺提供兩個模型的回答,用戶根據(jù)偏好選擇更優(yōu)答案,投票結(jié)果直接塑造公共排行榜。 由于該平臺訪問量巨大,并且評測機制貼近實際體驗,是目前國際上最權(quán)威的競技場榜單。
混元圖像3.0是騰訊9月28日發(fā)布并開源的原生多模態(tài)生圖模型。這是首個開源工業(yè)級原生多模態(tài)生圖模型,也是目前效果最好的開源生圖模型?;煸獔D像3.0具備常識并能夠利用知識進行推理;同時語義理解準確度高,并具備極致美學(xué)質(zhì)感,能生成真實的高質(zhì)感圖片;支持中英文文字生成,長文本文字渲染。
混元圖像3.0模型也同樣受到開發(fā)者的歡迎,發(fā)布后不久即登上了Hugging Face開源社區(qū)模型熱榜的第一名,持續(xù)一周穩(wěn)居第一;如今又登上了LMarena榜單的榜首,反映了用戶與社區(qū)對模型的關(guān)注與認可。
騰訊混元團隊透露,混元圖像3.0目前的版本已開放了文生圖能力,圖生圖、圖像編輯、多輪交互等版本將于后續(xù)發(fā)布。
理解世界知識,可基于簡單提示詞自主推理生成
精確生成文字,支持長文本渲染
準確理解復(fù)雜語義
多格表情包生成
寫實感與美學(xué)提升
多模態(tài)正在成為混元大模型的核心競爭力之一,混元3D與圖像生成模型均處于行業(yè)頂尖水平。在3D生成領(lǐng)域,8月上海人工智能實驗室的全球3D生成模型評測榜單顯示,混元3D模型在圖生3D和文生3D任務(wù)中均位列第一;混元世界模型Voyager在斯坦福大學(xué)WorldScore基準測試中綜合能力排名首位。
混元目前已形成語言、圖像、視頻、3D模型的多尺寸、多模態(tài)開源矩陣,提供接近商業(yè)模型性能的開源基座。圖像、視頻衍生模型數(shù)量總數(shù)達到3000個,混元3D系列模型社區(qū)下載量超過260萬,是全球最受歡迎的3D開源模型。
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。