丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
業(yè)界 正文
發(fā)私信給Nemo
發(fā)送

0

智源評測出爐:豆包大語言模型排名第一,多模態(tài)能力獲得三項第二

本文作者: Nemo   2024-12-20 18:12
導語:豆包視覺理解模型現(xiàn)已對企業(yè)客戶開放使用。

12月19日,智源研究院發(fā)布最新一期大模型綜合及專項評測結果。在覆蓋國內外100余個開源和商業(yè)閉源大模型的評測中,豆包通用模型pro獲得大語言模型主觀評測最高分;在多模態(tài)模型評測中,豆包視覺理解模型排名視覺語言模型第二,成績僅次于GPT-4o;豆包文生圖模型、豆包視頻生成模型(即夢P2.0 pro)也分別在相應測試中獲得全球第二。

智源評測出爐:豆包大語言模型排名第一,多模態(tài)能力獲得三項第二

據智源研究院介紹,大模型評測平臺FlagEval聯(lián)合了全國10余家高校和機構合作共建。此次公布的榜單中,大語言模型主觀評測重點考察的是模型的中文能力,多模態(tài)模型評測榜單中,視覺語言模型主要考察的是模型在圖文理解、長尾視覺知識、文字識別以及復雜圖文數據分析能力。FlagEval大模型角斗場則是向用戶開放的模型對戰(zhàn)評測服務,反映了用戶對模型的偏好。

在大語言模型主觀評測中,豆包通用模型pro的知識運用和推理能力均獲得最高分,簡單理解、數學能力、安全等項目也排名前三,最終綜合成績排名第一。在FlagEval大模型角斗場榜單中,基于模型對戰(zhàn)的用戶投票結果,豆包通用模型pro得分排名第二,僅次于OpenAI的o1-mini。

在多模態(tài)模型評測榜單中,GPT-4o在視覺語言模型中排名第一,豆包視覺理解模型獲第二。在中文的通用知識、文字識別中,豆包表現(xiàn)突出,相比國外模型有較大優(yōu)勢。在文生圖測試中,混元和豆包排名前兩位;在文生視頻測試中,國產模型更是優(yōu)勢顯著,可靈1.5高品質版、即夢P2.0 pro、愛詩科技PixVerse v3和海螺AI排名前列。

據悉,豆包視覺理解模型在不久前的火山引擎Force大會上首次發(fā)布,現(xiàn)已對企業(yè)客戶開放使用。火山引擎方面表示,豆包大模型通過算法、工程、軟硬件結合的技術創(chuàng)新,大幅優(yōu)化使用成本,讓每一家企業(yè)都能用得起,推動AI技術普惠和應用發(fā)展。


雷峰網版權文章,未經授權禁止轉載。詳情見轉載須知。

分享:
相關文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經綁定,現(xiàn)在您可以設置密碼以方便用郵箱登錄
立即設置 以后再說