丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
業(yè)界 正文
發(fā)私信給我在思考中
發(fā)送

0

通義千問登頂OpenCompass開源基模評測榜

本文作者: 我在思考中 2023-12-12 11:16
導(dǎo)語:僅開源12天,通義千問包攬多個大模型權(quán)威評測冠軍!

12月12日,中國權(quán)威的大模型評測平臺OpenCompass日前更新了榜單,阿里云通義千問登上開源基座大模型榜首,并在中文數(shù)據(jù)集評測中包攬前二。

通義千問登頂OpenCompass開源基模評測榜 圖說:通義千問72B登頂OpenCompass基座大模型榜

OpenCompass是上海人工智能實驗室開源的大模型評測平臺,涵蓋學(xué)科、語言、知識、理解、推理等五大評測維度,支持50余個數(shù)據(jù)集的評測,Qwen、LLaMA2等開源模型及GPT-4、ChatGPT等主流模型均參與評測,可全面評估大模型能力,是業(yè)界公認最權(quán)威的中文能力評測榜單之一。

通義千問72B開源模型(Qwen-72B),以67.1的綜合得分奪得OpenCompass基座大模型榜單冠軍,并在學(xué)科能力、理解能力兩大維度評測中超越標桿GPT-4,創(chuàng)下開源大模型的新紀錄。而在OpenCompass中文數(shù)據(jù)集評測中,通義千問72B基座大模型和對話大模型(Qwen-72B-Chat)包攬前二,與其他模型拉開差距。

通義千問登頂OpenCompass開源基模評測榜 圖說:通義千問72B基座大模型及對話大模型包攬中文數(shù)據(jù)集測試前二

據(jù)了解,自12月1日開源,通義千問72B即在10個權(quán)威基準評測中創(chuàng)下開源模型最優(yōu)成績,幾天前力壓Llama2登頂全球最具權(quán)威性的HuggingFace排行榜,此次又登上OpenCompass榜首,通義千問72B已成為國內(nèi)外公認的性能最強的開源大模型,完全可滿足企業(yè)級、科研級應(yīng)用對大模型性能的高要求。

截至目前,阿里云已開源通義千問18億、70億、140億、720億參數(shù)的4款大語言模型,以及視覺理解Qwen-VL、音頻理解Qwen-Audio的 2款多模態(tài)大模型,開源模型系列總下載量超150萬,并涌現(xiàn)出150余款新模型和新應(yīng)用。

為打造“AI時代最開放的大模型”,通義千問將持續(xù)投入開源,并為中小企業(yè)及全球開發(fā)者提供更便利的大模型服務(wù):開發(fā)者可在阿里云魔搭社區(qū)直接體驗系列模型效果,也可通過阿里云靈積平臺調(diào)用模型API,或基于阿里云百煉平臺定制大模型應(yīng)用;阿里云人工智能平臺PAI還針對通義千問全系列模型進行深度適配,推出輕量級微調(diào)、全參數(shù)微調(diào)、分布式訓(xùn)練、離線推理驗證、在線服務(wù)部署等服務(wù)。

雷峰網(wǎng)(公眾號:雷峰網(wǎng))


雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

分享:
相關(guān)文章
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說