通義千問(wèn)登頂OpenCompass開(kāi)源基模評(píng)測(cè)榜

本文作者：我在思考中

2023-12-12 11:16

導(dǎo)語(yǔ)：僅開(kāi)源12天，通義千問(wèn)包攬多個(gè)大模型權(quán)威評(píng)測(cè)冠軍！

12月12日，中國(guó)權(quán)威的大模型評(píng)測(cè)平臺(tái)OpenCompass日前更新了榜單，阿里云通義千問(wèn)登上開(kāi)源基座大模型榜首，并在中文數(shù)據(jù)集評(píng)測(cè)中包攬前二。

通義千問(wèn)登頂OpenCompass開(kāi)源基模評(píng)測(cè)榜圖說(shuō)：通義千問(wèn)72B登頂OpenCompass基座大模型榜

OpenCompass是上海人工智能實(shí)驗(yàn)室開(kāi)源的大模型評(píng)測(cè)平臺(tái)，涵蓋學(xué)科、語(yǔ)言、知識(shí)、理解、推理等五大評(píng)測(cè)維度，支持50余個(gè)數(shù)據(jù)集的評(píng)測(cè)，Qwen、LLaMA2等開(kāi)源模型及GPT-4、ChatGPT等主流模型均參與評(píng)測(cè)，可全面評(píng)估大模型能力，是業(yè)界公認(rèn)最權(quán)威的中文能力評(píng)測(cè)榜單之一。

通義千問(wèn)72B開(kāi)源模型（Qwen-72B），以67.1的綜合得分奪得OpenCompass基座大模型榜單冠軍，并在學(xué)科能力、理解能力兩大維度評(píng)測(cè)中超越標(biāo)桿GPT-4，創(chuàng)下開(kāi)源大模型的新紀(jì)錄。而在OpenCompass中文數(shù)據(jù)集評(píng)測(cè)中，通義千問(wèn)72B基座大模型和對(duì)話大模型（Qwen-72B-Chat）包攬前二，與其他模型拉開(kāi)差距。

通義千問(wèn)登頂OpenCompass開(kāi)源基模評(píng)測(cè)榜圖說(shuō)：通義千問(wèn)72B基座大模型及對(duì)話大模型包攬中文數(shù)據(jù)集測(cè)試前二

據(jù)了解，自12月1日開(kāi)源，通義千問(wèn)72B即在10個(gè)權(quán)威基準(zhǔn)評(píng)測(cè)中創(chuàng)下開(kāi)源模型最優(yōu)成績(jī)，幾天前力壓Llama2登頂全球最具權(quán)威性的HuggingFace排行榜，此次又登上OpenCompass榜首，通義千問(wèn)72B已成為國(guó)內(nèi)外公認(rèn)的性能最強(qiáng)的開(kāi)源大模型，完全可滿足企業(yè)級(jí)、科研級(jí)應(yīng)用對(duì)大模型性能的高要求。

截至目前，阿里云已開(kāi)源通義千問(wèn)18億、70億、140億、720億參數(shù)的4款大語(yǔ)言模型，以及視覺(jué)理解Qwen-VL、音頻理解Qwen-Audio的 2款多模態(tài)大模型，開(kāi)源模型系列總下載量超150萬(wàn)，并涌現(xiàn)出150余款新模型和新應(yīng)用。

為打造“AI時(shí)代最開(kāi)放的大模型”，通義千問(wèn)將持續(xù)投入開(kāi)源，并為中小企業(yè)及全球開(kāi)發(fā)者提供更便利的大模型服務(wù)：開(kāi)發(fā)者可在阿里云魔搭社區(qū)直接體驗(yàn)系列模型效果，也可通過(guò)阿里云靈積平臺(tái)調(diào)用模型API，或基于阿里云百煉平臺(tái)定制大模型應(yīng)用；阿里云人工智能平臺(tái)PAI還針對(duì)通義千問(wèn)全系列模型進(jìn)行深度適配，推出輕量級(jí)微調(diào)、全參數(shù)微調(diào)、分布式訓(xùn)練、離線推理驗(yàn)證、在線服務(wù)部署等服務(wù)。

雷峰網(wǎng)(公眾號(hào)：雷峰網(wǎng))

雷峰網(wǎng)版權(quán)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

0人收藏

相關(guān)文章

我在思考中

運(yùn)營(yíng)

發(fā)私信

當(dāng)月熱門(mén)文章