0
本文作者: Nemo | 2025-05-06 17:10 |
5月6日消息,國際權威大模型測評榜LiveBench公布了最新一期排名,阿里巴巴開源的新一代通義千問模型Qwen3(簡稱千問3)斬獲全球開源模型冠軍,并在指令遵循(Instruction Following)這一關鍵能力上超越o3 High、o4-Mini High、Gemini 2.5 pro等頂級閉源模型位列全球第一。
圖示 5月6日LiveBench榜單官網(wǎng)截圖
據(jù)了解,LiveBench榜單由圖靈獎得主、Meta首席AI科學家楊立昆(Yann LeCun)聯(lián)合紐約大學等機構(gòu)推出,從數(shù)學、推理、編程、語言理解等多個復雜維度全面評估大模型,并因其采用動態(tài)更新的題庫而被譽為“全球首個無法作弊的模型基準測試”。在最新一期的LiveBench榜單上,千問3表現(xiàn)與o4-mini、Claude3.7等頂尖閉源模型相當,并超越DeepSeek-R1取得了全球開源模型冠軍。同時,千問3還斬獲指令遵循這一細分領域的全球冠軍,這說明千問3具備全球頂級的語言理解和生成能力。
千問3于4月29日凌晨開源,是國內(nèi)首個“混合推理模型”,其參數(shù)量僅為DeepSeek-R1的1/3,性能全面提升的同時成本還大幅下降,引發(fā)大模型產(chǎn)業(yè)鏈連夜適配和接入浪潮:英偉達、英特爾、高通、聯(lián)發(fā)科、AMD、ARM、華為昇騰、壁仞科技等芯片平臺都已完成了千問3的適配,北上津杭等十余地算力平臺也已接入千問3。截至目前,阿里通義已開源200多個模型,全球下載量超過3億次,千問的衍生模型數(shù)量超10萬,遠超美國Llama,成為全球第一開源模型。
*附LiveBench榜單官網(wǎng)鏈接:https://livebench.ai/#/
雷峰網(wǎng)版權文章,未經(jīng)授權禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。