0
本文作者: Nemo | 2025-03-26 11:06 |
3月26日,中國(guó)AI又給全球開(kāi)源社區(qū)帶來(lái)了新驚喜——阿里通義千問(wèn)與DeepSeek,均于昨日低調(diào)開(kāi)源了兩款新模型:阿里發(fā)布了更適合本地部署的高性能「多模態(tài)模型」Qwen2.5-VL-32B,DeepSeek則將此前熱門(mén)的「基座模型」V3更新到0324版本,并官宣在魔搭社區(qū)上架開(kāi)源。截至目前,魔搭社區(qū)模型總數(shù)已超4萬(wàn)個(gè),已成為中國(guó)最大的AI開(kāi)源社區(qū)。
千問(wèn)Qwen-VL是全球AI開(kāi)源社區(qū)最受歡迎的多模態(tài)模型之一,此前,通義千問(wèn)Qwen2.5-VL已開(kāi)源3B、7B及72B等3個(gè)尺寸,昨日又推出更適合本地部署的32B版本。Qwen2.5-VL-32B模型在MMMU、MathVista、 MM-MT-Bench 等基準(zhǔn)測(cè)試中的性能表現(xiàn)突出,超越了更大規(guī)模的 Qwen2-VL-72B 和 GPT-4o-0513,并且優(yōu)于近期火熱的Mistral-Small-3.1-24B 、Gemma-3-27B-IT等模型。在開(kāi)發(fā)者關(guān)注的知名Hacker News網(wǎng)站上,Qwen2.5-VL-32B的熱度爆表,是當(dāng)天評(píng)論最多的新聞。
DeepSeek-V3是全球最受關(guān)注的基座大模型之一,也于昨夜官宣完成小版本升級(jí)。據(jù)DeepSeek透露,新版 V3-0324 模型借鑒 R1 模型訓(xùn)練過(guò)程中所使用的強(qiáng)化學(xué)習(xí)技術(shù),大幅提高了在推理類(lèi)任務(wù)上的表現(xiàn)水平,在數(shù)學(xué)、代碼類(lèi)相關(guān)評(píng)測(cè)集上取得了超過(guò) GPT-4.5 的得分成績(jī),并在前端開(kāi)發(fā)、中文寫(xiě)作、中文搜索等能力上均有提升。V3-0324 模型在HuggingFace開(kāi)源后不久,即斬獲趨勢(shì)榜榜首。同時(shí),在昨日官方推文中,DeepSeek首次官宣在魔搭社區(qū)開(kāi)源,更好服務(wù)于中國(guó)開(kāi)發(fā)者和企業(yè)。
據(jù)了解,阿里云聯(lián)合CCF開(kāi)源發(fā)展委員會(huì)共同牽頭組建的魔搭社區(qū)(Model Scope),已發(fā)展成為中國(guó)最大的AI開(kāi)源社區(qū)。秉承“模型即服務(wù)”(MaaS,Model as a Service)理念,魔搭為AI開(kāi)發(fā)者提供模型體驗(yàn)、下載、調(diào)優(yōu)、訓(xùn)練、推理、部署等一站式服務(wù),“找大模型上魔搭”成為開(kāi)發(fā)者心照不宣的默契。截至目前,阿里通義千問(wèn)、DeepSeek、階躍星辰、MiniMax、月之暗面、百川智能、零一萬(wàn)物、智譜AI等知名大模型公司均官方在魔搭開(kāi)源最新模型,魔搭社區(qū)模型總量超過(guò) 4萬(wàn)個(gè),涵蓋LLM、對(duì)話、語(yǔ)音、文生圖、圖生視頻、AI作曲等多個(gè)領(lǐng)域,魔搭已經(jīng)服務(wù)超過(guò)1000萬(wàn)開(kāi)發(fā)者。
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。