端側(cè)ChatGPT時(shí)刻！這家清華系大模型公司趕在OpenAI、蘋果之前

本文作者：我在思考中

2024-09-09 15:54

導(dǎo)語：端側(cè)AI 已然成為了大模型必爭之地！

下周蘋果即將召開發(fā)布會了！

但最令筆者期待的不是 iphone16，而是蘋果今年提出的 Apple Intelligence 的進(jìn)展，這是蘋果今年進(jìn)軍端側(cè) AI 的一大殺手锏。

其實(shí)早在今年年初，國內(nèi)就有一家當(dāng)時(shí)還名不見經(jīng)傳的大模型公司率先喊出 “端側(cè)AI是未來大趨勢”的口號，當(dāng)時(shí)還沒有太多玩家意識到端側(cè)AI的重要性。僅僅半年后，谷歌、蘋果等巨頭就紛紛掉頭轉(zhuǎn)向，開始大模型反卷小型化，就連 OpenAI 也一反“大力出奇跡”的常態(tài)，不得不順應(yīng)端側(cè)AI大趨勢，推出的更小、更便宜、更高效的 GPT-4o mini。

可以說，端側(cè)AI 已然成為了大模型必爭之地！

然而就在蘋果發(fā)布會一周前這個(gè)時(shí)間點(diǎn)，同樣是這家國內(nèi)大模型公司，率先把「 ChatGPT 」跑在了端側(cè)！宣告了端側(cè) ChatGPT 時(shí)刻的到來！而且還在趕在OpenAI、谷歌、蘋果等巨頭之前。

沒錯(cuò)，這家公司就是面壁智能，今天剛剛發(fā)布了新一代基座模型面壁小鋼炮 MiniCPM 3.0 ，再次以小博大，以 4B 參數(shù)，帶來超越 GPT-3.5 的性能，強(qiáng)得不像端側(cè)模型。

這還是一款瑞士軍刀般全面開掛的基座模型，一口氣帶來：

無限長文本，榜單性能超越 Kimi，超長文本也不崩；

性能比肩 GPT-4o 的端側(cè)最強(qiáng) Function Calling；

超強(qiáng) RAG 外掛三件套，中文檢索第一、生成超 Llama3-8B。

? MiniCPM 3.0 開源地址：

GitHub：https://github.com/OpenBMB/MiniCPM

HuggingFace：https://huggingface.co/openbmb/MiniCPM3-4B

1.讓「GPT-3.5 」在端側(cè)跑起來，面壁提前兌現(xiàn)承諾

今年年初，面壁在初代面壁小鋼炮發(fā)布時(shí)立下 Flag：今年內(nèi)讓 GPT-3.5 水平的模型在端側(cè)跑起來！

沒想到，面壁智能總是能給人驚喜，他們提前兌現(xiàn)了承諾，提前近 4 個(gè)月將其實(shí)現(xiàn)！

MiniCPM 3.0 再次挖掘端側(cè)模型的極致性能，僅 4B 參數(shù)，在包括自然語言理解、知識、代碼、數(shù)學(xué)等多項(xiàng)能力上對 GPT-3.5 實(shí)現(xiàn)趕超，在 Qwen2-7B、 Phi-3.5、GLM4-9B、LLaMa3-8B 等一眾中外知名模型脫穎而出。

端側(cè)ChatGPT時(shí)刻！這家清華系大模型公司趕在OpenAI、蘋果之前

2.大模型科學(xué)化方法論指導(dǎo)，面壁定律再落一子

為何每一代面壁小鋼炮基座模型的發(fā)布，都以小博大，擁有超預(yù)期的高效與強(qiáng)悍？

端側(cè)ChatGPT時(shí)刻！這家清華系大模型公司趕在OpenAI、蘋果之前

背后原因，AI科技評論早在半年前就曾深入挖掘并報(bào)道：被低估的面壁：打造出不輸 OpenAI 的 Scaling Law 曲線

面壁緊緊圍繞 Scaling Law 的核心，高效構(gòu)建了大模型的科學(xué)化方法論，將提升知識密度視為高效大模型的第一性原理（知識密度 =模型能力/參與計(jì)算的模型參數(shù)），并且提出了大模型時(shí)代的「摩爾定律」：模型知識密度不斷提升，平均每 8 個(gè)月提升一倍，稱之為「面壁定律」。

這一年來，面壁在自家的大模型科學(xué)化方法論指導(dǎo)下，歷經(jīng)數(shù)次調(diào)整，構(gòu)建了全新技術(shù)架構(gòu)，于面壁定律的趨勢曲線再落一子。

端側(cè)ChatGPT時(shí)刻！這家清華系大模型公司趕在OpenAI、蘋果之前

不止是基座模型，面壁的多模態(tài)模型同樣優(yōu)秀的不像是款端側(cè)模型！

他們一個(gè)月前發(fā)布的 MiniCPM-V 2.6，首次在端側(cè)實(shí)現(xiàn)單圖、多圖、視頻理解等多模態(tài)核心能力全面超越GPT-4V，三項(xiàng)能力均取得 20B 以下 SOTA 成績，單圖理解越級比肩 Gemini 1.5 Pro 和 GPT-4o mini。

總結(jié)來說：

基座模型方面：面壁率先讓「GPT-3.5 」在端側(cè)跑起來；

多模態(tài)模型方面：面壁同樣率先讓「GPT-4V」跑在手機(jī)上！

下面詳細(xì)介紹一下面壁新一代性能超越 GPT-3.5的面壁小鋼炮 MiniCPM 3.0。

3.頂尖實(shí)力大集結(jié)，大模型中的“瑞士軍刀”

新一代小鋼炮集長文本、Function Call 與 RAG 等大模型重要能力于一身，小而強(qiáng)，小而全。僅4B體量，在這些呼聲極高的模型功能上，MiniCPM 3.0 集結(jié)各家所長，并且對業(yè)界頗有口碑的模型實(shí)現(xiàn)超越，堪稱是大模型中的“瑞士軍刀”。

面壁「無限」長文本，性能超 Kimi：長長長文本不崩！

上下文長度是衡量大模型基礎(chǔ)能力的一項(xiàng)重要指標(biāo)，更長的上下文長度意味大模型擁有更大的“內(nèi)存”和更長的“記憶”，不僅能提高大模型處理數(shù)據(jù)的能力上限，還能拓寬大模型應(yīng)用的廣度和深度。

面壁提出 LLMxMapReduce長本文分幀處理技術(shù) ，一舉實(shí)現(xiàn)「無限」長文本！32, 128, 256, 512K…MiniCPM 3.0 打破大模型記憶限制，可以將上下文長度無限穩(wěn)定拓展，想多長就多長！

除了超越 GPT-4、KimiChat 等標(biāo)桿模型的優(yōu)異表現(xiàn)（ InfiniteBench 榜單成績）；更神奇的是，文本越長，這個(gè)4B小鋼炮憑借愈加穩(wěn)定的表現(xiàn)，展現(xiàn)出的性能優(yōu)勢越強(qiáng)。

端側(cè)ChatGPT時(shí)刻！這家清華系大模型公司趕在OpenAI、蘋果之前

InfiniteBench大模型長文本能力的權(quán)威評測集檢索、數(shù)學(xué)、代碼、問答和摘要等多維度能力評估

① MiniCPM 3.0 表現(xiàn)超越 GPT-4、KimiChat、Qwen2-70B；

② 千億模型 Qwen2-70B、Llama3-70b 結(jié)合LLMxMapReduce也取得更佳表現(xiàn)。

端側(cè)ChatGPT時(shí)刻！這家清華系大模型公司趕在OpenAI、蘋果之前

InfiniteBench Zh.QA 評測結(jié)果顯示，4B參數(shù)的面壁小鋼炮整體性能優(yōu)于Kimi，在更長的文本上表現(xiàn)出相較更強(qiáng)的穩(wěn)定性。

端側(cè)ChatGPT時(shí)刻！這家清華系大模型公司趕在OpenAI、蘋果之前

LLMxMapReduce 技術(shù)框架圖

擁有無限上下文，可以讓模型一次性讀取不限字?jǐn)?shù)的書籍或不限量的學(xué)術(shù)論文、簡歷等材料，成為你身邊更加強(qiáng)大的終端個(gè)人助手。模型還可以讀取你的大眾點(diǎn)評美食、酒店評價(jià)、微博互動內(nèi)容，并牢牢記住你和AI 跨越多年的聊天記錄，成為最懂你的AI陪伴者。

GPT-4o 級 Function calling ，終端Agent應(yīng)用蓄勢待發(fā)

智能體應(yīng)用是端側(cè)AI 必爭之地，其中一項(xiàng)至關(guān)重要的技術(shù)是 Function Calling（函數(shù)調(diào)用），它能夠?qū)⒂脩裟：妮斎胝Z義轉(zhuǎn)換為機(jī)器可以精確理解執(zhí)行的結(jié)構(gòu)化指令，并讓大模型連接外部工具和系統(tǒng)，例如通過語音在手機(jī)上調(diào)用日歷、天氣、郵件、瀏覽器等 APP 或相冊、文件等本地?cái)?shù)據(jù)庫，從而打開終端設(shè)備 Agent 應(yīng)用的無限可能，也讓人機(jī)交互更加自然和方便。

MiniCPM 3.0 擁有端側(cè)最強(qiáng) Function calling 性能，在權(quán)威評測榜單 Berkeley Function-Calling Leaderboard 上，其性能接近 GPT-4o，并超越 Llama 3.1-8B、Qwen-2-7B、GLM-4-9B 等眾多模型。

端側(cè)ChatGPT時(shí)刻！這家清華系大模型公司趕在OpenAI、蘋果之前

RAG 外掛三件套，中文檢索第一，生成超 Llama3-8B

端側(cè)模型也能開外掛，RAG（檢索增強(qiáng)生成技術(shù)）讓模型引用外部知識庫，檢索到最新、最可靠的專業(yè)知識，確保生成內(nèi)容更加可信，大大減少大模型的幻覺問題。大模型+RAG 在行業(yè)中極其實(shí)用，尤其是對法律、醫(yī)療等依賴專業(yè)知識庫、對大模型幻覺容忍度極低的垂直行業(yè)。

我們一口氣帶來超強(qiáng) RAG 外掛三件套：MiniCPM-Embedding（檢索模型）、MiniCPM-Reranker（重排序模型）和面向 RAG 場景的 LoRA 插件（生成模型），款款優(yōu)秀：

MiniCPM-Embedding（檢索模型）中英跨語言檢索取得 SOTA 性能，在評估模型文本嵌入能力的權(quán)威評測集 MTEB 的檢索榜單上中文第一、英文第十三；

MiniCPM-Reranker（重排序模型）在中文、英文、中英跨語言測試上取得 SOTA 性能；

經(jīng)過針對 RAG 場景的 LoRA 訓(xùn)練后，MiniCPM 3.0-RAG-LoRA 在開放域問答（NQ、TQA、MARCO）、多跳問答（HotpotQA）、對話（WoW）、事實(shí)核查（FEVER）和信息填充（T-REx）等多項(xiàng)任務(wù)上的性能表現(xiàn)，超越 Llama3-8B 和 Baichuan2-13B 等業(yè)內(nèi)優(yōu)秀模型。

端側(cè)ChatGPT時(shí)刻！這家清華系大模型公司趕在OpenAI、蘋果之前

4.安全，可靠，皮實(shí)，端側(cè)大模型就看面壁小鋼炮

輕、快、高效低成本，更友好的端側(cè)體驗(yàn)，是面壁小鋼炮系列一以貫之的優(yōu)點(diǎn)。MiniCPM 3.0 量化后僅 2.2 G 內(nèi)存，端側(cè)應(yīng)用十分友好。

相比云端模型，面壁小鋼炮 MiniCPM 系列模型有一顆陪你行走世界的大心臟，天然具有弱網(wǎng)、斷網(wǎng)可用、超低時(shí)延、數(shù)據(jù)隱私安全等本地優(yōu)勢。無論是陪你闖蕩精彩遠(yuǎn)方、勇敢探索，還是將眼前的瑣碎默默打理與守護(hù)，MiniCPM都是值得信任的大模型好朋友。

端側(cè)ChatGPT時(shí)刻！這家清華系大模型公司趕在OpenAI、蘋果之前

最后，筆者還想聊一下觀察到的面壁智能端側(cè)AI的下一步。

5.面壁小鋼炮+機(jī)器人，開啟具身智能無限可能

大模型與機(jī)器人融合的 “具身智能”，是未來十年最令人期待的科技突破之一！

最近，面壁小鋼炮 MiniCPM 端側(cè)模型在這方面邁出了關(guān)鍵一步。

一是聯(lián)手加速進(jìn)化機(jī)器人，打造出完整“具身智能”的先驅(qū)方案，業(yè)界首個(gè)高效端側(cè)模型運(yùn)行在人形機(jī)器人的演示，理解、推理、并與物理世界互動的智能系統(tǒng)，這激動人心的未來場景，已拉開帷幕！

二是聯(lián)手大象機(jī)器人。前些天 MiniCPM 端側(cè)模型將植入大象機(jī)器人旗下仿真陪伴寵物機(jī)器人 metaCat 米塔貓，高效端側(cè)模型能夠顯著提升仿真機(jī)器寵物“類生命體”的智能交互體驗(yàn)：不依賴網(wǎng)絡(luò)，不需要復(fù)雜的硬件改造，以更自由更自然的交互，讓機(jī)器萌寵觸發(fā)聲、光、電、動作響應(yīng)，仿真感更強(qiáng)，情感陪伴更加逼真。

面壁小鋼炮 MiniCPM 端側(cè)模型之前在 PC、平板、手機(jī)已有實(shí)際運(yùn)行，最近面壁智能與加速進(jìn)化機(jī)器人和大象機(jī)器人的合作，讓筆者看到了面壁智能從端側(cè)AI+機(jī)器人方向切入具身智能的無限可能。觸角也伸入智能座艙，面壁聯(lián)合MTK，為梧桐科技提供了MiniCPM車載多模態(tài)大模型，實(shí)現(xiàn)艙駕協(xié)控相關(guān)的功能控制，包括知識查詢和人-車-環(huán)境感知融合的多模態(tài)增強(qiáng)理解模塊，成為梧桐科技A I座艙芯算一體的端側(cè)大模型重要合作伙伴！

未來大模型+機(jī)器人演化出終極形態(tài)，端側(cè)智能無處不在，面壁智能天地廣闊。

雷峰網(wǎng)(公眾號：雷峰網(wǎng))

雷峰網(wǎng)版權(quán)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

0人收藏

相關(guān)文章

我在思考中

運(yùn)營

發(fā)私信

當(dāng)月熱門文章

端側(cè)ChatGPT時(shí)刻！這家清華系大模型公司趕在OpenAI、蘋果之前

端側(cè)ChatGPT時(shí)刻！這家清華系大模型公司趕在OpenAI、蘋果之前