丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預(yù)覽,將在時失效
人工智能 正文
發(fā)私信給我在思考中
發(fā)送

0

端側(cè)ChatGPT時刻!這家清華系大模型公司趕在OpenAI、蘋果之前

本文作者: 我在思考中 2024-09-09 15:54
導(dǎo)語:端側(cè)AI 已然成為了大模型必爭之地!

下周蘋果即將召開發(fā)布會了!

但最令筆者期待的不是 iphone16,而是蘋果今年提出的 Apple Intelligence 的進(jìn)展,這是蘋果今年進(jìn)軍端側(cè) AI 的一大殺手锏。

其實(shí)早在今年年初,國內(nèi)就有一家當(dāng)時還名不見經(jīng)傳的大模型公司率先喊出 “端側(cè)AI是未來大趨勢”的口號,當(dāng)時還沒有太多玩家意識到端側(cè)AI的重要性。僅僅半年后,谷歌、蘋果等巨頭就紛紛掉頭轉(zhuǎn)向,開始大模型反卷小型化,就連 OpenAI 也一反“大力出奇跡”的常態(tài),不得不順應(yīng)端側(cè)AI大趨勢,推出的更小、更便宜、更高效的 GPT-4o mini。

可以說,端側(cè)AI 已然成為了大模型必爭之地!

然而就在蘋果發(fā)布會一周前這個時間點(diǎn),同樣是這家國內(nèi)大模型公司,率先把「 ChatGPT 」跑在了端側(cè)!宣告了端側(cè) ChatGPT 時刻的到來!而且還在趕在OpenAI、谷歌、蘋果等巨頭之前。

沒錯,這家公司就是面壁智能,今天剛剛發(fā)布了新一代基座模型面壁小鋼炮 MiniCPM 3.0 ,再次以小博大,以 4B 參數(shù),帶來超越 GPT-3.5 的性能,強(qiáng)得不像端側(cè)模型。

這還是一款瑞士軍刀般全面開掛的基座模型,一口氣帶來:

無限長文本,榜單性能超越 Kimi,超長文本也不崩;

性能比肩 GPT-4o 的端側(cè)最強(qiáng) Function Calling;

超強(qiáng) RAG 外掛三件套,中文檢索第一、生成超 Llama3-8B。

?  MiniCPM 3.0 開源地址:

GitHub:https://github.com/OpenBMB/MiniCPM

HuggingFace:https://huggingface.co/openbmb/MiniCPM3-4B


1.讓 「GPT-3.5 」在端側(cè)跑起來,面壁提前兌現(xiàn)承諾

今年年初,面壁在初代面壁小鋼炮發(fā)布時立下 Flag:今年內(nèi)讓 GPT-3.5 水平的模型在端側(cè)跑起來!

沒想到,面壁智能總是能給人驚喜,他們提前兌現(xiàn)了承諾,提前近 4 個月將其實(shí)現(xiàn)!

MiniCPM 3.0 再次挖掘端側(cè)模型的極致性能,僅 4B 參數(shù),在包括自然語言理解、知識、代碼、數(shù)學(xué)等多項(xiàng)能力上對 GPT-3.5 實(shí)現(xiàn)趕超,在 Qwen2-7B、 Phi-3.5、GLM4-9B、LLaMa3-8B 等一眾中外知名模型脫穎而出。

端側(cè)ChatGPT時刻!這家清華系大模型公司趕在OpenAI、蘋果之前


2.大模型科學(xué)化方法論指導(dǎo),面壁定律再落一子

為何每一代面壁小鋼炮基座模型的發(fā)布,都以小博大,擁有超預(yù)期的高效與強(qiáng)悍?

端側(cè)ChatGPT時刻!這家清華系大模型公司趕在OpenAI、蘋果之前

背后原因,AI科技評論早在半年前就曾深入挖掘并報道:被低估的面壁:打造出不輸 OpenAI 的 Scaling Law 曲線

面壁緊緊圍繞 Scaling Law 的核心,高效構(gòu)建了大模型的科學(xué)化方法論,將提升知識密度視為高效大模型的第一性原理(知識密度 =模型能力/參與計算的模型參數(shù)),并且提出了大模型時代的「摩爾定律」:模型知識密度不斷提升,平均每 8 個月提升一倍,稱之為「面壁定律」。

這一年來,面壁在自家的大模型科學(xué)化方法論指導(dǎo)下,歷經(jīng)數(shù)次調(diào)整,構(gòu)建了全新技術(shù)架構(gòu),于面壁定律的趨勢曲線再落一子。

端側(cè)ChatGPT時刻!這家清華系大模型公司趕在OpenAI、蘋果之前

不止是基座模型,面壁的多模態(tài)模型同樣優(yōu)秀的不像是款端側(cè)模型!

他們一個月前發(fā)布的 MiniCPM-V 2.6,首次在端側(cè)實(shí)現(xiàn)單圖、多圖、視頻理解等多模態(tài)核心能力全面超越GPT-4V,三項(xiàng)能力均取得 20B 以下 SOTA 成績,單圖理解越級比肩 Gemini 1.5 Pro 和 GPT-4o mini。

總結(jié)來說:

基座模型方面:面壁率先讓 「GPT-3.5 」在端側(cè)跑起來;

多模態(tài)模型方面:面壁同樣率先讓「GPT-4V」跑在手機(jī)上!

下面詳細(xì)介紹一下面壁新一代性能超越 GPT-3.5的 面壁小鋼炮 MiniCPM 3.0。


3.頂尖實(shí)力大集結(jié),大模型中的“瑞士軍刀”

新一代小鋼炮集長文本、Function Call 與 RAG 等大模型重要能力于一身,小而強(qiáng),小而全。僅4B體量,在這些呼聲極高的模型功能上,MiniCPM 3.0 集結(jié)各家所長,并且對業(yè)界頗有口碑的模型實(shí)現(xiàn)超越,堪稱是大模型中的“瑞士軍刀”。

面壁「無限」長文本,性能超 Kimi:長長長文本不崩!

上下文長度是衡量大模型基礎(chǔ)能力的一項(xiàng)重要指標(biāo),更長的上下文長度意味大模型擁有更大的“內(nèi)存”和更長的“記憶”,不僅能提高大模型處理數(shù)據(jù)的能力上限,還能拓寬大模型應(yīng)用的廣度和深度。

面壁提出 LLMxMapReduce長本文分幀處理技術(shù)  ,一舉實(shí)現(xiàn)「無限」長文本!32, 128, 256, 512K…MiniCPM 3.0 打破大模型記憶限制,可以將上下文長度無限穩(wěn)定拓展,想多長就多長!

除了超越 GPT-4、KimiChat 等標(biāo)桿模型的優(yōu)異表現(xiàn)( InfiniteBench 榜單成績);更神奇的是,文本越長,這個4B小鋼炮憑借愈加穩(wěn)定的表現(xiàn),展現(xiàn)出的性能優(yōu)勢越強(qiáng)。

端側(cè)ChatGPT時刻!這家清華系大模型公司趕在OpenAI、蘋果之前

InfiniteBench大模型長文本能力的權(quán)威評測集 檢索、數(shù)學(xué)、代碼、問答和摘要等多維度能力評估

① MiniCPM 3.0 表現(xiàn)超越 GPT-4、KimiChat、Qwen2-70B;

② 千億模型 Qwen2-70B、Llama3-70b 結(jié)合LLMxMapReduce也取得更佳表現(xiàn)。

端側(cè)ChatGPT時刻!這家清華系大模型公司趕在OpenAI、蘋果之前

InfiniteBench Zh.QA 評測結(jié)果顯示,4B參數(shù)的面壁小鋼炮整體性能優(yōu)于Kimi,在更長的文本上表現(xiàn)出相較更強(qiáng)的穩(wěn)定性。

端側(cè)ChatGPT時刻!這家清華系大模型公司趕在OpenAI、蘋果之前

端側(cè)ChatGPT時刻!這家清華系大模型公司趕在OpenAI、蘋果之前

LLMxMapReduce 技術(shù)框架圖

擁有無限上下文, 可以讓模型一次性讀取不限字?jǐn)?shù)的書籍或不限量的學(xué)術(shù)論文、簡歷等材料,成為你身邊更加強(qiáng)大的終端個人助手。模型還可以讀取你的大眾點(diǎn)評美食、酒店評價、微博互動內(nèi)容,并牢牢記住你和AI 跨越多年的聊天記錄,成為最懂你的AI陪伴者。

GPT-4o 級 Function calling ,終端Agent應(yīng)用蓄勢待發(fā)

智能體應(yīng)用是端側(cè)AI 必爭之地,其中一項(xiàng)至關(guān)重要的技術(shù)是 Function Calling(函數(shù)調(diào)用),它能夠?qū)⒂脩裟:妮斎胝Z義轉(zhuǎn)換為機(jī)器可以精確理解執(zhí)行的結(jié)構(gòu)化指令,并讓大模型連接外部工具和系統(tǒng),例如通過語音在手機(jī)上調(diào)用日歷、天氣、郵件、瀏覽器等 APP 或相冊、文件等本地數(shù)據(jù)庫,從而打開終端設(shè)備 Agent 應(yīng)用的無限可能,也讓人機(jī)交互更加自然和方便。

MiniCPM 3.0 擁有端側(cè)最強(qiáng) Function calling 性能 ,在權(quán)威評測榜單 Berkeley Function-Calling Leaderboard 上,其性能接近 GPT-4o,并超越 Llama 3.1-8B、Qwen-2-7B、GLM-4-9B 等眾多模型。

端側(cè)ChatGPT時刻!這家清華系大模型公司趕在OpenAI、蘋果之前

RAG 外掛三件套,中文檢索第一,生成超 Llama3-8B

端側(cè)模型也能開外掛,RAG(檢索增強(qiáng)生成技術(shù))讓模型引用外部知識庫,檢索到最新、最可靠的專業(yè)知識,確保生成內(nèi)容更加可信,大大減少大模型的幻覺問題。大模型+RAG 在行業(yè)中極其實(shí)用,尤其是對法律、醫(yī)療等依賴專業(yè)知識庫、對大模型幻覺容忍度極低的垂直行業(yè)。

我們一口氣帶來超強(qiáng) RAG 外掛三件套:MiniCPM-Embedding(檢索模型)、MiniCPM-Reranker(重排序模型)和面向 RAG 場景的 LoRA 插件(生成模型),款款優(yōu)秀:

MiniCPM-Embedding(檢索模型)中英跨語言檢索取得 SOTA 性能,在評估模型文本嵌入能力的權(quán)威評測集 MTEB 的檢索榜單上中文第一、英文第十三 ;

MiniCPM-Reranker(重排序模型)在中文、英文、中英跨語言測試上取得 SOTA 性能 ;

經(jīng)過針對 RAG 場景的 LoRA 訓(xùn)練后,MiniCPM 3.0-RAG-LoRA 在開放域問答(NQ、TQA、MARCO)、多跳問答(HotpotQA)、對話(WoW)、事實(shí)核查(FEVER)和信息填充(T-REx)等多項(xiàng)任務(wù)上的性能表現(xiàn),超越 Llama3-8B 和 Baichuan2-13B 等業(yè)內(nèi)優(yōu)秀模型。

端側(cè)ChatGPT時刻!這家清華系大模型公司趕在OpenAI、蘋果之前端側(cè)ChatGPT時刻!這家清華系大模型公司趕在OpenAI、蘋果之前端側(cè)ChatGPT時刻!這家清華系大模型公司趕在OpenAI、蘋果之前端側(cè)ChatGPT時刻!這家清華系大模型公司趕在OpenAI、蘋果之前端側(cè)ChatGPT時刻!這家清華系大模型公司趕在OpenAI、蘋果之前


4.安全,可靠,皮實(shí),端側(cè)大模型就看面壁小鋼炮

輕、快、高效低成本,更友好的端側(cè)體驗(yàn),是面壁小鋼炮系列一以貫之的優(yōu)點(diǎn)。MiniCPM 3.0 量化后僅 2.2 G 內(nèi)存,端側(cè)應(yīng)用十分友好。

相比云端模型,面壁小鋼炮 MiniCPM 系列模型有一顆陪你行走世界的大心臟,天然具有弱網(wǎng)、斷網(wǎng)可用、超低時延、數(shù)據(jù)隱私安全等本地優(yōu)勢。無論是陪你闖蕩精彩遠(yuǎn)方、勇敢探索,還是將眼前的瑣碎默默打理與守護(hù),MiniCPM都是值得信任的大模型好朋友。

端側(cè)ChatGPT時刻!這家清華系大模型公司趕在OpenAI、蘋果之前端側(cè)ChatGPT時刻!這家清華系大模型公司趕在OpenAI、蘋果之前端側(cè)ChatGPT時刻!這家清華系大模型公司趕在OpenAI、蘋果之前


端側(cè)ChatGPT時刻!這家清華系大模型公司趕在OpenAI、蘋果之前端側(cè)ChatGPT時刻!這家清華系大模型公司趕在OpenAI、蘋果之前端側(cè)ChatGPT時刻!這家清華系大模型公司趕在OpenAI、蘋果之前


最后,筆者還想聊一下觀察到的面壁智能端側(cè)AI的下一步。


5.面壁小鋼炮+機(jī)器人,開啟具身智能無限可能

大模型與機(jī)器人融合的 “具身智能”,是未來十年最令人期待的科技突破之一!

最近,面壁小鋼炮 MiniCPM 端側(cè)模型在這方面邁出了關(guān)鍵一步。

一是聯(lián)手加速進(jìn)化機(jī)器人,打造出完整“具身智能”的先驅(qū)方案,業(yè)界首個高效端側(cè)模型運(yùn)行在人形機(jī)器人的演示,理解、推理、并與物理世界互動的智能系統(tǒng),這激動人心的未來場景,已拉開帷幕!

二是聯(lián)手大象機(jī)器人。前些天 MiniCPM 端側(cè)模型將植入大象機(jī)器人旗下仿真陪伴寵物機(jī)器人 metaCat 米塔貓,高效端側(cè)模型能夠顯著提升仿真機(jī)器寵物“類生命體”的智能交互體驗(yàn):不依賴網(wǎng)絡(luò),不需要復(fù)雜的硬件改造,以更自由更自然的交互,讓機(jī)器萌寵觸發(fā)聲、光、電、動作響應(yīng),仿真感更強(qiáng),情感陪伴更加逼真。

面壁小鋼炮 MiniCPM 端側(cè)模型之前在 PC、平板、手機(jī)已有實(shí)際運(yùn)行,最近面壁智能與加速進(jìn)化機(jī)器人和大象機(jī)器人的合作,讓筆者看到了面壁智能從端側(cè)AI+機(jī)器人方向切入具身智能的無限可能。觸角也伸入智能座艙,面壁聯(lián)合MTK,為梧桐科技提供了MiniCPM車載多模態(tài)大模型,實(shí)現(xiàn)艙駕協(xié)控相關(guān)的功能控制,包括知識查詢和人-車-環(huán)境感知融合的多模態(tài)增強(qiáng)理解模塊,成為梧桐科技A I座艙芯算一體的端側(cè)大模型重要合作伙伴!

未來大模型+機(jī)器人演化出終極形態(tài),端側(cè)智能無處不在,面壁智能天地廣闊。

雷峰網(wǎng)(公眾號:雷峰網(wǎng))

雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知

端側(cè)ChatGPT時刻!這家清華系大模型公司趕在OpenAI、蘋果之前

分享:
相關(guān)文章
當(dāng)月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說