0
過去一段時間,大模型行業(yè)經歷了一場風切變。
八月初,騰訊官宣“混元系列小模型”落地,不久后,阿里跟進了兩款通義Qwen3-4B。
起初,大家以為只是國內大廠對轟,互秀肌肉罷了。
幾天后,劇情愈演愈烈,大洋彼岸的 OpenAI 也加入戰(zhàn)斗,破天荒開源gpt-oss-20B等兩款模型,同樣聚焦在小模型上。
頭部玩家們如此整齊劃一的舉動,很難讓人不浮想翩翩:
在大集群訓練、大集群部署之外,小模型要重回舞臺中央。
01
小模型重回大眾視野
小模型不是一個新名詞。
但這次回歸的,不是停留在論文上的小模型,而是真正落地在終端的小模型。
在2020年 GPT-3 發(fā)布之前,全世界都在訓小模型,只不過大多數(shù)小模型成果,都在論文里或者實驗室里,屬于普羅大眾眼里紙上談兵的“小模型”。
但 GPT-3 連帶著ChatGPT橫空出世,從學術界出圈,成為了人工智能領域史詩級的商業(yè)化產品。
有了資本加持,人工智能的發(fā)展從「大煉模型」邁入了「煉大模型」時代。
2021年到2024年,AI的技術路線可以總結成五個字:大力出奇跡”。
堆數(shù)據(jù),堆算力,打補丁,改prompt,以及做post training的大模型思路,成了人工智能的正統(tǒng),小模型至此徹底被雪藏了。
但去年底,OpenAI 的前首席科學家 Ilya Sutskever 正式預警:「數(shù)據(jù)壓榨到頭了」。
大家逐漸意識到,數(shù)據(jù)會枯竭,算力永遠不夠。
于是今年開始,大模型領域玩家開始分化。
除了一部分頭部玩家仍追隨 OpenAI 的腳步,死磕大參數(shù)基模外,剩下很多燒不起錢的玩家開始轉頭擁抱應用端。
然而,在這兩個主流之外,還有一小撮“非共識”的玩家,把目光落在了小模型上。
但這次,不少創(chuàng)業(yè)公司重新拾起的小模型,和文章開頭提到ChatGPT出現(xiàn)前十年間停留在論文上的小模型完全不一樣。
它們是真正落地在終端的小模型,并且有了另一個名字:
端側小模型或端側智能。
02
嶄露頭角的端側小模型公司們
今年以來,不少端側小模型已經開始嶄露頭角了。
前一段的WAIC上,西門子MindSphere展臺上圍滿了專業(yè)觀眾。
大家正在看一個展臺上一個小于50MB的端側部署小模型,它能夠預測現(xiàn)場的三臺沖壓設備故障,并發(fā)出警報。
在這之前,車間里沖壓機床只有累到趴窩才會被工人察覺,緊接著就需要停擺檢修,造成全車間流水線暫停,帶來巨大人力和財力損失。
因此在沖壓機床出故障前,預警功能就非常重要。
面對這樣的小場景,大模型算力再強,moe結構設計再精妙,也無法處理。
但這樣一個精準的端側小模型,就能夠輕松應對。
這就是落地在終端小模型的冰山一角。
在這條窄路上前進的,還有一些獨角獸公司,比如base北京的AI初創(chuàng)公司面壁智能。
之所以關注這家企業(yè),是因為這家公司今年五月的一次成功融資。
在DeepSeek大火后,國內大模型公司融資難度堪比抵地獄級。一方面是行業(yè)共識認為大模型已收斂,另一方面,有DeepSeek珠玉在前,你實在太難說服投資人為什么要投你了。
但面壁智能卻能持續(xù)拿到融資。
我問了很多業(yè)內人士,得到一個答案,關鍵在于它早早找到了自己的道路:小模型。
AI 科技評論獨家知悉,就在這幾天,面壁的全體員工,收到了一封特殊的“內部信”。
郵件來自公司決策層,借著公司三周年周慶,高層向全體員工回答了一個問題:為什么公司從大模型切入,卻all in 端側小模型?
郵件講述了一些底層思考,內容非常爆炸,即使是外人看來,也能從一家AI初創(chuàng)公司的生存視角,有所收獲。
按照郵件內的時間節(jié)點描述,面壁智能的創(chuàng)立初期是100%堅定大模型方向的。
它的創(chuàng)立時間是2022年,甚至早于DeepSeek。
創(chuàng)始團隊出身于清華系,來自清華大學自然語言處理實驗室。
在創(chuàng)立之前,面壁的創(chuàng)始團隊就主力參與北京智源人工智能研究院的“悟道”,從時間來看,面壁智能應該吃到一波融資的紅利,但我們先去分析過,國內的AI 科技 VC 有一些路徑依賴,更愿意選擇一些“曾經打過勝仗的連續(xù)創(chuàng)業(yè)者”,導致面壁智能雖然起的大早,但并沒有成為資本的寵兒,而是靠自己硬拚出來的天地。
2022-2023年間,面壁一直在死磕大模型,當初他們的愿景是做出平民版大模型,我們曾經寫過稿件,認為他是國內和DeepSeek愿景最類似的公司。
當然,面壁也做出了不少成績,比如訓練出多個百億、千億參數(shù)規(guī)模的大模型。
轉折點發(fā)生在2023 年。
2023年,隨著 Llama 開源,眾多資本涌入,那一年里,大模型的創(chuàng)業(yè)公司增加到了十幾家。
面壁智能迅速發(fā)現(xiàn),千億大模型燒錢太快,并且商業(yè)化方面難以落地,于是果斷選擇了調整戰(zhàn)略,決定轉向訓練參數(shù)規(guī)模更小、算力更低、但性能更強的端側模型。
轉型之初,面壁并不容易。
一方面,端側智能算是在黑暗中摸索,另一方面,市場上噪音很多,比如DeepSeek V3 以少勝多的戰(zhàn)役,也曾讓面壁的創(chuàng)始人懷疑,如果堅持不轉型,是否自己也有機會在大模型上攀上一座高峰。(后續(xù)的行情,證明面壁智能果斷轉型是明智的)
但彼時,面壁已經全盤all in 端側小模型,已經失去驗證“更低成本訓練更強大模型”的機會了。
好在小模型并不是邪修,面壁團隊迅速在端側小模型賽道找到感覺,有了一些自己的思路。
03 想成為端側小模型的“開拓者”,并不容易
從時間上看,面壁智能不僅比文章開頭提到的“混元”和“通義Qwen3”更早開啟小模型的探索,并且在端側探索上,幾乎是領先行業(yè)一年半的身位。
提前一年半的布局,讓面壁有不少成果。
第一是模型層面,面壁的端側模型被稱為小鋼炮 MiniCPM系列。
至今已經完成多次迭代,最新的是上周開源的 minicpm v4.0 ,一款 8B 能做到5%的極高稀疏度,端側能跑長文本、深思考,另一款 0.5B 更是能適配非常多的終端場景,能做到手機端持續(xù)、穩(wěn)定可用,還不發(fā)熱。
再加上此前做在視覺及實時語音對話等優(yōu)化,面壁智能的端側模型,完全能實現(xiàn)在iPad上進行多模態(tài)直播,這意味著,它的使用場景變得異常豐富。
從麥當勞的點餐機器人,到政府行政服務中心的服務機器人,再到兒童陪伴玩具都能完全能夠勝任。
除了技術層面的突破,還有一些學術和開源成果。
上個月《Nature Communications》正式收錄了面壁智能此前發(fā)布的一項關于新模型 MiniCPM-V 的研究成果系列。
其中包括一個OpenCompass 評分中超越 GPT-4V(2023.11.16 版本)的80 億參數(shù)模型。
開源方面,面壁智能的小鋼炮 MiniCPM 系列是2024 年 Hugging Face 最多下載、最受歡迎中國大模型,截至目前全平臺下載量累計破 1000 萬,能看到一定的使命感在里面。
除去技術層面和學術等層面,但真正能讓大家直觀感受的,還是落地到現(xiàn)實世界的場景。
社交媒體上經常有一些同類型的問題,為什么都說大模型能力早早超越人類,但遲遲沒看到驚艷的落地場景?
答案在于大模型的能力,需要高性能云服務器才能發(fā)揮出來。
但大家平時生活中使用的手機,平板汽車等設備,都是算力非常有限的設備。
這類型設備有一個學名,叫做“邊端算力場景”。
而這正是眾多小模型廠家的主場。
繼續(xù)拿面壁智能舉例。和需要調用各種云端超高算力的大模型不一樣,面壁的小鋼炮系列模型,能在消費級顯卡上流暢運行。
這就意味著手機,個人電腦,汽車,機器人,甚至是剛才提到的工廠環(huán)境,以及一些涉密的政府部門等等都可以部署。
“不僅把模型的配置門檻打下來了,使用場景還變得更豐富了”。
在面壁智能的內部信上,也提到了這些場景。
首先是汽車場景,面壁智能圍繞著智能座艙,發(fā)布了一個以 MiniCPM 模型為核心汽車助手 cpmGO 。
我查了一下,這是業(yè)界第一個純端側的智能座艙。(雷峰網(公眾號:雷峰網))
目前 cpmGO ,已經與長安、上汽大眾、長城、吉利、廣汽等車企談完合作了。
不出意外,第一款量產車會落在今年三季度即將上市的網紅車款長安馬自達 MAZDA EZ-60 上。
不止是車企,面壁還與高通、英特爾、聯(lián)發(fā)科技、梧桐車聯(lián)、德賽西威、中科創(chuàng)達、安波福等做了深度適配,正在推動下一代智能座艙的誕生。
這一點,面壁高層非常重視,根據(jù)內部信的內容,面壁今年為此特地成立了汽車業(yè)務線,目標非常簡單粗暴:
“將MiniCPM 搭載到更多汽車上”。
從某種意義上,面壁確實在端側的技術探索和實踐落地上,在努力成為行業(yè)開拓者的角色。
最后,當我們在寫這篇文章的時候得知,前面提到那個西門子展臺的沖壓機床預警小模型,經過幾個月的真實產線的數(shù)據(jù)訓練,預測準確率已經提升到89%,隨著時間積累,準確度還在不斷提高中。
與此同時,面壁智能的全體員工,也在對這份內部信進行了深度復盤。
過去,大模型領域在資本的加持下,蒙眼狂奔,讓我們誤以為 AGI 很快會到來,不做大模型就是原罪。
但當頭部大模型企業(yè)開始進入瓶頸期,我們也冷靜下來才逐漸看到,有那么多端側小模型企業(yè),正在腳踏實地去思考人類到底喜歡什么,大眾到底需要什么,然后反推出背后的技術路線,做出小而美的落地產品。
它們值得被看到。(雷峰網)
雷峰網原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知。