DeepSeek 反思潮：AGI 既被重新審視，又被持續(xù)低估

本文作者：陳彩嫻

2025-02-28 23:45

導語：不斷的攻守異位，要么是實力相當，要么是高度不確定性。

2 月很有意思。

一、DeepSeek 反思潮

在 DeepSeek 的集體反思潮中，無論是大廠內(nèi)部的“AGI 創(chuàng)業(yè)團隊”、還是 AGI 的明星創(chuàng)業(yè)公司，都進行了戰(zhàn)略調(diào)整。很顯然，DeepSeek 的暴擊讓整個行業(yè)都進行了一次深刻的反思，值得注意的幾個變化是：

首先，大模型創(chuàng)業(yè)公司重新將技術(shù)突破提升到一個新的高度、超越產(chǎn)品更新成為公司戰(zhàn)略發(fā)展的優(yōu)先級。

據(jù)近日與張予彤接觸過的 VC 反饋，DeepSeek 不花一分錢投流的崛起啟示了 AGI 的技術(shù)高度，也讓 Moonshot 反思了過去一年類互聯(lián)網(wǎng)打法、過度重視產(chǎn)品投流的策略局限性。在未來的一年，Moonshot 要將基礎(chǔ)模型的突破作為重點，將更多資源投到技術(shù)而非研發(fā)上。

事實上，這不僅僅是月之暗面的結(jié)論，也是這波 AGI 創(chuàng)業(yè)潮中卡技術(shù)生態(tài)位的大模型公司的普遍轉(zhuǎn)變。與此相對應(yīng)的，是產(chǎn)品團隊的資源比重下降，因為 DeepSeek 的成功已經(jīng)側(cè)面證明了：AGI 時代可能不需要產(chǎn)品經(jīng)理，也不需要投流，只要技術(shù)實力提升后就會有用戶增長。

2024 年的投流大戰(zhàn)，以 DeepSeek 不花一分錢、DAU 最高時達 4000 萬落下帷幕，而受創(chuàng)最重的自然是投流團隊，因為錢相當于白花了。投流越多、傷害越大，如 Moonshot；投流越少，傷害越小，如 MiniMax。

據(jù) AI 科技評論獲悉，MiniMax 前產(chǎn)品一號位離職的原因之一，就是曾與創(chuàng)始人在投流上發(fā)生分歧。MiniMax 的組織架構(gòu)之前是互聯(lián)網(wǎng)打法，按照不同產(chǎn)品進行分組，產(chǎn)品團隊一度達到 200 人，但 2024 年年中開始就一直在調(diào)整產(chǎn)品團隊，接下來可能會進一步裁減產(chǎn)品人員。雷峰網(wǎng)(公眾號：雷峰網(wǎng))

其次，是字節(jié)與騰訊的攻守異位，以及字節(jié)大模型技術(shù)團隊的架構(gòu)調(diào)整。

過去一周，騰訊元寶接入 DeepSeek 后在中國區(qū)蘋果免費 APP 下載排行榜上超過豆包，排名第二、僅次于 DeepSeek。在“DeepSeek+”的風潮下，相比百度、阿里、字節(jié)等有技術(shù)包袱的大廠來說，騰訊的元寶與微信等應(yīng)用迅速抓住了機會，毫無負擔地接入了 DeepSeek，一下子由過去兩年的被動防守轉(zhuǎn)為主動出擊，變守為攻，扭轉(zhuǎn)了局勢。

業(yè)內(nèi)周知，在過去的兩年，騰訊在大模型、AIGC 相關(guān)技術(shù)與產(chǎn)品上雖然努力追趕，但始終不溫不火。又由于將算力與人才等資源更多投入基礎(chǔ)模型，文生視頻等方向的研究資源被影響，團隊核心骨干從騰訊流向快手、字節(jié)等團隊?？梢哉f，DeepSeek 救了騰訊大模型一把。

也因此，有業(yè)內(nèi)人士認為：基礎(chǔ)模型的研究最終只需要 DeepSeek 一家即可。隨之引發(fā)的，是近日傳出的大模型公司有老股東開始張羅退股的聲音，認為“智譜、階躍甚至字節(jié)、阿里等公司的大模型都沒戲了”?！獙τ谶@種聲音，筆者不敢茍同，認為應(yīng)該持續(xù)觀望。

有一個比喻能很好地形容當前中國大模型創(chuàng)業(yè)潮的格局：

一個富二代學霸做了一份接近滿分的卷子，并把答案公布了出來。但這份答案的學習有一定的資源成本與面子成本，另一個能承擔起這兩種成本的富二代學渣直接拿來抄了、也考了接近滿分的成績?，F(xiàn)在留下一群從農(nóng)村通過贊助入學、平時考七八十分的學生，以及同是富二代但努力方向錯了的學生，不知所措。

他們終將認識到，開放社會的競爭不一定公平，但一定殘酷。打破這種結(jié)構(gòu)性困境很難，或許需要“一命二運三風水四積陰德五讀書”，但他們沒有其他選擇。

回到現(xiàn)實，字節(jié)的大模型團隊進行調(diào)整，也是因為 AGI 的競爭格局發(fā)生了變化——DeepSeek 沖出來之前，業(yè)內(nèi)幾乎所有人都在夸字節(jié)的豆包，豆包也上升十分迅猛，給 kimi 造成極大的圍剿；但 DeepSeek 霸屏整個春節(jié)后，字節(jié)意識到，AGI 仍是一個高度的果實，必須換一個更能打的將領(lǐng)。

據(jù) AI 科技評論驗證，此前字節(jié)的基礎(chǔ)模型技術(shù)研究由朱文佳帶領(lǐng)，春節(jié)后進行了一次大的人員調(diào)整，基礎(chǔ)模型技術(shù)研發(fā)的一號位換成了由吳永輝，黃文灝等在 2024 年新加入的大模型骨干都向吳永輝匯報，而朱文佳則轉(zhuǎn)向了模型應(yīng)用一號位，吳永輝與朱文佳都向梁汝波匯報。

經(jīng) AI 科技評論梳理，2023 年字節(jié)剛組建大模型團隊時，團隊人員主要來自字節(jié)內(nèi)部，包括搜索、抖音、西瓜、TikTok 等等多條知名業(yè)務(wù)線，在字節(jié)過往產(chǎn)品上有過大大小小的勝仗，朱文佳下面各個小組中一號位人選從外面招入的人才并不多。

從 2024 年年中開始，越來越多 AGI 方向的知名人才被招入字節(jié)，團隊開始換血。據(jù)知情人士分析，這背后的原因是：朱文佳等人來自搜推廣技術(shù)背景，而大模型是新的范式，兩者不一定適合。字節(jié)、MiniMax 等公司此前低估 RL 技術(shù)路線就是一個例證。吳永輝代替朱文佳成為基礎(chǔ)模型研究一號位，意味著字節(jié)換血的決心更徹底。雷峰網(wǎng)

吳永輝此前在谷歌的職級僅次于 Jeff Dean，是谷歌 Gemini 的核心貢獻者之一。而據(jù)幾位硅谷華人的信源，吳永輝擅長模型工程。谷歌自 2017 年發(fā)布 Transformer 后一直在大模型賽道上持續(xù)創(chuàng)新，且谷歌研究大模型一直是從底層框架、算力到上層算法的系統(tǒng)性推進，從知識面上吳永輝確更適合大模型技術(shù)一號位的角色。（谷歌 Gemini 是否被低估？歡迎感興趣的讀者添加作者微信 Fiona190913 交流）

據(jù)知情人士透露，朱文佳此前在帶領(lǐng)字節(jié)大模型技術(shù)研發(fā)時，在人才任用上更重用以往一起打過仗的親信喬木等人，同時在大模型基礎(chǔ)研究的創(chuàng)新 idea 采用上不夠開放。這背后的邏輯不難理解：AGI 的技術(shù)有極高不確定性、用熟悉的隊友能減少溝通成本。如果 AGI 是一個很低的桃子，“錢多人傻”的打法也許可以，但事實或許并非如此。

據(jù)了解，新加入字節(jié)的技術(shù)人員曾向朱文佳提過諸如 SPPO 等強化學習方向、火星優(yōu)化器等高效訓練方向的技術(shù)方案，“一些方案明明自己驗證了 work、但被朱文佳移交給身邊的人驗證后被反饋不 work 而棄掉”。此前字節(jié)內(nèi)部賽馬文生視頻，其他團隊賽贏，但后續(xù)成果被朱文佳劃到了 Seed 團隊。（更多字節(jié)大模型內(nèi)部的研究細節(jié)，歡迎天街作者微信 Fiona190913 交流）

大模型是一項有門檻的創(chuàng)新技術(shù)，無論在大廠還是創(chuàng)業(yè)公司，實際上都需要創(chuàng)業(yè)者的心態(tài)。第一批低估 AGI 的人已經(jīng)被摁倒，但并非所有人都吸取了教訓。雷峰網(wǎng)

二、AGI 的壁壘在哪？

“算法是沒有壁壘的。”一位大模型 VC 這樣評論道。與此同時，還有相似的聲音：“DeepSeek 現(xiàn)象只是曇花一現(xiàn)，過 6 個月就會被追上”，以及“大模型創(chuàng)業(yè)公司必然會死，最后贏家只有 DeepSeek 與大廠，你看騰訊元寶”。

筆者認為，在下論斷之前，首先要回答一個問題：DeepSeek 已經(jīng)實現(xiàn)終極 AGI 了嗎？答案顯然是否定的，即使是 DeepSeek 官方都承認，R1 模型仍有一些致命缺陷，比如通用能力不足、語言混淆、提示詞敏感以及軟件工程能力不足。

如果這個問題達成了共識，那么我們就要思考下一層：

第一，DeepSeek 是不是一定能解決 AGI 的所有技術(shù)問題？

第二，DeepSeek 是不是只需一家之力就能實現(xiàn)終極 AGI？

第三，中國是不是只有 DeepSeek 一家有實力解決 AGI 的各個技術(shù)問題？

同樣以騰訊元寶為例。雖然元寶接入 DeepSeek 后可以贏得一時的勝利，但沒有人能保證 DeepSeek 永遠滿分。如果有一天 DeepSeek 不開卷、競爭的規(guī)則被改寫，又將攻守異位。

對于上述問題，筆者均持懷疑態(tài)度，原因很簡單：DeepSeek 并非聚集了中國乃至全球所有的 AGI 技術(shù)人才。即使曾經(jīng)明星如云的 OpenAI，也因為2023、2024 年經(jīng)歷了大批核心人才出走，發(fā)展受阻。

關(guān)于 AGI，如果不將其當成只是 DeepSeek 一家的責任，而是作為整個 AI 行業(yè)的必然終局，那么就不難有一種樸素的感覺：AGI 的大航海，需要的不只是一個“DeepSeek”，也不會只有一個“DeepSeek”。AGI 是一個行業(yè)，而不是一個產(chǎn)品。

在 2 月的交流中，筆者總結(jié)，造成 AGI 從業(yè)者這種“既重視又低估”的矛盾心理的一個重要原因，或許是互聯(lián)網(wǎng)思維的慣性。

經(jīng)歷過互聯(lián)網(wǎng)大戰(zhàn)的從業(yè)者向 AI 科技評論舉例，“互聯(lián)網(wǎng)產(chǎn)品就是競爭到最后往往就是只有一家勝出，比如出行大戰(zhàn)、3Q 大戰(zhàn)等等?！钡P者認為，這種類比不太恰當，因為互聯(lián)網(wǎng)產(chǎn)品的技術(shù)如搜推廣從谷歌開始、再到國內(nèi)時，大體的技術(shù)天花板已經(jīng)確定，而 DeepSeek 證明了 AGI 的天花板比 OpenAI 所取得的成績還高。

與 AGI 或大模型能在同一個層面類比的技術(shù)分支，或許用自動駕駛的 L4、英偉達芯片等高難度的技術(shù)來類比更合適。雖然 L4 至今沒有實現(xiàn)，但自動駕駛技術(shù)從 L2 到 L4 的過程中曾衍生了不同維度的產(chǎn)品商業(yè)化（如掃地機器人），同樣，AGI 也是一個逐步取得勝利、逐步催生商業(yè)技術(shù)產(chǎn)品的過程。

有些團隊本就不具備競爭 AGI 的技術(shù)實力，但這并不能推斷出“DeepSeek 是唯一能競爭 AGI 的創(chuàng)業(yè)團隊”或“中國只需要一家 AGI 公司”的結(jié)論。哪怕是海外的各家基礎(chǔ)模型，也在能力上各有分工，如 GPT 更擅長聽指令、Claude 更擅長代碼。

再回顧更大的行業(yè)規(guī)律：如果說搜廣推技術(shù)由谷歌開啟、字節(jié)抖音推至巔峰，那么大模型技術(shù)由 OpenAI 開啟，由將由誰推至巔峰？互聯(lián)網(wǎng)時代經(jīng)歷了 20 年才得出答案、中間也經(jīng)歷了許多故事，那么 AGI 時代也不可能只在 2 年內(nèi)驗證最初的贏家與最后的贏家。

那么，AGI 的壁壘在哪？

筆者認為，AGI 的壁壘實際是：算法的優(yōu)勢、技術(shù)的創(chuàng)新雖然無法構(gòu)成堅不可摧的壁壘，但可以贏得時間差。

以月之暗面為例。事實上，Moonshot 與 DeepSeek 都是在 2023 年的上半年成立、前后相差只有一個月。

在 2021 年智源的“悟道”大模型項目中，楊植麟也是悟道 2.0 大模型的核心開發(fā)者之一，從底層 Transformer 到上層大模型的算法訓練都有完整、系統(tǒng)的研究背書。相比之下，DeepSeek 創(chuàng)始團隊、包括梁文鋒雖是計算機專業(yè)背景，但在 NLP、Transformer 與預訓練等大模型的關(guān)鍵技術(shù)上與 Moonshot 團隊必然存在技術(shù)學習的時間差。

如果以 Moonshot 在成立時就具備訓練千億大模型的能力開始算起，到 DeepSeek 在 2024 年 5 月發(fā)布 V2，那么這個時間差粗略計算大約是 1 年；如果嚴格考慮 V2 訓練成本大幅降低的研發(fā)時間，這個時間差也至少是 6 個月以上。

但由于 Moonshot 在過去兩年更重視產(chǎn)品增長、而非基礎(chǔ)模型的底層技術(shù)創(chuàng)新，Moonshot 與 DeepSeek 的基礎(chǔ)模型時間差也從 2023 年“DeepSeek 至少比 Moonshot 落后半年”變成了 2025 年“Moonshot 至少比 DeepSeek 落后 XXX 年”。在互聯(lián)網(wǎng)思維的過度指導下，前后相減，Moonshot 至少失去了一年的優(yōu)勢，主動變被動。

據(jù)知情人士透露，DeepSeek 內(nèi)部計劃今年 3 月發(fā)布 V3.5，6 月之前發(fā)布 V4。換言之，假設(shè)其他團隊的基礎(chǔ)模型能在 6 月趕上 V3 與 R1，作為先行者，DeepSeek 已經(jīng)利用時間差贏得了領(lǐng)先的技術(shù)研發(fā)期，以及這半年內(nèi)的生態(tài)護城河。模型的效果容易提升，但生態(tài)不容易割據(jù)。

是坐享其成，還是參與競爭，亦或看清局勢、早早轉(zhuǎn)向自身的優(yōu)勢所在，不容易判斷。盡管 DeepSeek 當前風頭正盛，但 AGI 仍然是一個掛在高處的果子，需要持續(xù)的底層技術(shù)創(chuàng)新。

在跋涉的過程中，一定會有人退出，無論是 VC 也好、創(chuàng)業(yè)者也好、技術(shù)人員也好，但無論如何，這條路上不會只有 DeepSeek，也希望不會只有 DeepSeek。

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

0人收藏

相關(guān)文章

陳彩嫻

編輯

發(fā)私信

當月熱門文章

DeepSeek 反思潮：AGI 既被重新審視，又被持續(xù)低估

DeepSeek 反思潮：AGI 既被重新審視，又被持續(xù)低估