丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
人工智能 正文
發(fā)私信給陳彩嫻
發(fā)送

0

DeepSeek 反思潮:AGI 既被重新審視,又被持續(xù)低估

本文作者: 陳彩嫻   2025-02-28 23:45
導語:不斷的攻守異位,要么是實力相當,要么是高度不確定性。

2 月很有意思。

一、DeepSeek 反思潮

在 DeepSeek 的集體反思潮中,無論是大廠內(nèi)部的“AGI 創(chuàng)業(yè)團隊”、還是 AGI 的明星創(chuàng)業(yè)公司,都進行了戰(zhàn)略調(diào)整。很顯然,DeepSeek 的暴擊讓整個行業(yè)都進行了一次深刻的反思,值得注意的幾個變化是:

首先,大模型創(chuàng)業(yè)公司重新將技術(shù)突破提升到一個新的高度、超越產(chǎn)品更新成為公司戰(zhàn)略發(fā)展的優(yōu)先級。

據(jù)近日與張予彤接觸過的 VC 反饋,DeepSeek 不花一分錢投流的崛起啟示了 AGI 的技術(shù)高度,也讓 Moonshot 反思了過去一年類互聯(lián)網(wǎng)打法、過度重視產(chǎn)品投流的策略局限性。在未來的一年,Moonshot 要將基礎(chǔ)模型的突破作為重點,將更多資源投到技術(shù)而非研發(fā)上。

事實上,這不僅僅是月之暗面的結(jié)論,也是這波 AGI 創(chuàng)業(yè)潮中卡技術(shù)生態(tài)位的大模型公司的普遍轉(zhuǎn)變。與此相對應(yīng)的,是產(chǎn)品團隊的資源比重下降,因為 DeepSeek 的成功已經(jīng)側(cè)面證明了:AGI 時代可能不需要產(chǎn)品經(jīng)理,也不需要投流,只要技術(shù)實力提升后就會有用戶增長。

2024 年的投流大戰(zhàn),以 DeepSeek 不花一分錢、DAU 最高時達 4000 萬落下帷幕,而受創(chuàng)最重的自然是投流團隊,因為錢相當于白花了。投流越多、傷害越大,如 Moonshot;投流越少,傷害越小,如 MiniMax。

據(jù) AI 科技評論獲悉,MiniMax 前產(chǎn)品一號位離職的原因之一,就是曾與創(chuàng)始人在投流上發(fā)生分歧。MiniMax 的組織架構(gòu)之前是互聯(lián)網(wǎng)打法,按照不同產(chǎn)品進行分組,產(chǎn)品團隊一度達到 200 人,但 2024 年年中開始就一直在調(diào)整產(chǎn)品團隊,接下來可能會進一步裁減產(chǎn)品人員。雷峰網(wǎng)(公眾號:雷峰網(wǎng))

其次,是字節(jié)與騰訊的攻守異位,以及字節(jié)大模型技術(shù)團隊的架構(gòu)調(diào)整。

過去一周,騰訊元寶接入 DeepSeek 后在中國區(qū)蘋果免費 APP 下載排行榜上超過豆包,排名第二、僅次于 DeepSeek。在“DeepSeek+”的風潮下,相比百度、阿里、字節(jié)等有技術(shù)包袱的大廠來說,騰訊的元寶與微信等應(yīng)用迅速抓住了機會,毫無負擔地接入了 DeepSeek,一下子由過去兩年的被動防守轉(zhuǎn)為主動出擊,變守為攻,扭轉(zhuǎn)了局勢。

業(yè)內(nèi)周知,在過去的兩年,騰訊在大模型、AIGC 相關(guān)技術(shù)與產(chǎn)品上雖然努力追趕,但始終不溫不火。又由于將算力與人才等資源更多投入基礎(chǔ)模型,文生視頻等方向的研究資源被影響,團隊核心骨干從騰訊流向快手、字節(jié)等團隊??梢哉f,DeepSeek 救了騰訊大模型一把。

也因此,有業(yè)內(nèi)人士認為:基礎(chǔ)模型的研究最終只需要 DeepSeek 一家即可。隨之引發(fā)的,是近日傳出的大模型公司有老股東開始張羅退股的聲音,認為“智譜、階躍甚至字節(jié)、阿里等公司的大模型都沒戲了”?!獙τ谶@種聲音,筆者不敢茍同,認為應(yīng)該持續(xù)觀望。

有一個比喻能很好地形容當前中國大模型創(chuàng)業(yè)潮的格局:

一個富二代學霸做了一份接近滿分的卷子,并把答案公布了出來。但這份答案的學習有一定的資源成本與面子成本,另一個能承擔起這兩種成本的富二代學渣直接拿來抄了、也考了接近滿分的成績?,F(xiàn)在留下一群從農(nóng)村通過贊助入學、平時考七八十分的學生,以及同是富二代但努力方向錯了的學生,不知所措。

他們終將認識到,開放社會的競爭不一定公平,但一定殘酷。打破這種結(jié)構(gòu)性困境很難,或許需要“一命二運三風水四積陰德五讀書”,但他們沒有其他選擇。

回到現(xiàn)實,字節(jié)的大模型團隊進行調(diào)整,也是因為 AGI 的競爭格局發(fā)生了變化——DeepSeek 沖出來之前,業(yè)內(nèi)幾乎所有人都在夸字節(jié)的豆包,豆包也上升十分迅猛,給 kimi 造成極大的圍剿;但 DeepSeek 霸屏整個春節(jié)后,字節(jié)意識到,AGI 仍是一個高度的果實,必須換一個更能打的將領(lǐng)。

據(jù) AI 科技評論驗證,此前字節(jié)的基礎(chǔ)模型技術(shù)研究由朱文佳帶領(lǐng),春節(jié)后進行了一次大的人員調(diào)整,基礎(chǔ)模型技術(shù)研發(fā)的一號位換成了由吳永輝,黃文灝等在 2024 年新加入的大模型骨干都向吳永輝匯報,而朱文佳則轉(zhuǎn)向了模型應(yīng)用一號位,吳永輝與朱文佳都向梁汝波匯報。

經(jīng) AI 科技評論梳理,2023 年字節(jié)剛組建大模型團隊時,團隊人員主要來自字節(jié)內(nèi)部,包括搜索、抖音、西瓜、TikTok 等等多條知名業(yè)務(wù)線,在字節(jié)過往產(chǎn)品上有過大大小小的勝仗,朱文佳下面各個小組中一號位人選從外面招入的人才并不多。

從 2024 年年中開始,越來越多 AGI 方向的知名人才被招入字節(jié),團隊開始換血。據(jù)知情人士分析,這背后的原因是:朱文佳等人來自搜推廣技術(shù)背景,而大模型是新的范式,兩者不一定適合。字節(jié)、MiniMax 等公司此前低估 RL 技術(shù)路線就是一個例證。吳永輝代替朱文佳成為基礎(chǔ)模型研究一號位,意味著字節(jié)換血的決心更徹底。雷峰網(wǎng)

吳永輝此前在谷歌的職級僅次于 Jeff Dean,是谷歌 Gemini 的核心貢獻者之一。而據(jù)幾位硅谷華人的信源,吳永輝擅長模型工程。谷歌自 2017 年發(fā)布 Transformer 后一直在大模型賽道上持續(xù)創(chuàng)新,且谷歌研究大模型一直是從底層框架、算力到上層算法的系統(tǒng)性推進,從知識面上吳永輝確更適合大模型技術(shù)一號位的角色。(谷歌 Gemini 是否被低估?歡迎感興趣的讀者添加作者微信 Fiona190913 交流)

據(jù)知情人士透露,朱文佳此前在帶領(lǐng)字節(jié)大模型技術(shù)研發(fā)時,在人才任用上更重用以往一起打過仗的親信喬木等人,同時在大模型基礎(chǔ)研究的創(chuàng)新 idea 采用上不夠開放。這背后的邏輯不難理解:AGI 的技術(shù)有極高不確定性、用熟悉的隊友能減少溝通成本。如果 AGI 是一個很低的桃子,“錢多人傻”的打法也許可以,但事實或許并非如此。

據(jù)了解,新加入字節(jié)的技術(shù)人員曾向朱文佳提過諸如 SPPO 等強化學習方向、火星優(yōu)化器等高效訓練方向的技術(shù)方案,“一些方案明明自己驗證了 work、但被朱文佳移交給身邊的人驗證后被反饋不 work 而棄掉”。此前字節(jié)內(nèi)部賽馬文生視頻,其他團隊賽贏,但后續(xù)成果被朱文佳劃到了 Seed 團隊。(更多字節(jié)大模型內(nèi)部的研究細節(jié),歡迎天街作者微信 Fiona190913 交流)

大模型是一項有門檻的創(chuàng)新技術(shù),無論在大廠還是創(chuàng)業(yè)公司,實際上都需要創(chuàng)業(yè)者的心態(tài)。第一批低估 AGI 的人已經(jīng)被摁倒,但并非所有人都吸取了教訓。雷峰網(wǎng)


二、AGI 的壁壘在哪?

“算法是沒有壁壘的。”一位大模型 VC 這樣評論道。與此同時,還有相似的聲音:“DeepSeek 現(xiàn)象只是曇花一現(xiàn),過 6 個月就會被追上”,以及“大模型創(chuàng)業(yè)公司必然會死,最后贏家只有 DeepSeek 與大廠,你看騰訊元寶”。

筆者認為,在下論斷之前,首先要回答一個問題:DeepSeek 已經(jīng)實現(xiàn)終極 AGI 了嗎?答案顯然是否定的,即使是 DeepSeek 官方都承認,R1 模型仍有一些致命缺陷,比如通用能力不足、語言混淆、提示詞敏感以及軟件工程能力不足。

如果這個問題達成了共識,那么我們就要思考下一層:

第一,DeepSeek 是不是一定能解決 AGI 的所有技術(shù)問題?

第二,DeepSeek 是不是只需一家之力就能實現(xiàn)終極 AGI?

第三,中國是不是只有 DeepSeek 一家有實力解決 AGI 的各個技術(shù)問題?

同樣以騰訊元寶為例。雖然元寶接入 DeepSeek 后可以贏得一時的勝利,但沒有人能保證 DeepSeek 永遠滿分。如果有一天 DeepSeek 不開卷、競爭的規(guī)則被改寫,又將攻守異位。

對于上述問題,筆者均持懷疑態(tài)度,原因很簡單:DeepSeek 并非聚集了中國乃至全球所有的 AGI 技術(shù)人才。即使曾經(jīng)明星如云的 OpenAI,也因為2023、2024 年經(jīng)歷了大批核心人才出走,發(fā)展受阻。

關(guān)于 AGI,如果不將其當成只是 DeepSeek 一家的責任,而是作為整個 AI 行業(yè)的必然終局,那么就不難有一種樸素的感覺:AGI 的大航海,需要的不只是一個“DeepSeek”,也不會只有一個“DeepSeek”。AGI 是一個行業(yè),而不是一個產(chǎn)品。

在 2 月的交流中,筆者總結(jié),造成 AGI 從業(yè)者這種“既重視又低估”的矛盾心理的一個重要原因,或許是互聯(lián)網(wǎng)思維的慣性。

經(jīng)歷過互聯(lián)網(wǎng)大戰(zhàn)的從業(yè)者向 AI 科技評論舉例,“互聯(lián)網(wǎng)產(chǎn)品就是競爭到最后往往就是只有一家勝出,比如出行大戰(zhàn)、3Q 大戰(zhàn)等等?!钡P者認為,這種類比不太恰當,因為互聯(lián)網(wǎng)產(chǎn)品的技術(shù)如搜推廣從谷歌開始、再到國內(nèi)時,大體的技術(shù)天花板已經(jīng)確定,而 DeepSeek 證明了 AGI 的天花板比 OpenAI 所取得的成績還高。

與 AGI 或大模型能在同一個層面類比的技術(shù)分支,或許用自動駕駛的 L4、英偉達芯片等高難度的技術(shù)來類比更合適。雖然 L4 至今沒有實現(xiàn),但自動駕駛技術(shù)從 L2 到 L4 的過程中曾衍生了不同維度的產(chǎn)品商業(yè)化(如掃地機器人),同樣,AGI 也是一個逐步取得勝利、逐步催生商業(yè)技術(shù)產(chǎn)品的過程。

有些團隊本就不具備競爭 AGI 的技術(shù)實力,但這并不能推斷出“DeepSeek 是唯一能競爭 AGI 的創(chuàng)業(yè)團隊”或“中國只需要一家 AGI 公司”的結(jié)論。哪怕是海外的各家基礎(chǔ)模型,也在能力上各有分工,如 GPT 更擅長聽指令、Claude 更擅長代碼。

再回顧更大的行業(yè)規(guī)律:如果說搜廣推技術(shù)由谷歌開啟、字節(jié)抖音推至巔峰,那么大模型技術(shù)由 OpenAI 開啟,由將由誰推至巔峰?互聯(lián)網(wǎng)時代經(jīng)歷了 20 年才得出答案、中間也經(jīng)歷了許多故事,那么 AGI 時代也不可能只在 2 年內(nèi)驗證最初的贏家與最后的贏家。

那么,AGI 的壁壘在哪?

筆者認為,AGI 的壁壘實際是:算法的優(yōu)勢、技術(shù)的創(chuàng)新雖然無法構(gòu)成堅不可摧的壁壘,但可以贏得時間差。

以月之暗面為例。事實上,Moonshot 與 DeepSeek 都是在 2023 年的上半年成立、前后相差只有一個月。

在 2021 年智源的“悟道”大模型項目中,楊植麟也是悟道 2.0 大模型的核心開發(fā)者之一,從底層 Transformer 到上層大模型的算法訓練都有完整、系統(tǒng)的研究背書。相比之下,DeepSeek 創(chuàng)始團隊、包括梁文鋒雖是計算機專業(yè)背景,但在 NLP、Transformer 與預訓練等大模型的關(guān)鍵技術(shù)上與 Moonshot 團隊必然存在技術(shù)學習的時間差。

如果以 Moonshot 在成立時就具備訓練千億大模型的能力開始算起,到 DeepSeek 在 2024 年 5 月發(fā)布 V2,那么這個時間差粗略計算大約是 1 年;如果嚴格考慮 V2 訓練成本大幅降低的研發(fā)時間,這個時間差也至少是 6 個月以上。

但由于 Moonshot 在過去兩年更重視產(chǎn)品增長、而非基礎(chǔ)模型的底層技術(shù)創(chuàng)新,Moonshot 與 DeepSeek 的基礎(chǔ)模型時間差也從 2023 年“DeepSeek 至少比 Moonshot 落后半年”變成了 2025 年“Moonshot 至少比 DeepSeek 落后 XXX 年”。在互聯(lián)網(wǎng)思維的過度指導下,前后相減,Moonshot 至少失去了一年的優(yōu)勢,主動變被動。

據(jù)知情人士透露,DeepSeek 內(nèi)部計劃今年 3 月發(fā)布 V3.5,6 月之前發(fā)布 V4。換言之,假設(shè)其他團隊的基礎(chǔ)模型能在 6 月趕上 V3 與 R1,作為先行者,DeepSeek 已經(jīng)利用時間差贏得了領(lǐng)先的技術(shù)研發(fā)期,以及這半年內(nèi)的生態(tài)護城河。模型的效果容易提升,但生態(tài)不容易割據(jù)。

是坐享其成,還是參與競爭,亦或看清局勢、早早轉(zhuǎn)向自身的優(yōu)勢所在,不容易判斷。盡管 DeepSeek 當前風頭正盛,但 AGI 仍然是一個掛在高處的果子,需要持續(xù)的底層技術(shù)創(chuàng)新。

在跋涉的過程中,一定會有人退出,無論是 VC 也好、創(chuàng)業(yè)者也好、技術(shù)人員也好,但無論如何,這條路上不會只有 DeepSeek,也希望不會只有 DeepSeek。

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

DeepSeek 反思潮:AGI 既被重新審視,又被持續(xù)低估

分享:
相關(guān)文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說