小紅書要不要做大模型？

本文作者：二維馬曉寧

2025-01-23 16:56

導(dǎo)語(yǔ)：小紅書要抓住重要的戰(zhàn)略級(jí)機(jī)會(huì)，也要看清并揚(yáng)棄自身的短板。

小紅書的爆火，再次引發(fā)了我們對(duì)于小紅書技術(shù)問題的討論，也進(jìn)一步將小紅書與現(xiàn)在最受關(guān)注的大模型能力聯(lián)系在了一起。在過(guò)去的 2024 年，卷大模型已經(jīng)成為了中國(guó)互聯(lián)網(wǎng)大廠的標(biāo)配，但是到了 2025 年，對(duì)于接下來(lái)的 AI 戰(zhàn)略，小紅書仍需抉擇。

小紅書其實(shí)一直都在緊跟大模型的浪潮。2023 年初，ChatGPT 3.0 剛剛爆紅不久，小紅書就開始摸排國(guó)內(nèi)相關(guān)的創(chuàng)業(yè)公司，并很快成為了 Minimax 在 A2 輪次的投資方之一，這輪同時(shí)入資的還有騰訊、小米、金山三家大廠。

這次投資之后，2023 年 9 月，小紅書基于 Minimax 的大語(yǔ)言模型，開始在App中內(nèi)測(cè) AI 聊天功能的 AI 助手Davinic（達(dá)芬奇），之后做出了同樣基于 Minimax 的社交陪伴功能“AI 寵物小伙伴”，用戶可以只能創(chuàng)建自己的寵物角色。

如果說(shuō)投資 Minimax 只是開胃小菜，那么追逐月之暗面則是小紅書接下來(lái)的重頭大戲。

張宇彤是金沙江在投資小紅書過(guò)程中的項(xiàng)目主導(dǎo)人。小紅書要投大模型廠商，月之暗面自然通過(guò)張予彤的關(guān)系進(jìn)入了小紅書的視野。

這是月之暗面第三輪融資，總估值高達(dá) 9 億美金，最初定下的投資方有三家，分別是小紅書、云九資本、五源資本，各自有 1000萬(wàn) 美金的投資額度。小紅書作為領(lǐng)投方，在金額上有所猶豫，想要增加到兩千萬(wàn)至三千萬(wàn)之間，張予彤要求各方先打錢再開放信息，云九和五源就先以債的方式打過(guò)去了錢。

誰(shuí)知道小紅書這一猶豫，阿里就擠進(jìn)了投資隊(duì)伍，把這一輪估值撐到了 15 億美金，小紅書從領(lǐng)投方變成了跟投方。

除了投資，小紅書也組建了大模型團(tuán)隊(duì)，負(fù)責(zé)人是前格林深瞳首席科學(xué)家、小紅書 AI 創(chuàng)新負(fù)責(zé)人張德兵。他在 2023 年 10 月份的一次技術(shù)分享中說(shuō)過(guò)，小紅書大模型布局將主要圍繞三個(gè)方向：一是多模態(tài)技術(shù)在小紅書內(nèi)部應(yīng)用場(chǎng)景具體的落地，二是針對(duì)內(nèi)容創(chuàng)作者、借助AIGC工具降本增效，三是更關(guān)注成本。

不久之后小紅書自研語(yǔ)言大模型的消息開始傳出，2024 年小紅書開始灰度測(cè)試自研通用大模型基座“小地瓜”。

小紅書產(chǎn)品和設(shè)計(jì)負(fù)責(zé)人鄧超負(fù)責(zé) AI 產(chǎn)品探索。截止到目前為止，小紅書內(nèi)部已經(jīng)推出過(guò)多款 AI 產(chǎn)品，除了達(dá)芬奇和 AI 寵物外，小紅書還有 AI 繪畫產(chǎn)品“Trik”、文生圖產(chǎn)品“此刻”、AI搜索助手“搜搜薯”。2024 年底，小紅書先后在站外和站內(nèi)上架了 AI 搜索新產(chǎn)品“點(diǎn)點(diǎn)”和“問點(diǎn)點(diǎn)”。

小紅書既然發(fā)力許久，并且在模型層和應(yīng)用層都小有成績(jī)，在接下來(lái)的 2025 年，要不要在大模型領(lǐng)域繼續(xù)深入呢？如何深入？

能做、要做、就該做

對(duì)于這個(gè)問題，AI科技評(píng)論與多位業(yè)內(nèi)人士交流過(guò)，要和不要兩個(gè)選項(xiàng)都有不少理由，而且都能言之成理。

支持方普遍認(rèn)為，小紅書要繼續(xù)發(fā)力大模型，既有戰(zhàn)略性的原因，也有產(chǎn)品力的考量。

小紅書想要掙錢，主要有商業(yè)化和電商兩條路可走，而在商業(yè)化方面，為了保持住小紅書的內(nèi)容調(diào)性，推薦系統(tǒng)中能夠推送的廣告占比必然有一個(gè)閾值，因此，搜索廣告就是小紅書的重要增長(zhǎng)點(diǎn)。

小紅書已經(jīng)成為國(guó)內(nèi)最重要的搜索平臺(tái)之一，承接了百度和其他搜索平臺(tái)的不少需求，目前日均搜索量（qv）已經(jīng)超百度一半。想要延續(xù)搜索份額的增長(zhǎng)勢(shì)頭，小紅書就一定要在 AI 上持續(xù)發(fā)力，保證用戶的搜索體驗(yàn)處于市場(chǎng)領(lǐng)先地位，進(jìn)而擴(kuò)大市場(chǎng)份額，最終成功實(shí)現(xiàn)商業(yè)化收入上的突破。

從戰(zhàn)略上來(lái)看，小紅書不僅應(yīng)該做 AI 搜索，而且要大做特做，最好能夠取代百度，成為國(guó)內(nèi)最大的搜索流量池。

當(dāng)前 AI 搜索是大模型應(yīng)用的當(dāng)紅產(chǎn)品形態(tài)，海內(nèi)外都有不少明星產(chǎn)品，Perplexity、kimi、夸克乃至豆包都被歸為該類別。小紅書與抖音是國(guó)內(nèi)當(dāng)前互聯(lián)網(wǎng)流量最集中的兩個(gè)社交平臺(tái)，不少人認(rèn)為 2024 年豆包的崛起是歸功于抖音的流量扶持與字節(jié)底層基座模型的能力成長(zhǎng)，因此小紅書基于自身強(qiáng)大基座模型開發(fā)類 ChatGPT 產(chǎn)品+小紅書平臺(tái)的流量密碼，也或有望彎道超車。

從這一角度看，小紅書繼續(xù)投入資源升級(jí)基座大模型、開發(fā) AI 搜索與聊天產(chǎn)品有天然優(yōu)勢(shì)，還有行業(yè)先驗(yàn)?zāi)０宥拱r(shí)間線拉長(zhǎng)來(lái)看，假如未來(lái)五年、十年基于大模型的 AI 應(yīng)用大爆發(fā)，小紅書的 AI 產(chǎn)品也將是未來(lái)其穿越行業(yè)周期的一道護(hù)城河、入場(chǎng)券，即使大模型的投入大也是“一筆劃算的帳”。

另一個(gè)關(guān)于大模型應(yīng)用的想象是新型社交，如 MiniMax 開發(fā)的產(chǎn)品 Talkie。

新時(shí)代一定要設(shè)計(jì)新的社交產(chǎn)品和社交工具。但目前抖音與小紅書已經(jīng)能滿足用戶對(duì)新型社交的需求，因此社交的本質(zhì)是在一個(gè)高密度社區(qū)里找到自己想找的人與內(nèi)容，所以新型大模型社交產(chǎn)品的崛起會(huì)面臨現(xiàn)有社交平臺(tái)的流量圍剿；反之，現(xiàn)有社交平臺(tái)基于大模型升級(jí)原有平臺(tái)的社交功能則有天然優(yōu)勢(shì)。小紅書與其成為被新生代事物挑戰(zhàn)的被動(dòng)方，不如成為發(fā)起挑戰(zhàn)的主動(dòng)方。

第二點(diǎn)原因，則在于小紅書用戶的多元化，以及由此產(chǎn)生的對(duì)各類 AI 工具的渴求。

小紅書起身于圖文社區(qū)，但是現(xiàn)在已經(jīng)發(fā)展為一個(gè)涵蓋圖文、短視頻、直播、群聊社交等多種媒介形態(tài)的平臺(tái)。在內(nèi)容的創(chuàng)作端和消費(fèi)端，用戶的需求已經(jīng)越來(lái)越復(fù)雜。剪映誕生于輔助抖音的內(nèi)容創(chuàng)作，即屬于該邏輯。

在小紅書群聊輸入框的+號(hào)里，隱藏著小紅書AI聲聊的入口。這個(gè)產(chǎn)品可以幫助用戶變聲說(shuō)話，用唱歌的方式聊天等等。

這是小紅書發(fā)掘的其中一個(gè)社交需求場(chǎng)景。用戶的新需求可能隱藏在各個(gè)角落，創(chuàng)作者有 AI 生成文案的需求，有 AI 編輯圖片視頻的需求，有直播間數(shù)字化場(chǎng)景的需求，有通過(guò) AI 手段與粉絲互動(dòng)的需求等等，這種場(chǎng)景小紅書不去發(fā)掘，就會(huì)被站外工具發(fā)掘，甚至?xí)绊懙秸麄€(gè)平臺(tái)社區(qū)的氛圍。

比如此前在《“TikTok 難民”大批涌入，小紅書會(huì)面臨什么技術(shù)挑戰(zhàn)？》一文中提到的，不少人對(duì)跨語(yǔ)種的交流需求催生了一個(gè)全新的場(chǎng)景，那么小紅書就有必要做一個(gè)多模態(tài)的翻譯產(chǎn)品。

而且根據(jù)分析公司 Similarweb的最新數(shù)據(jù)，小紅書在本周早些時(shí)候，一天內(nèi)就吸引了近 300萬(wàn)美國(guó)用戶，現(xiàn)在美國(guó)iOS和Android設(shè)備上的每日活躍用戶約為340萬(wàn)，是上周同期的十倍有余。大批量的海外用戶迫切需要小紅書內(nèi)嵌的翻譯能力。

除了戰(zhàn)略和產(chǎn)品方面的考量外，支持方最重要的觀點(diǎn)還是，小紅書目前是國(guó)內(nèi)最大的用戶原創(chuàng)內(nèi)容中心之一，圖文質(zhì)量很高，有效信息含量豐富。在多年來(lái)強(qiáng)調(diào)社區(qū)調(diào)性的運(yùn)營(yíng)管理中，社區(qū)互動(dòng)氛圍強(qiáng)，用戶中“活人”占比多，語(yǔ)料庫(kù)質(zhì)量極佳。小紅書擁有國(guó)內(nèi)發(fā)展 AI 大模型技術(shù)最好的語(yǔ)料庫(kù)之一，數(shù)據(jù)又成為下一代模型升級(jí)的關(guān)鍵，多元化多語(yǔ)種數(shù)據(jù)更是稀缺。

所以小紅書在訓(xùn)練大模型的時(shí)候，先天就有數(shù)據(jù)上的優(yōu)勢(shì)，不僅遠(yuǎn)超六小虎，甚至超過(guò)國(guó)內(nèi)絕大部分大廠。訓(xùn)練基座大模型，可以保證其技術(shù)的自主性與模型應(yīng)用迭代的節(jié)奏控制。即使自己不做大模型的預(yù)訓(xùn)練，理論上也可以成為國(guó)內(nèi)最好的語(yǔ)料庫(kù)供應(yīng)商之一，“小紅書應(yīng)該接住這潑天的富貴”。

沒人、沒錢、沒必要

當(dāng)然反駁者的意見也不容小覷。小紅書當(dāng)然有機(jī)會(huì)去做大模型，但是機(jī)會(huì)夠不夠大，值不值得小紅書全力投入呢？

質(zhì)疑者的第一條理由就是技術(shù)人才的問題。

小紅書不是一家以技術(shù)見長(zhǎng)的公司，強(qiáng)運(yùn)營(yíng)、強(qiáng)策劃是小紅書不斷破圈的殺手锏。但是訓(xùn)練大模型，是一件技術(shù)要求極高的工作。

AI 科技評(píng)論與多位業(yè)內(nèi)人士討論過(guò)，要想做大模型，最重要的是找到合適的人。甚至于，只要找到了正確的人，一個(gè)大模型的訓(xùn)練團(tuán)隊(duì)，可能只要十來(lái)個(gè)人就能做起來(lái)了。不止一位從業(yè)者認(rèn)為，上一代所有的AI人才，不論是搞CV的，還是搞 NLP的，看到大模型仍然要從頭學(xué)起，之前積累的經(jīng)驗(yàn)幾乎是一夜清零。

小紅書目前大模型的帶頭人張德兵，此前的履歷是格靈深瞳的首席科學(xué)家，博士畢業(yè)于浙江大學(xué)，師從著名的計(jì)算機(jī)視覺與機(jī)器學(xué)習(xí)專家何曉飛教授。

張德兵是一位在學(xué)術(shù)屆和在產(chǎn)業(yè)界成果突出、經(jīng)驗(yàn)豐富的計(jì)算機(jī)視覺專家，但他此前也沒有訓(xùn)練過(guò)超大規(guī)模集群下的大語(yǔ)言模型，并沒有相關(guān)的經(jīng)驗(yàn)。

至于小紅書另外的三個(gè)算法團(tuán)隊(duì)，核心人物中的風(fēng)笛原是阿里算法策略專家，凱奇是原鳳巢首席架構(gòu)師，吳毅是百度搜索算法專家，更不了解大模型。

除了算法人才，訓(xùn)練基座大模型也需要優(yōu)秀的 Infra 人才搭建萬(wàn)卡集群。相比算法人才，國(guó)內(nèi)優(yōu)秀的底層基礎(chǔ)設(shè)施與系統(tǒng)人才更加鳳毛棱角，少數(shù)的幾個(gè)人才也已經(jīng)被字節(jié)、阿里等大廠與頭部大模型獨(dú)角獸公司瓜分。小紅書要吸引這些人才，難度非同小可。

缺人，這是小紅書訓(xùn)練大模型面臨的第一個(gè)問題。

第二個(gè)問題是，大模型實(shí)在太花錢了。

一個(gè)通用大模型進(jìn)行一次預(yù)訓(xùn)練的費(fèi)用，就要千萬(wàn)美金以上，這還不包含人力成本、算力成本、后續(xù)的優(yōu)化、模型的更新和部署等費(fèi)用。大大小小的費(fèi)用相加，等到模型真的能用，至少要五千萬(wàn)美金起步了。

大模型已經(jīng)成為一個(gè)比拼財(cái)力的賽道。字節(jié)過(guò)去一年在 AI 研發(fā)上的投入超過(guò)百度阿里騰訊三者的總和 1000 億元人民幣。在六小虎中融資額相對(duì)較少、只有數(shù)億美金的零一萬(wàn)物，現(xiàn)在也已經(jīng)放棄了預(yù)訓(xùn)練。

根據(jù)公開報(bào)道，小紅書在 2023 年才首次實(shí)現(xiàn)歷史性突破扭虧為盈，當(dāng)年?duì)I收 37 億美元，凈利潤(rùn) 5 億美元。到現(xiàn)在剛盈利兩年的小紅書，能在大模型上投入多少錢？

更何況，小紅書的大模型能力，在同行之間不具備競(jìng)爭(zhēng)力，也沒有云業(yè)務(wù)的加持，就沒辦法成為一個(gè)賺錢的業(yè)務(wù)，純屬燒錢的行為，小紅書應(yīng)該既不愿、也不能長(zhǎng)期支撐這樣的投資行為。

至于不支持小紅書做大模型的最后一個(gè)理由，則是目前業(yè)界的共識(shí)：模型無(wú)關(guān)論（Model-Agnostic）。

在 Scaling Law見底，Transformer 架構(gòu)仍然一統(tǒng)天下的今天，市面上的諸多大模型從能力上來(lái)講沒有本質(zhì)的差別，用戶的使用體感上各有千秋，但整體而言，沒有代際差異。

多個(gè) AI 應(yīng)用團(tuán)隊(duì)告訴 AI 科技評(píng)論，從 2024 年年中 Claude Sonnet 3.5 發(fā)布后開始，他們?cè)陂_發(fā)大模型應(yīng)用時(shí)就是普遍接入 4、5 個(gè)不同的基座大模型，因?yàn)槎嗉一Ｐ偷男阅芏家涯苕敲?OpenAI，“大模型就像電源一樣即插即用”，所以不同基座模型的迭代速度不再影響上層應(yīng)用的開發(fā)。

在當(dāng)前第一梯隊(duì)的大模型中，現(xiàn)在的 AI 產(chǎn)品無(wú)論選擇使用哪一個(gè)，只要經(jīng)過(guò)合理的fine tune，最終結(jié)果也都大差不差。更何況，AI產(chǎn)品可以選擇多個(gè)大模型，可以隨著產(chǎn)品特征，或者是用戶需求主動(dòng)切換大模型。小紅書做 AI 產(chǎn)品的時(shí)候，也可以走這樣的路線。以現(xiàn)在的 API 價(jià)格之低，用基座模型廠商的模型，還是一種省錢行為呢。

結(jié)語(yǔ)：

在多方討論之后，AI 科技評(píng)論認(rèn)為，小紅書接下來(lái)，應(yīng)該全力以赴去做AI產(chǎn)品，不要投入精力去做大模型。

AI 搜索的產(chǎn)品特點(diǎn)，既契合小紅書自然生長(zhǎng)的搜索流量，也能利用好小紅書上規(guī)模龐大的優(yōu)質(zhì)語(yǔ)料庫(kù)。這是小紅書應(yīng)該抓住的戰(zhàn)略級(jí)機(jī)會(huì)。

雷峰網(wǎng)(公眾號(hào)：雷峰網(wǎng))認(rèn)為，在現(xiàn)有條件下，小紅書可能還缺乏做大模型的能力，與其勉強(qiáng)自己，不如使用開源模型，或者只需要接入 API，先解決平臺(tái)上的 AI 產(chǎn)品問題，將小紅書打造成引領(lǐng) AI 時(shí)代的社區(qū)平臺(tái)。

大家怎么看？

雷峰網(wǎng)稿件，請(qǐng)勿轉(zhuǎn)載

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

0人收藏

相關(guān)文章

二維馬曉寧

編輯

發(fā)私信

當(dāng)月熱門文章