0
小紅書的爆火,再次引發(fā)了我們對于小紅書技術(shù)問題的討論,也進(jìn)一步將小紅書與現(xiàn)在最受關(guān)注的大模型能力聯(lián)系在了一起。在過去的 2024 年,卷大模型已經(jīng)成為了中國互聯(lián)網(wǎng)大廠的標(biāo)配,但是到了 2025 年,對于接下來的 AI 戰(zhàn)略,小紅書仍需抉擇。
小紅書其實(shí)一直都在緊跟大模型的浪潮。2023 年初,ChatGPT 3.0 剛剛爆紅不久,小紅書就開始摸排國內(nèi)相關(guān)的創(chuàng)業(yè)公司,并很快成為了 Minimax 在 A2 輪次的投資方之一,這輪同時入資的還有騰訊、小米、金山三家大廠。
這次投資之后,2023 年 9 月,小紅書基于 Minimax 的大語言模型,開始在App中內(nèi)測 AI 聊天功能的 AI 助手Davinic(達(dá)芬奇),之后做出了同樣基于 Minimax 的社交陪伴功能“AI 寵物小伙伴”,用戶可以只能創(chuàng)建自己的寵物角色。
如果說投資 Minimax 只是開胃小菜,那么追逐月之暗面則是小紅書接下來的重頭大戲。
張宇彤是金沙江在投資小紅書過程中的項(xiàng)目主導(dǎo)人。小紅書要投大模型廠商,月之暗面自然通過張予彤的關(guān)系進(jìn)入了小紅書的視野。
這是月之暗面第三輪融資,總估值高達(dá) 9 億美金,最初定下的投資方有三家,分別是小紅書、云九資本、五源資本,各自有 1000萬 美金的投資額度。小紅書作為領(lǐng)投方,在金額上有所猶豫,想要增加到兩千萬至三千萬之間,張予彤要求各方先打錢再開放信息,云九和五源就先以債的方式打過去了錢。
誰知道小紅書這一猶豫,阿里就擠進(jìn)了投資隊(duì)伍,把這一輪估值撐到了 15 億美金,小紅書從領(lǐng)投方變成了跟投方。
除了投資,小紅書也組建了大模型團(tuán)隊(duì),負(fù)責(zé)人是前格林深瞳首席科學(xué)家、小紅書 AI 創(chuàng)新負(fù)責(zé)人張德兵。他在 2023 年 10 月份的一次技術(shù)分享中說過,小紅書大模型布局將主要圍繞三個方向:一是多模態(tài)技術(shù)在小紅書內(nèi)部應(yīng)用場景具體的落地,二是針對內(nèi)容創(chuàng)作者、借助AIGC工具降本增效,三是更關(guān)注成本。
不久之后小紅書自研語言大模型的消息開始傳出,2024 年小紅書開始灰度測試自研通用大模型基座“小地瓜”。
小紅書產(chǎn)品和設(shè)計(jì)負(fù)責(zé)人鄧超負(fù)責(zé) AI 產(chǎn)品探索。截止到目前為止,小紅書內(nèi)部已經(jīng)推出過多款 AI 產(chǎn)品,除了達(dá)芬奇和 AI 寵物外,小紅書還有 AI 繪畫產(chǎn)品“Trik”、文生圖產(chǎn)品“此刻”、AI搜索助手“搜搜薯”。2024 年底,小紅書先后在站外和站內(nèi)上架了 AI 搜索新產(chǎn)品“點(diǎn)點(diǎn)”和“問點(diǎn)點(diǎn)”。
小紅書既然發(fā)力許久,并且在模型層和應(yīng)用層都小有成績,在接下來的 2025 年,要不要在大模型領(lǐng)域繼續(xù)深入呢?如何深入?
能做、要做、就該做
對于這個問題,AI科技評論與多位業(yè)內(nèi)人士交流過,要和不要兩個選項(xiàng)都有不少理由,而且都能言之成理。
支持方普遍認(rèn)為,小紅書要繼續(xù)發(fā)力大模型,既有戰(zhàn)略性的原因,也有產(chǎn)品力的考量。
小紅書想要掙錢,主要有商業(yè)化和電商兩條路可走,而在商業(yè)化方面,為了保持住小紅書的內(nèi)容調(diào)性,推薦系統(tǒng)中能夠推送的廣告占比必然有一個閾值,因此,搜索廣告就是小紅書的重要增長點(diǎn)。
小紅書已經(jīng)成為國內(nèi)最重要的搜索平臺之一,承接了百度和其他搜索平臺的不少需求,目前日均搜索量(qv)已經(jīng)超百度一半。想要延續(xù)搜索份額的增長勢頭,小紅書就一定要在 AI 上持續(xù)發(fā)力,保證用戶的搜索體驗(yàn)處于市場領(lǐng)先地位,進(jìn)而擴(kuò)大市場份額,最終成功實(shí)現(xiàn)商業(yè)化收入上的突破。
從戰(zhàn)略上來看,小紅書不僅應(yīng)該做 AI 搜索,而且要大做特做,最好能夠取代百度,成為國內(nèi)最大的搜索流量池。
當(dāng)前 AI 搜索是大模型應(yīng)用的當(dāng)紅產(chǎn)品形態(tài),海內(nèi)外都有不少明星產(chǎn)品,Perplexity、kimi、夸克乃至豆包都被歸為該類別。小紅書與抖音是國內(nèi)當(dāng)前互聯(lián)網(wǎng)流量最集中的兩個社交平臺,不少人認(rèn)為 2024 年豆包的崛起是歸功于抖音的流量扶持與字節(jié)底層基座模型的能力成長,因此小紅書基于自身強(qiáng)大基座模型開發(fā)類 ChatGPT 產(chǎn)品+小紅書平臺的流量密碼,也或有望彎道超車。
從這一角度看,小紅書繼續(xù)投入資源升級基座大模型、開發(fā) AI 搜索與聊天產(chǎn)品有天然優(yōu)勢,還有行業(yè)先驗(yàn)?zāi)0宥拱?。將時間線拉長來看,假如未來五年、十年基于大模型的 AI 應(yīng)用大爆發(fā),小紅書的 AI 產(chǎn)品也將是未來其穿越行業(yè)周期的一道護(hù)城河、入場券,即使大模型的投入大也是“一筆劃算的帳”。
另一個關(guān)于大模型應(yīng)用的想象是新型社交,如 MiniMax 開發(fā)的產(chǎn)品 Talkie。
新時代一定要設(shè)計(jì)新的社交產(chǎn)品和社交工具。但目前抖音與小紅書已經(jīng)能滿足用戶對新型社交的需求,因此社交的本質(zhì)是在一個高密度社區(qū)里找到自己想找的人與內(nèi)容,所以新型大模型社交產(chǎn)品的崛起會面臨現(xiàn)有社交平臺的流量圍剿;反之,現(xiàn)有社交平臺基于大模型升級原有平臺的社交功能則有天然優(yōu)勢。小紅書與其成為被新生代事物挑戰(zhàn)的被動方,不如成為發(fā)起挑戰(zhàn)的主動方。
第二點(diǎn)原因,則在于小紅書用戶的多元化,以及由此產(chǎn)生的對各類 AI 工具的渴求。
小紅書起身于圖文社區(qū),但是現(xiàn)在已經(jīng)發(fā)展為一個涵蓋圖文、短視頻、直播、群聊社交等多種媒介形態(tài)的平臺。在內(nèi)容的創(chuàng)作端和消費(fèi)端,用戶的需求已經(jīng)越來越復(fù)雜。剪映誕生于輔助抖音的內(nèi)容創(chuàng)作,即屬于該邏輯。
在小紅書群聊輸入框的+號里,隱藏著小紅書AI聲聊的入口。這個產(chǎn)品可以幫助用戶變聲說話,用唱歌的方式聊天等等。
這是小紅書發(fā)掘的其中一個社交需求場景。用戶的新需求可能隱藏在各個角落,創(chuàng)作者有 AI 生成文案的需求,有 AI 編輯圖片視頻的需求,有直播間數(shù)字化場景的需求,有通過 AI 手段與粉絲互動的需求等等,這種場景小紅書不去發(fā)掘,就會被站外工具發(fā)掘,甚至?xí)绊懙秸麄€平臺社區(qū)的氛圍。
比如此前在《“TikTok 難民”大批涌入,小紅書會面臨什么技術(shù)挑戰(zhàn)?》一文中提到的,不少人對跨語種的交流需求催生了一個全新的場景,那么小紅書就有必要做一個多模態(tài)的翻譯產(chǎn)品。
而且根據(jù)分析公司 Similarweb的最新數(shù)據(jù),小紅書在本周早些時候,一天內(nèi)就吸引了近 300萬美國用戶,現(xiàn)在美國iOS和Android設(shè)備上的每日活躍用戶約為340萬,是上周同期的十倍有余。大批量的海外用戶迫切需要小紅書內(nèi)嵌的翻譯能力。
除了戰(zhàn)略和產(chǎn)品方面的考量外,支持方最重要的觀點(diǎn)還是,小紅書目前是國內(nèi)最大的用戶原創(chuàng)內(nèi)容中心之一,圖文質(zhì)量很高,有效信息含量豐富。在多年來強(qiáng)調(diào)社區(qū)調(diào)性的運(yùn)營管理中,社區(qū)互動氛圍強(qiáng),用戶中“活人”占比多,語料庫質(zhì)量極佳。小紅書擁有國內(nèi)發(fā)展 AI 大模型技術(shù)最好的語料庫之一,數(shù)據(jù)又成為下一代模型升級的關(guān)鍵,多元化多語種數(shù)據(jù)更是稀缺。
所以小紅書在訓(xùn)練大模型的時候,先天就有數(shù)據(jù)上的優(yōu)勢,不僅遠(yuǎn)超六小虎,甚至超過國內(nèi)絕大部分大廠。訓(xùn)練基座大模型,可以保證其技術(shù)的自主性與模型應(yīng)用迭代的節(jié)奏控制。即使自己不做大模型的預(yù)訓(xùn)練,理論上也可以成為國內(nèi)最好的語料庫供應(yīng)商之一,“小紅書應(yīng)該接住這潑天的富貴”。
沒人、沒錢、沒必要
當(dāng)然反駁者的意見也不容小覷。小紅書當(dāng)然有機(jī)會去做大模型,但是機(jī)會夠不夠大,值不值得小紅書全力投入呢?
質(zhì)疑者的第一條理由就是技術(shù)人才的問題。
小紅書不是一家以技術(shù)見長的公司,強(qiáng)運(yùn)營、強(qiáng)策劃是小紅書不斷破圈的殺手锏。但是訓(xùn)練大模型,是一件技術(shù)要求極高的工作。
AI 科技評論與多位業(yè)內(nèi)人士討論過,要想做大模型,最重要的是找到合適的人。甚至于,只要找到了正確的人,一個大模型的訓(xùn)練團(tuán)隊(duì),可能只要十來個人就能做起來了。不止一位從業(yè)者認(rèn)為,上一代所有的AI人才,不論是搞CV的,還是搞 NLP的,看到大模型仍然要從頭學(xué)起,之前積累的經(jīng)驗(yàn)幾乎是一夜清零。
小紅書目前大模型的帶頭人張德兵,此前的履歷是格靈深瞳的首席科學(xué)家,博士畢業(yè)于浙江大學(xué),師從著名的計(jì)算機(jī)視覺與機(jī)器學(xué)習(xí)專家何曉飛教授。
張德兵是一位在學(xué)術(shù)屆和在產(chǎn)業(yè)界成果突出、經(jīng)驗(yàn)豐富的計(jì)算機(jī)視覺專家,但他此前也沒有訓(xùn)練過超大規(guī)模集群下的大語言模型,并沒有相關(guān)的經(jīng)驗(yàn)。
至于小紅書另外的三個算法團(tuán)隊(duì),核心人物中的風(fēng)笛原是阿里算法策略專家,凱奇是原鳳巢首席架構(gòu)師,吳毅是百度搜索算法專家,更不了解大模型。
除了算法人才,訓(xùn)練基座大模型也需要優(yōu)秀的 Infra 人才搭建萬卡集群。相比算法人才,國內(nèi)優(yōu)秀的底層基礎(chǔ)設(shè)施與系統(tǒng)人才更加鳳毛棱角,少數(shù)的幾個人才也已經(jīng)被字節(jié)、阿里等大廠與頭部大模型獨(dú)角獸公司瓜分。小紅書要吸引這些人才,難度非同小可。
缺人,這是小紅書訓(xùn)練大模型面臨的第一個問題。
第二個問題是,大模型實(shí)在太花錢了。
一個通用大模型進(jìn)行一次預(yù)訓(xùn)練的費(fèi)用,就要千萬美金以上,這還不包含人力成本、算力成本、后續(xù)的優(yōu)化、模型的更新和部署等費(fèi)用。大大小小的費(fèi)用相加,等到模型真的能用,至少要五千萬美金起步了。
大模型已經(jīng)成為一個比拼財(cái)力的賽道。字節(jié)過去一年在 AI 研發(fā)上的投入超過百度阿里騰訊三者的總和 1000 億元人民幣。在六小虎中融資額相對較少、只有數(shù)億美金的零一萬物,現(xiàn)在也已經(jīng)放棄了預(yù)訓(xùn)練。
根據(jù)公開報(bào)道,小紅書在 2023 年才首次實(shí)現(xiàn)歷史性突破扭虧為盈,當(dāng)年?duì)I收 37 億美元,凈利潤 5 億美元。到現(xiàn)在剛盈利兩年的小紅書,能在大模型上投入多少錢?
更何況,小紅書的大模型能力,在同行之間不具備競爭力,也沒有云業(yè)務(wù)的加持,就沒辦法成為一個賺錢的業(yè)務(wù),純屬燒錢的行為,小紅書應(yīng)該既不愿、也不能長期支撐這樣的投資行為。
至于不支持小紅書做大模型的最后一個理由,則是目前業(yè)界的共識:模型無關(guān)論(Model-Agnostic)。
在 Scaling Law見底,Transformer 架構(gòu)仍然一統(tǒng)天下的今天,市面上的諸多大模型從能力上來講沒有本質(zhì)的差別,用戶的使用體感上各有千秋,但整體而言,沒有代際差異。
多個 AI 應(yīng)用團(tuán)隊(duì)告訴 AI 科技評論,從 2024 年年中 Claude Sonnet 3.5 發(fā)布后開始,他們在開發(fā)大模型應(yīng)用時就是普遍接入 4、5 個不同的基座大模型,因?yàn)槎嗉一P偷男阅芏家涯苕敲?OpenAI,“大模型就像電源一樣即插即用”,所以不同基座模型的迭代速度不再影響上層應(yīng)用的開發(fā)。
在當(dāng)前第一梯隊(duì)的大模型中,現(xiàn)在的 AI 產(chǎn)品無論選擇使用哪一個,只要經(jīng)過合理的fine tune,最終結(jié)果也都大差不差。更何況,AI產(chǎn)品可以選擇多個大模型,可以隨著產(chǎn)品特征,或者是用戶需求主動切換大模型。小紅書做 AI 產(chǎn)品的時候,也可以走這樣的路線。以現(xiàn)在的 API 價格之低,用基座模型廠商的模型,還是一種省錢行為呢。
結(jié)語:
在多方討論之后,AI 科技評論認(rèn)為,小紅書接下來,應(yīng)該全力以赴去做AI產(chǎn)品,不要投入精力去做大模型。
AI 搜索的產(chǎn)品特點(diǎn),既契合小紅書自然生長的搜索流量,也能利用好小紅書上規(guī)模龐大的優(yōu)質(zhì)語料庫。這是小紅書應(yīng)該抓住的戰(zhàn)略級機(jī)會。
雷峰網(wǎng)(公眾號:雷峰網(wǎng))認(rèn)為,在現(xiàn)有條件下,小紅書可能還缺乏做大模型的能力,與其勉強(qiáng)自己,不如使用開源模型,或者只需要接入 API,先解決平臺上的 AI 產(chǎn)品問題,將小紅書打造成引領(lǐng) AI 時代的社區(qū)平臺。
大家怎么看?
雷峰網(wǎng)稿件,請勿轉(zhuǎn)載
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。