?中國(guó)大模型落地肉搏：誰先「扎進(jìn)」行業(yè)，誰就先入「咸陽(yáng)」

本文作者：董子博

2023-07-11 18:19

導(dǎo)語：“AGI 的夢(mèng)想再絢爛，大模型的落地才是真功夫?！?

大模型之戰(zhàn)，已經(jīng)進(jìn)入了一個(gè)新的階段。

在從ChatGPT發(fā)布算起，國(guó)內(nèi)公司“跑步進(jìn)場(chǎng)”的大約半年里，大模型競(jìng)爭(zhēng)的焦點(diǎn)集中在類ChatGPT的通用語言模型上。

然而到了7月，在上海的 WAIC 2023 上，討論通用大模型的聲量則開始在悄無聲息中降低。

首先是用戶對(duì)大模型的認(rèn)知發(fā)生了改變：從6月初起，“ChatGPT變笨了”的話題一度在社交媒體上引發(fā)討論。用戶在寫作、繪畫等AIGC領(lǐng)域的新鮮勁開始退去，當(dāng)他們?cè)噲D用ChatGPT解決實(shí)際問題時(shí)，往往難以得到滿意的答案；

另一方面，基于醫(yī)療、金融、教育等垂直行業(yè)的大模型開始出現(xiàn)。而已經(jīng)發(fā)布通用大模型的公司，也在針對(duì)行業(yè)推出模型服務(wù)，發(fā)力行業(yè)模型，已經(jīng)成為各家的共識(shí)。

在 WAIC 2023 上，更多人開始關(guān)注能夠真正扎進(jìn)行業(yè)、給企業(yè)帶來生產(chǎn)力躍升的大模型產(chǎn)品。

當(dāng)大模型競(jìng)爭(zhēng)的重點(diǎn)從通用大模型轉(zhuǎn)向行業(yè)大模型，又將產(chǎn)生什么樣的變化？

一、見自己：通用與行業(yè)，應(yīng)該如何平衡？

ChatGPT帶火了大模型產(chǎn)品的研發(fā)，然而在過去幾個(gè)月中，這些涌現(xiàn)出來的ChatGPT大模型產(chǎn)品通常都偏向于“對(duì)話交互型”而非“知識(shí)增強(qiáng)型”，這意味著，大多數(shù)C端用戶與AI的交互偏向于“閑聊”而非“啟發(fā)/創(chuàng)造”。

如雷峰網(wǎng)此前在《大模型時(shí)代的三道鴻溝：數(shù)據(jù)、成本與想象力》一文中所提及，在第一個(gè)賽段即類ChatGPT的競(jìng)逐中，各個(gè)廠商比的不是“武功”，而是“想法”：由于C端用戶的付費(fèi)意愿偏低，到目前為止，只有ChatGPT這種產(chǎn)品形態(tài)在To C市場(chǎng)得到了驗(yàn)證；在過去幾個(gè)月，國(guó)內(nèi)大模型產(chǎn)品設(shè)計(jì)一味追隨 ChatGPT，將問題的定義交給用戶（俗稱“AI 召喚師”），導(dǎo)致了嚴(yán)重的同質(zhì)化現(xiàn)象。

同時(shí)，通用大模型只能在通用屬性強(qiáng)的場(chǎng)景中應(yīng)用，在B端，技術(shù)還未完備的情況下，通用的大模型由于缺乏專有領(lǐng)域的知識(shí)，很難實(shí)際落進(jìn)行業(yè)場(chǎng)景，產(chǎn)生生產(chǎn)力。

通用大模型解決不了專業(yè)的問題，而那些相對(duì)簡(jiǎn)單的問題，用戶也不見得非要使用大模型進(jìn)行解決。

不能幫助用戶解決實(shí)際的問題——這是大模型的商業(yè)鏈路中，一個(gè)急需解決的巨大 Bug?！按笫麓鸩涣?，小事不用答”，現(xiàn)時(shí)的通用大模型就處在這樣一個(gè)不上不下的位置上。

如果沒有能夠發(fā)揮效用的“立身之本”，大模型就只能像一個(gè)氣球，越吹越大，越飄越高。

感到路徑出現(xiàn)了誤差，廠商們便隨即開始調(diào)轉(zhuǎn)車頭，把正在“飄向空中”的大模型“拽”回地面，落進(jìn)場(chǎng)景，給客戶帶來實(shí)際的“降本增效”。如何在通用與行業(yè)兩個(gè)方向平衡，則成為了大模型廠商關(guān)注的問題。

當(dāng)中最為典型的案例，是今年3月推出的金融行業(yè)模型 BloomBergGPT。它在私有金融任務(wù)上的表現(xiàn)出了遠(yuǎn)高于當(dāng)前的通用GPT模型的能力。

在相關(guān)論文中，作者認(rèn)為，對(duì)模型效果提升促進(jìn)最大的三個(gè)因素依次為精心清洗的高質(zhì)量數(shù)據(jù)集、合理的標(biāo)記器（tokenizer）、合理的模型結(jié)構(gòu)。

這也為大模型廠商們?cè)贏I 2.0 的賽道上指明了一條道路：如果垂直領(lǐng)域的任務(wù)足夠復(fù)雜、數(shù)據(jù)足夠獨(dú)特且數(shù)據(jù)量足夠大，自主研發(fā)垂直領(lǐng)域的大型模型，可能是一個(gè)至少在短期內(nèi)讓大模型落地、解決行業(yè)需求痛點(diǎn)的策略。

誰先占領(lǐng)行業(yè)，誰就更先占領(lǐng) To B 和 To C 先機(jī)；誰先讓大模型產(chǎn)生實(shí)際的效用，誰就能先入“咸陽(yáng)”。

但一個(gè)大模型，要完成面向行業(yè)的落地談何容易？

對(duì)于一個(gè)大模型的提供方來說，必須得能夠?qū)嵈驅(qū)嵉亍霸边M(jìn)場(chǎng)景，了解企業(yè)的痛點(diǎn)，并針對(duì)性地尋找大模型所獨(dú)有的解決方案。

而在這一點(diǎn)上，率先提出行業(yè)大模型的騰訊，深有感觸。

“企業(yè)需要的，是在實(shí)際場(chǎng)景中真正解決了某個(gè)問題，而不是在100個(gè)場(chǎng)景中，解決了70-80%的問題?！?/strong>騰訊集團(tuán)高級(jí)執(zhí)行副總裁、云與智慧產(chǎn)業(yè) CEO 湯道生，在6月19日騰訊行業(yè)大模型的發(fā)布會(huì)上如是說。

湯道生指出，在許多產(chǎn)業(yè)場(chǎng)景中，用戶對(duì)企業(yè)提供的專業(yè)服務(wù)有著“要求高，容錯(cuò)低”的需求。另一方面，訓(xùn)練數(shù)據(jù)越多，模型越大，訓(xùn)練與推理的成本也越高；除此之外，安全和合規(guī)也是企業(yè)需要考量的因素。

騰訊更專注于解決落地實(shí)際的問題，而通用大模型不能徹底解決用戶的所有問題。

圍繞產(chǎn)業(yè)客戶的需求，騰訊云公布了全新的MaaS（模型即服務(wù)）全景圖。有意思的是，他們也是國(guó)內(nèi)首家沒有單純押注通用大模型，而是率先系統(tǒng)性公布行業(yè)大模型，選擇基礎(chǔ)研究和產(chǎn)業(yè)落地兩條腿走路的大模型實(shí)踐路徑。

在這之后，金山、華為、字節(jié)，也都相繼發(fā)布行業(yè)大模型相關(guān)解決方案，意在給行業(yè)帶來實(shí)打?qū)嵉男伦兓?、新可能?/p>

二、見天地：大模型應(yīng)用，理解場(chǎng)景才是關(guān)鍵

要在實(shí)際場(chǎng)景能真正解決問題，大模型對(duì)場(chǎng)景的理解，才是真正的關(guān)鍵。

從某種意義上說，在大模型之戰(zhàn)的第一階段，短短3個(gè)月內(nèi)就有80多個(gè)大模型問世，更多的是屬于“普及”，證明自己具有“對(duì)標(biāo)ChatGPT”的能力，而6月之后的這一波行業(yè)大模型落地浪潮，才是真正“秀肌肉”的開始。

“930”變革后，湯道生曾將做To C業(yè)務(wù)的感受比作空軍開飛機(jī)：當(dāng)做產(chǎn)品時(shí)，不需要與每個(gè)用戶直接交流，只需通過用戶的使用體驗(yàn)就可以發(fā)現(xiàn)問題并解決問題。這就像在天空中飛行，進(jìn)行幾次飛行和轟炸后，炸彈就能覆蓋一大片區(qū)域。

而To B業(yè)務(wù)則更像是陸軍打仗，需要親自下場(chǎng)，與每個(gè)客戶面對(duì)面會(huì)談了解需求，談AI能夠?yàn)樗麄冏鍪裁矗约靶枰峁┠男┓矫娴哪芰Α?/p>

正是因?yàn)?To B 經(jīng)驗(yàn)不淺，騰訊深知，說是“行業(yè)模型”，即使是同一個(gè)行業(yè)，不同的企業(yè)的需求也千差萬別。一套模型方案，想要深入細(xì)致地理解企業(yè)的需求，就必須做詳細(xì)的定制——而如果大模型采用定制化的項(xiàng)目制模式，又將不可避免地走向 AI 1.0 時(shí)代的老路。

大模型要“落地”，就必須要完成“適用化”的革命。而騰訊行業(yè)大模型的嘗試，或許對(duì)于其他廠商有一些借鑒的價(jià)值。

一個(gè)模型不夠，就打造一個(gè)模型的“精選商店”——依托騰訊云的 TI 平臺(tái)，騰訊行業(yè)大模型給出的方案，是在平臺(tái)上開放多個(gè)模型，企業(yè)在選用了更加適合的模型后，可以針對(duì)自己的具體需求，進(jìn)行定制化的訓(xùn)練。

搭配完善的模型工具鏈，并有配套的方法指導(dǎo)和流程服務(wù)，讓用戶能夠自主地在標(biāo)品模式下，自己解決大模型的定制化需求。

而在這個(gè)模式下，大模型開發(fā)者的工作，就從定制產(chǎn)品，變成了標(biāo)品制作+售后服務(wù)的“解決方案”提供方——這也是一種比較理想和健康的 MaaS 商業(yè)模式。

有“精選商店”解決算法問題，算力和數(shù)據(jù)側(cè)，騰訊云的落地方案也比較務(wù)實(shí)。

算力側(cè)，新一代的高性能計(jì)算集群（HCC），通過“眾人拾柴火焰高”的規(guī)模效應(yīng)，讓單機(jī)算力形成1+1>2的效果。

以騰訊云配套的 HCC 為例，不僅有英偉達(dá)最新代次 H800 GPU 的“一騎當(dāng)千”，也有自研的星星海服務(wù)器，與3.2T的超高互聯(lián)帶寬，優(yōu)化了處理器、網(wǎng)絡(luò)架構(gòu)和存儲(chǔ)性能，也讓大集群的算力損耗能夠最大程度降低。

而數(shù)據(jù)側(cè)，當(dāng)下行業(yè)的關(guān)注點(diǎn)，更多放在數(shù)據(jù)的篩選、清洗和標(biāo)注等基礎(chǔ)工作上，卻往往忽視了數(shù)據(jù)庫(kù)建構(gòu)的重要性。

在云業(yè)務(wù)有多年的經(jīng)驗(yàn)積累，騰訊自研的向量數(shù)據(jù)庫(kù)，也給了行業(yè)大模型不少支持。

在應(yīng)用了自研的 AI 原生向量數(shù)據(jù)庫(kù) Tencent Cloud VectorDB 之后，騰訊的行業(yè)大模型在預(yù)訓(xùn)練數(shù)據(jù)的分類、去重和清洗過程中，效率相比傳統(tǒng)的解決方案能夠產(chǎn)生10倍的提升；

如果將向量數(shù)據(jù)庫(kù)作為外部知識(shí)庫(kù)，來輔助大模型完成推理，成本則可以完成2-4個(gè)數(shù)量級(jí)的降低。

模型精選商店+高性能算力集群+AI 原生向量數(shù)據(jù)庫(kù)，騰訊云的這套打法，給大模型廠商趟出了一條可能的路。

三、見眾生：MaaS為 B 端客戶帶來了什么？

AI 的“功法”縱然重要，但大模型的“華山論劍”終究不是紙上談兵，真正能夠分出高下的，是在實(shí)際場(chǎng)景中實(shí)打?qū)嵉摹皯?zhàn)績(jī)”。

需要注意的一點(diǎn)是：目前看來，并非所有的場(chǎng)景都適合應(yīng)用大模型技術(shù)。

對(duì)此，騰訊云副總裁、騰訊云智能與優(yōu)圖實(shí)驗(yàn)室負(fù)責(zé)人吳運(yùn)聲感觸頗多。

“我們一直在思考和探索，大模型和各行業(yè)結(jié)合背后最本質(zhì)的邏輯是什么？”在WAIC 2023會(huì)場(chǎng)，吳運(yùn)聲曾提到騰訊對(duì)大模型與真實(shí)場(chǎng)景結(jié)合的思考?！捌鋵?shí)只有兩點(diǎn)：一是技術(shù)的根本出發(fā)點(diǎn)是解決實(shí)際問題，二是如果不能深入行業(yè)探索，便不能真正解決行業(yè)面臨的問題。”

而據(jù)雷峰網(wǎng)(公眾號(hào)：雷峰網(wǎng))此前調(diào)研，大模型在企業(yè)落地也存在兩個(gè)難以落地的盲區(qū)：一是數(shù)據(jù)安全，二是成本可控。

先前提到騰訊扎進(jìn)行業(yè)場(chǎng)景，金融行業(yè)就是一個(gè)典型的例子。

以金融業(yè)務(wù)中常見的銀行單據(jù)處理場(chǎng)景為例，單據(jù)處理場(chǎng)景涉及到大量銀行回單、交易發(fā)票、跨境匯款申請(qǐng)書、業(yè)務(wù)往來郵件、傳真等非標(biāo)數(shù)據(jù)，需要整理、錄入系統(tǒng)，是不少業(yè)者難以逃離的“噩夢(mèng)”。

某國(guó)家首批股份制商業(yè)銀行與騰訊合作，騰訊TI-OCR大模型，可以在 Prompt 的調(diào)優(yōu)的基礎(chǔ)上，不經(jīng)過額外訓(xùn)練直接支持常規(guī)下游任務(wù)，零樣本學(xué)習(xí)泛化召回率可以達(dá)到93%、小樣本學(xué)習(xí)泛化召回率則能達(dá)到95%。

從樣本收集、模型訓(xùn)練到部署上線，實(shí)現(xiàn)全流程零人工參與，建模時(shí)間也從2周減少到僅需2天。

另一個(gè)傳統(tǒng)機(jī)器學(xué)習(xí)得以廣泛應(yīng)用的場(chǎng)景金融風(fēng)控，在實(shí)際業(yè)務(wù)中，很多時(shí)候受限于積累的樣本有限，或者是新品剛剛上線，面臨“零樣本”搭建風(fēng)控體系，制定策略非常困難?；隍v訊云風(fēng)控大模型豐富的場(chǎng)景樣本快速搭建能力，可以幫助客戶跳過“冷啟動(dòng)”過程。

除了上述需要判別式AI能力的場(chǎng)景，大模型的生成能力還將為金融行業(yè)帶來更大的驚喜。

如上述銀行客戶提出，在他們此前智能客服場(chǎng)景的實(shí)踐存在幾個(gè)痛點(diǎn)：知識(shí)維護(hù)量大；冷啟動(dòng)知識(shí)配置成本高，且需要持續(xù)投入運(yùn)營(yíng)；由于知識(shí)邊界受限，不在知識(shí)庫(kù)的問題無法回復(fù)或者答非所問，等等。

而通過行業(yè)大模型快速接入多個(gè)知識(shí)來源，同時(shí)直接對(duì)接銀行API進(jìn)行任務(wù)式對(duì)話問答，騰訊幫助客戶打造了專屬AI助手，提供智能咨詢、輔助分析、決策等服務(wù)，助力客戶多個(gè)核心業(yè)務(wù)智能化、健康發(fā)展。

另一個(gè)案例中，騰訊云 TI 平臺(tái)通過訓(xùn)練工坊和模型服務(wù)功能，幫助上海金融期貨信息技術(shù)有限公司（簡(jiǎn)稱“中金所”）解決了算法服務(wù)運(yùn)維成本高、資源分配不合理、算法框架重復(fù)構(gòu)建、依賴版本沖突等問題，降低了算法框架搭建成本和人力投入。

通過提供 restful 服務(wù)，以服務(wù)化的方式將算法通過平臺(tái)提供給其他部門使用，騰訊云 TI 平臺(tái)已成功支持中金所及技術(shù)公司內(nèi)部的智慧屏和三大平臺(tái)系統(tǒng)，每日調(diào)用峰值高達(dá)1億次，整體調(diào)用成功率超過了99%。

眼見眾生，心在天地。大模型不僅要面向客戶的需求，提供生產(chǎn)力的躍升，作為近10年最大的一波技術(shù)革命，AI 也給產(chǎn)業(yè)的自我更新帶來了新的可能和廣闊的想象空間。

在 WAIC 2023 上，騰訊展示了不少行業(yè)大模型落地的案例，從金融、文旅、政務(wù)、傳媒、教育等10大行業(yè)中，孵化出了超過50個(gè)針對(duì)性的解決方案，行業(yè)覆蓋力驚人。

“AI大模型技術(shù)發(fā)展和產(chǎn)業(yè)探索，離不開產(chǎn)業(yè)鏈協(xié)同和生態(tài)共建，這也是騰訊在AI發(fā)展方面一直堅(jiān)持的態(tài)度?！痹?WAIC 2023 上，吳運(yùn)聲如此總結(jié)道，“我們?cè)概c行業(yè)伙伴攜手，去探索無限的可能性?！?/p>

結(jié)語：

AGI 的夢(mèng)想再絢爛，大模型的落地才是真功夫。

十年前的 AI 1.0 時(shí)代，雷峰網(wǎng)早已見識(shí)過 AI 賽道的炙手可熱。

“必須扎到行業(yè)，必須創(chuàng)造價(jià)值，一家 AI 服務(wù)的提供商才能活下去?！蔽虻竭@個(gè)道理，不少人工智能公司花了整整十年的時(shí)間。

頂層的設(shè)計(jì)往往充滿著不確定性，而市場(chǎng)的判斷卻是樸素而直接的：誰能給我?guī)硎找妫l就是于我有用的；誰能給我?guī)砀嗟膬r(jià)值，我就用腳為他“投票”。

大模型競(jìng)逐的第二個(gè)賽段，勢(shì)必圍繞市場(chǎng)和業(yè)界展開，對(duì)于技術(shù)和產(chǎn)品齊備的玩家來說，當(dāng)下的“必爭(zhēng)之地”，就是在市場(chǎng)上獲得認(rèn)可，并通過端到端的模式，形成一套能夠越轉(zhuǎn)越快的數(shù)據(jù)飛輪，積累更多的大模型 Know how，最終在萬事俱備的情況下，做更好的通用大模型。

誰先在行業(yè)站穩(wěn)第一只腳，誰就能更早迎接 AI 的下一個(gè)飛速發(fā)展期。

（后續(xù)，雷峰網(wǎng)將持續(xù)關(guān)注這個(gè)足稱偉大的 AI “英雄時(shí)代”，歡迎添加作者微信：william_dong，交流認(rèn)知，互通有無。）

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

0人收藏

分享：

相關(guān)文章

騰訊行業(yè)大模型 WAIC

騰訊Q2財(cái)報(bào)：營(yíng)銷服務(wù)358億！再創(chuàng)新高

創(chuàng)想三維與騰訊云達(dá)成戰(zhàn)略合作，AI建模工具再升級(jí)

2025騰訊全球數(shù)字生態(tài)大會(huì)定檔9月16日

騰訊云在全球數(shù)據(jù)分析Clickbench測(cè)試中位居第一

董子博

編輯

發(fā)私信

當(dāng)月熱門文章

3D圖形引擎，在「別處」開花

誰在給字節(jié)賺錢：?巨量?一出，誰與爭(zhēng)鋒?

Game Jam?Unity中國(guó)開發(fā)挑戰(zhàn)賽知乎特別場(chǎng)開啟，5部作品直通決賽

最新文章

SHEIN已覆蓋近400城產(chǎn)業(yè)帶，驅(qū)動(dòng)傳統(tǒng)制造升級(jí)出海

對(duì)話居靜：算力行業(yè)卷「地產(chǎn)」？All in大同做全產(chǎn)業(yè)鏈玩家 | 智算想象力十人談

阿里通義推新一代語音模型Fun-ASR，垂直領(lǐng)域識(shí)別準(zhǔn)確率提升15%以上

特斯拉與火山引擎達(dá)成合作，全新Model Y L車型接入豆包大模型

即夢(mèng)推出“智能多幀”功能突破AI視頻長(zhǎng)鏡頭創(chuàng)作瓶頸

拼多多發(fā)布《2025農(nóng)產(chǎn)品上行半年報(bào)》：“多多好特產(chǎn)”加碼扶持農(nóng)貨商家，農(nóng)產(chǎn)品銷量同比增長(zhǎng)47%

熱門搜索

金融科技雅虎 zynga Mobileye TechCrunch xbox saas 教育智能投顧 Echo 高德地圖

?中國(guó)大模型落地肉搏：誰先「扎進(jìn)」行業(yè)，誰就先入「咸陽(yáng)」

一、見自己：通用與行業(yè)，應(yīng)該如何平衡？

二、見天地：大模型應(yīng)用，理解場(chǎng)景才是關(guān)鍵

三、見眾生：MaaS為 B 端客戶帶來了什么？

結(jié)語：

?中國(guó)大模型落地肉搏：誰先「扎進(jìn)」行業(yè)，誰就先入「咸陽(yáng)」

一、見自己：通用與行業(yè)，應(yīng)該如何平衡？

二、見天地：大模型應(yīng)用，理解場(chǎng)景才是關(guān)鍵

三、見眾生：MaaS為 B 端客戶帶來了什么？