0
卷了一年多,大模型真的“火”了嗎?
有關(guān)大模型,似乎總有吵不完的架:追求“大參數(shù)”還是考慮“Scaling Law”?“稠密”和“稀疏”哪個(gè)框架更優(yōu)?“語(yǔ)言”和“多模態(tài)”誰(shuí)才是大模型的真正未來(lái)?玩家們旗幟鮮明、各有主見(jiàn),而這個(gè)熱度,卻似乎一直沒(méi)有傳導(dǎo)到更加落地的市場(chǎng)上。
而一眾大廠中,百度是大模型工程化落地的鳳毛麟角——根據(jù)今日釋出的2024年百度第二季度財(cái)報(bào)顯示,顯示季度總營(yíng)收339億元,百度核心營(yíng)收267億元,百度核心經(jīng)營(yíng)利潤(rùn)56億元,同比增長(zhǎng)23%。
文心大模型日調(diào)用量超6億, AI 帶動(dòng)云營(yíng)收51億元,同比增長(zhǎng)14%,漲勢(shì)喜人。
把“飄”在天上的 AI 落回地上,能有如此成績(jī),百度做對(duì)了什么?
先說(shuō)百度 Q2 財(cái)報(bào)最亮眼的數(shù)據(jù)——文心大模型調(diào)用量的猛增。
日調(diào)用量超6億,日均處理tokens文本數(shù)超一萬(wàn)億。調(diào)用量狂增的背后,總讓人想起今年5月那場(chǎng)聲勢(shì)浩大、引得整個(gè)行業(yè)關(guān)注的“大模型價(jià)格戰(zhàn)”。
這場(chǎng)戰(zhàn)斗中,百度殺價(jià)的力度堪稱“兇猛”:
戰(zhàn)斗打響很快,百度就直接宣布將 ERNIE-Speed、ERNIE-Lite、ERNIE-Tiny 系列模型預(yù)置服務(wù)免費(fèi);
而到了今年7月,在 WAIC 期間,百度智能云宣布進(jìn)一步降價(jià),把 ERNIE 4.0、ERNIE 3.5 兩款旗艦?zāi)P偷膬r(jià)格大幅壓低,輸入輸出分別低至0.03元/千Tokens、0.06元/千Tokens。
把價(jià)格門檻直接摘掉,自然有不少用戶競(jìng)相涌入。尤其是不少大中、中小型公司機(jī)構(gòu),沒(méi)了對(duì)成本的顧慮,也就有了嘗試大模型的熱情。
價(jià)格降下來(lái),確實(shí)減少了客戶調(diào)用的“推力”;而大模型競(jìng)爭(zhēng)如此激烈,即使價(jià)格再低,尤其在當(dāng)下價(jià)格已經(jīng)低無(wú)可低的情況下,為什么文心可以脫穎而出?
早有文章分析過(guò),百度能夠進(jìn)行如此近乎決絕的讓利,本質(zhì)上依仗的是百度更先進(jìn)的全棧 AI 技術(shù)力,才有了免費(fèi)和降價(jià)的底氣。
文心大模型誕生以來(lái),就緊追時(shí)代的潮流,文心大模型的周均訓(xùn)練有效率達(dá)到98.8%,相比文心一言發(fā)布時(shí),訓(xùn)練效率提升到當(dāng)時(shí)的5.1倍,推理105倍,推理成本下降至最初的1%。6月,百度還推出了飛槳3.0,此次升級(jí)顯著提高了飛槳框架與百度 AI 基礎(chǔ)設(shè)施和文心大模型的兼容性,有望在未來(lái)進(jìn)一步降低模型推理成本。
對(duì)于當(dāng)下大模型用戶的痛點(diǎn),百度剖析得非常深刻——用戶的第一類痛點(diǎn),是應(yīng)用落地的門檻比較高,如何快速結(jié)合場(chǎng)景開(kāi)發(fā)出合適的的應(yīng)用;而第二類痛點(diǎn),則是對(duì)于具體的場(chǎng)景,如何用專用模型滿足自己的行業(yè)需求。
本質(zhì)上,一個(gè)技術(shù)產(chǎn)品讓用戶買賬,第一性仍然是技術(shù)產(chǎn)品的“可用”和“好用”。
就在財(cái)報(bào)發(fā)布前一天,百度宣布支持對(duì)旗艦大模型 ERNIE 4.0 Turbo 進(jìn)行精調(diào)。此前,百度千帆大模型平臺(tái)已支持 ERNIE 3.5、ERNIE Speed、ERNIE Lite、ERNIE Tiny、ERNIE Character 進(jìn)行模型精調(diào),截止當(dāng)前已共計(jì)6款文心大模型可在千帆平臺(tái)進(jìn)行精調(diào)使用,累計(jì)精調(diào)出2.1萬(wàn)個(gè)模型,服務(wù)超過(guò)千家企業(yè)核心業(yè)務(wù)場(chǎng)景,擁有眾多成功效果案例。
政務(wù)領(lǐng)域,中華全國(guó)總工會(huì)聯(lián)合百度智能云,把 AI 的能力用在了法律咨詢上,讓勞動(dòng)者可以通過(guò)大模型,更精準(zhǔn)地了解法律問(wèn)題、更快地計(jì)算勞動(dòng)賠償金額、更個(gè)性化地完成案情評(píng)估。
相比傳統(tǒng)的開(kāi)發(fā)方式,這套對(duì)精準(zhǔn)度、反饋速度要求極高的系統(tǒng),交付僅用了一個(gè)月,相比傳統(tǒng)3-6個(gè)月的交付周期有顯著的效率提升。
生產(chǎn)力能有如此提升,讓更多用戶看到這個(gè)價(jià)值,文心大模型的調(diào)用量不漲都難。
AI 迅速發(fā)展,給百度帶來(lái)的直接成績(jī),是公司云業(yè)務(wù)的持續(xù)增長(zhǎng)。
財(cái)報(bào)披露,Q2季度,百度智能云營(yíng)收51億元,同比增長(zhǎng)14% ,AI 收入占比9%,高于上一季度的6.9%。
把優(yōu)秀的大模型當(dāng)作一張名片,與之結(jié)合緊密的云業(yè)務(wù)也自然被隨之帶動(dòng)。AI 應(yīng)用的大繁榮,讓 GPU 云慢慢成為企業(yè)采購(gòu)時(shí)的“標(biāo)配”。
于是,模型即服務(wù)(MaaS)的模式正逐漸登上舞臺(tái),成為百度云增長(zhǎng)的新增量。
據(jù) IDC 最新報(bào)告,百度智能云在2023年中國(guó)大模型平臺(tái)市場(chǎng)份額位居第一,達(dá)到19.9%。同樣,在今年國(guó)內(nèi)近260個(gè)已公告中標(biāo)的大模型項(xiàng)目中,百度領(lǐng)跑中標(biāo)單位排行。在主流大模型廠商中,百度中標(biāo)項(xiàng)目數(shù)量最多、覆蓋了最多行業(yè)、也已6400萬(wàn)+的中標(biāo)金額冠絕群雄,蟬聯(lián)三項(xiàng)第一。
在大模型落地的這段時(shí)間里,千帆平臺(tái)“悶聲發(fā)大財(cái)”,已經(jīng)累計(jì)服務(wù)了15萬(wàn)家客戶,在政務(wù)、電力、教育等多個(gè)行業(yè)發(fā)力,不僅讓技術(shù)產(chǎn)品得到了市場(chǎng)的認(rèn)可,更給社會(huì)帶來(lái)了生產(chǎn)力升級(jí)的回饋。
在河南、重慶等地的鄉(xiāng)村中,千帆正推動(dòng)著“大模型下鄉(xiāng)”,把醫(yī)保繳費(fèi)、戶籍辦理等最細(xì)碎、最耗時(shí)的問(wèn)題,讓村民放心交予大模型輔助。
遇到本地政務(wù)知識(shí)庫(kù)難以精確覆蓋的問(wèn)題,大模型還能結(jié)合百度搜索給出解答,并自動(dòng)@訴求提問(wèn)人回復(fù),把全時(shí)無(wú)休的便民服務(wù)帶給鄉(xiāng)村。
目前,居民助理已經(jīng)走入超過(guò)6000個(gè)村莊,讓普通老百姓也能享受更加智能的生活。
要讓客戶感到“可用”和“好用”,百度在大模型商業(yè)化上,靠的更是在大模型工具鏈上的升級(jí)。
深耕工具鏈升級(jí),是百度在今年技術(shù)發(fā)展的主旋律之一。
在模型精調(diào)的角度上,ModelBuilder 推出了混合文心大模型高質(zhì)量數(shù)據(jù)功能。用戶可以將通用混合語(yǔ)料和垂直領(lǐng)域語(yǔ)料,與業(yè)務(wù)數(shù)據(jù)進(jìn)行融合,來(lái)精調(diào)出更穩(wěn)定、效果更好的行業(yè)專屬大模型。
到了 AI 原生應(yīng)用開(kāi)發(fā)的角度, AppBuilder 解決了客戶在開(kāi)發(fā) AI 原生應(yīng)用時(shí)的不少難題——海量知識(shí)檢索、自定義策略、企業(yè)級(jí)安全保障等幾個(gè)方面都有所增強(qiáng),把大模型的可用性再提升了一個(gè)臺(tái)階。目前,已有超數(shù)十萬(wàn)應(yīng)用在平臺(tái)上被創(chuàng)建,覆蓋在線教育、電商、政務(wù)等行業(yè)。
百度的大模型體系對(duì)客戶生產(chǎn)力的實(shí)際提升,在業(yè)界有目共睹。
而回頭看,百度自身也有一個(gè)巨大的技術(shù)產(chǎn)品生態(tài),大模型的能力如果真的如此厲害,能讓百度這棵24歲的“老樹(shù)”再長(zhǎng)出“新芽嗎?
互聯(lián)網(wǎng)上,有這樣一個(gè)廣為流傳的故事:第二次世界大戰(zhàn)中期,戰(zhàn)爭(zhēng)正是焦灼時(shí)期,美軍降落傘的質(zhì)量卻令人堪憂,為了讓降落傘的合格率達(dá)到100%,軍方想出了一個(gè)法子:讓降落傘的銷售人員親自測(cè)試,不跳就不能過(guò)關(guān)。如此一來(lái),降落傘的合格率才終于接近了100%。
“一個(gè)產(chǎn)品,如果你自己都不用,那么何談讓別人放心呢?”
同一個(gè)的道理,對(duì)于百度也一樣適用。早在去年,李彥宏就喊出了要用文心大模型重構(gòu)百度旗下所有產(chǎn)品的豪言壯語(yǔ)。而首當(dāng)其沖的就是百度的大本營(yíng)——搜索。
目前,已有18%的搜索結(jié)果由 AI 生成,能夠?yàn)橛脩籼峁└鼫?zhǔn)確和直接的結(jié)果。這恰好印證了百度在一年前提出的“新搜索”的概念,以“極致滿足”“推薦激發(fā)”和“多輪交互”三個(gè)特點(diǎn),讓用戶的搜索結(jié)果更準(zhǔn)確、更有組織、更直觀。
智能體是其中關(guān)鍵的一環(huán)。百度正在搜索結(jié)果中加快分發(fā)智能體,目前,百度的智能體日均分發(fā)次數(shù)已經(jīng)超800百萬(wàn),是5月的兩倍之多。
李彥宏反復(fù)強(qiáng)調(diào),智能體就好比 AI 的網(wǎng)站,門檻低但天花板高。
在開(kāi)發(fā)角度,開(kāi)發(fā)智能體比網(wǎng)站只會(huì)更加簡(jiǎn)單,李彥宏說(shuō):“當(dāng)時(shí)網(wǎng)站是怎么做出來(lái)的?通過(guò)瀏覽器過(guò)一遍源代碼,非常簡(jiǎn)單,稍微改一改,我也可以做出來(lái)。今天做智能體跟這個(gè)很類似……起個(gè)名字,告訴它回答什么、不回答什么,一個(gè)智能體就做成了。”
作為業(yè)內(nèi)最早布局的大廠之一,百度在智能體的賽道上已經(jīng)搭建出了一個(gè)初具規(guī)模的生態(tài)。在百度文心智能體平臺(tái) AgentBuilder 上,已積累了20萬(wàn)開(kāi)發(fā)者、6.3萬(wàn)企業(yè)入駐,開(kāi)發(fā)者在文心智能體平臺(tái)上制作智能體時(shí),可靈活選擇文心大模型3.5或4.0版本,兩版模型均可免費(fèi)使用,可以說(shuō)把使用門檻“一刀砍平”。
今夏的巴黎奧運(yùn)會(huì)開(kāi)幕,不少運(yùn)動(dòng)員的粉絲都行動(dòng)了起來(lái),自發(fā)集結(jié)在百度文心智能體平臺(tái)上,開(kāi)發(fā)了不少粉絲應(yīng)援智能體。中國(guó)女乒運(yùn)動(dòng)員孫穎莎的粉絲,為她開(kāi)發(fā)了“孫穎莎的小迷妹”;支持女乓運(yùn)動(dòng)員王曼昱,粉絲們開(kāi)發(fā)了“曼昱的小芋圓”;女子跳水運(yùn)動(dòng)員全紅嬋的智能體,則因?yàn)樗鸪鋈Φ臅?shū)包掛飾,被粉絲命名為“嬋嬋的小書(shū)包”,交流別開(kāi)生面,十分有趣。
而到了農(nóng)業(yè)領(lǐng)域,中國(guó)工程院的朱有勇院士,也協(xié)助百度打造了“農(nóng)民院士智能體”。這個(gè)智能體,搭載了朱有勇及團(tuán)隊(duì)研究成果,能夠?yàn)檗r(nóng)民解答多種問(wèn)題,種植旱地優(yōu)質(zhì)稻、冬季馬鈴薯等農(nóng)作物都不在話下,把技術(shù)惠農(nóng)提升到了一個(gè)新的層次。
門檻低,效果好,智能體怎能不火?不難看到,未來(lái)智能體的規(guī)模,可以類比今日繁如星海的網(wǎng)站,形成一個(gè)龐大的生態(tài)。
而百度的野心,是把搜索作為智能體分發(fā)的最大入口,站在智能體大繁榮的前沿。
在百度的一眾傳統(tǒng)產(chǎn)品中,百度文庫(kù)是出了名的“梅開(kāi)二度”。
被大模型重構(gòu)為“一站式 AI 內(nèi)容獲取和創(chuàng)作平臺(tái)”,百度文庫(kù)在 AI 的路上走得更加靠前,以智能PPT、智能文檔、智能思維導(dǎo)圖、智能研究報(bào)告等上百項(xiàng)多模態(tài)AI功能,讓用戶的文檔體驗(yàn)和使用效率都大幅增強(qiáng)。
截止目前,百度文庫(kù)累計(jì) AI 用戶數(shù)已突破1.8億,AI 功能使用次數(shù)已突破22億,讓更多人享受到了大模型帶來(lái)的生產(chǎn)力紅利,讓這個(gè)15歲的老產(chǎn)品煥發(fā)了“第二春”。
今年,李彥宏曾經(jīng)高調(diào)提出,大模型的重點(diǎn)還是“卷應(yīng)用”:“沒(méi)有應(yīng)用,光有基礎(chǔ)模型,不管是開(kāi)源還是閉源都一文不值?!?/p>
但實(shí)際能看到的,是百度在基礎(chǔ)模型和應(yīng)用上,兩手都要抓,兩手都要硬。
在過(guò)去的十幾年間,百度在大模型和 AI 基礎(chǔ)研究上灑下的汗水,終究滋養(yǎng)出了一畝肥沃的土壤;而光有土壤還不夠,百度已經(jīng)進(jìn)入到了他們大模型發(fā)展的第二階段,著力打造 AI 原生應(yīng)用——在這片“沃土”上,種出豐饒的“莊稼”。
把生成式 AI 深度接入業(yè)務(wù),堅(jiān)決用大模型重構(gòu)搜索,這也讓一眾券商對(duì)百度的信心再次得到提振。
摩根大通表示:“從商業(yè)角度來(lái)看,這樣的變化將把百度在價(jià)值鏈中的角色從單純的流量導(dǎo)向擴(kuò)展到售前咨詢。我們相信后者將增加交易對(duì)話的流量,如果執(zhí)行得相當(dāng)成功,它將在中長(zhǎng)期內(nèi)對(duì)盈利產(chǎn)生積極影響?!?/p>
其他大廠想把大模型真正落地,或許真的要學(xué)學(xué)百度:把使用和成本門檻降到最低,依靠云實(shí)力和工具鏈建立一個(gè)良好運(yùn)轉(zhuǎn)的生態(tài),依靠大模型和智能體重構(gòu)已有業(yè)務(wù)。
這三招,都是推動(dòng)著大模型真正“飛入尋常百姓家”的關(guān)鍵操作。
雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。