大模型，能改變火山引擎在云牌桌上的位置嗎？

本文作者：胡敏

2024-12-30 18:09

導(dǎo)語(yǔ)：在大模型上重兵投入的火山引擎，或許有了一次更新自己在云牌桌上排名的機(jī)會(huì)。

“原來(lái)我并不看好火山引擎，但現(xiàn)在有些改觀了?！痹谠菩袠I(yè)已經(jīng)干了8年的張坤表示。

大模型大戰(zhàn)兩年后，雷峰網(wǎng)再次和許多從業(yè)者聊起火山引擎這位“后進(jìn)生”時(shí)，一些人對(duì)火山引擎的看法有了很大變化。

云牌桌上的后來(lái)者

火山引擎在2021年12月正式宣布開始參與云計(jì)算市場(chǎng)的競(jìng)爭(zhēng)。與其他幾家云廠商相比，這個(gè)入局時(shí)間顯得有些姍姍來(lái)遲。

回顧其他幾家云廠商，阿里云屬于最早邁出步子的人，2009年成立阿里云，并開始自主研發(fā)大規(guī)模分布式計(jì)算操作系統(tǒng)“飛天”。

而騰訊云是2013年3月正式上線運(yùn)營(yíng)，2018年930之后，騰訊成立CSIG，轉(zhuǎn)型產(chǎn)業(yè)互聯(lián)網(wǎng)。

華為云在集團(tuán)中的地位經(jīng)歷了多次調(diào)整和提升。最初，華為云作為二級(jí)部門存在，但在短短半年內(nèi)迅速提升為一級(jí)部門，戰(zhàn)略地位僅次于華為的三大BG（運(yùn)營(yíng)商BG、企業(yè)BG和消費(fèi)者BG），后來(lái)又重回集團(tuán)業(yè)務(wù)體系。

到2021年底，火山引擎入局時(shí)，云市場(chǎng)已經(jīng)呈現(xiàn)四強(qiáng)競(jìng)爭(zhēng)格局，以阿里云為首，占據(jù)國(guó)內(nèi)四成云服務(wù)市場(chǎng)規(guī)模，其次是華為云、騰訊云與百度智能云?；鹕揭孀鳛楹髞?lái)者，想要在這個(gè)市場(chǎng)上爭(zhēng)得一席之地，有一場(chǎng)相當(dāng)難的攻堅(jiān)戰(zhàn)要打。

當(dāng)年，以Ucloud、青云為代表的獨(dú)立云廠商即便占據(jù)先發(fā)優(yōu)勢(shì)，但在這四家云廠商進(jìn)入云市場(chǎng)后，開始以投入10-20倍的人力，不計(jì)成本、不計(jì)收益的快速占領(lǐng)市場(chǎng)，后來(lái)獨(dú)立云廠商不得不退出了舞臺(tái)中央，站在獨(dú)立云廠商的視角來(lái)看，這個(gè)故事的確聽(tīng)起來(lái)相當(dāng)悲傷，但這也暗含了云市場(chǎng)廝殺的激烈程度。

半年以前，雷峰網(wǎng)曾與數(shù)十名云從業(yè)者交流過(guò)火山引擎能否走出不同的命運(yùn)軌跡，逆襲進(jìn)入云行業(yè)前三甲時(shí)，其大多給出的回答：很難，入局太晚了。

面對(duì)強(qiáng)勁的對(duì)手，火山引擎如何撬開云計(jì)算市場(chǎng)？雷峰網(wǎng)認(rèn)為，核心策略之一就是價(jià)格。這種策略在云市場(chǎng)上掀起了不小的波瀾，火山引擎接連拿下了不少的泛互、游戲、消費(fèi)電子等行業(yè)客戶，取得了高速增長(zhǎng)。據(jù)業(yè)內(nèi)人士透露，今年火山引擎的營(yíng)收目標(biāo)是要前一年基礎(chǔ)上翻倍。

火山引擎這種發(fā)展態(tài)勢(shì)，也讓其成為了目前云市場(chǎng)里唯一一家還在大規(guī)模招聘的公司?！捌渌麕准以茝S商這幾年招聘需求縮減了至少30%，而火山引擎不僅招聘崗位多，而且給略有漲幅的薪資待遇?！鲍C頭劉赟表示。

不過(guò)，這種高速增長(zhǎng)繁榮并未掩蓋住擔(dān)憂，不少?gòu)臉I(yè)者認(rèn)為，短期內(nèi)，火山引擎在有資源時(shí)，自然可以大力投入，但低價(jià)彈藥并非無(wú)窮盡，長(zhǎng)期還是需要靠產(chǎn)品驅(qū)動(dòng)，而目前大部分認(rèn)為，火山引擎在產(chǎn)品上還很難追趕上友商。

不過(guò)，這是半年前大多數(shù)人的論斷，近半年，一些業(yè)內(nèi)人對(duì)火山引擎的評(píng)價(jià)又發(fā)生了一些變化，認(rèn)為，這一波大模型正在給了火山引擎一個(gè)極佳機(jī)會(huì)，提升產(chǎn)品競(jìng)爭(zhēng)力，同時(shí)也給了火山引擎銷售，拉開一個(gè)新的突破口。

AI infra，云廠商們站在了同一起跑線上

為何說(shuō)大模型正在讓火山引擎趕超老牌云廠商？

核心原因是，隨著大模型訓(xùn)練推理需求的不斷增多，客戶在云底座的選用上，除了關(guān)注以往云的基礎(chǔ)能力外，還會(huì)進(jìn)一步關(guān)心在AI infra方面的能力。而在AI infra上，所有云廠商都在同一起跑線，并且火山引擎的迭代速度幾乎是廠商里面最快的。

前不久，火山引擎Force冬季大會(huì)上新升級(jí)了以GPU為中心的AI infra分布式業(yè)務(wù)體系，通過(guò) vRDMA 網(wǎng)絡(luò)支持大規(guī)模并行計(jì)算及 P/D 分離推理架構(gòu)，提升訓(xùn)練和推理效率，降低企業(yè)使用成本；EIC 彈性極速緩存解決方案，實(shí)現(xiàn) GPU 直連，使大模型推理時(shí)延降低至五十分之一，成本降低 20%。

火山引擎在AI infra上能快速迭代的原因，這要追溯到2021年火山引擎制定的產(chǎn)品戰(zhàn)略。

“從2021年起，我們就確立了兩手抓的產(chǎn)品思路，一邊抓存量，一邊做增量?！被鹕揭嬖苹A(chǔ)產(chǎn)品負(fù)責(zé)人羅浩表示。

大模型，能改變火山引擎在云牌桌上的位置嗎？

火山引擎云基礎(chǔ)產(chǎn)品負(fù)責(zé)人羅浩

羅浩所言的存量是指?jìng)鹘y(tǒng)云計(jì)算的需求，包括ECS、存儲(chǔ)、數(shù)據(jù)庫(kù)、網(wǎng)絡(luò)、安全等一些云基礎(chǔ)產(chǎn)品。不可否認(rèn)，作為后來(lái)者，火山引擎在這些基礎(chǔ)云產(chǎn)品上與其他廠商還存在差距，所以羅浩認(rèn)為，在這一塊他們的核心就是要快速補(bǔ)齊短板。

不過(guò)，光是補(bǔ)齊短板遠(yuǎn)遠(yuǎn)不夠，如何能在產(chǎn)品上有所差異，才是贏得市場(chǎng)競(jìng)爭(zhēng)的關(guān)鍵。而隨著生成式AI浪潮的到來(lái)，火山引擎隨即決定要從算力上做突圍，也就是羅浩所說(shuō)的增量，來(lái)服務(wù)比如兩年前爆發(fā)的訓(xùn)練需求，今天大規(guī)模的推理需求。

“早在2021年，我們就開始大規(guī)模投入AI和GPU了?！?/p>

這一戰(zhàn)略判斷，從過(guò)去一年火山引擎在AI infra上的銷售表現(xiàn)，已經(jīng)可以驗(yàn)證正確性，大模型公司幾乎都是火山引擎AI infra 的采購(gòu)者。

如果說(shuō)4年前“兩手抓”的產(chǎn)品戰(zhàn)略是火山引擎在AI infra上實(shí)現(xiàn)追趕的根基，那過(guò)去幾年的內(nèi)外部實(shí)踐則是AI infra迭代的關(guān)鍵驅(qū)動(dòng)力，所有產(chǎn)品穩(wěn)定性和能力往往是在一次次業(yè)務(wù)場(chǎng)景中淬煉重生。

在這些實(shí)踐中，讓火山引擎AI infra加速狂奔的是豆包大模型。前不久，火山引擎總裁譚待在火山引擎Force冬季大會(huì)上公布了一個(gè)數(shù)據(jù)，2024年豆包的日均token數(shù)據(jù)從5月15日的1200億，到12月18日增長(zhǎng)到了4萬(wàn)億。

要承載33倍的增長(zhǎng)，這幾乎其他廠商都沒(méi)有遇到過(guò)的，背后對(duì)于底層AI infra 的性能、成本幾乎是一次大考。

羅浩談到，今年5月份之前，那時(shí)豆包體量還小，為了讓豆包大模型能夠良好地運(yùn)行，他們通過(guò)增加更多的GPU資源來(lái)保證大模型能夠快速響應(yīng)大量的查詢請(qǐng)求，以提升客戶的使用體驗(yàn)。

但他們很快發(fā)現(xiàn)，“堆量”這種方法行不通了，隨著用戶量的增加，繼續(xù)這樣做成本就變得難以承受。

優(yōu)化推理成本迫在眉睫，他們團(tuán)隊(duì)開始大量分析哪些地方是“成本暴發(fā)戶”，經(jīng)過(guò)他們仔細(xì)的計(jì)算發(fā)現(xiàn)，緩存和存儲(chǔ)部分是拉高計(jì)算成本的重要部分。

“傳統(tǒng)的緩存技術(shù)有一個(gè)問(wèn)題，就是它處理數(shù)據(jù)時(shí)會(huì)繞一大圈，通過(guò)CPU再到內(nèi)存，這會(huì)導(dǎo)致延時(shí)增加，性能下降。”羅浩說(shuō)。

為解決這個(gè)問(wèn)題，他們決定重寫整個(gè)緩存系統(tǒng)。新的系統(tǒng)完全圍繞GPU展開，不再依賴傳統(tǒng)的CPU架構(gòu)。這意味著，數(shù)據(jù)可以通過(guò)一種更高效的方式直接從GPU傳輸?shù)竭h(yuǎn)端內(nèi)存，使用一種叫做GDR，GPU Direct RDMA（GPU直接遠(yuǎn)程內(nèi)存訪問(wèn)）技術(shù)，這樣不僅減少了延時(shí)，還提升了整體性能。

這個(gè)數(shù)據(jù)傳遞過(guò)程就像是送信，原來(lái)需要通過(guò)郵局，既慢又容易出錯(cuò)。而現(xiàn)在，系統(tǒng)就像給數(shù)據(jù)裝上了直通車，直接從一個(gè)人手中快速送到另一個(gè)人，省去了中間環(huán)節(jié)，速度更快，準(zhǔn)確性更高。

“這些內(nèi)外部業(yè)務(wù)，對(duì)我們的意義就是，讓我們比別人早踩坑，也早發(fā)現(xiàn)問(wèn)題，早解決?！?/p>

今年5月火山引擎Force春季大會(huì)上，豆包主力模型在企業(yè)市場(chǎng)的定價(jià)比行業(yè)價(jià)格降低了99.3%，“這個(gè)降價(jià)99.3%并非是我們拍腦袋想的，而是建構(gòu)在之前對(duì)AI infra的優(yōu)化上算出來(lái)的。”

羅浩表示，計(jì)算范式當(dāng)前正在從云原生進(jìn)入“AI云原生”的新時(shí)代，火山引擎以GPU為中心重新優(yōu)化計(jì)算、存儲(chǔ)與網(wǎng)絡(luò)架構(gòu)。GPU可以直接訪問(wèn)存儲(chǔ)和數(shù)據(jù)庫(kù)，來(lái)顯著降低IO的延遲。同時(shí)，整個(gè)系統(tǒng)提供高速互聯(lián)和端到端的安全保護(hù)。

這是國(guó)內(nèi)首次有云廠商喊出“AI云原生”的理念。如今，新架構(gòu)仍在支持著豆包大模型實(shí)現(xiàn)快速的指數(shù)級(jí)業(yè)務(wù)增長(zhǎng)。

除有豆包大模型“倒逼”外，火山引擎AI infra能夠在較短時(shí)間內(nèi)升級(jí)，也與火山引擎獨(dú)特的組織架構(gòu)有關(guān)。

國(guó)內(nèi)其他幾家云廠商的產(chǎn)研團(tuán)隊(duì)基本是和集團(tuán)業(yè)務(wù)是分開的，但火山引擎并不是，做火山引擎的這一批人馬，就是來(lái)自字節(jié)中臺(tái)，像羅浩本人，就有兩個(gè)身份，一個(gè)是火山引擎云基礎(chǔ)產(chǎn)品負(fù)責(zé)人，另一個(gè)是字節(jié)跳動(dòng)基礎(chǔ)架構(gòu)云產(chǎn)品負(fù)責(zé)人，而吳迪也同樣如此，他第一個(gè)身份是火山引擎的算法負(fù)責(zé)人，另一個(gè)也是字節(jié)機(jī)器學(xué)習(xí)中臺(tái)的一位負(fù)責(zé)人。

這種組織的好處有兩個(gè)：第一火山資源和字節(jié)的資源都在一個(gè)人手上管理，這樣也能實(shí)現(xiàn)資源的充分利用；第二是人才能力上的復(fù)用。

為商業(yè)化撕開了新突破口

大模型到來(lái)，除縮小火山引擎與其他廠商產(chǎn)品之間的差距外，其帶來(lái)更明顯的效果就是，為火山引擎商業(yè)化帶來(lái)了一個(gè)新的突破口。

上文也提到，作為后進(jìn)生的火山引擎進(jìn)入云市場(chǎng)時(shí)，面臨很大的一個(gè)問(wèn)題就是如何打開市場(chǎng)，過(guò)去火山引擎用了一些價(jià)格策略的確也取得了一些成果，但這終究不是長(zhǎng)久之計(jì)。

而這一波大模型，對(duì)于火山引擎來(lái)說(shuō)，其最重要的就是手上多了一張撬動(dòng)客戶的“王牌”——豆包大模型。

一名火山引擎銷售曾對(duì)雷峰網(wǎng)(公眾號(hào)：雷峰網(wǎng))說(shuō)過(guò)他的銷售經(jīng)歷：以前經(jīng)常找拜訪客戶由頭通常要絞盡腦汁，而且由于火山引擎在云市場(chǎng)是后來(lái)者，一些客戶往往會(huì)提出靈魂拷問(wèn)，為什么選你？但自從大模型出現(xiàn)后，越來(lái)越多的客戶有了大模型訓(xùn)練需求，一些客戶還會(huì)主動(dòng)找上來(lái)問(wèn)，如何去搭建自己的大模型。

趁著大模型這一波熱度，火山引擎在加速推進(jìn)商業(yè)化，據(jù)資深獵頭王帆透露，今年年中，火山引擎單獨(dú)成立了一個(gè)10人不到的大模型商業(yè)化小組，這也是云廠商中唯一一家單獨(dú)成立大模型銷售團(tuán)隊(duì)的，其他云廠商的大模型銷售人馬仍然是賣云的銷售、渠道。

云銷售賣大模型有一個(gè)問(wèn)題是在于，技術(shù)有壁壘，一般的云銷售不一定有能力跟客戶講清楚大模型的價(jià)值、技術(shù)，而火山引擎也在寄希望于通過(guò)豆包大模型，打入更多已經(jīng)跟友商合作的客戶中去，而這也是這個(gè)小組成立的重要原因。

過(guò)去一年，可以看到火山引擎借助大模型在商業(yè)化的突破，據(jù)了解，目前豆包大模型已經(jīng)應(yīng)用到了汽車、手機(jī)、金融、消費(fèi)、互娛等30多個(gè)行業(yè)，尤為值得一提的是汽車行業(yè)，火山引擎的確拿下了不少的汽車大單。

早在去年，火山引擎先后與吉利、長(zhǎng)城、蔚來(lái)、廣汽等多家車企達(dá)成深度合作，為車企提供了數(shù)字化營(yíng)銷、智能座艙、車載聚合音視頻內(nèi)容等一系列服務(wù)。

今年5月，火山引擎成立了汽車大模型生態(tài)聯(lián)盟，一汽紅旗、東風(fēng)乘用車、吉利汽車、長(zhǎng)城汽車、廣汽乘用車、宇通客車在內(nèi)的24家整車廠、官方機(jī)構(gòu)、出行生態(tài)公司等加入其中。下半年，火山引擎在汽車領(lǐng)域有一個(gè)重要的突破客戶，那就是奔馳。8月13日，火山引擎與奔馳簽署戰(zhàn)略合作備忘錄，雙方宣布將在大模型、生成式人工智能和大數(shù)據(jù)技術(shù)領(lǐng)域展開合作。

不過(guò)，也有很多人會(huì)有疑問(wèn)，賣大模型是否能為火山引擎增收，畢竟眼下，OpenAI和Gemini都在不斷降價(jià)。今年5月豆包在國(guó)內(nèi)率先掀起大模型的降級(jí)潮，豆包主力模型在企業(yè)市場(chǎng)的定價(jià)為0.0008元/千Tokens，隨即幾個(gè)月其他廠商也迅速跟進(jìn)，而12月底，火山引擎再次將視覺(jué)模型價(jià)格打下來(lái)，定價(jià)為0.003元/千Tokens。

火山引擎總裁譚待公開表示，豆包大模型的定價(jià)一步到位，有合理毛利。不過(guò)，所有廠商目前大模型API收入規(guī)模都不大。結(jié)合雷峰網(wǎng)調(diào)研發(fā)現(xiàn)，月消費(fèi)1萬(wàn)，相當(dāng)于公有云消費(fèi)1000萬(wàn)的客戶體量，是很大客戶了。

的確，眼下大模型帶來(lái)的收益遠(yuǎn)遠(yuǎn)小于投入，不過(guò)大模型的生意還要是要拉長(zhǎng)時(shí)間維度來(lái)看，大模型應(yīng)用規(guī)模上去之后，一定會(huì)帶動(dòng)云的用量，據(jù)IDC報(bào)告，未來(lái)5年國(guó)內(nèi)的訓(xùn)練、推理算力分別以超50%、190%的年復(fù)合增速發(fā)展，并在2028年推理算力會(huì)超過(guò)訓(xùn)練算力。而到那個(gè)時(shí)候，率先在大模型上重兵投入的火山引擎，興許也更新了自己在云牌桌上的排名。

雷峰網(wǎng)原創(chuàng)文章，未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

1人收藏

相關(guān)文章