丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
行業(yè)云 正文
發(fā)私信給胡敏
發(fā)送

0

大模型,能改變火山引擎在云牌桌上的位置嗎?

本文作者: 胡敏   2024-12-30 18:09
導(dǎo)語(yǔ):在大模型上重兵投入的火山引擎,或許有了一次更新自己在云牌桌上排名的機(jī)會(huì)。

“原來(lái)我并不看好火山引擎,但現(xiàn)在有些改觀了?!痹谠菩袠I(yè)已經(jīng)干了8年的張坤表示。

大模型大戰(zhàn)兩年后,雷峰網(wǎng)再次和許多從業(yè)者聊起火山引擎這位“后進(jìn)生”時(shí),一些人對(duì)火山引擎的看法有了很大變化。

云牌桌上的后來(lái)者

火山引擎在2021年12月正式宣布開(kāi)始參與云計(jì)算市場(chǎng)的競(jìng)爭(zhēng)。與其他幾家云廠商相比,這個(gè)入局時(shí)間顯得有些姍姍來(lái)遲。

回顧其他幾家云廠商,阿里云屬于最早邁出步子的人,2009年成立阿里云,并開(kāi)始自主研發(fā)大規(guī)模分布式計(jì)算操作系統(tǒng)“飛天”。

而騰訊云是2013年3月正式上線運(yùn)營(yíng),2018年930之后,騰訊成立CSIG,轉(zhuǎn)型產(chǎn)業(yè)互聯(lián)網(wǎng)。

華為云在集團(tuán)中的地位經(jīng)歷了多次調(diào)整和提升。最初,華為云作為二級(jí)部門存在,但在短短半年內(nèi)迅速提升為一級(jí)部門,戰(zhàn)略地位僅次于華為的三大BG(運(yùn)營(yíng)商BG、企業(yè)BG和消費(fèi)者BG),后來(lái)又重回集團(tuán)業(yè)務(wù)體系。

到2021年底,火山引擎入局時(shí),云市場(chǎng)已經(jīng)呈現(xiàn)四強(qiáng)競(jìng)爭(zhēng)格局,以阿里云為首,占據(jù)國(guó)內(nèi)四成云服務(wù)市場(chǎng)規(guī)模,其次是華為云、騰訊云與百度智能云?;鹕揭孀鳛楹髞?lái)者,想要在這個(gè)市場(chǎng)上爭(zhēng)得一席之地,有一場(chǎng)相當(dāng)難的攻堅(jiān)戰(zhàn)要打。

當(dāng)年,以Ucloud、青云為代表的獨(dú)立云廠商即便占據(jù)先發(fā)優(yōu)勢(shì),但在這四家云廠商進(jìn)入云市場(chǎng)后,開(kāi)始以投入10-20倍的人力,不計(jì)成本、不計(jì)收益的快速占領(lǐng)市場(chǎng),后來(lái)獨(dú)立云廠商不得不退出了舞臺(tái)中央,站在獨(dú)立云廠商的視角來(lái)看,這個(gè)故事的確聽(tīng)起來(lái)相當(dāng)悲傷,但這也暗含了云市場(chǎng)廝殺的激烈程度。

半年以前,雷峰網(wǎng)曾與數(shù)十名云從業(yè)者交流過(guò)火山引擎能否走出不同的命運(yùn)軌跡,逆襲進(jìn)入云行業(yè)前三甲時(shí),其大多給出的回答:很難,入局太晚了。

面對(duì)強(qiáng)勁的對(duì)手,火山引擎如何撬開(kāi)云計(jì)算市場(chǎng)?雷峰網(wǎng)認(rèn)為,核心策略之一就是價(jià)格。這種策略在云市場(chǎng)上掀起了不小的波瀾,火山引擎接連拿下了不少的泛互、游戲、消費(fèi)電子等行業(yè)客戶,取得了高速增長(zhǎng)。據(jù)業(yè)內(nèi)人士透露,今年火山引擎的營(yíng)收目標(biāo)是要前一年基礎(chǔ)上翻倍。

火山引擎這種發(fā)展態(tài)勢(shì),也讓其成為了目前云市場(chǎng)里唯一一家還在大規(guī)模招聘的公司?!捌渌麕准以茝S商這幾年招聘需求縮減了至少30%,而火山引擎不僅招聘崗位多,而且給略有漲幅的薪資待遇?!鲍C頭劉赟表示。

不過(guò),這種高速增長(zhǎng)繁榮并未掩蓋住擔(dān)憂,不少?gòu)臉I(yè)者認(rèn)為,短期內(nèi),火山引擎在有資源時(shí),自然可以大力投入,但低價(jià)彈藥并非無(wú)窮盡,長(zhǎng)期還是需要靠產(chǎn)品驅(qū)動(dòng),而目前大部分認(rèn)為,火山引擎在產(chǎn)品上還很難追趕上友商。

不過(guò),這是半年前大多數(shù)人的論斷,近半年,一些業(yè)內(nèi)人對(duì)火山引擎的評(píng)價(jià)又發(fā)生了一些變化,認(rèn)為,這一波大模型正在給了火山引擎一個(gè)極佳機(jī)會(huì),提升產(chǎn)品競(jìng)爭(zhēng)力,同時(shí)也給了火山引擎銷售,拉開(kāi)一個(gè)新的突破口。

AI infra,云廠商們站在了同一起跑線上

為何說(shuō)大模型正在讓火山引擎趕超老牌云廠商?

核心原因是,隨著大模型訓(xùn)練推理需求的不斷增多,客戶在云底座的選用上,除了關(guān)注以往云的基礎(chǔ)能力外,還會(huì)進(jìn)一步關(guān)心在AI infra方面的能力。而在AI infra上,所有云廠商都在同一起跑線,并且火山引擎的迭代速度幾乎是廠商里面最快的。

前不久,火山引擎Force冬季大會(huì)上新升級(jí)了以GPU為中心的AI infra分布式業(yè)務(wù)體系,通過(guò) vRDMA 網(wǎng)絡(luò)支持大規(guī)模并行計(jì)算及 P/D 分離推理架構(gòu),提升訓(xùn)練和推理效率,降低企業(yè)使用成本;EIC 彈性極速緩存解決方案,實(shí)現(xiàn) GPU 直連,使大模型推理時(shí)延降低至五十分之一,成本降低 20%。

火山引擎在AI infra上能快速迭代的原因,這要追溯到2021年火山引擎制定的產(chǎn)品戰(zhàn)略。

“從2021年起,我們就確立了兩手抓的產(chǎn)品思路,一邊抓存量,一邊做增量。”火山引擎云基礎(chǔ)產(chǎn)品負(fù)責(zé)人羅浩表示。

大模型,能改變火山引擎在云牌桌上的位置嗎?

火山引擎云基礎(chǔ)產(chǎn)品負(fù)責(zé)人羅浩

羅浩所言的存量是指?jìng)鹘y(tǒng)云計(jì)算的需求,包括ECS、存儲(chǔ)、數(shù)據(jù)庫(kù)、網(wǎng)絡(luò)、安全等一些云基礎(chǔ)產(chǎn)品。不可否認(rèn),作為后來(lái)者,火山引擎在這些基礎(chǔ)云產(chǎn)品上與其他廠商還存在差距,所以羅浩認(rèn)為,在這一塊他們的核心就是要快速補(bǔ)齊短板。

不過(guò),光是補(bǔ)齊短板遠(yuǎn)遠(yuǎn)不夠,如何能在產(chǎn)品上有所差異,才是贏得市場(chǎng)競(jìng)爭(zhēng)的關(guān)鍵。而隨著生成式AI浪潮的到來(lái),火山引擎隨即決定要從算力上做突圍,也就是羅浩所說(shuō)的增量,來(lái)服務(wù)比如兩年前爆發(fā)的訓(xùn)練需求,今天大規(guī)模的推理需求。

“早在2021年,我們就開(kāi)始大規(guī)模投入AI和GPU了。”

這一戰(zhàn)略判斷,從過(guò)去一年火山引擎在AI infra上的銷售表現(xiàn),已經(jīng)可以驗(yàn)證正確性,大模型公司幾乎都是火山引擎AI infra 的采購(gòu)者。

如果說(shuō)4年前“兩手抓”的產(chǎn)品戰(zhàn)略是火山引擎在AI infra上實(shí)現(xiàn)追趕的根基,那過(guò)去幾年的內(nèi)外部實(shí)踐則是AI infra迭代的關(guān)鍵驅(qū)動(dòng)力,所有產(chǎn)品穩(wěn)定性和能力往往是在一次次業(yè)務(wù)場(chǎng)景中淬煉重生。

在這些實(shí)踐中,讓火山引擎AI infra加速狂奔的是豆包大模型。前不久,火山引擎總裁譚待在火山引擎Force冬季大會(huì)上公布了一個(gè)數(shù)據(jù),2024年豆包的日均token數(shù)據(jù)從5月15日的1200億,到12月18日增長(zhǎng)到了4萬(wàn)億。

要承載33倍的增長(zhǎng),這幾乎其他廠商都沒(méi)有遇到過(guò)的,背后對(duì)于底層AI infra 的性能、成本幾乎是一次大考。

羅浩談到,今年5月份之前,那時(shí)豆包體量還小,為了讓豆包大模型能夠良好地運(yùn)行,他們通過(guò)增加更多的GPU資源來(lái)保證大模型能夠快速響應(yīng)大量的查詢請(qǐng)求,以提升客戶的使用體驗(yàn)。

但他們很快發(fā)現(xiàn),“堆量”這種方法行不通了,隨著用戶量的增加,繼續(xù)這樣做成本就變得難以承受。

優(yōu)化推理成本迫在眉睫,他們團(tuán)隊(duì)開(kāi)始大量分析哪些地方是“成本暴發(fā)戶”,經(jīng)過(guò)他們仔細(xì)的計(jì)算發(fā)現(xiàn),緩存和存儲(chǔ)部分是拉高計(jì)算成本的重要部分。

“傳統(tǒng)的緩存技術(shù)有一個(gè)問(wèn)題,就是它處理數(shù)據(jù)時(shí)會(huì)繞一大圈,通過(guò)CPU再到內(nèi)存,這會(huì)導(dǎo)致延時(shí)增加,性能下降。”羅浩說(shuō)。

為解決這個(gè)問(wèn)題,他們決定重寫(xiě)整個(gè)緩存系統(tǒng)。新的系統(tǒng)完全圍繞GPU展開(kāi),不再依賴傳統(tǒng)的CPU架構(gòu)。這意味著,數(shù)據(jù)可以通過(guò)一種更高效的方式直接從GPU傳輸?shù)竭h(yuǎn)端內(nèi)存,使用一種叫做GDR,GPU Direct RDMA(GPU直接遠(yuǎn)程內(nèi)存訪問(wèn))技術(shù),這樣不僅減少了延時(shí),還提升了整體性能。

這個(gè)數(shù)據(jù)傳遞過(guò)程就像是送信,原來(lái)需要通過(guò)郵局,既慢又容易出錯(cuò)。而現(xiàn)在,系統(tǒng)就像給數(shù)據(jù)裝上了直通車,直接從一個(gè)人手中快速送到另一個(gè)人,省去了中間環(huán)節(jié),速度更快,準(zhǔn)確性更高。

“這些內(nèi)外部業(yè)務(wù),對(duì)我們的意義就是,讓我們比別人早踩坑,也早發(fā)現(xiàn)問(wèn)題,早解決。”

今年5月火山引擎Force春季大會(huì)上,豆包主力模型在企業(yè)市場(chǎng)的定價(jià)比行業(yè)價(jià)格降低了99.3%,“這個(gè)降價(jià)99.3%并非是我們拍腦袋想的,而是建構(gòu)在之前對(duì)AI infra的優(yōu)化上算出來(lái)的。”

羅浩表示,計(jì)算范式當(dāng)前正在從云原生進(jìn)入“AI云原生”的新時(shí)代,火山引擎以GPU為中心重新優(yōu)化計(jì)算、存儲(chǔ)與網(wǎng)絡(luò)架構(gòu)。GPU可以直接訪問(wèn)存儲(chǔ)和數(shù)據(jù)庫(kù),來(lái)顯著降低IO的延遲。同時(shí),整個(gè)系統(tǒng)提供高速互聯(lián)和端到端的安全保護(hù)。

這是國(guó)內(nèi)首次有云廠商喊出“AI云原生”的理念。如今,新架構(gòu)仍在支持著豆包大模型實(shí)現(xiàn)快速的指數(shù)級(jí)業(yè)務(wù)增長(zhǎng)。

除有豆包大模型“倒逼”外,火山引擎AI infra能夠在較短時(shí)間內(nèi)升級(jí),也與火山引擎獨(dú)特的組織架構(gòu)有關(guān)。

國(guó)內(nèi)其他幾家云廠商的產(chǎn)研團(tuán)隊(duì)基本是和集團(tuán)業(yè)務(wù)是分開(kāi)的,但火山引擎并不是,做火山引擎的這一批人馬,就是來(lái)自字節(jié)中臺(tái),像羅浩本人,就有兩個(gè)身份,一個(gè)是火山引擎云基礎(chǔ)產(chǎn)品負(fù)責(zé)人,另一個(gè)是字節(jié)跳動(dòng)基礎(chǔ)架構(gòu)云產(chǎn)品負(fù)責(zé)人,而吳迪也同樣如此,他第一個(gè)身份是火山引擎的算法負(fù)責(zé)人,另一個(gè)也是字節(jié)機(jī)器學(xué)習(xí)中臺(tái)的一位負(fù)責(zé)人。

這種組織的好處有兩個(gè):第一火山資源和字節(jié)的資源都在一個(gè)人手上管理,這樣也能實(shí)現(xiàn)資源的充分利用;第二是人才能力上的復(fù)用。

為商業(yè)化撕開(kāi)了新突破口

大模型到來(lái),除縮小火山引擎與其他廠商產(chǎn)品之間的差距外,其帶來(lái)更明顯的效果就是,為火山引擎商業(yè)化帶來(lái)了一個(gè)新的突破口。

上文也提到,作為后進(jìn)生的火山引擎進(jìn)入云市場(chǎng)時(shí),面臨很大的一個(gè)問(wèn)題就是如何打開(kāi)市場(chǎng),過(guò)去火山引擎用了一些價(jià)格策略的確也取得了一些成果,但這終究不是長(zhǎng)久之計(jì)。

而這一波大模型,對(duì)于火山引擎來(lái)說(shuō),其最重要的就是手上多了一張撬動(dòng)客戶的“王牌”——豆包大模型。

一名火山引擎銷售曾對(duì)雷峰網(wǎng)說(shuō)過(guò)他的銷售經(jīng)歷:以前經(jīng)常找拜訪客戶由頭通常要絞盡腦汁,而且由于火山引擎在云市場(chǎng)是后來(lái)者,一些客戶往往會(huì)提出靈魂拷問(wèn),為什么選你?但自從大模型出現(xiàn)后,越來(lái)越多的客戶有了大模型訓(xùn)練需求,一些客戶還會(huì)主動(dòng)找上來(lái)問(wèn),如何去搭建自己的大模型。

趁著大模型這一波熱度,火山引擎在加速推進(jìn)商業(yè)化,據(jù)資深獵頭王帆透露,今年年中,火山引擎單獨(dú)成立了一個(gè)10人不到的大模型商業(yè)化小組,這也是云廠商中唯一一家單獨(dú)成立大模型銷售團(tuán)隊(duì)的,其他云廠商的大模型銷售人馬仍然是賣云的銷售、渠道。

云銷售賣大模型有一個(gè)問(wèn)題是在于,技術(shù)有壁壘,一般的云銷售不一定有能力跟客戶講清楚大模型的價(jià)值、技術(shù),而火山引擎也在寄希望于通過(guò)豆包大模型,打入更多已經(jīng)跟友商合作的客戶中去,而這也是這個(gè)小組成立的重要原因。

過(guò)去一年,可以看到火山引擎借助大模型在商業(yè)化的突破,據(jù)了解,目前豆包大模型已經(jīng)應(yīng)用到了汽車、手機(jī)、金融、消費(fèi)、互娛等30多個(gè)行業(yè),尤為值得一提的是汽車行業(yè),火山引擎的確拿下了不少的汽車大單。

早在去年,火山引擎先后與吉利、長(zhǎng)城、蔚來(lái)、廣汽等多家車企達(dá)成深度合作,為車企提供了數(shù)字化營(yíng)銷、智能座艙、車載聚合音視頻內(nèi)容等一系列服務(wù)。

今年5月,火山引擎成立了汽車大模型生態(tài)聯(lián)盟,一汽紅旗、東風(fēng)乘用車、吉利汽車、長(zhǎng)城汽車、廣汽乘用車、宇通客車在內(nèi)的24家整車廠、官方機(jī)構(gòu)、出行生態(tài)公司等加入其中。下半年,火山引擎在汽車領(lǐng)域有一個(gè)重要的突破客戶,那就是奔馳。8月13日,火山引擎與奔馳簽署戰(zhàn)略合作備忘錄,雙方宣布將在大模型、生成式人工智能和大數(shù)據(jù)技術(shù)領(lǐng)域展開(kāi)合作。

不過(guò),也有很多人會(huì)有疑問(wèn),賣大模型是否能為火山引擎增收,畢竟眼下,OpenAI和Gemini都在不斷降價(jià)。今年5月豆包在國(guó)內(nèi)率先掀起大模型的降級(jí)潮,豆包主力模型在企業(yè)市場(chǎng)的定價(jià)為0.0008元/千Tokens,隨即幾個(gè)月其他廠商也迅速跟進(jìn),而12月底,火山引擎再次將視覺(jué)模型價(jià)格打下來(lái),定價(jià)為0.003元/千Tokens。

火山引擎總裁譚待公開(kāi)表示,豆包大模型的定價(jià)一步到位,有合理毛利。不過(guò),所有廠商目前大模型API收入規(guī)模都不大。結(jié)合雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))調(diào)研發(fā)現(xiàn),月消費(fèi)1萬(wàn),相當(dāng)于公有云消費(fèi)1000萬(wàn)的客戶體量,是很大客戶了。

的確,眼下大模型帶來(lái)的收益遠(yuǎn)遠(yuǎn)小于投入,不過(guò)大模型的生意還要是要拉長(zhǎng)時(shí)間維度來(lái)看,大模型應(yīng)用規(guī)模上去之后,一定會(huì)帶動(dòng)云的用量,據(jù)IDC報(bào)告,未來(lái)5年國(guó)內(nèi)的訓(xùn)練、推理算力分別以超50%、190%的年復(fù)合增速發(fā)展,并在2028年推理算力會(huì)超過(guò)訓(xùn)練算力。而到那個(gè)時(shí)候,率先在大模型上重兵投入的火山引擎,興許也更新了自己在云牌桌上的排名。

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。

分享:
相關(guān)文章
最新文章
請(qǐng)?zhí)顚?xiě)申請(qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說(shuō)