0
本文作者: 周蕾 | 2022-04-07 15:01 |
“2022年,會(huì)是FinOps爆發(fā)元年。”
FinOps(云財(cái)務(wù)管理/云成本優(yōu)化),這個(gè)名詞看似陌生,今年卻已經(jīng)被騰訊、阿里等互聯(lián)網(wǎng)大廠提及多次。
用一句大白話來說,F(xiàn)inOps的目的,是上云上得更加劃算,讓IT、財(cái)務(wù)、業(yè)務(wù)等部門不至于為了上云這筆糊涂賬打起來。
“確保從云計(jì)算中花費(fèi)的投入獲得最大價(jià)值,實(shí)現(xiàn)系統(tǒng)、最佳實(shí)踐和文化的結(jié)合——以提高組織理解云成本和進(jìn)行業(yè)務(wù)權(quán)衡的能力。正如DevOps通過打破煙囪和提高敏捷性、實(shí)現(xiàn)了開發(fā)的巨大改進(jìn)一樣,F(xiàn)inOps期望通過將技術(shù)、業(yè)務(wù)和財(cái)務(wù)人員與一套新的流程結(jié)合在一起,提高云的業(yè)務(wù)價(jià)值?!?br/>——FinOps的官方定義
在《企業(yè)上云的最大「迷信」:降本增效》一文中,雷峰網(wǎng)就曾提到,不少企業(yè)陷入某種誤區(qū),在上云為業(yè)務(wù)提速的同時(shí),誤以為上云必然也帶來成本的降低。但事實(shí)上,上云超支、資源閑置浪費(fèi)的情況比比皆是,與降本增效的初心南轅北轍。FinOps的出現(xiàn),則被認(rèn)為是上云超支的一劑靈藥。
不過,一個(gè)新概念的流傳,必然會(huì)伴隨眾多質(zhì)疑與爭論。雷峰網(wǎng)在采訪調(diào)研的過程中,聽到最多的回答是“沒聽說過”“沒有必要”。
有從業(yè)者直言,國內(nèi)企業(yè)還沒來得及完全消化“云原生”“數(shù)字化轉(zhuǎn)型”等概念,F(xiàn)inOps只是云廠商對外推銷的又一套新話術(shù)。
但也有多位大廠高管向我們強(qiáng)調(diào),工具和技術(shù)確實(shí)已經(jīng)長成,但不能提供保障:這就好比一支鋼筆出水再怎么順滑,也不能保證你能寫出一手漂亮的字。
在他們眼中,這并不是一個(gè)平地而起的概念;相反,不少企業(yè)的發(fā)展過程中,F(xiàn)inOps的理念已經(jīng)自然萌芽,只不過是現(xiàn)在找到了更貼切、成體系的表達(dá)。
“它不只是某個(gè)特定的技術(shù)、工具或者解決方案,更是一種上升到組織架構(gòu)和管理文化層面的實(shí)踐?!币晃谎芯縁inOps的云計(jì)算從業(yè)者如是說。
究竟FinOps是什么,又為什么非做不可?企業(yè)怎樣才能——或者說,才應(yīng)該進(jìn)入到FinOps的世界中?
Gartner此前的一項(xiàng)研究數(shù)據(jù),引起了不少廠商的關(guān)注:45%的企業(yè)由于缺乏優(yōu)化措施,在直接遷移上云的過程中會(huì)超買 55%的資源,并且在上云初期的18個(gè)月內(nèi)多花費(fèi)70%。
一家房企的IT負(fù)責(zé)人就告訴雷峰網(wǎng),“云服務(wù)的‘浪費(fèi)’,從技術(shù)上來說是,無法避免,不可能是‘用多少買多少’,萬一買少了影響業(yè)務(wù)運(yùn)行呢?”
這樣的想法不在少數(shù),也更符合人們的一貫思路,就好比提前囤積物資,以備不時(shí)之需。可事實(shí)上,把這種舊想法原封不動(dòng)地帶進(jìn)“云時(shí)代”,正是造成云成本超支的“元兇”之一。
前廣發(fā)證券首席架構(gòu)師、凡泰極客CEO梁啟鴻曾向雷峰網(wǎng)強(qiáng)調(diào),在過去,為了對系統(tǒng)負(fù)載的波動(dòng)提供足夠的支持,IT系統(tǒng)總是要按冗余、支持峰值業(yè)務(wù)來進(jìn)行capacity planning(容量規(guī)劃),是一個(gè)CAPEX(Capital Expenditure,資本性支出)問題。
而采用云服務(wù),在理想情況下,正是希望將CAPEX變成OPEX(Operating Expense,企業(yè)管理支出),實(shí)現(xiàn)“效用計(jì)算”:“讓計(jì)算效能就像電、水、天然氣一樣隨需隨用,按用度收費(fèi)?!?/p>
云資源某種程度上就像是“房子”:如今搭建新房的速度確實(shí)越來越快,但已建成的新房常常堆滿雜物,或是入住人數(shù)總是遠(yuǎn)低于估計(jì)值。為了保證總有可用的房間,大量新建確實(shí)是個(gè)辦法,但新建同樣也要再花費(fèi)一筆,為什么不同時(shí)回頭清理一下那些舊房間?
FinOps的意義,正是讓每一間房發(fā)揮自己的最大價(jià)值。
但也有多位IT從業(yè)者向雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))提出質(zhì)疑:FinOps這個(gè)說法并不特別,甚至可能會(huì)“為了省錢而花錢”。
“上云的收益之一,本就是用戶不再需要持有固定資產(chǎn)進(jìn)行維護(hù)和折舊,相應(yīng)的成本結(jié)構(gòu)能夠優(yōu)化。上云成本按量付費(fèi),可以根據(jù)業(yè)務(wù)增長按比例擴(kuò)大投入,不需要過度超前,過剩的資源也能快速釋放?!?/p>
“云原生架構(gòu)的目的,和FinOps離得不遠(yuǎn),還有必要單獨(dú)包裝這么一個(gè)新概念嗎?”
在騰訊云FinOps產(chǎn)品負(fù)責(zé)人孟凡杰看來,云原生技術(shù)棧確實(shí)提供了一系列提高資源利用率的能力,如對資源更細(xì)粒度的管控和分配、自動(dòng)伸縮能力等,也更靠近隨需隨用、靈活運(yùn)用的目標(biāo)。
“理論上來說,業(yè)務(wù)遷移到云原生平臺(tái)以后,利用率應(yīng)該大大提升才對。但企業(yè)對云原生的技術(shù)認(rèn)知往往還停留在以前的階段,在虛擬機(jī)上怎么用資源,到了云原生平臺(tái)照舊,并沒有意識(shí)到可以在保證業(yè)務(wù)穩(wěn)定的前提下,采用成本更優(yōu)化的手段?!?/p>
就以Kubernetes為例,其提供的原生能力在一些用戶手里并沒有完全釋放。
“比如你是一個(gè)平臺(tái)側(cè)運(yùn)維人員,你背負(fù)著提升平臺(tái)資源利用率的 KPI。集群內(nèi)運(yùn)行著眾多負(fù)載規(guī)律波動(dòng)的應(yīng)用,你驚喜地發(fā)現(xiàn),Kubernetes 提供了自動(dòng)擴(kuò)容能力,你很想試試看。
“但真正使用了HPA,從負(fù)載上升觸發(fā)閾值,到彈性控制器開始擴(kuò)容,到應(yīng)用啟動(dòng)完成,可能有數(shù)分鐘甚至數(shù)十分鐘的滯后,在彈性起作用之前,應(yīng)用已經(jīng)被壓垮。于是你拋棄自動(dòng)彈性能力,繼續(xù)回歸到鎖定超量資源的老路上來。”孟凡杰感慨道。
利器在手卻難有重用,這只是云資源浪費(fèi)的冰山一角。Kubernetes集群的CPU利用率偏低,過時(shí)不用的研發(fā)項(xiàng)目占用資源,沒有規(guī)模測算能力,超配采購……種種情況都導(dǎo)致了云資源未能得到充分利用。
火山引擎副總經(jīng)理張鑫則向雷峰網(wǎng)表示,二者其實(shí)是完全不同的層級,F(xiàn)inOps應(yīng)當(dāng)是更宏大完整的體系。
“一般是公司的財(cái)務(wù)、采購對成本有直接的關(guān)注和要求,甚至是他們KPI的一部分,但研發(fā)、產(chǎn)品團(tuán)隊(duì)通常不背成本指標(biāo),‘如何用盡量少的資源達(dá)到業(yè)務(wù)目標(biāo)’不是他們優(yōu)先關(guān)注的部分。
FinOps最重要的一點(diǎn),是如何讓財(cái)務(wù)、采購部門與企業(yè)產(chǎn)品、研發(fā)部門對齊目標(biāo),共同為成本負(fù)責(zé),落到管理流程和機(jī)制上,這并非云原生或某一技術(shù)和工具能形成閉環(huán)的?!?/p>
那么,是眼下所有的企業(yè)都應(yīng)該進(jìn)入到FinOps的實(shí)踐中嗎?
“國內(nèi)大多數(shù)企業(yè)的上云開支,還用不到一套完整的策略和工具,來執(zhí)行如此具體的降本目標(biāo)。開支已經(jīng)非常大的時(shí)候,企業(yè)才會(huì)關(guān)注到這一塊。”一位獨(dú)立云廠商的中層如是說。
企業(yè)對上云的關(guān)注點(diǎn)確實(shí)是循序漸進(jìn)的,張鑫表示,第一階段企業(yè)關(guān)注的,更多是隱私、穩(wěn)定,以及行業(yè)監(jiān)管政策;第二階段則是云與業(yè)務(wù)、研發(fā)、管理等體系的適配,關(guān)注效率的提升;第三階段,才會(huì)來到成本優(yōu)化的層次。
孟凡杰則認(rèn)為,不少國內(nèi)企業(yè)還處在業(yè)務(wù)遷上云原生的時(shí)期,當(dāng)企業(yè)面對業(yè)務(wù)壓力時(shí),成本管控的優(yōu)先級自然會(huì)先“放一放”;當(dāng)業(yè)務(wù)趨于穩(wěn)定,應(yīng)用的容器化、架構(gòu)的現(xiàn)代化接近完成,也就是時(shí)候?qū)㈥P(guān)注點(diǎn)轉(zhuǎn)到成本優(yōu)化上來。
但現(xiàn)狀如此,并不代表這就是理想的狀態(tài)。孟凡杰也直言,云成本優(yōu)化應(yīng)該從上云的第一天就開始規(guī)劃,并且不斷優(yōu)化。
“我們從現(xiàn)有數(shù)據(jù)發(fā)現(xiàn),有部分的業(yè)務(wù)開發(fā)人員對業(yè)務(wù)的增長過于自信,申請的云資源超過其真實(shí)用量的情況,用戶在為閑置資源買單。很多組織認(rèn)為忽視了成本對利潤的影響,在上云的過程中,只是把過去的經(jīng)驗(yàn)簡單粗暴的套用在新技術(shù)棧上。也有眾多團(tuán)隊(duì)武斷地認(rèn)為成本優(yōu)化和業(yè)務(wù)穩(wěn)定性是相背離的,二者只能取其一。”
在國內(nèi)乃至整個(gè)亞太區(qū),F(xiàn)inOps還是相對新鮮的概念,但在歐美,F(xiàn)inOps已形成了一定的討論規(guī)模。孟凡杰透露,除了Linux基金會(huì)已經(jīng)下設(shè)FinOps基金會(huì)外,歐美一些FinOps主題的峰會(huì)也已經(jīng)達(dá)到近千人規(guī)模。
張鑫指出,國外的企業(yè)對云成本的重視程度,之所以更高一些,與國內(nèi)外的公有云滲透率、云服務(wù)的價(jià)格體系有著莫大關(guān)系。
“尤其是價(jià)格和采購模式上,國外的體系更加實(shí)時(shí)、動(dòng)態(tài)和復(fù)雜。例如云服務(wù)連續(xù)使用多久之后自動(dòng)有梯度價(jià)格,或者產(chǎn)生折扣,但在國內(nèi),買賣雙方往往是預(yù)先談好采購的框架,成本優(yōu)化的空間并不那么大。”
盡管FinOps在國內(nèi)提及不多,早在2020年12月,信通院就牽頭成立了FinOps產(chǎn)業(yè)推進(jìn)方陣,推進(jìn)規(guī)?;瘜?shí)踐。
“很多企業(yè)其實(shí)沒有意識(shí)到自己已經(jīng)在涉足FinOps,但他們會(huì)用成本的視角來審視每個(gè)部門的花費(fèi),設(shè)資源利用率的紅黑榜,給業(yè)務(wù)側(cè)做一些施壓。那一步已經(jīng)邁出去了,只不過暫時(shí)還沒有和方法論結(jié)合到一起?!泵戏步苷f。
也是在2020年,有關(guān)上云超支的Gartner報(bào)告引起了騰訊云和火山引擎的注意。
在那些率先擁抱云原生的互聯(lián)網(wǎng)大廠內(nèi)部,云成本優(yōu)化的種子其實(shí)早就生根萌芽、形成最佳實(shí)踐的方法論。FinOps的出現(xiàn),讓大廠們的優(yōu)化經(jīng)驗(yàn)得到了更體系化的表達(dá)。
以字節(jié)跳動(dòng)為例,他們內(nèi)部已有相關(guān)實(shí)踐,例如云賬單分析,多云架構(gòu)下對不同廠商定價(jià)策略的審視,推薦、廣告、搜索的在離線任務(wù)混合部署等。目前,字節(jié)跳動(dòng)在云成本優(yōu)化上的最佳實(shí)踐,將通過火山引擎對外提供服務(wù)。
阿里集團(tuán)也搭建了自己的混合云資源管理平臺(tái)(HCRM),推進(jìn)自身成本數(shù)字化從無到有的建設(shè),重新疏通集團(tuán)內(nèi)部的云資源計(jì)費(fèi)和結(jié)算鏈路。
騰訊則走得更快一些。孟凡杰向雷峰網(wǎng)透露,在騰訊內(nèi)部,云業(yè)務(wù)成本中心承擔(dān)著FinOps團(tuán)隊(duì)的職責(zé),需要背上資源優(yōu)化的考核指標(biāo),從平臺(tái)側(cè)、業(yè)務(wù)側(cè)著手,甚至可以向上匯報(bào),通過GM的層級去推動(dòng)。
團(tuán)隊(duì)也制定了云原生成熟度評估模型,考評集群的利用率等指標(biāo),結(jié)合彈性、混部等云原生技術(shù)對業(yè)務(wù)進(jìn)行改造,成熟度的“分?jǐn)?shù)”會(huì)層層細(xì)化下發(fā),具體到每一個(gè)運(yùn)行在Kubernetes集群上的作業(yè)。
對外,騰訊云推出了云原生成本管理產(chǎn)品“成本大師”,從成本洞察、成本優(yōu)化、成本運(yùn)營三個(gè)層面來協(xié)助企業(yè)降本。
2021年11月底,騰訊云宣布加入FinOps基金會(huì),成為國內(nèi)首家FinOps基金會(huì)的頂級成員。這一動(dòng)作,也讓FinOps走進(jìn)更多企業(yè)的視野。
騰訊開源聯(lián)盟主席單致豪告訴雷峰網(wǎng),F(xiàn)inOps基金會(huì)在2020年8月成立后,他們就一直保持關(guān)注,直到開源思路和目的明確、了解清楚Linux基金會(huì)在FinOps上的發(fā)展方向后,他們與FinOps基金會(huì)執(zhí)行董事 J.R. Storment 和技術(shù)咨詢委員會(huì)(TAC)主席 Mike Fuller 等一起經(jīng)過好幾次深度的線上討論會(huì),同步騰訊云的加入目的、發(fā)展戰(zhàn)略,最終達(dá)成合作。
此后,騰訊云將參與到圍繞云財(cái)務(wù)管理最佳實(shí)踐的標(biāo)準(zhǔn)制定。單致豪將結(jié)合公司整體的開源戰(zhàn)略推進(jìn)FinOps,孟凡杰則作為騰訊云FinOps產(chǎn)品負(fù)責(zé)人,從技術(shù)層面參與到基金會(huì)日常的工作中去。
騰訊也推出了基于云原生技術(shù)的成本優(yōu)化開源項(xiàng)目 Crane,將自身內(nèi)部云資源優(yōu)化流程方法和工具做系統(tǒng)性輸出?!癈rane致力于推薦資源和智能彈性配置,業(yè)務(wù)人員無需再為業(yè)務(wù)需要多少資源,自動(dòng)擴(kuò)縮容應(yīng)該如何配置等問題而煩惱,Crane會(huì)基于業(yè)務(wù)的時(shí)序變動(dòng)數(shù)據(jù)給出最優(yōu)解?!泵戏步芙榻B。
除此以外,雷峰網(wǎng)也了解到,某手機(jī)廠商已經(jīng)開始了與FinOps相關(guān)的實(shí)踐;作業(yè)幫、小紅書等企業(yè)也與騰訊云開啟了圍繞FinOps的合作。
在調(diào)研的過程中,受訪者們不約而同地達(dá)成了一個(gè)共識(shí):技術(shù)也好,工具也罷,F(xiàn)inOps更應(yīng)該是一種管理基因,被注入到企業(yè)當(dāng)中去。
在張鑫眼中,跨團(tuán)隊(duì)的目標(biāo)對齊、設(shè)置類似敏捷教練的FinOps教練角色、設(shè)置統(tǒng)一的資源監(jiān)控看板,都是技術(shù)之外無比重要的步驟。
孟凡杰則指出,企業(yè)要適應(yīng)這種新的節(jié)奏,組織架構(gòu)上就應(yīng)當(dāng)有所調(diào)整,F(xiàn)inOps團(tuán)隊(duì)得到來自高層的授權(quán)和支持,才能真正推動(dòng)成本優(yōu)化目標(biāo)的執(zhí)行。
DevOps和敏捷文化的盛行,曾經(jīng)狠狠打破不少企業(yè)內(nèi)部的部門墻,如今“新生”的FinOps概念,能夠成功復(fù)制DevOps的輝煌,打破企業(yè)轉(zhuǎn)型的下一道桎梏嗎?
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。