0
本文作者: 趙之齊 | 2025-02-25 16:20 |
上個月,Databricks 宣布 Meta 已成為其投資者之一,參與了最近一輪總額達到 100 億美元的融資,據(jù)悉,這是風投史上規(guī)模最大的一次投資之一。至此,Databricks 估值已達 640 億美元。
融資熱度持續(xù)上漲的 Databricks 背后所代表的技術(shù)風向,是其于 2020 年提出的“湖倉一體”。這一概念在數(shù)倉領(lǐng)域激起千層浪,成立于 2021 年的云器科技,便是該理念的踐行者之一。云器在成立之初就專注于云湖倉,并于去年開始落地商業(yè)化。今年 1 月,云器 Lakehouse 向全球用戶開放注冊,目前單日 SQL transaction 已經(jīng)接近千萬。
“任何一個技術(shù)不成為產(chǎn)品是沒有作用的,任何一個產(chǎn)品如果不能商業(yè)化也是沒有意義的”,云器科技 CEO 喻思成向雷峰網(wǎng)說道。創(chuàng)立云器科技前,喻思成曾任 Oracle 全球副總裁,后來成為阿里巴巴集團副總裁、阿里云國際業(yè)務(wù)負責人,將阿里云海外業(yè)務(wù)從零開始建立起來。
與同期許多技術(shù)驅(qū)動的初創(chuàng)公司不同,云器在成立之初便確立了“技術(shù)+產(chǎn)品+商業(yè)”三駕馬車齊頭并進的團隊架構(gòu),團隊成員主要自國內(nèi)外頂尖云計算與大數(shù)據(jù)企業(yè)。早期仍在產(chǎn)品研發(fā)階段時,云器團隊便定下目標:與 100 家潛在客戶深度溝通,確保產(chǎn)品方向與市場需求對齊。
與雷峰網(wǎng)(公眾號:雷峰網(wǎng))回顧商業(yè)化進程時,喻思成認為公司成立至今大方向始終沒有改變,一方面是對“湖倉一體”趨勢的預(yù)判與確信,AI 出現(xiàn)促進了人們對“湖倉一體”的需求;另一方面,也得益于及時跟進市場需求的團隊配合。
云器成立之初,目標就是全球的市場。他們的目標客戶是數(shù)據(jù)型企業(yè)中的遠見者——需要數(shù)據(jù)基礎(chǔ)設(shè)施,并實現(xiàn)數(shù)據(jù)的價值”。
但喻思成也感慨,云器接下來面對的挑戰(zhàn),就是如何發(fā)展得更快一些。這是他的焦慮與野心:不希望云器做一家成長緩慢的公司,希望借下一代數(shù)據(jù)技術(shù)爆發(fā)時,云器能實現(xiàn)彎道超車。
以下是雷峰網(wǎng)在不改變談話原意的基礎(chǔ)上進行的對話整理。
云器科技 CEO 喻思成
一個產(chǎn)品打中一千個人的痛點
雷峰網(wǎng):您當時離開阿里開始創(chuàng)業(yè),是什么契機讓您有這樣的決定?
喻思成:2020 至 2021 年期間,技術(shù)、商業(yè)模式和融資環(huán)境都經(jīng)歷了重要變革。在技術(shù)領(lǐng)域,Snowflake 的成功上市以及 Databricks 等公司的快速發(fā)展,有力地證明了“一體化湖倉”是大數(shù)據(jù)架構(gòu)的未來趨勢。此外,云計算市場格局也基本穩(wěn)定,呈現(xiàn)出美國三大云廠商和中國四大云廠商的競爭態(tài)勢。在此背景下,云上湖倉作為下一代大數(shù)據(jù)處理技術(shù)方向,已得到確認。
此前,大數(shù)據(jù)技術(shù)經(jīng)歷了多個演進階段,從 Teradata 到 Hadoop,再到各大云平臺自研的大數(shù)據(jù)平臺,比如阿里云 Maxcompute 。發(fā)展至今,涌現(xiàn)出 Databricks 、云器 Lakehouse 等跨云、多云中立的數(shù)據(jù)平臺產(chǎn)品。正如我之前在阿里云體會到的,如果多云一體化云湖倉是未來方向,那么在單一云平臺內(nèi)部實現(xiàn)真正的多云架構(gòu),將面臨諸多挑戰(zhàn)——因此,才有了離開阿里創(chuàng)業(yè)的契機。
雷峰網(wǎng):云器在 2021 年成立之初就已經(jīng)錨定了要做云湖倉嗎?當時商業(yè)化策略是什么樣的?
喻思成:對,最初計劃在兩年內(nèi)研發(fā)產(chǎn)品,然后開始商業(yè)化。預(yù)期是先聚焦中國市場、再拓展亞洲市場,將來考慮歐美,大方向從未改變。截止到 2024 年底,云器經(jīng)歷了一年多的商業(yè)化,我們對市場環(huán)境的整體體感是,雖然國內(nèi)商業(yè)環(huán)境不如 2021 年的預(yù)期,但海外市場并沒有太大回退,云器依然收獲不少客戶,整體運行在快速發(fā)展的軌道上。
雷峰網(wǎng):去年這一年在做商業(yè)化,是指已經(jīng)走完 PMF(Product Market Fit,產(chǎn)品和市場達到最佳的契合點)階段了嗎?
喻思成:目前云器已經(jīng)落地幾十個付費客戶,營收增長比較快,在阿里、騰訊、AWS、GCP 等平臺上都已經(jīng)有生產(chǎn)的客戶。在這些平臺上單日 SQL transaction 已經(jīng)接近千萬。但我認為 PMF 是一個持續(xù)的過程,到今天都不覺得我們 PMF 走完了。
比如云器的核心優(yōu)勢是獨創(chuàng)的增量計算技術(shù),對比傳統(tǒng) 數(shù)據(jù) Infra 架構(gòu),效率提升極大。但初期切入時要更換客戶現(xiàn)有架構(gòu)中的哪一塊組件?是需要不斷迭代的認知問題。不同客戶的業(yè)務(wù)、數(shù)據(jù)量、使用的技術(shù)架構(gòu)都不同,因此痛點也不一樣??蛻艨赡苁褂枚鄠€組件組合的功能,比如用 Spark 做 ETL、用 Clickhouse 做 OLAP等。目前,我們在很多客戶實踐中逐漸摸索出來,替換 Spark 是最有效的方案。
雷峰網(wǎng):現(xiàn)在云器出海進度如何?
喻思成:我們已經(jīng)在東南亞實現(xiàn)商業(yè)化,也有幫助國內(nèi)客戶在東南亞落地,但還未進入美國市場。出海方式既有“直客”模式,直接去服務(wù)客戶,也有跟合作伙伴合作,主要的合作伙伴是七朵云(云廠商),目前云器 Lakehouse 已經(jīng)適配所有主流云平臺。
雷峰網(wǎng):云器在今年 1 月 15 日宣布 Lakehouse 免費向全球開放注冊,為什么考慮這樣的舉措?
喻思成:云器 Lakehouse 產(chǎn)品正式發(fā)布是在 2023 年 7 月份,經(jīng)過了 18 個月,我們得到了很多 Key accounts 驗證,PMF 走到一定階段后,我們有信心能承接大部分客戶的通用需求,因此在 2025 年初正式開放注冊。
雷峰網(wǎng):免費意味著什么?
喻思成:數(shù)據(jù)普惠不是空談,用戶可以零成本啟動。
現(xiàn)在注冊的用戶飆升很快,客戶數(shù)量也超出預(yù)期。很多客戶是公司里的 Data infra 團隊,做企業(yè)大數(shù)據(jù)的基礎(chǔ)設(shè)施;當然也有使用這些基礎(chǔ)設(shè)施的人,做 Business Analytics、做 BI 的、做數(shù)據(jù)分析或數(shù)據(jù)開發(fā)的。
云器的 Compiler optimizer 都是完全自研,服務(wù)一個客戶和服務(wù)一千個客戶難度完全不一樣,系統(tǒng)壓力非常大,不只是峰值的問題,還包括設(shè)計一個產(chǎn)品要打中一千個人的痛點。
雷峰網(wǎng):云器有考慮跟 AI 的融合嗎?
喻思成:AI 方面一直在做,最近也有發(fā)布 AI 產(chǎn)品 Data GPT,通過 AI 大模型技術(shù),讓不懂 SQL 的業(yè)務(wù)人員也可以直接用自然語言交互,內(nèi)置的指標體系大模型可以把業(yè)務(wù)語言轉(zhuǎn)換成 SQL 查詢業(yè)務(wù)結(jié)果,并展示為報表或圖像。這是在云器 Lakehouse 基礎(chǔ)上的 AI 能力。
雷峰網(wǎng):那未來會考慮做信創(chuàng)嗎?
喻思成:打造信創(chuàng)體系確實在規(guī)劃之中,我們目前正在跟相關(guān)部門積極溝通,推進國產(chǎn)化軟硬件的適配工作。當然,這也要視客戶的需求而定。云器早期的客戶主要集中在線上互聯(lián)網(wǎng)領(lǐng)域,如 SaaS、游戲、電商行業(yè),但隨著產(chǎn)品能力逐漸被大部分企業(yè)認可,業(yè)務(wù)拓展到線下企業(yè),例如車企,以及未來的銀行金融客戶,對信創(chuàng)的需求將會日益凸顯。因此,我們將根據(jù)市場需求,加大在相關(guān)領(lǐng)域的投入。
商業(yè)閉環(huán)從第一天開始培育
雷峰網(wǎng):在開拓客戶過程中會面臨困難嗎?2021 年前后很多數(shù)據(jù)庫公司創(chuàng)業(yè)出來,當時云器創(chuàng)立后在商業(yè)化開拓客戶過程中,會存在數(shù)據(jù)庫市場被之前的公司占領(lǐng)、需要跟他們搶客戶的情況嗎?
喻思成:有,但這種情況往往不太多。目前在中國,我們跟存量的云廠商、大數(shù)據(jù)商業(yè)化平臺一起去服務(wù)和轉(zhuǎn)換的客戶,大部分是開源的使用者?,F(xiàn)在市面上 95% 的大數(shù)據(jù)平臺,都是使用者用開源軟件自己搭建的。但并非所有公司都適合用開源軟件去搭建一個大數(shù)據(jù)平臺,因為非常耗費人力和資源。自建數(shù)據(jù)平臺往往適合規(guī)模較大且技術(shù)較強的公司,對中小型公司、尤其小型公司來說,整體成本難以承受。比如,搭建一個大數(shù)據(jù)平臺需要至少 20 個組件工具,Spark、Clickhouse 等,Data infra 團隊少則兩三人、多則五六人,而且要百臺以上服務(wù)器,每年幾百萬固定的消耗。
從這個角度上說,云器提供了更高效、更經(jīng)濟的解決方案去滿足不同企業(yè)需求。我們更多是轉(zhuǎn)換 95% 的藍海市場,而不是在已轉(zhuǎn)化好的 5% 市場里爭搶。
雷峰網(wǎng):云器的客戶領(lǐng)域行業(yè)上分布也是以金融領(lǐng)域為重嗎,還是會更分散?
喻思成:實際上金融領(lǐng)域并不是我們最初的重點,我們更多關(guān)注線上垂直互聯(lián)網(wǎng),或者叫 Digital native 企業(yè)。因為云器 Lakehouse 就是基于云誕生的,對客戶的云環(huán)境是最基本的要求。目前來看,Digital native 企業(yè)上云比例遠高于傳統(tǒng)企業(yè)。
雷峰網(wǎng):云器的第一個商業(yè)化客戶是誰?
喻思成:一家為跨境電商建站的 SaaS 企業(yè)。
雷峰網(wǎng):所以在云上打磨好之后,之后會去跟金融之類比較傳統(tǒng)的行業(yè)接觸嗎?
喻思成:是的,我們現(xiàn)在已經(jīng)開始逐漸向線下拓展。雖然還不能在本地 IDC 機房里部署,但支持在私有云環(huán)境下安裝。
雷峰網(wǎng):過去在工作中有印象比較深遇到什么困難嗎?
喻思成:我們在過去的一年中打了很多硬仗,比如拿下幾個旗艦級的客戶,如長安汽車、銷售易以及東南亞最大的電商物流公司 NinjaVan等。
初期,客戶對我們的增量計算技術(shù)的通用性、數(shù)據(jù)引擎技術(shù)的效率(數(shù)倍甚至十倍于現(xiàn)有架構(gòu)),以及替代Spark引擎所能帶來的成本降低幅度,初期持懷疑態(tài)度。只有在實際測試體驗過我們的產(chǎn)品后,他們才逐漸認可。因此,如何快速贏得客戶信任,是我們目前面臨的主要挑戰(zhàn)。
為此,我們會組建由我(CEO)或 CTO 帶隊的專案組,內(nèi)部稱之為“小黑屋”, 通常采用方案演示配合POC(概念驗證)的方式,并在客戶上線后,提供全托管的 SaaS 服務(wù),接管其運維工作。這個過程短則一個季度,長的要三個季度。
雷峰網(wǎng):過程中會有覺得困難想放棄的時候嗎?
喻思成:那倒沒有。困難是很多,但我們的團隊絕大部分來自于幾個頭部云廠商和互聯(lián)網(wǎng)廠商的核心團隊,服務(wù)過類似阿里這樣數(shù)據(jù)量、交易量都世界最頭部的客戶后,沒有哪個客戶是服務(wù)不了的。雖然創(chuàng)業(yè)資源有限,但我們堅持提供與頭部廠商同等甚至更高的服務(wù)標準。這要求團隊必須具備極強的戰(zhàn)斗力,而面對大型客戶,大家反而都感到非常興奮。
雷峰網(wǎng):云器創(chuàng)立之初搭建的就是“商務(wù)+技術(shù)+產(chǎn)品”這樣一個完整的團隊組合,但同期很多數(shù)據(jù)庫公司早期可能會更專注于技術(shù)人員的配置上,為什么云器在創(chuàng)立之初就有考慮這樣的配置?
喻思成:云器從最初就重視商業(yè)化。在我們看來,任何一個技術(shù)不成為產(chǎn)品是沒有作用的,任何一個產(chǎn)品不能商業(yè)化也是沒有意義的。很多技術(shù)聽起來高大上,但不能產(chǎn)品化;或者產(chǎn)品聽起來很好但客戶不買單。我們不希望悶頭做兩年產(chǎn)品后到市場上發(fā)現(xiàn)完全不對,再回去從頭開始閉門造車。
雷峰網(wǎng):所以在前期打磨產(chǎn)品時已經(jīng)一邊去跟市場接觸、了解用戶需求。
喻思成:對。我們在產(chǎn)品研發(fā)時,商業(yè)化團隊就定了一個目標:要和 100 個客戶接觸,問他們“我目前準備做這個產(chǎn)品,你會不會買單”。
在新技術(shù)來臨前占據(jù)好位置
雷峰網(wǎng):您感覺國內(nèi)數(shù)據(jù)庫市場發(fā)展到現(xiàn)在,比起云器創(chuàng)立初期來說有什么變化?
喻思成:這是個好問題。我個人覺得,2021 年大家已經(jīng)感受到整個市場在未來十年內(nèi)會有大升級,所以很多人出來創(chuàng)業(yè)。但到 2024 年市場環(huán)境經(jīng)濟形勢不如人意,包括云器在內(nèi)的一些公司,選擇出海,國內(nèi)外同時布局。但全球來看,2021 年看到的未來十年整個代際升級的趨勢依然存在,Databricks 最近的融資也可以看出, AI 浪潮下的 Data Infra 需求呈幾倍甚至指數(shù)級增長。
其實很多國內(nèi)做大數(shù)據(jù)平臺的友商聚焦點不一樣。有的做最上層的 BI 展現(xiàn),再往下可能是指標,做數(shù)據(jù)精細化加工,還有做數(shù)據(jù)中臺,再往下有專門做 ETL 編排的,都是為了幫助客戶把數(shù)據(jù)真正用起來,數(shù)據(jù)已經(jīng)有了,如何讓數(shù)據(jù)幫客戶產(chǎn)生更好的價值。云器是做最底下那一層,數(shù)倉,離客戶的直接業(yè)務(wù)還是比較遠,更偏技術(shù)性。所以雖然也感受到經(jīng)濟的起伏,但感受到的并不像其他友商那么多。
雷峰網(wǎng):感受不像其他友商那么多,是因為技術(shù)上的需求不會因為經(jīng)濟波動有很大的影響?
喻思成:對,因為上層或者越往上靠的廠商,要了解客戶的業(yè)務(wù)和行業(yè),要回答的問題是怎么幫客戶用數(shù)據(jù)賺錢。但云器的客戶大部分都是“成熟客戶”,如果客戶上來就說“我手里有數(shù)據(jù)但我不知道怎么變現(xiàn)”,那這就不是我們的客戶。
雷峰網(wǎng):現(xiàn)在大家都在做數(shù)據(jù)普惠化。
喻思成:我們也在做數(shù)據(jù)普惠化。目前開放注冊后企業(yè)可以以零成本啟動,再按需付費。很多客戶希望能以低成本進行數(shù)據(jù)處理,而不是投入百萬級別的資金來搭建大平臺。云器的最低消費客戶每月只需支付大約 10 元人民幣,這大大降低了使用成本。
雷峰網(wǎng):所以您講的“成熟客戶”,也是云器在選客戶時著重看的標準是嗎?
喻思成:對。舉個例子,如果數(shù)據(jù)是原材料,大數(shù)據(jù)平臺就是廚房,客戶做數(shù)據(jù)分析的人員就是廚師,其用戶就是外面的食客。我們看一個客戶是不是成熟,就看這個食客比例有多高。如果這個企業(yè)里有 30% 以上的人沒有數(shù)據(jù)就開不了工,說明它真的是數(shù)據(jù)驅(qū)動型企業(yè);但如果整個公司數(shù)據(jù)只有老板定期看看報表,這就不是一個很成熟的企業(yè)。
云器是做廚具的,讓客戶只需要留下廚師,不需要另起爐灶。成熟的客戶就像廚師,他們知道如何做菜,而我們的工具就是幫助他們做得更好。
雷峰網(wǎng):您也提過中國用戶對數(shù)據(jù)平臺的選擇很多時候不是簡單常理推論可得,不是一個特別容易拓展的市場,您觀察到大家有些什么樣的選擇特點?
喻思成:中國的客戶大致分為兩類:一種是能獨立做菜的,另一種是不知道怎么做菜的。對于后者,最開始要解決的就是要給他們提供咨詢服務(wù),告訴他們 Data monetization(數(shù)據(jù)價值實現(xiàn)) 如何做。隨著市場的發(fā)展,越來越多企業(yè)能自己做菜,但偏向咨詢的業(yè)務(wù)模式并不適合我們,我們更傾向于做產(chǎn)品型公司。
雷峰網(wǎng):Databricks 在 2020 年提出湖倉一體,當時還是比較新的概念?,F(xiàn)在發(fā)展到 2025 年,您對湖倉一體的認知上會有什么變化嗎?
喻思成:沒有變化過。我們很幸運,當時就堅定地做下來。AI 大模型的出現(xiàn)將加速這一趨勢,未來幾乎所有企業(yè)都能利用它來實現(xiàn) AI 應(yīng)用,將結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)存儲在一個 Lakehouse 中,滿足不同客戶的需求。
雷峰網(wǎng):眼下推進湖倉一體會面臨什么難點嗎?
喻思成:沒有太大障礙,大家基本默認數(shù)據(jù)庫底下要用湖倉一體,這也是為什么 Databricks 這幾年估值漲得非???;另外我們也看到更多機會,例如在云湖倉上有更高時效性的數(shù)據(jù)分析的需求。
雷峰網(wǎng):會有新出現(xiàn)的技術(shù)給湖倉一體落地帶來挑戰(zhàn)嗎?
喻思成:目前沒有,湖倉架構(gòu)本身已經(jīng)得到業(yè)界廣泛認可,主要還是一個標準花落誰家的問題。就像目前數(shù)據(jù)庫三個標準,Delta Lake、Hudi,之前 Databricks 把 Iceberg 也收購了,就看最后誰來掌控數(shù)據(jù)湖的標準。而我們思考的是提前布局,構(gòu)建更加“一體化”融合的數(shù)據(jù)平臺。因此云器發(fā)布的包括一體化引擎 Single-Engine,以及實現(xiàn)的通用“增量計算”技術(shù),正是為了提前布局下一代數(shù)據(jù)平臺的技術(shù)能力,應(yīng)對未來更深層次的融合需求。
雷峰網(wǎng):這幾年云器商業(yè)化過程中會面臨什么困難嗎?
喻思成:我們到今天為止,最大的困難都還是怎么能發(fā)展得更快一些。我們的商業(yè)化版圖一直在擴張,但始終對我們來說最大的問題都是怎么能跑得快一些、再快一些。
雷峰網(wǎng):是覺得有哪里發(fā)展得慢了,有些焦慮嗎?
喻思成:我們不希望做一個緩慢成長的公司。
雷峰網(wǎng):怎么定義“緩慢成長”?
喻思成:很多人說“慢即是快”,它確實有哲學含義,但我覺得還是要能很快在一個商業(yè)化環(huán)境里迭代驗證自己。2021 年數(shù)倉向數(shù)據(jù)湖發(fā)展,2023 年就開始出現(xiàn)生成式AI(GenAI),迭代速度會越來越快。Deepseek 出現(xiàn)后,下一個 Deepseek 很快就會出現(xiàn)。我們希望在下一代技術(shù)來臨前,占據(jù)一個好的位置、一個領(lǐng)導者的位置。
專題介紹
2020年前后,國產(chǎn)數(shù)據(jù)庫創(chuàng)業(yè)大潮洶涌。然而,隨著AI大模型的出現(xiàn),人們視線的聚焦與資本的興趣也發(fā)生轉(zhuǎn)變。五年過去,國內(nèi)的數(shù)據(jù)庫公司現(xiàn)狀如何?他們在做什么新的嘗試?又遇到什么新的困難?本專題與一系列數(shù)據(jù)庫創(chuàng)業(yè)公司的創(chuàng)始人對話,回顧近年數(shù)據(jù)庫公司在商業(yè)和技術(shù)領(lǐng)域的探索??v然面對數(shù)據(jù)庫市場的寒冬,從業(yè)者們各有招數(shù),懷揣著對數(shù)據(jù)庫的理想與確信,走出各具特色的商業(yè)化之路。我們誠邀對此專題感興趣的從業(yè)者共同參與討論,或是作為受訪對象分享您的真知灼見。歡迎添加微信 Ericazhao23。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。