0
本文作者: 趙之齊 | 2025-01-14 14:45 |
隨著企業(yè)數(shù)據(jù)增加,尋找有效方法管理復(fù)雜、相互關(guān)聯(lián)的數(shù)據(jù)也日益重要。比起傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(kù),圖數(shù)據(jù)庫(kù)更擅長(zhǎng)于此。
Business Research Insights的報(bào)告顯示,2023年全球圖數(shù)據(jù)庫(kù)規(guī)模約6億美元,預(yù)計(jì)2032年將達(dá)到21.6億,2023年至2032年復(fù)合增長(zhǎng)率預(yù)計(jì)為18.2%。國(guó)內(nèi)也有調(diào)研顯示,95%企業(yè)認(rèn)為圖數(shù)據(jù)庫(kù)是重要的數(shù)據(jù)管理工具,超65%的廠(chǎng)商認(rèn)為業(yè)務(wù)上圖數(shù)據(jù)庫(kù)優(yōu)于其他選擇,目前應(yīng)用場(chǎng)景主要集中在金融風(fēng)控、欺詐檢測(cè)等。
不過(guò),由于目前市場(chǎng)教育仍需提升、圖數(shù)據(jù)庫(kù)的生態(tài)系統(tǒng)和行業(yè)應(yīng)用場(chǎng)景有待完善拓寬等,整體而言,圖數(shù)據(jù)庫(kù)使用仍處于早期階段。
作為圖數(shù)據(jù)庫(kù)市場(chǎng)玩家之一的嬴圖成立于2019年,已入選Gartner? 2022《圖數(shù)據(jù)庫(kù)管理系統(tǒng)市場(chǎng)指南》全球代表廠(chǎng)商,以及登上DataTech 50 2024 / ESG FinTech100全球獎(jiǎng)項(xiàng)名單,其在全球圖數(shù)據(jù)庫(kù)行業(yè)地位可見(jiàn)一斑。嬴圖也于去年發(fā)布Powerhouse,標(biāo)志產(chǎn)品架構(gòu)的徹底革新,為復(fù)雜數(shù)據(jù)計(jì)算、分析和存儲(chǔ)提供快速?gòu)?qiáng)大的動(dòng)力支持。
嬴圖的成績(jī)單熠熠閃耀。嬴圖創(chuàng)始人兼CEO孫宇熙向雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))回顧嬴圖的成長(zhǎng)歷程,感慨完成產(chǎn)品“不可能三角”的閉環(huán)并不容易。從0到1,嬴圖如何在圖數(shù)據(jù)庫(kù)市場(chǎng)中打出自己的名聲?已經(jīng)是第四次創(chuàng)業(yè)的孫宇熙,這些年對(duì)數(shù)據(jù)庫(kù)市場(chǎng)又有何觀(guān)察?
嬴圖創(chuàng)始人兼CEO孫宇熙
數(shù)據(jù)庫(kù)的市場(chǎng)教育是踩坑踩過(guò)來(lái)的
做好圖數(shù)據(jù)庫(kù)這個(gè)目標(biāo),起源于孫宇熙在2016年的一次創(chuàng)業(yè)嘗試。
當(dāng)時(shí)他從EMC離開(kāi),結(jié)束了自己九年的大廠(chǎng)工作生涯后,用兩三年做了名為全歷史(Allhistory)的文化產(chǎn)品。這個(gè)網(wǎng)站的內(nèi)核是知識(shí)圖譜,對(duì)內(nèi)容關(guān)聯(lián)性的要求很強(qiáng)。然而,團(tuán)隊(duì)在市場(chǎng)調(diào)研后發(fā)現(xiàn),當(dāng)時(shí)很多圖數(shù)據(jù)庫(kù)都算力不足,數(shù)據(jù)庫(kù)穿透能力很差,耗費(fèi)大量資源。
孫宇熙沒(méi)能找到滿(mǎn)意的圖數(shù)據(jù)庫(kù)。2019年,他親自下場(chǎng),成立了嬴圖。
不同于傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(kù),圖數(shù)據(jù)庫(kù)具有更高的靈活性,支持高維建模和動(dòng)態(tài)建模;能進(jìn)行更高效的復(fù)雜查詢(xún)與計(jì)算、多表關(guān)聯(lián)查詢(xún),能實(shí)現(xiàn)動(dòng)態(tài)、海量、復(fù)雜模型的實(shí)時(shí)計(jì)算與分析;并且是白盒化、可解釋的。尤其在查詢(xún)邏輯上,圖數(shù)據(jù)架構(gòu)在關(guān)聯(lián)查詢(xún)時(shí),效率會(huì)顯著高于關(guān)系型數(shù)據(jù)庫(kù);隨著查詢(xún)深度增加,時(shí)耗差異會(huì)指數(shù)級(jí)增加。
然而,當(dāng)時(shí)以傳統(tǒng)數(shù)據(jù)庫(kù)為默認(rèn)選項(xiàng)的市場(chǎng),對(duì)圖數(shù)據(jù)庫(kù)的接受如何?
孫宇熙指出,過(guò)去幾年的數(shù)據(jù)庫(kù)市場(chǎng)混亂,極大考驗(yàn)用戶(hù)的判斷能力。一個(gè)悖論是:用戶(hù)要知道產(chǎn)品好壞就要使用產(chǎn)品,但使用產(chǎn)品前往往需要先采購(gòu)——有些POC只是走一輪過(guò)場(chǎng),讓用戶(hù)在判斷產(chǎn)品真實(shí)效力時(shí)仍舉步維艱。而且,圖數(shù)據(jù)庫(kù)應(yīng)能做關(guān)聯(lián)分析,但可能是漢字使用習(xí)慣導(dǎo)致,有中國(guó)IT從業(yè)者會(huì)習(xí)慣性認(rèn)為數(shù)據(jù)“庫(kù)”就是只存不算。
舉例來(lái)說(shuō),把全國(guó)工商數(shù)據(jù)導(dǎo)在圖數(shù)據(jù)庫(kù)里,若想知道某公司的對(duì)外投資網(wǎng)絡(luò)里有多少股份在百分之幾以上的被投公司,只存不算的數(shù)據(jù)庫(kù)無(wú)法進(jìn)行遞歸式穿透,需要把數(shù)據(jù)導(dǎo)到Apache Spark或Apache Hadoop再寫(xiě)一套程序,之后把結(jié)果導(dǎo)到Excel里傳回或做成報(bào)表,再找一套可視化工具實(shí)現(xiàn)。本該實(shí)時(shí)完成的事變成大規(guī)模批處理,要橫跨幾個(gè)部門(mén)、花幾天,甚至幾周才能實(shí)現(xiàn)。
很多頭部金融機(jī)構(gòu)和銀行都走過(guò)“采購(gòu)只存不算的圖數(shù)據(jù)庫(kù)”的彎路,可以說(shuō),數(shù)據(jù)庫(kù)的市場(chǎng)教育是大家踩坑踩過(guò)來(lái)的。尤其早期,涉及到認(rèn)知層面的碰撞都會(huì)很激烈——當(dāng)時(shí)有的客戶(hù)并不重視實(shí)時(shí)性的意義,嬴圖的產(chǎn)品創(chuàng)新在他們眼中就一文不值,“當(dāng)你不覺(jué)得越快越強(qiáng)是一件好事時(shí),就會(huì)陷入螺旋式內(nèi)卷”。
嬴圖圖數(shù)據(jù)庫(kù)產(chǎn)品2大核心,分別是底層的實(shí)時(shí)圖數(shù)據(jù)庫(kù)與上層的高可視化平臺(tái)。底層的分布式、可擴(kuò)展、可彈性的高性能原生圖數(shù)據(jù)庫(kù),能承載萬(wàn)億級(jí)點(diǎn)邊的超大規(guī)模數(shù)據(jù)集,通過(guò)超融合統(tǒng)一圖計(jì)算架構(gòu),提供達(dá)到實(shí)時(shí)級(jí)別的微秒、毫秒級(jí)查詢(xún)和分析。
市場(chǎng)教育需要時(shí)間,是一種集體意識(shí)。所幸,對(duì)實(shí)時(shí)性的重視一傳十、十傳百,孫宇熙在這六年里已感受到頭部和中部客戶(hù)的認(rèn)知在發(fā)生變化。
嬴圖圖數(shù)據(jù)庫(kù)的存儲(chǔ)引擎、計(jì)算引擎,甚至查詢(xún)語(yǔ)言都是自研。新的查詢(xún)語(yǔ)言是否會(huì)給用戶(hù)帶來(lái)學(xué)習(xí)壓力?2024年4月,國(guó)際標(biāo)準(zhǔn)化組織(ISO)和國(guó)際電工委員會(huì)(IEC)發(fā)布了圖查詢(xún)語(yǔ)言(GQL)國(guó)際標(biāo)準(zhǔn)的第一個(gè)正式版本,嬴圖9月就在其最新的Powerhouse版本中提供GQL支持。在孫宇熙看來(lái),標(biāo)準(zhǔn)出現(xiàn)后對(duì)技術(shù)人員而言就不存在學(xué)習(xí)成本了,需要考慮的只是在SQL和GQL之間做抉擇。
到今天,孫宇熙都相信,圖數(shù)據(jù)庫(kù)是一種終極數(shù)據(jù)庫(kù)?,F(xiàn)在市場(chǎng)上同類(lèi)玩家不多,他這么理解:任何東西有足夠的門(mén)檻,做的人就一定很少。
產(chǎn)品從1做到99 要五到十年
創(chuàng)業(yè)初期做市場(chǎng)調(diào)研時(shí),孫宇熙發(fā)現(xiàn),國(guó)內(nèi)市場(chǎng)內(nèi)有三百多種不同類(lèi)型的數(shù)據(jù)庫(kù),但具體落地質(zhì)量參差不齊。早期他經(jīng)常被投資人問(wèn)到一個(gè)問(wèn)題:你這個(gè)產(chǎn)品是基于哪篇論文的?
“有基于一篇論文可以做出的產(chǎn)品嗎?一個(gè)產(chǎn)品通常要基于上百或上千篇論文吧”,孫宇熙答到。
他指出,光是計(jì)算引擎就可能要建立在一兩百篇論文的基礎(chǔ)上,而圖數(shù)據(jù)庫(kù)還包含存儲(chǔ)引擎、圖查詢(xún)語(yǔ)言編譯器或優(yōu)化器、數(shù)據(jù)庫(kù)管理組件等,還涉及到大量可視化問(wèn)題,這些都建基于浩如煙海的文獻(xiàn)。在一篇論文基礎(chǔ)上做出的產(chǎn)品,只能說(shuō)是“PPT創(chuàng)業(yè)”。
產(chǎn)品做出來(lái)還只是第一步,距離真正工業(yè)化道阻且長(zhǎng)。以金融業(yè)為例,他們對(duì)產(chǎn)品效率、系統(tǒng)穩(wěn)定性和精準(zhǔn)性要求很高,要把產(chǎn)品從0到1再做到99甚至120分,才有可能被采納。而產(chǎn)品從0到1可能只需花費(fèi)一年,但1到99就可能要花五到十年時(shí)間?!昂芏鄸|西做到最后都是工程,一個(gè)重研究輕工程的公司是極其危險(xiǎn)的”。
孫宇熙向雷峰網(wǎng)表示,“功能的完善”、“穩(wěn)定性”、“效率”這三個(gè)重要維度,是數(shù)據(jù)庫(kù)級(jí)別產(chǎn)品的“不可能三角”——這個(gè)三角沒(méi)有四五年,基本不可能達(dá)到閉環(huán)。巨大的時(shí)間成本對(duì)寸光陰寸金的創(chuàng)業(yè)公司而言,也是莫大考驗(yàn)。嬴圖在相當(dāng)長(zhǎng)一段時(shí)間里,做產(chǎn)品研發(fā)都依靠自己的資金儲(chǔ)備。
嬴圖成立于2019年,到現(xiàn)在已邁入第七個(gè)年頭。頭兩年公司還在做產(chǎn)品的閉環(huán),第一年大量時(shí)間進(jìn)行內(nèi)部試驗(yàn),實(shí)現(xiàn)高效的計(jì)算引擎;第二年把計(jì)算引擎的功能補(bǔ)全,讓它跟存儲(chǔ)引擎結(jié)合,實(shí)現(xiàn)端到端閉環(huán)。真正商業(yè)化落地是在第三年。
2021年開(kāi)始,產(chǎn)品進(jìn)行不斷迭代,一直到公司成立后的第四第五年,這個(gè)“不可能三角”才逐步閉環(huán)并增強(qiáng)。這時(shí)孫宇熙回顧兩年前產(chǎn)品,發(fā)現(xiàn)它就是“能用,但不完善”,“挺痛苦的,意味著那不是一個(gè)標(biāo)準(zhǔn)化的解決方案”。與國(guó)內(nèi)眾多廠(chǎng)商不同,嬴圖并不滿(mǎn)足于只提供定制化的解決方案。以全球金融風(fēng)險(xiǎn)管理領(lǐng)域?yàn)槔?021 年,嬴圖為某銀行定制的流動(dòng)性風(fēng)險(xiǎn)管理圖中臺(tái)系統(tǒng),一經(jīng)推出就斬獲國(guó)際唯一的 “流動(dòng)性風(fēng)險(xiǎn)管理成就獎(jiǎng)”,還被 IBM 研究院收錄為案例。但孫宇熙深知,定制化雖能解一時(shí)之需,卻難以推動(dòng)行業(yè)的長(zhǎng)遠(yuǎn)發(fā)展。所以,打破定制化局限,創(chuàng)造更具價(jià)值的創(chuàng)新樣本,通過(guò)金融+科技手段,才是將金融風(fēng)險(xiǎn)管理邁向更普適、高效的后手棋。
在這兩年,嬴圖數(shù)據(jù)庫(kù)在持續(xù)的場(chǎng)景拓展過(guò)程中,研發(fā)團(tuán)隊(duì)緊密?chē)@實(shí)際反饋,對(duì)產(chǎn)品性能進(jìn)行全方位、深層次的優(yōu)化,針對(duì)不同場(chǎng)景下的特殊需求,從硬件配置到軟件算法,從底層系統(tǒng)到交互展示逐一精雕細(xì)琢,其系統(tǒng)通用性能夠無(wú)縫適配各類(lèi)環(huán)境與用戶(hù)需求。孫宇熙指出,可拓展性也是產(chǎn)品的一大重要性能?,F(xiàn)在市場(chǎng)上大量產(chǎn)品沒(méi)有可拓展性,只能服務(wù)中小玩家——如果面對(duì)大玩家的海量數(shù)據(jù),有拓展性的情況下還要穩(wěn)定,且葆有良好的性能,這幾乎又是一個(gè)“不可能三角”。
不過(guò),即便見(jiàn)過(guò)很多場(chǎng)景,國(guó)內(nèi)數(shù)據(jù)庫(kù)公司仍面臨較普遍的發(fā)展痛點(diǎn),即甲方基本把乙方當(dāng)“外包團(tuán)隊(duì)”使用。孫宇熙說(shuō)道,中國(guó)許多甲方高度依賴(lài)乙方,要乙方幫忙尋找需求、設(shè)計(jì)產(chǎn)品,但知識(shí)產(chǎn)權(quán)理論上都?xì)w給甲方。這種合作模式會(huì)導(dǎo)致乙方永遠(yuǎn)在給別人高度定制開(kāi)發(fā),所做的內(nèi)容沒(méi)有延續(xù)性。
他也感受到,很多時(shí)候頭部金融機(jī)構(gòu)更能明白自己的需求,也因此,嬴圖很多早期的客戶(hù)是頭部金融機(jī)構(gòu),在雙方合作中打磨產(chǎn)品。
嬴圖的又一挑戰(zhàn)是身處后疫情時(shí)代,客戶(hù)沒(méi)錢(qián),資本市場(chǎng)干涸,劣幣驅(qū)逐良幣,價(jià)格戰(zhàn)愈演愈烈。在孫宇熙看來(lái),這是一件三敗俱傷的事情:有企業(yè)用十萬(wàn)去做本該用一百萬(wàn)完成的工程,打敗競(jìng)對(duì)拿下單子,但這大概率會(huì)是個(gè)爛尾工程;客戶(hù)會(huì)因過(guò)多爛尾工程而對(duì)整個(gè)行業(yè)產(chǎn)生失望,投入更少,導(dǎo)致行業(yè)間爭(zhēng)搶更加激烈,由此陷入惡性循環(huán)。
要走過(guò)辛苦的時(shí)期,嬴圖很注重開(kāi)源節(jié)流。比如孫宇熙很早就留意到了,公有云并不便宜。于是他們?cè)趫F(tuán)隊(duì)規(guī)模還在十人上下時(shí),便決定自己搭建私有云,這已經(jīng)夠幾十人開(kāi)發(fā)測(cè)試應(yīng)用,即便加上電費(fèi)、存儲(chǔ)硬盤(pán)和監(jiān)控網(wǎng)絡(luò)等成本,一年下來(lái)也只相當(dāng)于用公有云兩個(gè)月的成本,且能保障數(shù)據(jù)安全。
嬴圖推出的一系列相關(guān)專(zhuān)著 。
第四次創(chuàng)業(yè) 情緒內(nèi)核穩(wěn)定是重要招人標(biāo)準(zhǔn)
前段時(shí)間,孫宇熙參加了清華一個(gè)人工智能和大數(shù)據(jù)專(zhuān)委會(huì),與老師和畢業(yè)校友相聚。大家都在聊出海,嬴圖現(xiàn)在也得談?wù)摮龊5膯?wèn)題。
嬴圖的出海計(jì)劃里,跟云廠(chǎng)商合作是一個(gè)重要方向。孫宇熙指出,今年年初,嬴圖已發(fā)布了嬴圖Cloud2.1版本,并已在海外上線(xiàn)。因嬴圖客戶(hù)大多是大型企業(yè),海外的云廠(chǎng)商可以整套組件都部署到客戶(hù)那端,其API、SDK都能直接調(diào)用,云上的解決方案如圖數(shù)據(jù)庫(kù)等可以遷移。
國(guó)內(nèi)圖數(shù)據(jù)庫(kù)市場(chǎng)玩家中也不乏螞蟻、華為等大廠(chǎng)的身影,但孫宇熙對(duì)嬴圖在競(jìng)爭(zhēng)中的優(yōu)勢(shì)依然頗有信心。他觀(guān)察到,目前“old money”頭部金融機(jī)構(gòu)依然是數(shù)據(jù)庫(kù)的重要客戶(hù),但有時(shí)互聯(lián)網(wǎng)的產(chǎn)品放到監(jiān)管?chē)?yán)格、合規(guī)流程要求多的金融機(jī)構(gòu)里,容易水土不服;且有時(shí)大廠(chǎng)內(nèi)部復(fù)雜的陣營(yíng)傾向與立場(chǎng)分歧,也會(huì)極大影響產(chǎn)品研發(fā)。
這也是他在過(guò)往的職業(yè)生涯中所感受到的。
孫宇熙在清華計(jì)算機(jī)系學(xué)EDA,做CPU芯片設(shè)計(jì)。畢業(yè)后,比起做硬件底層,他更喜歡做網(wǎng)絡(luò)、操作系統(tǒng),在雅虎美國(guó)、微軟亞太研發(fā)集團(tuán)就職過(guò)研發(fā)或研發(fā)管理相關(guān)崗位,并曾任EMC亞太研發(fā)集團(tuán)CTO和中國(guó)研究院院長(zhǎng)。
談起微軟,孫宇熙印象深刻的是“建設(shè)性批評(píng)”的企業(yè)文化。它確實(shí)存在積極的一面,但硬幣的另一面也會(huì)表現(xiàn)為不同部門(mén)甚至同部門(mén)內(nèi)的微妙博弈或隱形抗衡。
也因?yàn)榇?,嬴圖從創(chuàng)立之日起就崇尚TEAL文化,強(qiáng)調(diào)組織的自主性、完整性和進(jìn)化性。團(tuán)隊(duì)的員工情緒(內(nèi)核)都非常穩(wěn)定——這是嬴圖招聘時(shí)著重考慮的一點(diǎn),再次才是寫(xiě)代碼、調(diào)試測(cè)試的功夫等,“情緒穩(wěn)定代表心智的成熟和把控自己情緒的能力,這并不容易,有的需要后天極大魄力才能學(xué)會(huì)”。
嬴圖為員工舉辦的研學(xué)沙龍分享活動(dòng),特別邀請(qǐng)了國(guó)際知名績(jī)效科學(xué)領(lǐng)域的Ken West 博士。其分享內(nèi)容聚焦于如何通過(guò)改變潛意識(shí)、提升自我意識(shí)以及激發(fā)正能量。
嬴圖是孫宇熙的第四次創(chuàng)業(yè)。他從1999年碩士畢業(yè)到現(xiàn)在工作的近25年中,有十五年時(shí)間基本都在創(chuàng)業(yè)。小公司從融資到退出或跟大公司合并的過(guò)程,他已經(jīng)歷過(guò)三次,可以說(shuō)是一個(gè)創(chuàng)業(yè)愛(ài)好者。
在孫宇熙看來(lái),自己能承受普通人難以承受的壓力,甚至不覺(jué)得那是壓力。對(duì)于過(guò)往他并沒(méi)有太多惋惜,“典型的創(chuàng)業(yè)者會(huì)選擇忘記遺憾”,但在很多個(gè)有所突破的時(shí)刻,他都感到成就滿(mǎn)滿(mǎn)——
面對(duì)圖數(shù)據(jù)庫(kù)所需的高計(jì)算力,嬴圖很早就意識(shí)到,需要解決的核心問(wèn)題是對(duì)超級(jí)節(jié)點(diǎn)極其高效地穿透?,F(xiàn)在,嬴圖有個(gè)名為“超級(jí)節(jié)點(diǎn)穿透”的核心專(zhuān)利,是全世界首個(gè)探索超級(jí)節(jié)點(diǎn)排序技術(shù)的專(zhuān)利,也僅此一個(gè)。
當(dāng)時(shí)團(tuán)隊(duì)嘗試了幾周都沒(méi)能把這串代碼跑通。有次孫宇熙在一個(gè)國(guó)際航班起飛前都還在嘗試。起飛關(guān)電腦后,他左思右想睡不著,半夢(mèng)半醒間有了靈感,打開(kāi)電腦寫(xiě)了一個(gè)多小時(shí),終于把這串代碼跑通。
那是在2019年下半年,他已記不清自己當(dāng)時(shí)是找乘務(wù)員要了杯酒,還是原地振臂高呼了兩聲,但無(wú)比確切的是當(dāng)時(shí)真的超級(jí)興奮。
在2025年的開(kāi)始,孫宇熙對(duì)未來(lái)充滿(mǎn)信心。他相信,隨著市場(chǎng)對(duì)圖數(shù)據(jù)庫(kù)有更好認(rèn)知,而嬴圖又能為客戶(hù)創(chuàng)造降本增效的產(chǎn)品和解決方案,再次偉大的機(jī)會(huì)也在眼前。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。