0
隨著企業(yè)數據增加,尋找有效方法管理復雜、相互關聯的數據也日益重要。比起傳統的關系型數據庫,圖數據庫更擅長于此。
Business Research Insights的報告顯示,2023年全球圖數據庫規(guī)模約6億美元,預計2032年將達到21.6億,2023年至2032年復合增長率預計為18.2%。國內也有調研顯示,95%企業(yè)認為圖數據庫是重要的數據管理工具,超65%的廠商認為業(yè)務上圖數據庫優(yōu)于其他選擇,目前應用場景主要集中在金融風控、欺詐檢測等。
不過,由于目前市場教育仍需提升、圖數據庫的生態(tài)系統和行業(yè)應用場景有待完善拓寬等,整體而言,圖數據庫使用仍處于早期階段。
作為圖數據庫市場玩家之一的嬴圖成立于2019年,已入選Gartner? 2022《圖數據庫管理系統市場指南》全球代表廠商,以及登上DataTech 50 2024 / ESG FinTech100全球獎項名單,其在全球圖數據庫行業(yè)地位可見一斑。嬴圖也于去年發(fā)布Powerhouse,標志產品架構的徹底革新,為復雜數據計算、分析和存儲提供快速強大的動力支持。
嬴圖的成績單熠熠閃耀。嬴圖創(chuàng)始人兼CEO孫宇熙向雷峰網回顧嬴圖的成長歷程,感慨完成產品“不可能三角”的閉環(huán)并不容易。從0到1,嬴圖如何在圖數據庫市場中打出自己的名聲?已經是第四次創(chuàng)業(yè)的孫宇熙,這些年對數據庫市場又有何觀察?
嬴圖創(chuàng)始人兼CEO孫宇熙
數據庫的市場教育是踩坑踩過來的
做好圖數據庫這個目標,起源于孫宇熙在2016年的一次創(chuàng)業(yè)嘗試。
當時他從EMC離開,結束了自己九年的大廠工作生涯后,用兩三年做了名為全歷史(Allhistory)的文化產品。這個網站的內核是知識圖譜,對內容關聯性的要求很強。然而,團隊在市場調研后發(fā)現,當時很多圖數據庫都算力不足,數據庫穿透能力很差,耗費大量資源。
孫宇熙沒能找到滿意的圖數據庫。2019年,他親自下場,成立了嬴圖。
不同于傳統的關系型數據庫,圖數據庫具有更高的靈活性,支持高維建模和動態(tài)建模;能進行更高效的復雜查詢與計算、多表關聯查詢,能實現動態(tài)、海量、復雜模型的實時計算與分析;并且是白盒化、可解釋的。尤其在查詢邏輯上,圖數據架構在關聯查詢時,效率會顯著高于關系型數據庫;隨著查詢深度增加,時耗差異會指數級增加。
然而,當時以傳統數據庫為默認選項的市場,對圖數據庫的接受如何?
孫宇熙指出,過去幾年的數據庫市場混亂,極大考驗用戶的判斷能力。一個悖論是:用戶要知道產品好壞就要使用產品,但使用產品前往往需要先采購——有些POC只是走一輪過場,讓用戶在判斷產品真實效力時仍舉步維艱。而且,圖數據庫應能做關聯分析,但可能是漢字使用習慣導致,有中國IT從業(yè)者會習慣性認為數據“庫”就是只存不算。
舉例來說,把全國工商數據導在圖數據庫里,若想知道某公司的對外投資網絡里有多少股份在百分之幾以上的被投公司,只存不算的數據庫無法進行遞歸式穿透,需要把數據導到Apache Spark或Apache Hadoop再寫一套程序,之后把結果導到Excel里傳回或做成報表,再找一套可視化工具實現。本該實時完成的事變成大規(guī)模批處理,要橫跨幾個部門、花幾天,甚至幾周才能實現。
很多頭部金融機構和銀行都走過“采購只存不算的圖數據庫”的彎路,可以說,數據庫的市場教育是大家踩坑踩過來的。尤其早期,涉及到認知層面的碰撞都會很激烈——當時有的客戶并不重視實時性的意義,嬴圖的產品創(chuàng)新在他們眼中就一文不值,“當你不覺得越快越強是一件好事時,就會陷入螺旋式內卷”。
嬴圖圖數據庫產品2大核心,分別是底層的實時圖數據庫與上層的高可視化平臺。底層的分布式、可擴展、可彈性的高性能原生圖數據庫,能承載萬億級點邊的超大規(guī)模數據集,通過超融合統一圖計算架構,提供達到實時級別的微秒、毫秒級查詢和分析。
市場教育需要時間,是一種集體意識。所幸,對實時性的重視一傳十、十傳百,孫宇熙在這六年里已感受到頭部和中部客戶的認知在發(fā)生變化。
嬴圖圖數據庫的存儲引擎、計算引擎,甚至查詢語言都是自研。新的查詢語言是否會給用戶帶來學習壓力?2024年4月,國際標準化組織(ISO)和國際電工委員會(IEC)發(fā)布了圖查詢語言(GQL)國際標準的第一個正式版本,嬴圖9月就在其最新的Powerhouse版本中提供GQL支持。在孫宇熙看來,標準出現后對技術人員而言就不存在學習成本了,需要考慮的只是在SQL和GQL之間做抉擇。
到今天,孫宇熙都相信,圖數據庫是一種終極數據庫。現在市場上同類玩家不多,他這么理解:任何東西有足夠的門檻,做的人就一定很少。
產品從1做到99 要五到十年
創(chuàng)業(yè)初期做市場調研時,孫宇熙發(fā)現,國內市場內有三百多種不同類型的數據庫,但具體落地質量參差不齊。早期他經常被投資人問到一個問題:你這個產品是基于哪篇論文的?
“有基于一篇論文可以做出的產品嗎?一個產品通常要基于上百或上千篇論文吧”,孫宇熙答到。
他指出,光是計算引擎就可能要建立在一兩百篇論文的基礎上,而圖數據庫還包含存儲引擎、圖查詢語言編譯器或優(yōu)化器、數據庫管理組件等,還涉及到大量可視化問題,這些都建基于浩如煙海的文獻。在一篇論文基礎上做出的產品,只能說是“PPT創(chuàng)業(yè)”。
產品做出來還只是第一步,距離真正工業(yè)化道阻且長。以金融業(yè)為例,他們對產品效率、系統穩(wěn)定性和精準性要求很高,要把產品從0到1再做到99甚至120分,才有可能被采納。而產品從0到1可能只需花費一年,但1到99就可能要花五到十年時間?!昂芏鄸|西做到最后都是工程,一個重研究輕工程的公司是極其危險的”。
孫宇熙向雷峰網(公眾號:雷峰網)表示,“功能的完善”、“穩(wěn)定性”、“效率”這三個重要維度,是數據庫級別產品的“不可能三角”——這個三角沒有四五年,基本不可能達到閉環(huán)。巨大的時間成本對寸光陰寸金的創(chuàng)業(yè)公司而言,也是莫大考驗。嬴圖在相當長一段時間里,做產品研發(fā)都依靠自己的資金儲備。
嬴圖成立于2019年,到現在已邁入第七個年頭。頭兩年公司還在做產品的閉環(huán),第一年大量時間進行內部試驗,實現高效的計算引擎;第二年把計算引擎的功能補全,讓它跟存儲引擎結合,實現端到端閉環(huán)。真正商業(yè)化落地是在第三年。
2021年開始,產品進行不斷迭代,一直到公司成立后的第四第五年,這個“不可能三角”才逐步閉環(huán)并增強。這時孫宇熙回顧兩年前產品,發(fā)現它就是“能用,但不完善”,“挺痛苦的,意味著那不是一個標準化的解決方案”。與國內眾多廠商不同,嬴圖并不滿足于只提供定制化的解決方案。以全球金融風險管理領域為例,2021 年,嬴圖為某銀行定制的流動性風險管理圖中臺系統,一經推出就斬獲國際唯一的 “流動性風險管理成就獎”,還被 IBM 研究院收錄為案例。但孫宇熙深知,定制化雖能解一時之需,卻難以推動行業(yè)的長遠發(fā)展。所以,打破定制化局限,創(chuàng)造更具價值的創(chuàng)新樣本,通過金融+科技手段,才是將金融風險管理邁向更普適、高效的后手棋。
在這兩年,嬴圖數據庫在持續(xù)的場景拓展過程中,研發(fā)團隊緊密圍繞實際反饋,對產品性能進行全方位、深層次的優(yōu)化,針對不同場景下的特殊需求,從硬件配置到軟件算法,從底層系統到交互展示逐一精雕細琢,其系統通用性能夠無縫適配各類環(huán)境與用戶需求。孫宇熙指出,可拓展性也是產品的一大重要性能。現在市場上大量產品沒有可拓展性,只能服務中小玩家——如果面對大玩家的海量數據,有拓展性的情況下還要穩(wěn)定,且葆有良好的性能,這幾乎又是一個“不可能三角”。
不過,即便見過很多場景,國內數據庫公司仍面臨較普遍的發(fā)展痛點,即甲方基本把乙方當“外包團隊”使用。孫宇熙說道,中國許多甲方高度依賴乙方,要乙方幫忙尋找需求、設計產品,但知識產權理論上都歸給甲方。這種合作模式會導致乙方永遠在給別人高度定制開發(fā),所做的內容沒有延續(xù)性。
他也感受到,很多時候頭部金融機構更能明白自己的需求,也因此,嬴圖很多早期的客戶是頭部金融機構,在雙方合作中打磨產品。
嬴圖的又一挑戰(zhàn)是身處后疫情時代,客戶沒錢,資本市場干涸,劣幣驅逐良幣,價格戰(zhàn)愈演愈烈。在孫宇熙看來,這是一件三敗俱傷的事情:有企業(yè)用十萬去做本該用一百萬完成的工程,打敗競對拿下單子,但這大概率會是個爛尾工程;客戶會因過多爛尾工程而對整個行業(yè)產生失望,投入更少,導致行業(yè)間爭搶更加激烈,由此陷入惡性循環(huán)。
要走過辛苦的時期,嬴圖很注重開源節(jié)流。比如孫宇熙很早就留意到了,公有云并不便宜。于是他們在團隊規(guī)模還在十人上下時,便決定自己搭建私有云,這已經夠幾十人開發(fā)測試應用,即便加上電費、存儲硬盤和監(jiān)控網絡等成本,一年下來也只相當于用公有云兩個月的成本,且能保障數據安全。
嬴圖推出的一系列相關專著 。
第四次創(chuàng)業(yè) 情緒內核穩(wěn)定是重要招人標準
前段時間,孫宇熙參加了清華一個人工智能和大數據專委會,與老師和畢業(yè)校友相聚。大家都在聊出海,嬴圖現在也得談論出海的問題。
嬴圖的出海計劃里,跟云廠商合作是一個重要方向。孫宇熙指出,今年年初,嬴圖已發(fā)布了嬴圖Cloud2.1版本,并已在海外上線。因嬴圖客戶大多是大型企業(yè),海外的云廠商可以整套組件都部署到客戶那端,其API、SDK都能直接調用,云上的解決方案如圖數據庫等可以遷移。
國內圖數據庫市場玩家中也不乏螞蟻、華為等大廠的身影,但孫宇熙對嬴圖在競爭中的優(yōu)勢依然頗有信心。他觀察到,目前“old money”頭部金融機構依然是數據庫的重要客戶,但有時互聯網的產品放到監(jiān)管嚴格、合規(guī)流程要求多的金融機構里,容易水土不服;且有時大廠內部復雜的陣營傾向與立場分歧,也會極大影響產品研發(fā)。
這也是他在過往的職業(yè)生涯中所感受到的。
孫宇熙在清華計算機系學EDA,做CPU芯片設計。畢業(yè)后,比起做硬件底層,他更喜歡做網絡、操作系統,在雅虎美國、微軟亞太研發(fā)集團就職過研發(fā)或研發(fā)管理相關崗位,并曾任EMC亞太研發(fā)集團CTO和中國研究院院長。
談起微軟,孫宇熙印象深刻的是“建設性批評”的企業(yè)文化。它確實存在積極的一面,但硬幣的另一面也會表現為不同部門甚至同部門內的微妙博弈或隱形抗衡。
也因為此,嬴圖從創(chuàng)立之日起就崇尚TEAL文化,強調組織的自主性、完整性和進化性。團隊的員工情緒(內核)都非常穩(wěn)定——這是嬴圖招聘時著重考慮的一點,再次才是寫代碼、調試測試的功夫等,“情緒穩(wěn)定代表心智的成熟和把控自己情緒的能力,這并不容易,有的需要后天極大魄力才能學會”。
嬴圖為員工舉辦的研學沙龍分享活動,特別邀請了國際知名績效科學領域的Ken West 博士。其分享內容聚焦于如何通過改變潛意識、提升自我意識以及激發(fā)正能量。
嬴圖是孫宇熙的第四次創(chuàng)業(yè)。他從1999年碩士畢業(yè)到現在工作的近25年中,有十五年時間基本都在創(chuàng)業(yè)。小公司從融資到退出或跟大公司合并的過程,他已經歷過三次,可以說是一個創(chuàng)業(yè)愛好者。
在孫宇熙看來,自己能承受普通人難以承受的壓力,甚至不覺得那是壓力。對于過往他并沒有太多惋惜,“典型的創(chuàng)業(yè)者會選擇忘記遺憾”,但在很多個有所突破的時刻,他都感到成就滿滿——
面對圖數據庫所需的高計算力,嬴圖很早就意識到,需要解決的核心問題是對超級節(jié)點極其高效地穿透?,F在,嬴圖有個名為“超級節(jié)點穿透”的核心專利,是全世界首個探索超級節(jié)點排序技術的專利,也僅此一個。
當時團隊嘗試了幾周都沒能把這串代碼跑通。有次孫宇熙在一個國際航班起飛前都還在嘗試。起飛關電腦后,他左思右想睡不著,半夢半醒間有了靈感,打開電腦寫了一個多小時,終于把這串代碼跑通。
那是在2019年下半年,他已記不清自己當時是找乘務員要了杯酒,還是原地振臂高呼了兩聲,但無比確切的是當時真的超級興奮。
在2025年的開始,孫宇熙對未來充滿信心。他相信,隨著市場對圖數據庫有更好認知,而嬴圖又能為客戶創(chuàng)造降本增效的產品和解決方案,再次偉大的機會也在眼前。
雷峰網原創(chuàng)文章,未經授權禁止轉載。詳情見轉載須知。