0
本文作者: 王德清 | 2021-06-09 10:39 |
作者 | 王德清
出品 | 雷鋒網(wǎng)產(chǎn)業(yè)組
國(guó)產(chǎn)數(shù)據(jù)庫(kù)行業(yè),從未像今天這樣熱鬧。
6月1日,螞蟻集團(tuán)自主研發(fā)的分布式數(shù)據(jù)庫(kù)OceanBase宣布正式開源,并成立OceanBase開源社區(qū),社區(qū)官網(wǎng)同步上線,300萬(wàn)行核心代碼向社區(qū)開放。就在幾天前,阿里云也對(duì)外宣布開源了PolarDB for PostgreSQL。
而在之前,騰訊云發(fā)布首款全自研分布式分析型數(shù)據(jù)庫(kù)TDSQL-A;國(guó)產(chǎn)數(shù)據(jù)庫(kù)廠商PingCAP也發(fā)布了TiDB 5.0 版本……
成型于上個(gè)世紀(jì)80年代,數(shù)據(jù)庫(kù)是計(jì)算機(jī)領(lǐng)域三大基礎(chǔ)軟件系統(tǒng)之一。早期的關(guān)系型數(shù)據(jù)庫(kù)以甲骨文數(shù)據(jù)庫(kù)為代表,取得了巨大的商業(yè)成功。后來(lái)出現(xiàn)了MySQL、PostgreSQL等開源的關(guān)系型數(shù)據(jù)庫(kù)。
作為基礎(chǔ)性軟件以及企業(yè)IT系統(tǒng)的關(guān)鍵支撐產(chǎn)品,數(shù)據(jù)庫(kù)具有牽一發(fā)而動(dòng)全身的特性。
你可能想不到的是,就是這樣一個(gè)重要的技術(shù),在2014年以前,全球數(shù)據(jù)庫(kù)市場(chǎng)份額名單中,幾乎找不到中國(guó)廠商的身影。
如今,隨著眾多企業(yè)入局,國(guó)產(chǎn)數(shù)據(jù)庫(kù)正在打著一場(chǎng)激烈的翻身仗,在此背景下,國(guó)產(chǎn)數(shù)據(jù)庫(kù)如何崛起?如何抓住歷史的機(jī)遇,掌握自己的命脈?成為當(dāng)前數(shù)據(jù)庫(kù)從業(yè)者所要思考的問(wèn)題。
最近幾年,國(guó)產(chǎn)數(shù)據(jù)庫(kù)在替代潮流中看到了機(jī)遇,無(wú)論是互聯(lián)網(wǎng)陣營(yíng)的阿里、騰訊,通信廠商華為、中興,還是達(dá)夢(mèng)、人大金倉(cāng)等老牌國(guó)產(chǎn)數(shù)據(jù)庫(kù),都把主戰(zhàn)場(chǎng)放在了“去O”的存量替代領(lǐng)域,幾乎所有的國(guó)產(chǎn)數(shù)據(jù)庫(kù)都把金融行業(yè)的國(guó)產(chǎn)化作為最重要的戰(zhàn)場(chǎng),從大型銀行、中小城商行、保險(xiǎn)公司、證券基金公司,過(guò)去幾年國(guó)產(chǎn)數(shù)據(jù)庫(kù)掀起了一個(gè)“替代”潮。
這也讓雷鋒網(wǎng)筆者想到了剛接觸數(shù)據(jù)庫(kù)行業(yè)時(shí)的一個(gè)困惑:為什么數(shù)據(jù)庫(kù)廠商都喜歡分享自己的數(shù)據(jù)庫(kù)產(chǎn)品如何通過(guò)測(cè)試,最終替換Oracle等傳統(tǒng)數(shù)據(jù)庫(kù)的故事。
后來(lái)一些行業(yè)從業(yè)者對(duì)筆者答疑表示,金融行業(yè)對(duì)于數(shù)據(jù)庫(kù)的要求是最高的,可用性要達(dá)到99.999%,這意味著,全年數(shù)據(jù)庫(kù)發(fā)生故障的時(shí)間不可以超過(guò)5分鐘。
而這個(gè)要求說(shuō)白了就是數(shù)據(jù)庫(kù)產(chǎn)品要具有高穩(wěn)定性、強(qiáng)容錯(cuò)性和高安全性。
也正是由于這個(gè)原因,取代Oracle(去O)等傳統(tǒng)數(shù)據(jù)庫(kù)成為了多數(shù)國(guó)產(chǎn)數(shù)據(jù)庫(kù)時(shí)至今日的奮斗目標(biāo)。
對(duì)此,我們不禁提出了疑問(wèn),國(guó)產(chǎn)數(shù)據(jù)庫(kù)的目標(biāo)難道只是要替代Oracle等傳統(tǒng)數(shù)據(jù)庫(kù),換句話來(lái)說(shuō),我們?nèi)〈薕racle等傳統(tǒng)數(shù)據(jù),就代表著我們的數(shù)據(jù)庫(kù)產(chǎn)品就已經(jīng)超越了他們了嘛?
答案當(dāng)然是否定的。
從Gartner、DB-Engines等研究機(jī)構(gòu)最新的報(bào)告中不難發(fā)現(xiàn),數(shù)據(jù)庫(kù)市場(chǎng)正在出現(xiàn)一個(gè)新的趨勢(shì):以O(shè)racle、DB2和Microsoft SQL Server三大巨頭為代表的傳統(tǒng)商業(yè)數(shù)據(jù)庫(kù)的市場(chǎng)份額不斷下降,而開源數(shù)據(jù)庫(kù)和云第三方數(shù)據(jù)庫(kù)市場(chǎng)在持續(xù)增長(zhǎng)。
在這個(gè)背后,是數(shù)字化轉(zhuǎn)型的浪潮向前涌進(jìn)。據(jù)知名咨詢機(jī)構(gòu)統(tǒng)計(jì),到2025年全球數(shù)據(jù)總量將超過(guò)160ZB,全球數(shù)據(jù)總量的近 20% 將成為影響日常生活的關(guān)鍵數(shù)據(jù),近 10% 將變?yōu)槌P(guān)鍵數(shù)據(jù)。
伴隨這個(gè)而來(lái)的,除了對(duì)數(shù)據(jù)庫(kù)有不變的高穩(wěn)定性、強(qiáng)容錯(cuò)性和高安全性之外,企業(yè)在數(shù)字化時(shí)代又提出了海量,實(shí)時(shí)、在線的數(shù)據(jù)分析的能力,這些反而是傳統(tǒng)數(shù)據(jù)庫(kù)不擅長(zhǎng)的。
因此,這對(duì)于那些只將目標(biāo)瞄在替代Oracle等傳統(tǒng)數(shù)據(jù)庫(kù)的國(guó)產(chǎn)數(shù)據(jù)庫(kù)廠商來(lái)說(shuō),面對(duì)當(dāng)前數(shù)字化轉(zhuǎn)型浪潮下的海量、實(shí)時(shí)、在線的數(shù)據(jù)分析的能力則有所欠缺。
數(shù)字化暴漲的海量、實(shí)時(shí)、在線需求,最終落在了分布式數(shù)據(jù)庫(kù)和大數(shù)據(jù)技術(shù)棧的肩頭上,中長(zhǎng)期看又以各種云服務(wù)模式的部署為主流?!伴_源、融合、云化”成為破解數(shù)字化時(shí)代數(shù)據(jù)需求的三大法寶。
因此,以后當(dāng)企業(yè)用戶提出:你的產(chǎn)品是否有應(yīng)用在大型互聯(lián)網(wǎng)公司核心交易系統(tǒng)中嘛?又該如何做解?
就在最近幾天,阿里云的PolarDB和螞蟻的OceanBase相繼宣布開源,加上作為先行者的TiDB,中國(guó)數(shù)據(jù)庫(kù)第一集團(tuán)的TOP ( TiDB,Oceanbase, PolarDB) 都將開源作為戰(zhàn)略選擇,在業(yè)內(nèi)引發(fā)了巨大的討論?!伴_源的拐點(diǎn)到了”、“開源成為新一代數(shù)據(jù)庫(kù)的主流選擇”,有的人甚至因此發(fā)問(wèn):開源會(huì)改變世界嗎?
對(duì)于這個(gè)問(wèn)題,實(shí)在難以找到答案。
但我們可以預(yù)見的是,開源將加速成為中國(guó)未來(lái)發(fā)展基礎(chǔ)軟硬件技術(shù)的關(guān)鍵路徑。
就在今年3月,開源正式被列入十四五規(guī)劃發(fā)展綱要,在數(shù)字經(jīng)濟(jì)加速發(fā)展的大背景下,中國(guó)未來(lái)五年會(huì)“支持?jǐn)?shù)字技術(shù)開源社區(qū)等創(chuàng)新聯(lián)合體發(fā)展,完善開源知識(shí)產(chǎn)權(quán)和法律體系,鼓勵(lì)企業(yè)開放軟件源代碼,硬件設(shè)計(jì)與應(yīng)用服務(wù)”。
而從全球范圍來(lái)看,開源也正在成為引領(lǐng)基礎(chǔ)軟件發(fā)展的決定性力量,以全球數(shù)據(jù)庫(kù)產(chǎn)品為例,2021年1月,開源數(shù)據(jù)庫(kù)首次超過(guò)商業(yè)數(shù)據(jù)庫(kù),代表著開源數(shù)據(jù)庫(kù)已經(jīng)成為支持?jǐn)?shù)字技術(shù)創(chuàng)新和數(shù)字經(jīng)濟(jì)發(fā)展的重要支撐力量。
除此之外,開源也正從互聯(lián)網(wǎng)公司逐步擴(kuò)展到了大型企業(yè)其他企業(yè)中,如戴姆勒集團(tuán)CIO堅(jiān)定把“開源優(yōu)先”作為推動(dòng)創(chuàng)新變革五大舉措中的首要舉措,可以預(yù)見,“開源優(yōu)先”未來(lái)十年不只是互聯(lián)網(wǎng)公司的專利,也將成為所有企業(yè),所有公共機(jī)構(gòu)未來(lái)十年的重要趨勢(shì)。
在全球科技領(lǐng)域,開源軟件成為吸引最牛開發(fā)者的法寶,開源軟件更酷、更快、更領(lǐng)先的特質(zhì)吸引著新一代開發(fā)者,成為企業(yè)獲取”工程師紅利“的關(guān)鍵。在軟件定義世界的時(shí)代,得開發(fā)者得天下,只有依靠開源的“群眾路線”。
但在此前,行業(yè)內(nèi)外對(duì)于開源軟件是有爭(zhēng)議的。
首先是關(guān)于開源軟件知識(shí)產(chǎn)權(quán)的糾紛。譬如在國(guó)內(nèi),個(gè)別企業(yè)會(huì)根據(jù)相關(guān)規(guī)則對(duì)開源軟件進(jìn)行修改、衍生,然后發(fā)行自己的版本,并把它變成閉源軟件。這不但可以看成是具有負(fù)面影響的道德問(wèn)題,還可能面臨侵犯知識(shí)產(chǎn)權(quán)遭受法律追訴的風(fēng)險(xiǎn)。
其次是安全隱患。雖然很多開源項(xiàng)目都由企業(yè)或資深專家開發(fā)維護(hù),但由于不完全是自己使用,導(dǎo)致貢獻(xiàn)者容易對(duì)安全性造成疏忽。譬如,知名開源項(xiàng)目爆出安全漏洞的例子多不勝數(shù):OpenSSL Heartbleed、Fastjson 遠(yuǎn)程代碼漏洞、Antd 圣誕彩蛋等等。
最后在商業(yè)化方面,有些公司會(huì)先行開源,而在產(chǎn)品完成之后又進(jìn)行閉源進(jìn)行商業(yè)化。同時(shí)也因?yàn)橹袊?guó)開源文化的不規(guī)范,小型技術(shù)公司會(huì)把開源的東西拿過(guò)來(lái)加一層界面,然后就說(shuō)這是自主研發(fā)的產(chǎn)品。
此前,雖有不盡人意的地方,但一些基礎(chǔ)軟件廠商也在一直堅(jiān)持開源,并取得了一些成績(jī)。
就在今年4月,PingCAP聯(lián)合創(chuàng)始人兼CTO黃東旭就曾對(duì)雷鋒網(wǎng)表示到,他們自主研發(fā)并在研發(fā)之初就進(jìn)行開源的分布式數(shù)據(jù)庫(kù)TiDB,經(jīng)過(guò)幾年的努力,已經(jīng)跨越了開源軟件的鴻溝。并且高度活躍的開源社區(qū)為 TiDB 產(chǎn)品發(fā)展帶來(lái)了飛輪效應(yīng)。
而之所以會(huì)從研發(fā)之初,就選擇將源代碼進(jìn)行國(guó)際開源,因?yàn)樵谄淇磥?lái),基礎(chǔ)軟件太過(guò)于通用又非常重要,因此獲取用戶的信任成本非常高。如果選擇不開源,一來(lái)傳播速度會(huì)很慢,二來(lái)對(duì)方的信任成本會(huì)很高。第三個(gè)最致命的是用戶的增長(zhǎng)并不會(huì)是一種病毒傳播式的增長(zhǎng),進(jìn)而導(dǎo)致產(chǎn)品的迭代速度會(huì)變得很慢。
而基于開源的數(shù)據(jù)庫(kù)研發(fā)迭代版本更快,極端場(chǎng)景的打磨客戶更多,社區(qū)反饋和貢獻(xiàn)更及時(shí),今天全球數(shù)據(jù)技術(shù)的頂級(jí)公司都基本以國(guó)際開源開發(fā)為主。
在探討這個(gè)問(wèn)題之前我們不妨了解一下數(shù)據(jù)庫(kù)的未來(lái)發(fā)展趨勢(shì)。
隨著數(shù)字經(jīng)濟(jì)的不斷發(fā)展,在Gartner看來(lái)未來(lái)數(shù)據(jù)庫(kù)發(fā)展有著四個(gè)趨勢(shì):開源、HTAP、云原生以及和大數(shù)據(jù)技術(shù)融合。
面對(duì)這樣的未來(lái)發(fā)展趨勢(shì),開源則可以完全可以幫助數(shù)據(jù)庫(kù)向前發(fā)展,我們不妨還以TiDB為例。
就在今年4月,TiDB發(fā)布了5.0版本,而最新發(fā)布的5.0 版本在原有 HTAP 引擎 TiFlash 的基礎(chǔ)上引入 MPP 架構(gòu),可以為其提供與存儲(chǔ)匹配的分布式計(jì)算引擎,進(jìn)一步提升海量數(shù)據(jù)下的并行計(jì)算與分析能力。
同時(shí),TiDB 5.0 基于分布式架構(gòu),支持云原生與多云,可以彈性擴(kuò)展吞吐或存儲(chǔ),輕松應(yīng)對(duì)高并發(fā)、海量數(shù)據(jù)場(chǎng)景,實(shí)現(xiàn)一棧式數(shù)據(jù)服務(wù)。企業(yè)級(jí)用戶和互聯(lián)網(wǎng)用戶都可以通過(guò)一套 TiDB 系統(tǒng)構(gòu)建數(shù)字場(chǎng)景應(yīng)用,而不必關(guān)注底層架構(gòu)。
此外,目前市面上大部分的大數(shù)據(jù)技術(shù)也都是基于開源來(lái)進(jìn)行研發(fā)的。如Hadoop、Spark、Flink……而由于TiDB一直堅(jiān)持國(guó)際開源,這也讓TiDB為代表的數(shù)據(jù)庫(kù)可以融合當(dāng)前大數(shù)據(jù)技術(shù)棧。
而這也讓企業(yè)用戶,只需要通過(guò)在數(shù)據(jù)庫(kù)之上采用增加大數(shù)據(jù)“外掛”的方式,就可以應(yīng)對(duì)未來(lái)企業(yè)所需要進(jìn)行的結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)、以及非結(jié)構(gòu)化數(shù)據(jù)的融合分析處理。只需要一個(gè)接口,就可以解決未來(lái)企業(yè)面臨的數(shù)據(jù)問(wèn)題。
當(dāng)了解到這些趨勢(shì)之后,我們要清楚的是,PingCAP也才成立于2015年,雖然成立的時(shí)間很短,但其能夠卻能夠保持著一年一個(gè)版本的更新。并在現(xiàn)在能夠在技術(shù)上取得領(lǐng)先,并在全球獲得了1500家用戶認(rèn)可的。
而在這背后則正是開源自主創(chuàng)新所帶來(lái)的回報(bào)。
因?yàn)椋瑪?shù)據(jù)庫(kù)產(chǎn)品作為一個(gè)“需要被用出來(lái)”的基礎(chǔ)軟件,國(guó)際開源場(chǎng)景可以為其發(fā)展提供三個(gè)方面的助力:一是全球領(lǐng)先的規(guī)?;瘓?chǎng)景,二是開放透明的協(xié)作機(jī)制,三是匯集全球創(chuàng)新智慧。
而國(guó)際開源社區(qū)的運(yùn)營(yíng)和高效協(xié)作是實(shí)現(xiàn)三大因素匯聚的載體,在這個(gè)“開源創(chuàng)新”的飛輪里面,規(guī)?;瘓?chǎng)景推動(dòng)了開放協(xié)作,開放協(xié)作帶來(lái)了全球智慧,然后進(jìn)一步推動(dòng)規(guī)?;瘓?chǎng)景的擴(kuò)大和用戶的增加,再進(jìn)入更大范圍的開放協(xié)作,帶動(dòng)更多全球工程師的參與,形成了一個(gè)飛輪效應(yīng),推動(dòng)產(chǎn)品的向前發(fā)展,從而行程技術(shù)領(lǐng)先。
業(yè)界總是喜歡在我國(guó)企業(yè)自主研發(fā)的基礎(chǔ)軟件前加上“國(guó)產(chǎn)”兩個(gè)字,如OceanBase、Polar DB、TiDB以及昨天剛剛發(fā)布的鴻蒙系統(tǒng)……
但頭頂著國(guó)產(chǎn)的標(biāo)簽,就只能在國(guó)內(nèi)使用嘛?
黃東旭此前說(shuō)到: “我們做的東西有點(diǎn)像在做一把錘子,中國(guó)人需要錘子,美國(guó)人也需要錘子,尤其是基礎(chǔ)軟件,我覺(jué)得是一個(gè)屬于全人類的東西。”
當(dāng)前數(shù)字化技術(shù)正在推動(dòng)各個(gè)企業(yè)向前發(fā)展,進(jìn)行數(shù)字化轉(zhuǎn)型。
如果說(shuō)此前由于用戶不了解,需要本地部署是的國(guó)產(chǎn)數(shù)據(jù)庫(kù)無(wú)法出海的話,國(guó)際開源社區(qū)和云化部署則將可以將其變?yōu)楝F(xiàn)實(shí)。
因?yàn)殡S著開源潮流不斷的從互聯(lián)網(wǎng)公司流入到傳統(tǒng)大型企業(yè),開源也就成為了國(guó)產(chǎn)數(shù)據(jù)庫(kù),為獲取規(guī)模場(chǎng)景,社區(qū)人才,進(jìn)而加速打磨和迭代產(chǎn)品的最佳模式,尤其是降低了海外用戶對(duì)數(shù)據(jù)庫(kù)產(chǎn)品的信任門檻。
同時(shí)隨著數(shù)據(jù)庫(kù)云化趨勢(shì)的加快,數(shù)據(jù)庫(kù)的部署也將可以足不出戶,直接遠(yuǎn)端的部署在公有云的基礎(chǔ)服務(wù)上面,通過(guò)云端方式服務(wù)全球客戶,實(shí)現(xiàn)可以可以跨越地理限制的云原生部署模式。
類似地,基于云原生架構(gòu)的數(shù)據(jù)庫(kù)產(chǎn)品可以數(shù)據(jù)庫(kù)提供商直接提供跨公有云,混合云的數(shù)據(jù)庫(kù)產(chǎn)品,大大降低了數(shù)據(jù)庫(kù)廠商在軟件授權(quán)時(shí)代需要全球重度部署銷售與技術(shù)服務(wù)團(tuán)隊(duì)的成本,使得云端出海成為輕量化,高效服務(wù)的創(chuàng)新模式。(雷鋒網(wǎng))
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。