0
作者:王慧賢
編輯:張棟
數(shù)據(jù)存儲、數(shù)據(jù)分析、數(shù)據(jù)安全......如今,圍繞“數(shù)據(jù)”的話題越來越多,離人們的生活也越來越近。
從陌生到熟悉,數(shù)據(jù)不僅“出圈”,甚至已然站在了C位。去年,中央發(fā)布的《關(guān)于構(gòu)建更加完善的要素市場化配置體制機制的意見》中明確表示,繼土地、勞動力、資本、技術(shù)后,數(shù)據(jù)成為第五大生產(chǎn)要素。
步入信息化時代后,數(shù)據(jù)庫、操作系統(tǒng)與中間件作為計算機最基礎的三大軟件,支撐著企業(yè)的正常運行。
當數(shù)據(jù)成為生產(chǎn)要素后,必然會迎來爆發(fā)式增長,企業(yè)的數(shù)據(jù)存儲和處理需求將進一步釋放。更重要的是,疫情加快了數(shù)字化轉(zhuǎn)型的腳步,更加速了企業(yè)的上云速度。
從信息化到數(shù)字化,時代的變革,總會帶來商業(yè)世界的變化。如何在云原生架構(gòu)下使用數(shù)據(jù)庫,成為企業(yè)的痛點和云廠商的機會,亞馬遜AWS的CTO Werner Vogels曾多次強調(diào):“數(shù)據(jù)庫是云計算的終極之戰(zhàn)?!?/p>
在數(shù)智化時代,云原生到底意味著什么?云原生數(shù)據(jù)庫和傳統(tǒng)數(shù)據(jù)庫相比,核心優(yōu)勢是什么?是否把數(shù)據(jù)庫搬上云就是云原生?基于這些問題,雷鋒網(wǎng)與阿里巴巴集團副總裁、阿里云數(shù)據(jù)庫產(chǎn)品事業(yè)部負責人李飛飛展開一場對話。
國產(chǎn)云原生數(shù)據(jù)庫,擺脫「切膚之痛」
如今,數(shù)據(jù)庫的商業(yè)世界,因為云的出現(xiàn)與發(fā)展,分成了兩大派系。
一派是以Oracle為代表的傳統(tǒng)商用數(shù)據(jù)庫,一派是以國外AWS、國內(nèi)阿里云為代表的云原生數(shù)據(jù)庫,去“IOE革命”下的產(chǎn)物。
其實,早期較為火熱的數(shù)據(jù)庫種類有三種,層次式數(shù)據(jù)庫、網(wǎng)絡式數(shù)據(jù)庫和關(guān)系型數(shù)據(jù)庫。
在《浪潮之巔》一書中,作者吳軍寫下了這樣的觀點:“Oracle 的興起很大程度上靠的是它最早看到關(guān)系型數(shù)據(jù)庫的市場前景,并且在商業(yè)模式上優(yōu)于 IBM。”
因此,在云原生數(shù)據(jù)庫“入世”之前,數(shù)據(jù)庫的天下一直是Oracle的,國內(nèi)大部分互聯(lián)網(wǎng)公司都不得不采用Oracle+IBM小型機+EMC的模式來維持正常運營。
高昂的費用,使得對于數(shù)據(jù)庫需求較大的互聯(lián)網(wǎng)巨頭“忍無可忍”。
2009年,阿里巴巴的Oracle RAC 集群節(jié)點數(shù)達到了創(chuàng)記錄的20個??捎捎贠racle并沒有彈性擴展的功能,只能按照峰值流量購買小型機和數(shù)據(jù)庫,導致阿里將業(yè)務上漲帶來的大部分利潤,都支付給了Oracle。
第二年,阿里便開始走上了去“IOE”之路,根據(jù)開源MySQL搭建了AliSQL,并順利經(jīng)過了淘寶雙11的考驗,國產(chǎn)云原生數(shù)據(jù)庫算是正式擺脫了“切膚之痛”,逐漸受到市場的真正認可。
另一邊,國外的AWS在2015年公布了基于云計算的自研數(shù)據(jù)庫Amazon Aurora。Aurora是一個關(guān)系型數(shù)據(jù)庫,可以跨3個可用區(qū)域復制6份數(shù)據(jù),其最大的特性就是高性能和高可用性。
云計算巨頭的入局,讓云原生數(shù)據(jù)庫在國內(nèi)外一步步成為主流。據(jù)Gartner預測,到了2021年,云數(shù)據(jù)庫在整個數(shù)據(jù)庫市場中的占比將首次達到50%,到2023年,75%的數(shù)據(jù)庫都要跑在云平臺之上。
關(guān)于云原生數(shù)據(jù)庫,隨著逐步的出圈,也讓人們關(guān)心的焦點從“是啥?”轉(zhuǎn)變?yōu)椤斑€能解決哪些問題?”
“云原生數(shù)據(jù)庫的邏輯就是當云計算發(fā)生本質(zhì)變化后,將計算資源、存儲資源進行池化和解耦,讓用戶的數(shù)據(jù)像使用水電一樣便利?!崩铒w飛向雷鋒網(wǎng)表示。
但云原生數(shù)據(jù)庫存在著數(shù)據(jù)孤島的問題,無法打通多個數(shù)據(jù)系統(tǒng)的情況下,企業(yè)在數(shù)據(jù)加工和數(shù)據(jù)管理上就會“壓力較大”,甚至在數(shù)據(jù)安全方面還存在隱患。
傳統(tǒng)數(shù)據(jù)倉庫一般基于T+1數(shù)據(jù)集成構(gòu)建離線數(shù)倉,以支撐企業(yè)各項分析與服務。傳統(tǒng)方案不但會影響線上業(yè)務穩(wěn)定性,且難以支持企業(yè)的實時需求。
因此,在李飛飛看來,云原生數(shù)據(jù)庫已經(jīng)走到2.0階段。這個階段要解決的問題,就是上述存在的痛點。
9月26日,在阿里云數(shù)據(jù)庫創(chuàng)新上云峰會上,阿里云發(fā)布了首個一站式敏捷數(shù)據(jù)倉庫解決方案。該方案結(jié)合一站式數(shù)據(jù)管理平臺DMS及云原生數(shù)據(jù)倉庫AnalyticDB(簡稱:ADB),實現(xiàn)了庫倉一體的技術(shù)架構(gòu),提供在線數(shù)據(jù)實時入倉、T+1周期性快照、按需建倉等能力,數(shù)據(jù)延時低至秒級,持續(xù)賦能業(yè)務在線化,使企業(yè)的在線數(shù)據(jù)可以釋放出更大的價值。
相較于傳統(tǒng)方案,阿里云一站式敏捷數(shù)據(jù)倉庫解決方案有4大核心優(yōu)勢:
1、對業(yè)務側(cè)影響小,不會因為數(shù)據(jù)匯聚集中和實時加工影響業(yè)務側(cè)正常運行,CPU、內(nèi)存占用低于5%;
2、事務順序和數(shù)據(jù)準確性有保障,且處理鏈路短,支持在線數(shù)據(jù)實時處理落倉,效率更高。數(shù)據(jù)傳輸效率100m/s,數(shù)據(jù)延時在10秒內(nèi);
3、支持復雜實時數(shù)據(jù)加工、計算邏輯;
4、低代碼操作,能夠大大降低實時數(shù)倉的構(gòu)建難度,提升構(gòu)建效率的同時,支撐企業(yè)數(shù)字化轉(zhuǎn)型過程中的各類實時場景。除了實時統(tǒng)計分析場景外,企業(yè)為滿足周期性數(shù)據(jù)分析需求,需建設周期性全量快照。
傳統(tǒng)數(shù)倉的周期性全量集成方案會對生產(chǎn)業(yè)務造成穩(wěn)定性影響、全量集成時效性差、且無法滿足客戶針對任意時間點進行數(shù)據(jù)回溯的業(yè)務訴求。
針對T+1周期性集成場景,一站式敏捷數(shù)據(jù)倉庫解決方案支持基于拉鏈表的T+1全量數(shù)據(jù)快照,用戶通過簡單幾個步驟,即可按需生成各種周期的全量或增量快照。
此外,業(yè)務還可按需進行任意時間點的數(shù)據(jù)回溯,以快速解決數(shù)據(jù)異常問題。
談起未來數(shù)據(jù)庫的發(fā)展趨勢,李飛飛提到以下五點:
1、云原生+分布式一定是數(shù)據(jù)庫的標配,分布式已經(jīng)是必選項。分布式數(shù)據(jù)庫由多個相互連接的數(shù)據(jù)庫組合而成,面向用戶則是以單個數(shù)據(jù)庫的形態(tài)出現(xiàn)。云原生分布式數(shù)據(jù)庫具備易用性、高擴展性、快速迭代、節(jié)約成本等特征,從資源池化到彈性擴展,再到智能運維,再到離在線一體化,解決企業(yè)用戶的核心訴求。
2、AI for DB(database,指數(shù)據(jù)庫)和 DB for AI 將是主流趨勢。用AI將數(shù)據(jù)庫運維管控智能化,尤其在云原生+分布式這個前提下更重要,因為數(shù)據(jù)庫不僅是內(nèi)核的能力彈性高可用、可拓展性,更重要的是部署后應用和運維的復雜度要大大降低。在數(shù)據(jù)庫里,面對越來越多非結(jié)構(gòu)化的數(shù)據(jù),分析能力十分重要。
3、數(shù)據(jù)的安全可信,在今天這個大環(huán)境下變得愈發(fā)重要,如何確保整個數(shù)據(jù)庫系統(tǒng),在處理數(shù)據(jù)全鏈路過程中提供加密能力、多方安全計算能力、隱私保護的能力,也是很重要的趨勢。
4、多模數(shù)據(jù)處理能力將越來越重要。比如,新型數(shù)據(jù)庫多模態(tài)的處理能力,在新能源汽車企業(yè)打標簽、智能電池化預測等應用場景中,將發(fā)揮越來越重要的作用。
5、一份數(shù)據(jù),多個數(shù)據(jù)處理引擎:實現(xiàn)倉庫一體、倉庫聯(lián)動、倉庫打通,數(shù)據(jù)之間無縫流轉(zhuǎn)。
以上判斷,也從側(cè)面反映出阿里云數(shù)據(jù)庫的走向,這點毋庸置疑。但除此之外,業(yè)界最關(guān)心的,還有開源。
近半年,國內(nèi)很多廠商相繼提出開源戰(zhàn)略,背后緣由顯而易見,為了打造生態(tài)。就在今年的阿里云峰會上,阿里云智能總裁、達摩院院長張建鋒(花名行癲)將2021年阿里云的發(fā)展關(guān)鍵詞歸納為:做好服務、做深基礎、做厚中臺、做強生態(tài)。
做好服務與生態(tài),成為如今廠商們不約而同的目標,而開源,就是最好的選擇。
當雷鋒網(wǎng)問到:“未來,阿里云數(shù)據(jù)庫會不會把所有能力都開源?”這一問題時,李飛飛給到的回答是:“不會?!?/p>
之所以有這樣的回答,是因為對于開源,他有著一些判斷和看法。
“商業(yè)化能力和開源社區(qū)之間,還是有區(qū)別的?;谠圃芸氐哪芰?、針對商業(yè)版數(shù)據(jù)庫兼容性等能力,阿里云不會選擇開源。”
李飛飛表示,這些部分,本就是阿里云數(shù)據(jù)庫的商業(yè)化版本。
事實上,業(yè)界大多數(shù)的數(shù)據(jù)庫廠商都不會針對自身的核心能力開源,如TiDB的核心管控組件、TiFlash。
與像MongoDB,、Cassandra、CouchDB這些以開源起家的數(shù)據(jù)庫廠商不同,開源只是阿里云數(shù)據(jù)庫的戰(zhàn)略,不是阿里云數(shù)據(jù)庫的命脈。
前幾年,有業(yè)內(nèi)人士表示,在面向開源時,國產(chǎn)數(shù)據(jù)庫首先需要解決信任以及開源知識產(chǎn)權(quán)等問題。“開源會讓廠商更加認真思考版權(quán)還有專利的問題,事實上,選擇開源后,對于數(shù)據(jù)庫廠商提出了更高的要求。”
李飛飛認為,開源只是一種選擇,數(shù)據(jù)庫開源成功并不代表著商業(yè)化就能夠成功,不開源也不能代表廠商不先進。
更準確的說,開源只是一種有效手段。
最終,阿里云數(shù)據(jù)庫希望客戶能夠通過開源版本把阿里云數(shù)據(jù)庫產(chǎn)品技術(shù)快速用起來,并能夠參與到技術(shù)產(chǎn)品的迭代過程中,在一些高階能力上,借鑒團隊專業(yè)能力和阿里云的服務能力,成為良好的商業(yè)合作伙伴,這是李飛飛以及阿里云數(shù)據(jù)庫對于開源的一些基本思考。雷鋒網(wǎng)雷鋒網(wǎng)雷鋒網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。