丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
業(yè)界 正文
發(fā)私信給王金許
發(fā)送

1

Zilliz 星爵:高維打擊,OLAP 數(shù)據(jù)庫的下一程

本文作者: 王金許 2018-01-22 11:04
導(dǎo)語:這個(gè)領(lǐng)域會(huì)有成為下一個(gè) Oracle 的機(jī)會(huì)?

一個(gè)月前, Open Power 高峰論壇之后,IBM Systems Open Power 總經(jīng)理 Ken King 在媒體溝通會(huì)上向記者們再次強(qiáng)調(diào)了 Power9 架構(gòu)的優(yōu)勢??傊?,在性能上,與 X86 相比,就差他說“吊打”二字了。

一定程度上,這數(shù)據(jù)處理能力上的大幅提升有關(guān),而 Zilliz 這家看上去不怎么起眼的數(shù)據(jù)庫公司是“賦能者”之一,它聯(lián)合 IBM 發(fā)布的是國內(nèi)首臺(tái) GPU 硬件加速 OLAP 數(shù)據(jù)庫一體機(jī) MEGAWISE。

這對 Power9 的性能到底有多大程度的提升呢?Zilliz 創(chuàng)始人星爵(真名謝超)當(dāng)時(shí)給了一組數(shù)據(jù):利用 GPU 的高并發(fā)性,數(shù)據(jù)處理的性能相對 CPU 架構(gòu)提高了 100 倍,同時(shí),硬件成本降低了 10 倍,數(shù)據(jù)中心的運(yùn)維、能耗成本大概降低 20 倍。

這些數(shù)據(jù)的背后就是 Zilliz 的價(jià)值所在,它從星爵極快的語速中結(jié)束,記者們看上去似乎還沒反應(yīng)過來。

但更讓他們感到疑惑的或許是他說的第一句話:基于 GPU 硬件加速的新一代 OLAP 數(shù)據(jù)庫會(huì)是一項(xiàng)全新的顛覆性技術(shù)。

Zilliz 星爵:高維打擊,OLAP 數(shù)據(jù)庫的下一程

歸根結(jié)底,算力不夠

這個(gè)時(shí)代屬于人工智能,但也別忘了作為其重要基石的大數(shù)據(jù)。

放眼望去,各行業(yè)無論是堆積的歷史數(shù)據(jù),還是正產(chǎn)出的數(shù)據(jù)正在變得愈加龐雜,那些擁有數(shù)據(jù)的企業(yè)希望有更好數(shù)據(jù)分析服務(wù)來調(diào)整、掌控自身的業(yè)務(wù)。

但現(xiàn)有的處理方案,比如,基于 Hadoop 的技術(shù)雖然成本低,但分析速度難以滿足企業(yè)需求,而有些采集數(shù)據(jù)的處理還具有一定時(shí)效性。

總體而言,數(shù)據(jù)庫處理主要面臨這兩大瓶頸:一是數(shù)據(jù)計(jì)算速度,這與處理器相關(guān),處理器越強(qiáng)大,算力越好,處理越快;二是數(shù)據(jù)訪問速度,數(shù)據(jù)要從磁盤讀取,然后轉(zhuǎn)到內(nèi)存進(jìn)入處理器進(jìn)行分析。

這兩大問題在數(shù)據(jù)庫發(fā)展中一直是此消彼長的存在,交替阻礙著彼此的發(fā)展。比如,通過水平擴(kuò)展可以增加更多處理器,但這會(huì)降低數(shù)據(jù)訪問速度。而后來出現(xiàn)的 A6,SSD 固態(tài)硬盤把數(shù)據(jù)訪問速度提高了一個(gè)數(shù)量級,但處理架構(gòu)不得不做出改變,就像數(shù)據(jù)不再是放在固態(tài)硬盤,而是在內(nèi)存里。

這樣問題來了,由于內(nèi)存比固態(tài)硬盤又多了一個(gè)數(shù)量級的訪問速度,那一旦給出更多數(shù)據(jù),CPU 計(jì)算能力又跟不上了。于是,又只能到處理器那里做文章,以此陷入新一輪你上我下的死循環(huán)之中。

這是當(dāng)時(shí)在 Oracle 做數(shù)據(jù)庫的星爵一直所思考的問題。

身處在世界上頂尖數(shù)據(jù)庫專家云集的系統(tǒng)里,他對這個(gè)產(chǎn)業(yè)的認(rèn)知不再只是琢磨具體的技術(shù)細(xì)節(jié),而是回歸那些基礎(chǔ)問題。

為什么數(shù)據(jù)庫發(fā)展會(huì)變慢?為什么大數(shù)據(jù)有這種 Hadoop 的方案出現(xiàn)?為什么數(shù)據(jù)分析不可能跟上數(shù)據(jù)產(chǎn)生量? 

歸根到底,星爵告訴雷鋒網(wǎng),這些都是因?yàn)閿?shù)據(jù)庫處理系統(tǒng)的算力不夠。

數(shù)據(jù)庫的 indexes 加快了數(shù)據(jù)訪問、分析的速度,它本質(zhì)上是用空間來換時(shí)間,那如果有一個(gè)算力快 1 萬倍的 CPU 會(huì)不會(huì)更好呢?

他想到,加了 indexes 之后數(shù)據(jù)可能只存 1TB,而現(xiàn)在可能要存 1.5TB 甚至 2TB 的數(shù)據(jù)。但這樣,數(shù)據(jù)更新的同時(shí)也需要更新索引來維護(hù)數(shù)據(jù)一致性,這會(huì)導(dǎo)致插入更新數(shù)據(jù)的分析速度也會(huì)變慢,而算法也將變得更為復(fù)雜。

這又是另一個(gè)死胡同,跳出這個(gè)思維困境,一個(gè)大膽假設(shè)是干脆不要 indexes 了可以嗎?

上世紀(jì) 80 年代以后,indexes 就被視為數(shù)據(jù)庫的標(biāo)配,但實(shí)際上,就像充電寶被看做是手機(jī)的“標(biāo)配”一樣,星爵認(rèn)為,其實(shí)就是算力不夠,“夠的話,indexes 也許就不需要了”。

2012 年,In-Memory Database 系統(tǒng)的出現(xiàn)也解決了一些問題,但他并不認(rèn)為這能進(jìn)行高維打擊——有 GPU 處理器的智能手機(jī)對功能手機(jī)就是高維打擊。

此路不通,他在尋找新的能讓數(shù)據(jù)庫有所革新的機(jī)會(huì)。

“提速降本”,高維打擊

基于 GPU 加速的數(shù)據(jù)庫研究最早于 2006 年就開始了,當(dāng)時(shí)主要是在 GPU 上做數(shù)據(jù)庫處理算法。隨后,數(shù)據(jù)庫處理算法在不斷擴(kuò)充和優(yōu)化中,與之相關(guān)的話題在每年的 SIGMOD、VLDB 和 ICDE 三大國際頂級數(shù)據(jù)庫會(huì)議上被業(yè)內(nèi)人士進(jìn)行探討,

但直到 2013 年,深度學(xué)習(xí)的崛起將 GPU 市場普及度推向了高潮?;?GPU 這個(gè)新硬件平臺(tái)的天然優(yōu)勢,人們對它的認(rèn)知不再是不務(wù)正業(yè)的游戲機(jī),而是可以成為 CPU 一樣的服務(wù)器芯片。

更重要的是,以英偉達(dá)的 CUDA 為代表的 GPU 生態(tài)也建了起來,開發(fā)門檻隨之降低。

“這應(yīng)該就是高維打擊的臨界點(diǎn)”,星爵覺得,他一直尋找的能讓數(shù)據(jù)庫從量變到質(zhì)變的革新終于要來了。

于是,2015 年下半年,在謝超所在的小組完成 Oracle 12c 的多租戶數(shù)據(jù)庫的研發(fā)后,是時(shí)候離開這個(gè)已經(jīng)服役 6 年的地方了。 

在 Oracle 的那些年,他經(jīng)歷了最初的項(xiàng)目立項(xiàng)到功能分析、需求分析,設(shè)計(jì)等整個(gè)流程。值得一提的是,2013 年,星爵所在的小組研發(fā)出了 Oracle 12c 第一版,“c”即代表“cloud(云計(jì)算)”,這是 Oracle 首個(gè)“為云而生”的數(shù)據(jù)庫,它奠定了未來 Oracle 數(shù)據(jù)庫發(fā)展的戰(zhàn)略方向。

不過,這家全球最大的數(shù)據(jù)庫巨頭準(zhǔn)備在云計(jì)算市場發(fā)力,正是在他碩士畢業(yè)進(jìn)入 Oracle 的第一年,這比 Amazon 在 2005 年第一次提出開發(fā)云計(jì)算平臺(tái)晚了整整四年。也難怪,Oracle CEO Larry Ellison 當(dāng)時(shí)對云計(jì)算根本瞧不上,甚至認(rèn)為那是一個(gè)愚蠢的概念。

與前老板的態(tài)度不同,星爵要去抓住做 GPU 數(shù)據(jù)庫的機(jī)會(huì)了,他堅(jiān)定認(rèn)為這與數(shù)據(jù)庫巨頭們競爭時(shí)能拉開差距。

因?yàn)?GPU 的出現(xiàn),讓數(shù)據(jù)提供速度與數(shù)據(jù)處理速度達(dá)到了平衡態(tài)。甚至,由于 GPU 處理能力在近幾年以數(shù)十倍速度不斷提升,這又遠(yuǎn)超于數(shù)據(jù)供給的速度,同時(shí)基于像 IBM 的 NVLink 這種高速互聯(lián)技術(shù),尤其 Power9 服務(wù)器使用的 NVLink 2.0,讓 GPU 與 CPU 之間可以建立三個(gè)通道,每個(gè)通道的速度提高到了 25G,這讓 GPU 訪問內(nèi)存的速度有了很大提升,而老對手英特爾并沒有解決數(shù)據(jù)訪問帶寬的問題。

對類似于 Power 系列軟硬一體機(jī)而言,基本需求點(diǎn)就是由軟件帶動(dòng)硬件的銷售,所以在他看來,IBM 在使用了 Zilliz 的數(shù)據(jù)庫軟件之后,也會(huì)促進(jìn)其硬件的銷量。 

數(shù)據(jù)分析速度問題就解決了,接下來就看能不能降低成本。

星爵告訴雷鋒網(wǎng),Power9 一體機(jī)每套大約 90 萬元,而像 Oracle 的 Exadata 服務(wù)器成本則在幾十萬美元到上百萬美元之間不等,這么一比,前者是占優(yōu)的。

還有更重要的后續(xù)維護(hù)和能耗成本。以前,在數(shù)據(jù)庫中心擺上服務(wù)器要占據(jù)半個(gè)機(jī)房,現(xiàn)在可能需要一臺(tái)服務(wù)器就已足夠,而節(jié)省了數(shù)據(jù)庫中心的空間,后期運(yùn)維、能耗也自然隨之降低。 

除了搭載在 X86、Power 這樣的軟硬一體機(jī)上,Zilliz 的 GPU 數(shù)據(jù)庫軟件也被互聯(lián)網(wǎng)、金融、政府等行業(yè)應(yīng)用,他們正在選擇一些頭部客戶去做 POC,把數(shù)據(jù)庫系統(tǒng)部署在它們的生產(chǎn)環(huán)境,以解決技術(shù)落地問題。他們今年預(yù)計(jì)會(huì)服務(wù) 30-50 家客戶。

他也看好云端的 SaaS 數(shù)據(jù)庫方案,認(rèn)為這在未來有很大的成長空間,現(xiàn)在他們的客戶就有 AWS、騰訊云、阿里云等云廠商。 

成為下一個(gè) Oracle 的機(jī)會(huì)

市場還處于早期階段。

Zilliz 目前是中國唯一一家做 GPU 數(shù)據(jù)庫的創(chuàng)業(yè)公司,其它拿到大額融資的還有三家,其中兩家在硅谷,一家在以色列。這四家公司在 OLAP 數(shù)據(jù)庫市場的年收入加起來不過 2000 萬美元左右。

不過,根據(jù) Gartner 的統(tǒng)計(jì)數(shù)據(jù),在 2017 年,OLAP 數(shù)據(jù)庫是大約是 183 億美元的市場,到 2020 年,預(yù)計(jì)會(huì)達(dá)到 228 億美元。

這個(gè)領(lǐng)域會(huì)有成為下一個(gè) Oracle 或者安卓的機(jī)會(huì),星爵這樣認(rèn)為。

一個(gè)問題是,既然這個(gè)市場空間的想象力這么大,巨頭們難道會(huì)坐視不理嗎?理論上講,像英偉達(dá)和 IBM 這樣的巨頭既然有硬件,那憑借這樣的優(yōu)勢,它們介入基于 GPU 數(shù)據(jù)庫軟件自然也不奇怪。況且,在數(shù)據(jù)庫領(lǐng)域還有 Oracle 盤踞一方,那 Zilliz 這樣的創(chuàng)業(yè)公司能有多大的機(jī)會(huì)?

先從技術(shù)層面看,數(shù)據(jù)庫作為底層系統(tǒng)軟件,它的準(zhǔn)入門檻不低,但對于做傳統(tǒng)的基于 CPU 數(shù)據(jù)庫的 Oracle 來說,它一旦選擇切換到以 GPU 為核心這個(gè)數(shù)據(jù)庫上,需要從硬件到軟件包括存儲(chǔ)、優(yōu)化、執(zhí)行到整個(gè)數(shù)據(jù)管理和調(diào)度上,基本都要重新寫入,而不只是更改一些兼容性內(nèi)容。這個(gè)過程看上去不那么輕松。

“它不像是手機(jī) APP,甚至是 ERP 或者 CRM?!毙蔷魧卒h網(wǎng)解釋,這就好比微軟雖然在 PC 操作系統(tǒng)上馳騁了幾十年,但在手機(jī)這個(gè)硬件平臺(tái)上的競爭力幾乎忽略不計(jì),“幾乎是一個(gè)推倒重來的過程?!?/p>

換個(gè)角度來看,即便巨頭們雖然有能力進(jìn)入,它們的共性在于響應(yīng)速度會(huì)緩慢很多。

另一方面,從商業(yè)角度來說,如果巨頭做 GPU 數(shù)據(jù)庫軟件,那必定也會(huì)沖擊現(xiàn)有的業(yè)務(wù)線。比如 Oracle現(xiàn)在賣得最好的是 Exadata,這還是 2010 年把 SUN 收購以后研發(fā)而成的。那在它投入了數(shù)十億美元的產(chǎn)品線,甚至還沒賺回成本時(shí),它的目標(biāo)應(yīng)該是賣出更多的 Exadata,如果轉(zhuǎn)向 GPU 服務(wù)器它會(huì)非常慎重。

所以可以看到,近年來巨頭們的策略選擇也開始有所轉(zhuǎn)變,一般都是先守住自己擅長的硬件,然后在軟件上找相應(yīng)的合作伙伴加盟開放平臺(tái),不再追求大包大攬。 IBM 成立的 Open Power 基金會(huì)就是如此。

因此,星爵并不認(rèn)為 GPU 數(shù)據(jù)庫這條路上他們會(huì)與 Oracle 們很快碰面。

創(chuàng)業(yè)公司機(jī)動(dòng)性要更強(qiáng),但并不意味著 Zilliz 闖入一個(gè)新興領(lǐng)域會(huì)比巨頭們?nèi)菀缀芏唷?/p>

公司發(fā)展戰(zhàn)略、商務(wù)拓展、市場銷售等方面是 CEO 星爵在這兩年里面臨的挑戰(zhàn),并且在未來幾年或許還將持續(xù)下去。一些挑戰(zhàn)讓這個(gè)團(tuán)隊(duì)在這兩年里走了彎路。

最糾結(jié)的還是對產(chǎn)品化的判斷,初期如何在產(chǎn)品與市場找出無縫切合點(diǎn)讓他們難以取舍,“最開始要兼容,你不能說完全做一個(gè)跟現(xiàn)在市場上所有(系統(tǒng))都去兼容。選哪家做兼容本身也沒有對錯(cuò),但可能要看最終是不是能選出最有價(jià)值的客戶,這可能要做大量的工作?!?/p>

針對不同方案對應(yīng)做數(shù)據(jù)庫,他們很快就做出了產(chǎn)品,但隨著系統(tǒng)增多,這種做法讓以后在技術(shù)上做擴(kuò)展會(huì)更加復(fù)雜。

他們現(xiàn)在更希望提煉出其中的共性,然后做出統(tǒng)一的方案去兼容多個(gè)系統(tǒng),即使研發(fā)進(jìn)度會(huì)相應(yīng)減緩。對于 OLAP 數(shù)據(jù)庫軟件來說,其實(shí)本質(zhì)上做的就是一個(gè)平臺(tái),“ERP、CRM 各種企業(yè)級軟件都是建立在數(shù)據(jù)庫之上的?!?/p>

在星爵看來,新一代數(shù)據(jù)庫技術(shù)就是能夠做到把各行業(yè)的大數(shù)據(jù)完全活用起來,包括那些正在死去的數(shù)據(jù)。

為了這個(gè)目標(biāo),Zilliz 正在加快市場的拓展,他們已經(jīng)與包括英偉達(dá)、IBM、偉創(chuàng)在內(nèi)的渠道商、系統(tǒng)整合商進(jìn)行合作。直銷加渠道銷售是現(xiàn)在的策略,這種方式讓 Zilliz 既有了硬件合作伙伴,后者也成了自己的渠道商,那頭部客戶建立關(guān)系也會(huì)更加高效,但如果自建一個(gè)銷售團(tuán)隊(duì),效率不一定跟得上。

換句話說,他們今年的重心將偏向產(chǎn)品落地,兼顧技術(shù)與產(chǎn)品研發(fā),下半年,他們也會(huì)正式在 FPGA 上做數(shù)據(jù)庫的場景化研發(fā)。

“我是一定要?jiǎng)?chuàng)業(yè)的”

現(xiàn)在正好是 Zilliz 成立兩周年,回看當(dāng)初離開 Oracle 的決定,星爵的回答很堅(jiān)決:沒有任何猶豫。

因?yàn)樵谀抢锷习嗟牡谝惶扉_始,他就是為創(chuàng)業(yè)去積累經(jīng)驗(yàn)的——很早他就認(rèn)定自己一定是要?jiǎng)?chuàng)業(yè)的。他說自己本質(zhì)上比較喜歡去追求冒險(xiǎn)、探索未知空間。

創(chuàng)業(yè)這件事是充滿了未知,但選擇的領(lǐng)域確實(shí)又是他所擅長的。在威斯康星大學(xué)麥迪遜分校攻讀計(jì)算機(jī)科學(xué)碩士學(xué)位時(shí),他專攻的就是數(shù)據(jù)庫,而后無論是在 Oracle 還是現(xiàn)在,所做的事都一脈相承。

他把硅谷文化也搬到了 Zilliz,“公司基本上是硅谷極客范兒”。

工程師身份讓他吸引了一批“臭味相投”的人才加入,他希望加入的早期員工有一個(gè)共同理念:為了做熱愛且有意義的事情走到一起,順便把錢賺了。

在團(tuán)隊(duì)內(nèi)部,他推崇個(gè)人英雄主義,希望每個(gè)人都能獨(dú)當(dāng)一面,這也解釋了他為什么要選“星爵”——《銀河護(hù)衛(wèi)隊(duì)》中保衛(wèi)銀河系的英雄——作為自己的花名。

星爵在宇宙中探索,卻不知道下個(gè)目的地,而他也擁抱創(chuàng)業(yè)中的不確定性?!斑@個(gè)過程中有挑戰(zhàn)那也是收獲,這就已經(jīng)足夠了,”他繼續(xù)說,“就算失敗了,那也會(huì)成為下一個(gè)你去探索的起點(diǎn)?!?/p>

有一絲騎士堂·吉訶德的意味,在宇宙中四處飄蕩的星爵在他眼里也挺失敗的。“但如果人生都可以預(yù)知,就少了很多樂趣?!彼a(bǔ)充道。

注:題圖來源于 Behance,作者 Ilya Tselyutin

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知

分享:
相關(guān)文章

編輯

關(guān)注人工智能的放牛娃
當(dāng)月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個(gè)人簡介
為了您的賬戶安全,請驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說