丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
業(yè)界 正文
發(fā)私信給王金許
發(fā)送

1

Zilliz 星爵:高維打擊,OLAP 數(shù)據(jù)庫(kù)的下一程

本文作者: 王金許 2018-01-22 11:04
導(dǎo)語(yǔ):這個(gè)領(lǐng)域會(huì)有成為下一個(gè) Oracle 的機(jī)會(huì)?

一個(gè)月前, Open Power 高峰論壇之后,IBM Systems Open Power 總經(jīng)理 Ken King 在媒體溝通會(huì)上向記者們?cè)俅螐?qiáng)調(diào)了 Power9 架構(gòu)的優(yōu)勢(shì)??傊谛阅苌?,與 X86 相比,就差他說“吊打”二字了。

一定程度上,這數(shù)據(jù)處理能力上的大幅提升有關(guān),而 Zilliz 這家看上去不怎么起眼的數(shù)據(jù)庫(kù)公司是“賦能者”之一,它聯(lián)合 IBM 發(fā)布的是國(guó)內(nèi)首臺(tái) GPU 硬件加速 OLAP 數(shù)據(jù)庫(kù)一體機(jī) MEGAWISE。

這對(duì) Power9 的性能到底有多大程度的提升呢?Zilliz 創(chuàng)始人星爵(真名謝超)當(dāng)時(shí)給了一組數(shù)據(jù):利用 GPU 的高并發(fā)性,數(shù)據(jù)處理的性能相對(duì) CPU 架構(gòu)提高了 100 倍,同時(shí),硬件成本降低了 10 倍,數(shù)據(jù)中心的運(yùn)維、能耗成本大概降低 20 倍。

這些數(shù)據(jù)的背后就是 Zilliz 的價(jià)值所在,它從星爵極快的語(yǔ)速中結(jié)束,記者們看上去似乎還沒反應(yīng)過來。

但更讓他們感到疑惑的或許是他說的第一句話:基于 GPU 硬件加速的新一代 OLAP 數(shù)據(jù)庫(kù)會(huì)是一項(xiàng)全新的顛覆性技術(shù)。

Zilliz 星爵:高維打擊,OLAP 數(shù)據(jù)庫(kù)的下一程

歸根結(jié)底,算力不夠

這個(gè)時(shí)代屬于人工智能,但也別忘了作為其重要基石的大數(shù)據(jù)。

放眼望去,各行業(yè)無論是堆積的歷史數(shù)據(jù),還是正產(chǎn)出的數(shù)據(jù)正在變得愈加龐雜,那些擁有數(shù)據(jù)的企業(yè)希望有更好數(shù)據(jù)分析服務(wù)來調(diào)整、掌控自身的業(yè)務(wù)。

但現(xiàn)有的處理方案,比如,基于 Hadoop 的技術(shù)雖然成本低,但分析速度難以滿足企業(yè)需求,而有些采集數(shù)據(jù)的處理還具有一定時(shí)效性。

總體而言,數(shù)據(jù)庫(kù)處理主要面臨這兩大瓶頸:一是數(shù)據(jù)計(jì)算速度,這與處理器相關(guān),處理器越強(qiáng)大,算力越好,處理越快;二是數(shù)據(jù)訪問速度,數(shù)據(jù)要從磁盤讀取,然后轉(zhuǎn)到內(nèi)存進(jìn)入處理器進(jìn)行分析。

這兩大問題在數(shù)據(jù)庫(kù)發(fā)展中一直是此消彼長(zhǎng)的存在,交替阻礙著彼此的發(fā)展。比如,通過水平擴(kuò)展可以增加更多處理器,但這會(huì)降低數(shù)據(jù)訪問速度。而后來出現(xiàn)的 A6,SSD 固態(tài)硬盤把數(shù)據(jù)訪問速度提高了一個(gè)數(shù)量級(jí),但處理架構(gòu)不得不做出改變,就像數(shù)據(jù)不再是放在固態(tài)硬盤,而是在內(nèi)存里。

這樣問題來了,由于內(nèi)存比固態(tài)硬盤又多了一個(gè)數(shù)量級(jí)的訪問速度,那一旦給出更多數(shù)據(jù),CPU 計(jì)算能力又跟不上了。于是,又只能到處理器那里做文章,以此陷入新一輪你上我下的死循環(huán)之中。

這是當(dāng)時(shí)在 Oracle 做數(shù)據(jù)庫(kù)的星爵一直所思考的問題。

身處在世界上頂尖數(shù)據(jù)庫(kù)專家云集的系統(tǒng)里,他對(duì)這個(gè)產(chǎn)業(yè)的認(rèn)知不再只是琢磨具體的技術(shù)細(xì)節(jié),而是回歸那些基礎(chǔ)問題。

為什么數(shù)據(jù)庫(kù)發(fā)展會(huì)變慢?為什么大數(shù)據(jù)有這種 Hadoop 的方案出現(xiàn)?為什么數(shù)據(jù)分析不可能跟上數(shù)據(jù)產(chǎn)生量? 

歸根到底,星爵告訴雷鋒網(wǎng),這些都是因?yàn)閿?shù)據(jù)庫(kù)處理系統(tǒng)的算力不夠。

數(shù)據(jù)庫(kù)的 indexes 加快了數(shù)據(jù)訪問、分析的速度,它本質(zhì)上是用空間來?yè)Q時(shí)間,那如果有一個(gè)算力快 1 萬(wàn)倍的 CPU 會(huì)不會(huì)更好呢?

他想到,加了 indexes 之后數(shù)據(jù)可能只存 1TB,而現(xiàn)在可能要存 1.5TB 甚至 2TB 的數(shù)據(jù)。但這樣,數(shù)據(jù)更新的同時(shí)也需要更新索引來維護(hù)數(shù)據(jù)一致性,這會(huì)導(dǎo)致插入更新數(shù)據(jù)的分析速度也會(huì)變慢,而算法也將變得更為復(fù)雜。

這又是另一個(gè)死胡同,跳出這個(gè)思維困境,一個(gè)大膽假設(shè)是干脆不要 indexes 了可以嗎?

上世紀(jì) 80 年代以后,indexes 就被視為數(shù)據(jù)庫(kù)的標(biāo)配,但實(shí)際上,就像充電寶被看做是手機(jī)的“標(biāo)配”一樣,星爵認(rèn)為,其實(shí)就是算力不夠,“夠的話,indexes 也許就不需要了”。

2012 年,In-Memory Database 系統(tǒng)的出現(xiàn)也解決了一些問題,但他并不認(rèn)為這能進(jìn)行高維打擊——有 GPU 處理器的智能手機(jī)對(duì)功能手機(jī)就是高維打擊。

此路不通,他在尋找新的能讓數(shù)據(jù)庫(kù)有所革新的機(jī)會(huì)。

“提速降本”,高維打擊

基于 GPU 加速的數(shù)據(jù)庫(kù)研究最早于 2006 年就開始了,當(dāng)時(shí)主要是在 GPU 上做數(shù)據(jù)庫(kù)處理算法。隨后,數(shù)據(jù)庫(kù)處理算法在不斷擴(kuò)充和優(yōu)化中,與之相關(guān)的話題在每年的 SIGMOD、VLDB 和 ICDE 三大國(guó)際頂級(jí)數(shù)據(jù)庫(kù)會(huì)議上被業(yè)內(nèi)人士進(jìn)行探討,

但直到 2013 年,深度學(xué)習(xí)的崛起將 GPU 市場(chǎng)普及度推向了高潮?;?GPU 這個(gè)新硬件平臺(tái)的天然優(yōu)勢(shì),人們對(duì)它的認(rèn)知不再是不務(wù)正業(yè)的游戲機(jī),而是可以成為 CPU 一樣的服務(wù)器芯片。

更重要的是,以英偉達(dá)的 CUDA 為代表的 GPU 生態(tài)也建了起來,開發(fā)門檻隨之降低。

“這應(yīng)該就是高維打擊的臨界點(diǎn)”,星爵覺得,他一直尋找的能讓數(shù)據(jù)庫(kù)從量變到質(zhì)變的革新終于要來了。

于是,2015 年下半年,在謝超所在的小組完成 Oracle 12c 的多租戶數(shù)據(jù)庫(kù)的研發(fā)后,是時(shí)候離開這個(gè)已經(jīng)服役 6 年的地方了。 

在 Oracle 的那些年,他經(jīng)歷了最初的項(xiàng)目立項(xiàng)到功能分析、需求分析,設(shè)計(jì)等整個(gè)流程。值得一提的是,2013 年,星爵所在的小組研發(fā)出了 Oracle 12c 第一版,“c”即代表“cloud(云計(jì)算)”,這是 Oracle 首個(gè)“為云而生”的數(shù)據(jù)庫(kù),它奠定了未來 Oracle 數(shù)據(jù)庫(kù)發(fā)展的戰(zhàn)略方向。

不過,這家全球最大的數(shù)據(jù)庫(kù)巨頭準(zhǔn)備在云計(jì)算市場(chǎng)發(fā)力,正是在他碩士畢業(yè)進(jìn)入 Oracle 的第一年,這比 Amazon 在 2005 年第一次提出開發(fā)云計(jì)算平臺(tái)晚了整整四年。也難怪,Oracle CEO Larry Ellison 當(dāng)時(shí)對(duì)云計(jì)算根本瞧不上,甚至認(rèn)為那是一個(gè)愚蠢的概念。

與前老板的態(tài)度不同,星爵要去抓住做 GPU 數(shù)據(jù)庫(kù)的機(jī)會(huì)了,他堅(jiān)定認(rèn)為這與數(shù)據(jù)庫(kù)巨頭們競(jìng)爭(zhēng)時(shí)能拉開差距。

因?yàn)?GPU 的出現(xiàn),讓數(shù)據(jù)提供速度與數(shù)據(jù)處理速度達(dá)到了平衡態(tài)。甚至,由于 GPU 處理能力在近幾年以數(shù)十倍速度不斷提升,這又遠(yuǎn)超于數(shù)據(jù)供給的速度,同時(shí)基于像 IBM 的 NVLink 這種高速互聯(lián)技術(shù),尤其 Power9 服務(wù)器使用的 NVLink 2.0,讓 GPU 與 CPU 之間可以建立三個(gè)通道,每個(gè)通道的速度提高到了 25G,這讓 GPU 訪問內(nèi)存的速度有了很大提升,而老對(duì)手英特爾并沒有解決數(shù)據(jù)訪問帶寬的問題。

對(duì)類似于 Power 系列軟硬一體機(jī)而言,基本需求點(diǎn)就是由軟件帶動(dòng)硬件的銷售,所以在他看來,IBM 在使用了 Zilliz 的數(shù)據(jù)庫(kù)軟件之后,也會(huì)促進(jìn)其硬件的銷量。 

數(shù)據(jù)分析速度問題就解決了,接下來就看能不能降低成本。

星爵告訴雷鋒網(wǎng),Power9 一體機(jī)每套大約 90 萬(wàn)元,而像 Oracle 的 Exadata 服務(wù)器成本則在幾十萬(wàn)美元到上百萬(wàn)美元之間不等,這么一比,前者是占優(yōu)的。

還有更重要的后續(xù)維護(hù)和能耗成本。以前,在數(shù)據(jù)庫(kù)中心擺上服務(wù)器要占據(jù)半個(gè)機(jī)房,現(xiàn)在可能需要一臺(tái)服務(wù)器就已足夠,而節(jié)省了數(shù)據(jù)庫(kù)中心的空間,后期運(yùn)維、能耗也自然隨之降低。 

除了搭載在 X86、Power 這樣的軟硬一體機(jī)上,Zilliz 的 GPU 數(shù)據(jù)庫(kù)軟件也被互聯(lián)網(wǎng)、金融、政府等行業(yè)應(yīng)用,他們正在選擇一些頭部客戶去做 POC,把數(shù)據(jù)庫(kù)系統(tǒng)部署在它們的生產(chǎn)環(huán)境,以解決技術(shù)落地問題。他們今年預(yù)計(jì)會(huì)服務(wù) 30-50 家客戶。

他也看好云端的 SaaS 數(shù)據(jù)庫(kù)方案,認(rèn)為這在未來有很大的成長(zhǎng)空間,現(xiàn)在他們的客戶就有 AWS、騰訊云、阿里云等云廠商。 

成為下一個(gè) Oracle 的機(jī)會(huì)

市場(chǎng)還處于早期階段。

Zilliz 目前是中國(guó)唯一一家做 GPU 數(shù)據(jù)庫(kù)的創(chuàng)業(yè)公司,其它拿到大額融資的還有三家,其中兩家在硅谷,一家在以色列。這四家公司在 OLAP 數(shù)據(jù)庫(kù)市場(chǎng)的年收入加起來不過 2000 萬(wàn)美元左右。

不過,根據(jù) Gartner 的統(tǒng)計(jì)數(shù)據(jù),在 2017 年,OLAP 數(shù)據(jù)庫(kù)是大約是 183 億美元的市場(chǎng),到 2020 年,預(yù)計(jì)會(huì)達(dá)到 228 億美元。

這個(gè)領(lǐng)域會(huì)有成為下一個(gè) Oracle 或者安卓的機(jī)會(huì),星爵這樣認(rèn)為。

一個(gè)問題是,既然這個(gè)市場(chǎng)空間的想象力這么大,巨頭們難道會(huì)坐視不理嗎?理論上講,像英偉達(dá)和 IBM 這樣的巨頭既然有硬件,那憑借這樣的優(yōu)勢(shì),它們介入基于 GPU 數(shù)據(jù)庫(kù)軟件自然也不奇怪。況且,在數(shù)據(jù)庫(kù)領(lǐng)域還有 Oracle 盤踞一方,那 Zilliz 這樣的創(chuàng)業(yè)公司能有多大的機(jī)會(huì)?

先從技術(shù)層面看,數(shù)據(jù)庫(kù)作為底層系統(tǒng)軟件,它的準(zhǔn)入門檻不低,但對(duì)于做傳統(tǒng)的基于 CPU 數(shù)據(jù)庫(kù)的 Oracle 來說,它一旦選擇切換到以 GPU 為核心這個(gè)數(shù)據(jù)庫(kù)上,需要從硬件到軟件包括存儲(chǔ)、優(yōu)化、執(zhí)行到整個(gè)數(shù)據(jù)管理和調(diào)度上,基本都要重新寫入,而不只是更改一些兼容性內(nèi)容。這個(gè)過程看上去不那么輕松。

“它不像是手機(jī) APP,甚至是 ERP 或者 CRM?!毙蔷魧?duì)雷鋒網(wǎng)解釋,這就好比微軟雖然在 PC 操作系統(tǒng)上馳騁了幾十年,但在手機(jī)這個(gè)硬件平臺(tái)上的競(jìng)爭(zhēng)力幾乎忽略不計(jì),“幾乎是一個(gè)推倒重來的過程?!?/p>

換個(gè)角度來看,即便巨頭們雖然有能力進(jìn)入,它們的共性在于響應(yīng)速度會(huì)緩慢很多。

另一方面,從商業(yè)角度來說,如果巨頭做 GPU 數(shù)據(jù)庫(kù)軟件,那必定也會(huì)沖擊現(xiàn)有的業(yè)務(wù)線。比如 Oracle現(xiàn)在賣得最好的是 Exadata,這還是 2010 年把 SUN 收購(gòu)以后研發(fā)而成的。那在它投入了數(shù)十億美元的產(chǎn)品線,甚至還沒賺回成本時(shí),它的目標(biāo)應(yīng)該是賣出更多的 Exadata,如果轉(zhuǎn)向 GPU 服務(wù)器它會(huì)非常慎重。

所以可以看到,近年來巨頭們的策略選擇也開始有所轉(zhuǎn)變,一般都是先守住自己擅長(zhǎng)的硬件,然后在軟件上找相應(yīng)的合作伙伴加盟開放平臺(tái),不再追求大包大攬。 IBM 成立的 Open Power 基金會(huì)就是如此。

因此,星爵并不認(rèn)為 GPU 數(shù)據(jù)庫(kù)這條路上他們會(huì)與 Oracle 們很快碰面。

創(chuàng)業(yè)公司機(jī)動(dòng)性要更強(qiáng),但并不意味著 Zilliz 闖入一個(gè)新興領(lǐng)域會(huì)比巨頭們?nèi)菀缀芏唷?/p>

公司發(fā)展戰(zhàn)略、商務(wù)拓展、市場(chǎng)銷售等方面是 CEO 星爵在這兩年里面臨的挑戰(zhàn),并且在未來幾年或許還將持續(xù)下去。一些挑戰(zhàn)讓這個(gè)團(tuán)隊(duì)在這兩年里走了彎路。

最糾結(jié)的還是對(duì)產(chǎn)品化的判斷,初期如何在產(chǎn)品與市場(chǎng)找出無縫切合點(diǎn)讓他們難以取舍,“最開始要兼容,你不能說完全做一個(gè)跟現(xiàn)在市場(chǎng)上所有(系統(tǒng))都去兼容。選哪家做兼容本身也沒有對(duì)錯(cuò),但可能要看最終是不是能選出最有價(jià)值的客戶,這可能要做大量的工作?!?/p>

針對(duì)不同方案對(duì)應(yīng)做數(shù)據(jù)庫(kù),他們很快就做出了產(chǎn)品,但隨著系統(tǒng)增多,這種做法讓以后在技術(shù)上做擴(kuò)展會(huì)更加復(fù)雜。

他們現(xiàn)在更希望提煉出其中的共性,然后做出統(tǒng)一的方案去兼容多個(gè)系統(tǒng),即使研發(fā)進(jìn)度會(huì)相應(yīng)減緩。對(duì)于 OLAP 數(shù)據(jù)庫(kù)軟件來說,其實(shí)本質(zhì)上做的就是一個(gè)平臺(tái),“ERP、CRM 各種企業(yè)級(jí)軟件都是建立在數(shù)據(jù)庫(kù)之上的。”

在星爵看來,新一代數(shù)據(jù)庫(kù)技術(shù)就是能夠做到把各行業(yè)的大數(shù)據(jù)完全活用起來,包括那些正在死去的數(shù)據(jù)。

為了這個(gè)目標(biāo),Zilliz 正在加快市場(chǎng)的拓展,他們已經(jīng)與包括英偉達(dá)、IBM、偉創(chuàng)在內(nèi)的渠道商、系統(tǒng)整合商進(jìn)行合作。直銷加渠道銷售是現(xiàn)在的策略,這種方式讓 Zilliz 既有了硬件合作伙伴,后者也成了自己的渠道商,那頭部客戶建立關(guān)系也會(huì)更加高效,但如果自建一個(gè)銷售團(tuán)隊(duì),效率不一定跟得上。

換句話說,他們今年的重心將偏向產(chǎn)品落地,兼顧技術(shù)與產(chǎn)品研發(fā),下半年,他們也會(huì)正式在 FPGA 上做數(shù)據(jù)庫(kù)的場(chǎng)景化研發(fā)。

“我是一定要?jiǎng)?chuàng)業(yè)的”

現(xiàn)在正好是 Zilliz 成立兩周年,回看當(dāng)初離開 Oracle 的決定,星爵的回答很堅(jiān)決:沒有任何猶豫。

因?yàn)樵谀抢锷习嗟牡谝惶扉_始,他就是為創(chuàng)業(yè)去積累經(jīng)驗(yàn)的——很早他就認(rèn)定自己一定是要?jiǎng)?chuàng)業(yè)的。他說自己本質(zhì)上比較喜歡去追求冒險(xiǎn)、探索未知空間。

創(chuàng)業(yè)這件事是充滿了未知,但選擇的領(lǐng)域確實(shí)又是他所擅長(zhǎng)的。在威斯康星大學(xué)麥迪遜分校攻讀計(jì)算機(jī)科學(xué)碩士學(xué)位時(shí),他專攻的就是數(shù)據(jù)庫(kù),而后無論是在 Oracle 還是現(xiàn)在,所做的事都一脈相承。

他把硅谷文化也搬到了 Zilliz,“公司基本上是硅谷極客范兒”。

工程師身份讓他吸引了一批“臭味相投”的人才加入,他希望加入的早期員工有一個(gè)共同理念:為了做熱愛且有意義的事情走到一起,順便把錢賺了。

在團(tuán)隊(duì)內(nèi)部,他推崇個(gè)人英雄主義,希望每個(gè)人都能獨(dú)當(dāng)一面,這也解釋了他為什么要選“星爵”——《銀河護(hù)衛(wèi)隊(duì)》中保衛(wèi)銀河系的英雄——作為自己的花名。

星爵在宇宙中探索,卻不知道下個(gè)目的地,而他也擁抱創(chuàng)業(yè)中的不確定性?!斑@個(gè)過程中有挑戰(zhàn)那也是收獲,這就已經(jīng)足夠了,”他繼續(xù)說,“就算失敗了,那也會(huì)成為下一個(gè)你去探索的起點(diǎn)?!?/p>

有一絲騎士堂·吉訶德的意味,在宇宙中四處飄蕩的星爵在他眼里也挺失敗的。“但如果人生都可以預(yù)知,就少了很多樂趣?!彼a(bǔ)充道。

注:題圖來源于 Behance,作者 Ilya Tselyutin

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

分享:
相關(guān)文章

編輯

關(guān)注人工智能的放牛娃
當(dāng)月熱門文章
最新文章
請(qǐng)?zhí)顚懮暾?qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說