0
本文作者: 張帥 | 2019-08-30 17:45 | 專題:CNCC 2019 |
全球正在進(jìn)入蓬勃發(fā)展的數(shù)字經(jīng)濟(jì)時(shí)代,數(shù)字產(chǎn)業(yè)化、產(chǎn)業(yè)數(shù)字化正在促進(jìn)實(shí)體經(jīng)濟(jì)和數(shù)字經(jīng)濟(jì)融合,數(shù)據(jù)成為關(guān)鍵生產(chǎn)要素,5G、4K/8K視頻、IoT、自動(dòng)駕駛等新聯(lián)接、新應(yīng)用正加速數(shù)據(jù)生產(chǎn)和流動(dòng),數(shù)據(jù)的計(jì)算、存儲(chǔ)、數(shù)據(jù)庫和大數(shù)據(jù)技術(shù)不斷突破,相互融合,促進(jìn)海量多樣性數(shù)據(jù)的價(jià)值最大化。
雷鋒網(wǎng)消息,近日由華為舉辦的全球數(shù)據(jù)基礎(chǔ)設(shè)施論壇上,華東師范大學(xué)副校長;數(shù)據(jù)學(xué)院創(chuàng)院院長、教授;中國計(jì)算機(jī)學(xué)會(huì)(CCF)數(shù)據(jù)庫專委會(huì)副主任周傲英發(fā)表了題為《中國未來需要什么樣的數(shù)據(jù)庫》主題演講。
周傲英教授深入淺出的講解了數(shù)據(jù)庫的發(fā)展歷史,并闡述了對(duì)數(shù)據(jù)庫發(fā)展趨勢(shì)的理解。他提到,過去的四五十年間,數(shù)據(jù)庫有很大的成功,但也有深刻的教訓(xùn)。發(fā)展至今,一個(gè)數(shù)據(jù)庫系統(tǒng)能夠解決所有的問題的想法已經(jīng)被擯棄,互聯(lián)網(wǎng)帶來的中國數(shù)據(jù)庫市場(chǎng)的新機(jī)遇。應(yīng)用驅(qū)動(dòng)創(chuàng)新,應(yīng)用能夠促進(jìn)技術(shù)的進(jìn)步,技術(shù)倒逼應(yīng)用的發(fā)展,形成一個(gè)聯(lián)動(dòng)良性循環(huán)。
以下為雷鋒網(wǎng)整理的周傲英教授演講實(shí)錄(雷鋒網(wǎng)現(xiàn)場(chǎng)編輯整理,未經(jīng)大會(huì)官方及演講者本人確認(rèn))。
周傲英:朋友們,很高興來到深圳,參加智能數(shù)據(jù)基礎(chǔ)設(shè)施全球論壇。我今天想跟大家分享的是《中國未來需要什么樣的數(shù)據(jù)庫》,也就是說,中國的數(shù)據(jù)庫面臨什么樣的機(jī)遇和什么樣的挑戰(zhàn)。
從數(shù)據(jù)庫的發(fā)展、數(shù)據(jù)庫的歷史角度。在世界上數(shù)據(jù)庫四五十年以來經(jīng)過了什么,我們未來會(huì)面臨著什么樣的環(huán)境,我們要做什么。這中間有一個(gè)特別大的變化,就是剛才侯總和胡總一直在提的數(shù)據(jù)。
“數(shù)據(jù)”是一個(gè)很老的詞,那為什么數(shù)據(jù)到現(xiàn)在如此的重要?數(shù)據(jù)庫是管理數(shù)據(jù)的,以前是管理數(shù)據(jù),未來也是管理數(shù)據(jù)。但就是因?yàn)楝F(xiàn)在我們對(duì)數(shù)據(jù)的認(rèn)識(shí)已經(jīng)超乎原來所有的認(rèn)識(shí)。這是我想分享的基本內(nèi)容。
大家都會(huì)想,數(shù)據(jù)庫是什么。因?yàn)閷?duì)一般的領(lǐng)導(dǎo)或者非專業(yè)人士,大家說把數(shù)據(jù)放在一起就叫數(shù)據(jù)庫。最早的數(shù)據(jù)庫是叫Data Bank。數(shù)據(jù)是像金錢一樣要存在銀行里。
但實(shí)際上對(duì)于專業(yè)人士,我們知道數(shù)據(jù)庫是計(jì)算機(jī)科學(xué)一個(gè)蠻重要的分支,因?yàn)閿?shù)據(jù)庫是支持關(guān)鍵核心業(yè)務(wù)。什么叫支持關(guān)鍵核心業(yè)務(wù)?就是管人、財(cái)、物,一定要精確管理,一定要分毫不差。數(shù)據(jù)庫經(jīng)過這幾十年的發(fā)展,有了巨大的變化。有了關(guān)系模型,有了事務(wù)處理,有查詢優(yōu)化,要越來越高效,越來越快。這就是數(shù)據(jù)庫這么幾十年的成就。
數(shù)據(jù)庫的發(fā)展,我們有非常輝煌的成就。這邊列出來的是四位數(shù)據(jù)庫的創(chuàng)造者或者先鋒(見PPT)。第一個(gè)是Charies Bachman,他提出了數(shù)據(jù)庫概念,提出DBTG報(bào)告,現(xiàn)在所的數(shù)據(jù)庫幾乎所有概念,各種語言等等概念都是他在他的報(bào)告里提出的。他是數(shù)據(jù)庫第一個(gè)圖靈獎(jiǎng)獲得者。
第二個(gè)是關(guān)系數(shù)據(jù)庫,關(guān)系模型的提出者,第三個(gè)是事務(wù)處理模型的提出者,也是第四范式的提出者,第四個(gè)是伯克利的教授,是數(shù)據(jù)庫很多系統(tǒng)的研發(fā)者,體系架構(gòu)的完善者。(見PPT)
我們?cè)倩仡櫼幌滤麄冏龅墓ぷ鳎搭^是COBOL語言。最早計(jì)算機(jī)出來時(shí)原來是做計(jì)算的,有了COBOL語言之后發(fā)現(xiàn)可以做商業(yè)的事,可以記帳可以發(fā)工資。
COBOL語言是一個(gè)語言,我們講語言時(shí),往往是把處理語句和數(shù)據(jù)放在一起,COBOL語言的數(shù)據(jù)量特別大,數(shù)據(jù)那一步特別大,所以要有一個(gè)文件系統(tǒng)管它。
文件系統(tǒng)數(shù)據(jù)越來越多時(shí),大家發(fā)現(xiàn)這是一個(gè)數(shù)據(jù)系統(tǒng)語言,所以有一個(gè)叫CODASYL,把COBOL語言做得更好。COBOL語言大家熟悉,如果不熟悉,追溯到2000年時(shí),“千年蟲”就是COBOL語言帶來的。
在COBOL語言會(huì)議上提出了DBTG報(bào)告,所以Charies Bachman拿到了圖靈獎(jiǎng)。它太簡單了,就是一個(gè)數(shù)據(jù)關(guān)系表,再到70年代時(shí)提出事務(wù)處理,使得原來在處理金融問題時(shí),可以用一個(gè)公共模型來處理,不要每個(gè)人都去編程序,使得我們的穩(wěn)定性和可用性更強(qiáng)了。
數(shù)據(jù)庫有很大的成功,但也有深刻的教訓(xùn)。
這個(gè)深刻的教訓(xùn)是因?yàn)閿?shù)據(jù)庫的發(fā)展歷史實(shí)際上是我們IT發(fā)展史的縮影、創(chuàng)新史的縮影。因?yàn)樗械腎T,包括數(shù)據(jù)庫,都是應(yīng)用驅(qū)動(dòng)創(chuàng)新。
剛才我在描述的,COBOL語言為了解決銀行的問題,就有了這一套發(fā)展,它是應(yīng)用在驅(qū)動(dòng)創(chuàng)新。我們國家現(xiàn)在是講創(chuàng)新驅(qū)動(dòng)發(fā)展。我們深刻的知道,對(duì)于IT來說,都是應(yīng)用驅(qū)動(dòng)創(chuàng)新,先有應(yīng)用再有技術(shù),再有理論。這個(gè)應(yīng)用的創(chuàng)新跟技術(shù)的創(chuàng)新形成良性的互動(dòng),形成一個(gè)正循環(huán)。數(shù)據(jù)庫發(fā)展的教訓(xùn)在于這是我們數(shù)據(jù)庫的先賢總結(jié)出來的教訓(xùn)。
原本我們以為一個(gè)數(shù)據(jù)庫系統(tǒng)能夠解決所有的問題,到大數(shù)據(jù)、Hadoop出來后,數(shù)據(jù)庫人認(rèn)為原來我們這個(gè)系統(tǒng)解決不了任何問題?;ヂ?lián)網(wǎng)出來以后,互聯(lián)網(wǎng)是最大的數(shù)據(jù)庫,但我們的數(shù)據(jù)庫在里面毫無作為,然后我們痛定思痛總結(jié)出來,對(duì)一類應(yīng)用就有一個(gè)數(shù)據(jù)庫。
抽象,從具體到抽象,我們把共性的東西、普遍的東西、本質(zhì)的東西抽象出來,就形成了數(shù)據(jù)庫。數(shù)據(jù)庫典型的就是抽象二字。
數(shù)據(jù)對(duì)語義的抽象形成了關(guān)系模型。關(guān)系數(shù)據(jù)庫的偉大之處在于把數(shù)據(jù)和語義分開來,我們要做數(shù)據(jù)庫的設(shè)計(jì),要設(shè)計(jì)第三范式,設(shè)計(jì)BC范式,把函數(shù)依賴抽象出來了,這個(gè)模式就反映了他們的語義。我們對(duì)業(yè)務(wù)邏輯的抽象,就得到了事物處理模型。一個(gè)票不給遞給兩個(gè)人,一個(gè)帳轉(zhuǎn)到那個(gè)帳號(hào),一定要那邊落了帳才能結(jié)束。對(duì)業(yè)務(wù)邏輯的抽象形成事務(wù)模型。
數(shù)據(jù)庫的三大成就就是關(guān)系模型、事務(wù)模型和查詢優(yōu)化。兩大成就都是抽象導(dǎo)致的。
抽象成就了數(shù)據(jù)庫的產(chǎn)業(yè),成就了數(shù)據(jù)庫的輝煌,但30多年僵化的抽象阻礙了發(fā)展。大家覺得抽象這么完美,這就是上帝定的、老天定的。關(guān)系數(shù)據(jù)庫這幾十年一統(tǒng)天下,根本的原因是我們覺得它可以解決所有問題。
當(dāng)大數(shù)據(jù)、互聯(lián)網(wǎng)概念出來之后,大家發(fā)現(xiàn)它不能解決這些問題。數(shù)據(jù)庫發(fā)展歷史中,有行業(yè)壟斷的格局,我們經(jīng)常說三足鼎立,Oracle、DB2和TERADATA。
新的業(yè)態(tài),新的產(chǎn)品數(shù)據(jù)庫很難發(fā)展起來。我們知道這些數(shù)據(jù)庫有一個(gè)最大的特點(diǎn),它很難Scaling Up。在互聯(lián)網(wǎng)時(shí)代,我們講Scaling Up,我們不止靠買高端的服務(wù)器、存儲(chǔ)向上擴(kuò)展,這是數(shù)據(jù)庫不適應(yīng)當(dāng)代的原因。
互聯(lián)網(wǎng)改變了世界,互聯(lián)網(wǎng)改變世界是因?yàn)榛ヂ?lián)網(wǎng)改變了人。
馬克思關(guān)于人的定義,他說人是社會(huì)關(guān)系的總和,人變了,這個(gè)世界就變了。這個(gè)互聯(lián)網(wǎng)怎么來改變?nèi)撕腿酥g的關(guān)系?因?yàn)樗淖兞巳撕腿酥g的連接,并且把用戶體驗(yàn)用數(shù)據(jù)來做。以前是靠教育、教養(yǎng)改善用戶體驗(yàn),現(xiàn)在是靠數(shù)據(jù),行為數(shù)據(jù)。有人說我們?cè)敢庥米约旱碾[私數(shù)據(jù)來換取服務(wù)的便利。他為什么能夠那么好的用?其實(shí)他拿到我們的隱私數(shù)據(jù)、行為?;ヂ?lián)網(wǎng)為什么能做這件事?
互聯(lián)網(wǎng)就是平臺(tái),在互聯(lián)網(wǎng)上誰都可以用,平等就會(huì)有民主。人工智能會(huì)再度熱,因?yàn)槲覀円鼍珳?zhǔn)營銷,通過行為數(shù)據(jù)洞察人性。最重要的手段是人工智能的算法或者深度學(xué)習(xí)的算法。馬克思也說,一個(gè)學(xué)科當(dāng)它用上數(shù)學(xué)了,就變成一個(gè)科學(xué)。我說互聯(lián)網(wǎng),就像100年以前中國人在呼喚的德先生和賽先生?;ヂ?lián)網(wǎng)特別重要,因?yàn)榛ヂ?lián)網(wǎng)造就了大數(shù)據(jù)。
在十八大召開以后,2013年李克強(qiáng)總理領(lǐng)導(dǎo)的新一代政府上任時(shí)就在講大數(shù)據(jù)、國家戰(zhàn)略。有了大數(shù)據(jù)之后講互聯(lián)網(wǎng)+,到2015年講創(chuàng)業(yè)創(chuàng)新,2016年講供給側(cè)改革,2017年講分享經(jīng)濟(jì),2018年講人工智能。我三五年前預(yù)測(cè)后面一定會(huì)講區(qū)塊鏈,因?yàn)閰^(qū)塊鏈才是真正的互聯(lián)網(wǎng)。這是世界潮流,數(shù)據(jù)帶來的。
互聯(lián)網(wǎng)為什么帶來這么大的變化?因?yàn)镈ata Is Power。
講到Data Is Power我們會(huì)想到Keowledge is power。我們現(xiàn)在講Power是在講電,數(shù)據(jù)是一個(gè)新的電。在Data Power以前我們還有兩個(gè)Power。最近的Power是“蒸汽能”,再早一點(diǎn)的Power是“電能”,后面是“數(shù)據(jù)能”。
有了蒸汽能才有第一次工業(yè)革命,我們進(jìn)入工業(yè)經(jīng)濟(jì),有了電能的誕生才有第二次工業(yè)革命。我們用最近30多年彌補(bǔ)了起來,現(xiàn)在面臨一個(gè)新的Power的誕生。
在新經(jīng)濟(jì)的背景下,也就是剛才提到的數(shù)字經(jīng)濟(jì),我們覺得數(shù)據(jù)就是新的生產(chǎn)資料,算力就是新的生產(chǎn)力。一個(gè)新的Power來了,就像電來了,從蒸汽時(shí)代轉(zhuǎn)到電的時(shí)代就是未來已來,一切重構(gòu)的時(shí)代,所有一切都應(yīng)該重新來一遍。
在我們這個(gè)時(shí)代數(shù)據(jù)作為一個(gè)Power出來,我們看數(shù)據(jù)系統(tǒng),Hadoop、Spark,都是為了解決應(yīng)用的問題,把它抽象成技術(shù),通過開源推廣應(yīng)用。這就是數(shù)據(jù)系統(tǒng)的成長之路,它跟以前的數(shù)據(jù)庫是一樣的,只是現(xiàn)在是活生生的就在我們眼睛前告訴我們。
我們現(xiàn)在處在一個(gè)非常重要的機(jī)遇窗口期。在資本主義經(jīng)濟(jì)里有一個(gè)說法叫康德拉季耶夫周期理論。資本主義經(jīng)濟(jì)要經(jīng)過50年、60年的波動(dòng),并且在一個(gè)新的Power誕生以后,前面20年都在準(zhǔn)備裝備、技術(shù)、理論,后面30年是廣泛應(yīng)用階段?;ヂ?lián)網(wǎng)到現(xiàn)在整整20年,未來30年對(duì)中國特別重要,能不能把這個(gè)Data Power發(fā)揮它的威力。
我說中國數(shù)據(jù)庫在這樣的時(shí)代面臨重要的機(jī)遇,互聯(lián)網(wǎng)非常成功的告訴我們,應(yīng)用驅(qū)動(dòng)創(chuàng)新,這是一條重要的路徑。
應(yīng)用能夠促進(jìn)技術(shù)的進(jìn)步,技術(shù)倒逼應(yīng)用的發(fā)展,形成一個(gè)良性循環(huán),這就是聯(lián)動(dòng)。
我們處在升級(jí)換代的時(shí)代,我們面臨這種國際形勢(shì),要我們做替代工程。替代工程和升級(jí)換代并舉的創(chuàng)新是最好的,我相信也是華為最好的機(jī)遇。替代工程只是我們的一個(gè)影子,升級(jí)換代才是最根本的東西,再加上開源。開源為這個(gè)持續(xù)的發(fā)展提供了生態(tài),開源從最初企業(yè)的自發(fā)行為個(gè)人的自發(fā)行為,逐漸演變成企業(yè)的商業(yè)行為。我現(xiàn)在覺得開源很多時(shí)候變成一種國家行為。因?yàn)樗旧鲜且环N文化、精神,并且它會(huì)形成一種國家的萬眾創(chuàng)新的能力。
我對(duì)未來中國數(shù)據(jù)庫的發(fā)展,要特別重視IT領(lǐng)域?qū)?yīng)用驅(qū)動(dòng)創(chuàng)新的認(rèn)識(shí)和研討。豐富的應(yīng)用是我們最大的驅(qū)動(dòng)力,它應(yīng)該是我們研究的出發(fā)點(diǎn),也應(yīng)該是我們研究的落腳點(diǎn)。
我們?cè)诮鉀Q問題的過程當(dāng)中,來形成技術(shù)、建立理論,我們要做好頂層設(shè)計(jì),要營造健康的生態(tài)來打造開源的文化,我們有龐大的技術(shù)力量和研究力量,我們有那么大的工程師,那么多的大學(xué),但我們需要組織和需要引導(dǎo)。健康生態(tài)的營造首先需要開放,開源是必由之路?;A(chǔ)軟件和系統(tǒng)軟件的模塊化、?;?,才能做到開源,才能促進(jìn)萬眾創(chuàng)新?;A(chǔ)研究和原始創(chuàng)新需要攻關(guān),需要久久圍攻。
我們處在數(shù)據(jù)庫發(fā)展的最佳時(shí)間,需要?jiǎng)?chuàng)新商業(yè)模式,豐富的應(yīng)用場(chǎng)景,要像華為這樣引領(lǐng)的企業(yè)。
我一直在說數(shù)據(jù)庫是信息社會(huì)的基礎(chǔ)設(shè)施。我們今天論壇的主題是“智能數(shù)據(jù)基礎(chǔ)設(shè)施”。如果數(shù)據(jù)認(rèn)為是一個(gè)新的Power,就像研究電力設(shè)施一樣,我們?cè)谘芯课覀兊幕A(chǔ)設(shè)施。數(shù)據(jù)是一個(gè)新的Power,我們有非常成功的方法學(xué),需要全譜系的。
我們不是做一個(gè)Oracle,我們要量身打造,奪身定制,為不同的應(yīng)用做不同的數(shù)據(jù)庫系統(tǒng)。中國數(shù)據(jù)庫的未來在于要有開放的架構(gòu),不要抱殘守缺固步自封。開源的生態(tài),解決問題,要真正的解決問題,更重要的是要解放思想,我覺得Open是我們數(shù)據(jù)庫走向自由的必由之路。
謝謝大家!
【CNCC 2019來了!】
10月17-19日,CNCC 2019 將在蘇州金雞湖國際會(huì)議中心舉辦,本次會(huì)議由中國計(jì)算機(jī)學(xué)會(huì) (CCF) 主辦,蘇州工業(yè)園區(qū)管委會(huì)承辦。
CNCC 全稱為中國計(jì)算機(jī)大會(huì),是我國計(jì)算領(lǐng)域規(guī)模最大、規(guī)格最高的學(xué)術(shù)、技術(shù)、產(chǎn)業(yè)交融互動(dòng)的盛會(huì)。該會(huì)議創(chuàng)建于 2003 年,每年于不同城市舉辦,至今已成功舉辦十五屆。會(huì)議形式包括大會(huì)特邀報(bào)告、大會(huì)論壇、技術(shù)論壇、特色活動(dòng)及展覽展示等。大會(huì)對(duì)本文提到的安防芯片領(lǐng)域的最新趨勢(shì)動(dòng)向準(zhǔn)備了豐富的內(nèi)容,敬請(qǐng)關(guān)注。
如果你是個(gè)人參會(huì),可以:
?通過官網(wǎng)cncc.ccf.org.cn參會(huì)報(bào)名
?申請(qǐng)論壇,作為論壇主席或講者參會(huì)
?申請(qǐng)資助參會(huì),申請(qǐng)者限邊遠(yuǎn)地區(qū)高校青年教師或?qū)W生
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。