丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號安全和更好的產(chǎn)品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
人工智能 正文
發(fā)私信給宗仁
發(fā)送

0

CNCC 2016| 中科院包云崗37頁PPT剖析 ——如何降低云計算數(shù)據(jù)中心的成本?

本文作者: 宗仁 2016-10-24 21:19 專題:2016中國計算機大會(CNCC 2016)
導語:我今天的話,圍繞一個目標,想把三個關(guān)鍵詞串起來,目標是希望降低云計算數(shù)據(jù)中心的成本,三個關(guān)鍵詞是云計算、馮諾依曼結(jié)構(gòu)以及標簽化。

雷鋒網(wǎng)按:本文根據(jù)包云崗教授近日在 CNCC 2016 上所做的大會特邀報告《云計算與標簽化馮諾依曼體系結(jié)構(gòu)》編輯整理而來,在未改變原意的基礎上略作了刪減。

包云崗,于2003年獲南京大學理學學士,2008年獲中科院計算所博士學位,現(xiàn)為中科院計算所研究員,博士生導師,先進計算機系統(tǒng)研究中心副主任。研究方向主要是計算機系統(tǒng)結(jié)構(gòu)。主要工作包括:(1)博士期間帶領小組設計與實現(xiàn)了在國際上具有獨特優(yōu)勢的訪存監(jiān)控系統(tǒng)HMTT (Sigmetrics’08),為斯坦福大學、EPFL、清華大學、華為、韓國Hynix等十幾個機構(gòu)提供超過2TB的訪存蹤跡數(shù)據(jù);(2)提出了基于路劃分的DMA Cache技術(shù) (HPCA’10),在2014年發(fā)布的Intel Xeon處理器中采用相同技術(shù)路線:(3)在普林斯頓大學開展博士后研究,發(fā)布多核基準測試集PARSEC 3.0版本 (ACM Computer Architecture News 2016),下載已逾7000次,被三大體系結(jié)構(gòu)國際頂級會議上70%以上的論文使用;(4)提出軟件定義服務器新架構(gòu)PARD (ASPLOS'15),作為華為全球合作五個代表性成果之一入選華為2015年報,并受邀參加2015年國際計算機頂級論壇德國Dagstuhl Seminar。包云崗在國際一流計算機系統(tǒng)會議期刊發(fā)表了10余篇論文,曾兩次獲計算所優(yōu)秀論文一等獎,獲2013年CCF-Intel青年學者獎。同時擔任CCF普及工作委員會主任,《中國計算機學會通訊》編委。

CNCC 2016| 中科院包云崗37頁PPT剖析 ——如何降低云計算數(shù)據(jù)中心的成本?

目標:降低云計算數(shù)據(jù)中心的成本

我今天的話,圍繞一個目標,想把三個關(guān)鍵詞串起來,目標是希望降低云計算數(shù)據(jù)中心的成本,三個關(guān)鍵詞是云計算、馮諾依曼結(jié)構(gòu)以及標簽化。

CNCC 2016| 中科院包云崗37頁PPT剖析 ——如何降低云計算數(shù)據(jù)中心的成本?

首先看2014年,百度這個最高獎,當時我的學生實習所在的團隊拿到這個最高獎,成為非常少有的在百度兩次獲得這個獎的,非常少有的現(xiàn)象,但他們的工作和貢獻卻值得兩次獲獎,他們以提高數(shù)據(jù)中心的利用率為點,為百度節(jié)省了上10億的成本。

CNCC 2016| 中科院包云崗37頁PPT剖析 ——如何降低云計算數(shù)據(jù)中心的成本?

關(guān)鍵詞一:云計算

所以,提到數(shù)據(jù)中心的話,我們很多人會覺得好像離自己很遠,實際上現(xiàn)在的數(shù)據(jù)中心已經(jīng)和發(fā)電廠,自然水廠一樣,成為了我們社會的基礎設施。比如打開微信,在這個等待的過程中,一半時間都是數(shù)據(jù)中心幫我們在處理請求,數(shù)據(jù)中心現(xiàn)在實際上是互聯(lián)網(wǎng)公司的核心競爭力。

CNCC 2016| 中科院包云崗37頁PPT剖析 ——如何降低云計算數(shù)據(jù)中心的成本?

微軟前CEO鮑爾默在2013年時曾驕傲地說——全世界沒有幾個公司懂云計算,懂公有云。真正能理解并管理這種大規(guī)模數(shù)據(jù)中心的企業(yè),在全世界非常非常少。

CNCC 2016| 中科院包云崗37頁PPT剖析 ——如何降低云計算數(shù)據(jù)中心的成本?

事實上,微軟它是有資本去驕傲的,你們可以看到微軟過去在數(shù)據(jù)中心領域投資了150億美元,包括上次國慶節(jié)我和微軟的一位杰出工程師,他負責數(shù)據(jù)中心的未來規(guī)劃,他表示到今年年底微軟在數(shù)據(jù)中心的投資會達到300億美元,我們知道一艘航母大概是100-150億美元,所以這些互聯(lián)網(wǎng)公司幾乎每年都要造“一艘航母”。

實際上數(shù)據(jù)中心是我們一個國家在工業(yè)信息各方面綜合實力的一個體現(xiàn),好在我們中國國內(nèi)的企業(yè)也不甘示弱。我們看到阿里上個月在張北數(shù)據(jù)中心啟用,這個數(shù)據(jù)中心耗資180億,但是它們已經(jīng)感到了成本的壓力。

CNCC 2016| 中科院包云崗37頁PPT剖析 ——如何降低云計算數(shù)據(jù)中心的成本?

所以它在最近在7月份的時候?qū)iT去成立了一個部門去降低數(shù)據(jù)中心的開銷。但是另外一邊,我們來看看數(shù)據(jù)中心利用率怎么樣?

CNCC 2016| 中科院包云崗37頁PPT剖析 ——如何降低云計算數(shù)據(jù)中心的成本?

這是蓋特納和麥肯錫的調(diào)研數(shù)據(jù):全球的服務器利用率只有6%到12%,即使是亞馬遜利用虛擬云計算把這個利用率提升了這個利用率還是只有7%-17%,所以可以看到大部分資源和成本其實是被浪費的,那怎么提高?

CNCC 2016| 中科院包云崗37頁PPT剖析 ——如何降低云計算數(shù)據(jù)中心的成本?

可以去共享,在一個服務器上去跑多個應用,這樣的話可以一定時期內(nèi)把服務器的利用率提高到幾倍。實際上谷歌也是這么做的,目前它們數(shù)據(jù)中心可以分成兩類:一類跑在線應用,另外一類跑批處理(作業(yè))。

CNCC 2016| 中科院包云崗37頁PPT剖析 ——如何降低云計算數(shù)據(jù)中心的成本?

我們可以看到,可以通過這種共享可以把批處理作業(yè)的這種數(shù)據(jù)中心提升到75%以上的CPU利用率, 但是對于在線應用(服務),還是只有30%。所以問題是為什么不把所有數(shù)據(jù)中心的利用率到提升到70%以上呢? 

CNCC 2016| 中科院包云崗37頁PPT剖析 ——如何降低云計算數(shù)據(jù)中心的成本?

這里有一個在線服務的例子。

  • 如果我們把CPU利用率從30%提升到70%,響應時間就會提高10倍。

  • 這個例子其實在我們的生活中也會常見,在北京四環(huán)如果要去南站,如果是早上6:00,只需要22分鐘就可以到,如果是下午3:00的話,我就需要一個小時,還不一定能到,如果要在車流量多的時候,要讓救護車順利通過這是難事,都出過好幾次這樣的新聞。

CNCC 2016| 中科院包云崗37頁PPT剖析 ——如何降低云計算數(shù)據(jù)中心的成本?

事實上數(shù)據(jù)中心也面臨著這樣的難題,就是我們怎么去保障用戶數(shù)據(jù)體驗,同時又能提高資源的利用率,這一點現(xiàn)在只能是二選一,  對于很多互聯(lián)網(wǎng)公司來說,保障用戶體驗往往是第一位的。

CNCC 2016| 中科院包云崗37頁PPT剖析 ——如何降低云計算數(shù)據(jù)中心的成本?

谷歌做過一個例子,它們搜索引擎的響應時間從0.4秒增加到0.9秒,廣告的收入就會下降20%,這對于谷歌來說,是上百億美元的損失。

CNCC 2016| 中科院包云崗37頁PPT剖析 ——如何降低云計算數(shù)據(jù)中心的成本?

所以我們可以這樣理解,這種情況下它寧可讓數(shù)據(jù)中心利用率低一些,即使損失幾十億,但可以保障用戶的體驗。但誰也不想這樣白白的浪費。像谷歌有世界上最頂尖的工程師,像Jeff Dean和 Luiz Barroso等, 他們在不斷地從軟件層次去優(yōu)化數(shù)據(jù)中心,通過在虛擬化、在操作系統(tǒng)、在分布式架構(gòu)上提出了很多新的技術(shù)。

CNCC 2016| 中科院包云崗37頁PPT剖析 ——如何降低云計算數(shù)據(jù)中心的成本?

關(guān)鍵詞二:馮諾依曼結(jié)構(gòu)

所以經(jīng)過10年的掙扎,到2015年,他們得出一個結(jié)論——需要硬件支持。

CNCC 2016| 中科院包云崗37頁PPT剖析 ——如何降低云計算數(shù)據(jù)中心的成本?

這是在去年Dick Sites,也是原來在Dec做CPU,現(xiàn)在在參與數(shù)據(jù)中心的。他提出,現(xiàn)在數(shù)據(jù)中心服務器跟以前傳統(tǒng)PC不一樣,有很多新的問題、新的挑戰(zhàn)。包括怎么來消除多個應用間的競爭?怎么來實現(xiàn)很好的隔離?這些都很難,需要硬件去做支持,軟件都已經(jīng)做了很多工作,已經(jīng)盡力了。但是硬件上怎么來支持?

那我們來回顧馮諾依曼結(jié)構(gòu),這是一個非常優(yōu)美的結(jié)構(gòu),但是它還不是完美。1978年圖靈獎獲得者John Backus,在他的演說當中直接指出馮諾依曼結(jié)構(gòu)中,連接CPU和存儲的通道會成為瓶頸,我們稱之為馮諾依曼瓶頸。

CNCC 2016| 中科院包云崗37頁PPT剖析 ——如何降低云計算數(shù)據(jù)中心的成本?

事實上正如Backus預言,從1980年開始,CPU很完美的增長速度就開始出現(xiàn)不一致,所以出現(xiàn)了CPU每年50%速度的增長,而Memory只有7%,這樣的話導致了內(nèi)存墻的問題,體系結(jié)構(gòu)界怎么來解決?

CNCC 2016| 中科院包云崗37頁PPT剖析 ——如何降低云計算數(shù)據(jù)中心的成本?

體系結(jié)構(gòu)界就是不斷地增長層次,一層、二層、三層,這樣來彌補CPU和內(nèi)存間速度的匹配。所以到今天,我們存儲的層次已經(jīng)變成這樣,有很多層。但是2000年之后,多核又出現(xiàn)了。多核的出現(xiàn),把整個存儲層次又分成了兩塊,一塊把它放在核內(nèi)、一塊把它放在核外,核內(nèi)的話,隨著核的數(shù)目增加,它可以不斷地復制。

但這個時候,我們?nèi)绻\行兩個應用程序,跑在不同的核上面,我們可以看到,當它們的請求都送到核外共享的這些存儲層次的話,對于這些存儲層次來說,它們并不知道這些應用,誰更優(yōu)先,誰更緊急,所以以第三級為例的話,它屬于一種無需共享的狀態(tài),沒有辦法去區(qū)分到底哪個是來自更緊急的應用,但這種無序共享實際上會導致性能無法保障。

CNCC 2016| 中科院包云崗37頁PPT剖析 ——如何降低云計算數(shù)據(jù)中心的成本?


這里Intel做過一項實驗,如果在一個CPU上面我只跑一個應用程序,可以把任務填滿到三級cache里面去,每一個應用都可以跑地很好,但只要兩個應用程序一起,性能就會下降超過三倍以上,對于云計算環(huán)境來說,這樣的用戶體驗就非常糟糕。

CNCC 2016| 中科院包云崗37頁PPT剖析 ——如何降低云計算數(shù)據(jù)中心的成本?

▎關(guān)鍵詞三:標簽化

如果回顧技術(shù)發(fā)展史的話,就會知道,今天數(shù)據(jù)中心遇到的問題,很多個應用,很多用戶,他們開始共享一個基礎設施,但他們的需求又不一樣,有的要求延遲,有的要求吞吐,所以帶來一些Qos的保障問題。但是谷歌的處理辦法是非常粗放式的,直接把它分成兩類(在線分離,離線分離兩類)。

但如果我們回顧一下因特網(wǎng)的話,90年代它也遇到這樣的問題,但因特網(wǎng)用了另外一套解決方案,它們就是標簽化網(wǎng)絡的機制。

CNCC 2016| 中科院包云崗37頁PPT剖析 ——如何降低云計算數(shù)據(jù)中心的成本?

什么是標簽化網(wǎng)絡?我的理解是4個方面。

  • 第一個是細粒度對象,每一個網(wǎng)絡包增加一個標簽。

  • 第二個是關(guān)聯(lián)語義,標簽的值是和用戶的需求直接相關(guān)的。

  • 第三個是攜帶傳播,也就是這個標簽會在這個網(wǎng)絡包的的生命周期中去傳播。

  • 第四個是轉(zhuǎn)發(fā)控制(見下)。所以某種程度上,實際上標簽代表了一種接口,它是把用戶的要求,通過標簽,傳到了底層的網(wǎng)絡設備。

CNCC 2016| 中科院包云崗37頁PPT剖析 ——如何降低云計算數(shù)據(jù)中心的成本?

事實上,在體系結(jié)構(gòu)界,也意識到了,我們現(xiàn)在傳統(tǒng)的接口,體系結(jié)構(gòu)界的接口,指令,虛擬內(nèi)存,實際上它自己也意識到了自己的局限性。所以在2012年的時候發(fā)出了白皮書,在白皮書中明確指出,我們需要新的更高層次的抽象接口,來把程序員,來把編譯器的信息傳遞到底層硬件,這信息包括Qos,包括Security等等。

CNCC 2016| 中科院包云崗37頁PPT剖析 ——如何降低云計算數(shù)據(jù)中心的成本?

那么的我們的一個疑問是,有沒有可能網(wǎng)絡界的標簽化也用到體系結(jié)構(gòu)內(nèi)呢,答案是可以的。因為我們觀察到今天的計算機,實際上它本質(zhì)上就是一個網(wǎng)絡,內(nèi)部不同的部件之間,它們的通信都是通過包的形式傳播的。比如我們要傳一個DMA,從網(wǎng)卡把數(shù)據(jù)送到內(nèi)存,這是一個典型的PCIe包,PCIe包就會通過網(wǎng)絡傳到I/O的橋上面,再轉(zhuǎn)成內(nèi)部的包,再送到內(nèi)存上去,線上網(wǎng)絡也是一樣。

CNCC 2016| 中科院包云崗37頁PPT剖析 ——如何降低云計算數(shù)據(jù)中心的成本?

所以我在2012年的時候當時就有這個想法,但一直沒有更深入的理解,后來回到計算所后,和各位老師多次交流,我們把它總結(jié)為標簽化馮諾依曼結(jié)構(gòu),它不是對馮諾依曼結(jié)構(gòu)的革新,它只是在馮諾依曼結(jié)構(gòu)上的一個擴展。它的特點,我想也是可以包括四方面:

  • 第一個是細粒度對象(見下);

  • 第二個是關(guān)聯(lián)語義(見下);

  • 第三個是攜帶傳播(見下);

  • 第四個是軟件定義的(或者可編程的)標簽控制邏輯,這一點的話我們可以通過這種方式,來實現(xiàn)對整個內(nèi)部請求的一個區(qū)分化的服務。

這是一個基本的idea。

CNCC 2016| 中科院包云崗37頁PPT剖析 ——如何降低云計算數(shù)據(jù)中心的成本?

所以,這個結(jié)構(gòu)是希望在云計算的環(huán)境下,保證用戶的體驗,然后再把現(xiàn)在CPU的速度提升到翻一倍。我們經(jīng)過實踐發(fā)現(xiàn),這在排隊模型里面,有很好的支持,這樣做,通過優(yōu)先權(quán)隊列,我們可以做到,在保證高優(yōu)先級應用的響應時間,把整個系統(tǒng)負載提高,所以標馮結(jié)構(gòu)實際上是通過標簽化機制實現(xiàn)了優(yōu)先權(quán)對列。

CNCC 2016| 中科院包云崗37頁PPT剖析 ——如何降低云計算數(shù)據(jù)中心的成本?

不過這帶來了很多開放性問題。

CNCC 2016| 中科院包云崗37頁PPT剖析 ——如何降低云計算數(shù)據(jù)中心的成本?


比如說理論上,這種結(jié)構(gòu),對于RAM,PRAM等計算模型有沒有影響,我們是不是要發(fā)展新的計算模型?我們在硬件體系上來實現(xiàn)它呢?我們怎么來編程,怎么把用戶的需求來表達?……這有很多問題。

比較幸運的是,我們剛剛收到了科技部的支持,所以我們在未來在這個領域會有更進一步的研究,在過去幾年,實際上我們在體系結(jié)構(gòu)層次上探索,下面我們簡單介紹一下我們在這方面探索的結(jié)果。

這是一個傳統(tǒng)的體系結(jié)構(gòu)工作,我們做的工作實際上就是,我們做了一種新的結(jié)構(gòu),名字叫PARD,實際上

  • 它首先就是把內(nèi)部的請求都進行標簽化。

CNCC 2016| 中科院包云崗37頁PPT剖析 ——如何降低云計算數(shù)據(jù)中心的成本?

  • 第二個在共享的部件上,我們加上控制、邏輯,同時把控制邏輯通過一個網(wǎng)絡的連接,形成一個控制平面。

  • 再一個我們會增加一個編程接口(管理模塊),然后把所有的控制平面,控制邏輯,把它抽象成成一個樹形來進行操作。

實踐結(jié)果

所以想法很簡單,但我們把它真的實現(xiàn),花了我們?nèi)甑臅r間,我們實現(xiàn)了兩個模擬器,一個軟件的模擬器,一個基于FPGA的原型,這些都可以開源,在網(wǎng)上可以下載到。

CNCC 2016| 中科院包云崗37頁PPT剖析 ——如何降低云計算數(shù)據(jù)中心的成本?

這是一個基于FPGA的原型(如下圖),它已經(jīng)實現(xiàn)了這種基本的標馮結(jié)構(gòu)。同時我們設計出了這么一個可編程邏輯的模版,它可以放到不同的部件里面去,所以在這個基礎上我們可以看看它是怎么用的?

CNCC 2016| 中科院包云崗37頁PPT剖析 ——如何降低云計算數(shù)據(jù)中心的成本?

我們可以看第一個例子,可以在標簽控制邏輯里面加上一點地址映射,那么我們就可以實現(xiàn)一個硬件實現(xiàn)的虛擬化,Hypervisor。我們不需要軟件的Hypervisor, 就可以把整個硬件標簽將計算機直接隔離成多個獨立的子機器,然后每個獨立的子機器(亦稱為分區(qū))可以運用獨立的操作系統(tǒng)。

CNCC 2016| 中科院包云崗37頁PPT剖析 ——如何降低云計算數(shù)據(jù)中心的成本?

這一點在我們FPGA平臺上已經(jīng)可以實現(xiàn),我們有4core, 就可以把它隔成個分區(qū),每個分區(qū)可以運行獨立的OS,而不需要Hypervisor。

CNCC 2016| 中科院包云崗37頁PPT剖析 ——如何降低云計算數(shù)據(jù)中心的成本?

而且分區(qū)之間的資源可以去動態(tài)地調(diào)節(jié),通過對控制邏輯進行一個重編程,同時我們也可以做到在控制邏輯里面加上優(yōu)先權(quán)隊列,優(yōu)先權(quán)的控制,那么我們就可以去做一些性能的隔離,去做一些性能QoS的保障。比如我們的一個實驗,如果在緩存帶寬50%的情況下,加上優(yōu)先權(quán)隊列,那么內(nèi)存控制器的排隊時間,對于高優(yōu)先級(任務)可以下降5.6倍,對于低優(yōu)先級的(任務)只會增加33%,這是非常好的一個結(jié)果。

CNCC 2016| 中科院包云崗37頁PPT剖析 ——如何降低云計算數(shù)據(jù)中心的成本?

基于這樣的一種分配,我們可以做到CPU在滿負荷的情況下,依然可以保證它較快的反應時間,這是產(chǎn)生的一個初步影響力,我們發(fā)表了一些論文,也是得到了華為的一些支持,工業(yè)界的一些支持,同時很幸運地被去年Dagstuhl Seminar論壇介紹這方面的工作,包括這個工作也是作為華為全球合作代表成果之一入選華為2015年報。

CNCC 2016| 中科院包云崗37頁PPT剖析 ——如何降低云計算數(shù)據(jù)中心的成本?

總結(jié)

CNCC 2016| 中科院包云崗37頁PPT剖析 ——如何降低云計算數(shù)據(jù)中心的成本?

標簽化馮諾依曼結(jié)構(gòu)它的目標其實是:

  • 去提高數(shù)據(jù)中心的資源利用率,降低數(shù)據(jù)中心的整個成本。

  • 但是也有人問我?如果它以后真的會成為主流?關(guān)于數(shù)據(jù)中心成本降低了,對于設備商來說,他們愿意干嗎?為什么他們有動力去做呢?因為他們的收入好像會下降。

  • 這里我想提一點,其實在200年前,英國的經(jīng)濟學家杰文斯就問過這個問題,煤炭利用率提升了一倍,但會不會煤的產(chǎn)量下降呢?事實上,他發(fā)現(xiàn),煤的產(chǎn)量增加了,因為更多的人會去用,所以技術(shù)的進步會去增加技術(shù)的消費量,我相信我們通過努力,去降低云計算的成本,也會進一步去促進云計算的快速發(fā)展。

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

CNCC 2016| 中科院包云崗37頁PPT剖析 ——如何降低云計算數(shù)據(jù)中心的成本?

分享:
相關(guān)文章

專注AIR(人工智能+機器人)

專注人工智能+機器人報道,經(jīng)驗分享請加微信keatslee8(請注明原因)。 科學的本質(zhì)是:問一個不恰當?shù)膯栴},于是走上了通往恰當答案的路。
當月熱門文章
最新文章
請?zhí)顚懮暾埲速Y料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
立即驗證
完善賬號信息
您的賬號已經(jīng)綁定,現(xiàn)在您可以設置密碼以方便用郵箱登錄
立即設置 以后再說