丁香五月天婷婷久久婷婷色综合91|国产传媒自偷自拍|久久影院亚洲精品|国产欧美VA天堂国产美女自慰视屏|免费黄色av网站|婷婷丁香五月激情四射|日韩AV一区二区中文字幕在线观看|亚洲欧美日本性爱|日日噜噜噜夜夜噜噜噜|中文Av日韩一区二区

您正在使用IE低版瀏覽器,為了您的雷峰網(wǎng)賬號(hào)安全和更好的產(chǎn)品體驗(yàn),強(qiáng)烈建議使用更快更安全的瀏覽器
此為臨時(shí)鏈接,僅用于文章預(yù)覽,將在時(shí)失效
業(yè)界 正文
發(fā)私信給史中
發(fā)送

0

跑在純國產(chǎn)處理器上的麒麟云,有哪些不為人知的故事?

本文作者: 史中 2017-05-26 11:52
導(dǎo)語:一個(gè)從頭到腳,從底層芯片到上層代碼都烙著自主可控的云計(jì)算系統(tǒng),是一張值得我們驕傲的底牌。

兩只手握在了一起,主席笑容可掬,川普春風(fēng)滿面。然而,聚光燈之外,畫風(fēng)并不溫暖。棱鏡計(jì)劃掀起海底光纜、美國對(duì)中國禁運(yùn) Intel “至強(qiáng)”芯片的往事歷歷在目。坐在牌桌上,如果說我們手中有底牌,一定來自于中國人在賽博世界中的代碼廝殺。

一個(gè)從頭到腳,從底層芯片到上層代碼都烙著自主可控的云計(jì)算系統(tǒng),是一張值得我們驕傲的底牌。

這正是譚郁松的夢(mèng)想。

跑在純國產(chǎn)處理器上的麒麟云,有哪些不為人知的故事?

▲譚郁松

文 | 史中(微信:Fungungun),雷鋒網(wǎng)主筆

采訪對(duì)象 | 譚郁松,國防科大計(jì)算機(jī)學(xué)院 研究員

天河往事

世界第一的中國超算

天河二號(hào),可以算是超算界的網(wǎng)紅。

中國的科學(xué)家們,用特有的超算技術(shù),幫助天河二號(hào)在世界超算排名中連續(xù)三年六次蟬聯(lián)冠軍。國防科大計(jì)算機(jī)學(xué)院研究員譚郁松便是其中一員。

天河二號(hào)上運(yùn)行著中國人自主研發(fā)的銀河麒麟系統(tǒng),在它最輝煌的日子里,也飽受外界吐槽,因?yàn)檫@個(gè)世界上最快的“超級(jí)大腦”雖然代表了中國,使用的卻是 Intel 的芯片。有人說,Intel 芯片的超強(qiáng)算力才是天河的成功秘訣。

很多人認(rèn)為超算就是把一堆芯片拼湊起來,但這不太正確。舉個(gè)例子,如果資金充足,你可以用錢堆出一輛很豪華的車,但未必能堆出 F1賽車。芯片運(yùn)算速度固然重要,但超算技術(shù),最核心的部分在于如何對(duì)系統(tǒng)進(jìn)行軟硬協(xié)同的優(yōu)化設(shè)計(jì)。天河二號(hào)在超高速互聯(lián)、異構(gòu)計(jì)算加速、編譯優(yōu)化以及對(duì)資源高效調(diào)度等方面,都有著世界領(lǐng)先的技術(shù)。

譚郁松說。

跑在純國產(chǎn)處理器上的麒麟云,有哪些不為人知的故事?

▲天河二號(hào)

從超算到云計(jì)算 

手握“超算”,譚郁松卻并不滿意。

正如他所說,超算的精髓在于對(duì)計(jì)算資源的精確且高效地調(diào)配。而這種精確調(diào)配的能力,僅僅用于高精尖的超算顯得有些浪費(fèi),它還有一個(gè)巨大的應(yīng)用方向:云計(jì)算。這正是麒麟云誕生的原因。

很多人會(huì)困惑,超算和云計(jì)算的區(qū)別在于哪里呢?

如果把超算比作F1,那么云計(jì)算就是公共汽車。一個(gè)追求頂尖的速度,一個(gè)追求彈性的空間。換言之:超算追求的是計(jì)算力并行的緊耦合,把一個(gè)任務(wù)做到極致;云計(jì)算追求的是計(jì)算力分布的松耦合,把池化資源的平均利用率做到最高。

譚郁松和團(tuán)隊(duì)的科研背景,讓他們成為了中國較早對(duì)云計(jì)算技術(shù)鉆研的團(tuán)隊(duì)。

技術(shù)大牛的烏托邦

故事要追溯到2006年。

彼時(shí)他從學(xué)術(shù)角度來看,計(jì)算機(jī)在資源管理方面的核心就是在做抽象和調(diào)度,普通集群如此,超算也是如此。如果能把超算直接變形成云服務(wù),就像構(gòu)建一幢沒有內(nèi)部沒有承重墻的大廈,里面的隔板可以隨時(shí)打掉重組,會(huì)是一件很酷的事情。

這樣一幢大廈,面臨什么技術(shù)難度呢?

跑在純國產(chǎn)處理器上的麒麟云,有哪些不為人知的故事?

▲用超算構(gòu)建的云計(jì)算,如同構(gòu)建一個(gè)沒有內(nèi)部承重墻的大廈

在2013年,云計(jì)算大多還停留在一個(gè)集群幾百個(gè)節(jié)點(diǎn)的時(shí)候,譚郁松和團(tuán)隊(duì)選擇了在天河二號(hào)上挑戰(zhàn)用6400個(gè)節(jié)點(diǎn)做云,這就是麒麟云(KYLINCLOUD)的最初形態(tài)。 

上輩子是超算的麒麟云(KYLINCLOUD),遇到過什么坑?

麒麟云面臨的第一個(gè)大問題,仍然是算力的調(diào)度和協(xié)調(diào)。

一個(gè)控制節(jié)點(diǎn)相當(dāng)于一個(gè)頭領(lǐng),下面一堆兄弟。但是在云的情況下,一個(gè)節(jié)點(diǎn)既要管理開銷,又要維護(hù)狀態(tài),這時(shí)一個(gè)頭領(lǐng)就忙不過來了。此時(shí)可能需要多個(gè)頭領(lǐng),但問題又來了,管理節(jié)點(diǎn)之間要做狀態(tài)同步,且不能發(fā)生管理沖突。類似這樣的問題數(shù)不勝數(shù),如果解決不了,就會(huì)出現(xiàn)“集群規(guī)模增加, 管理成本增加更快”的問題。因此,如何進(jìn)行高效能的算力調(diào)度和協(xié)調(diào),支持資源的彈性伸縮是關(guān)鍵。經(jīng)過努力,做到了單云規(guī)模達(dá)到6400節(jié)點(diǎn),這應(yīng)是當(dāng)時(shí)規(guī)模最大的單云。

譚郁松對(duì)雷鋒網(wǎng)說。 

麒麟云面臨的第二個(gè)問題,是軟硬件可靠性的問題。

任何硬件和軟件都有發(fā)生故障的概率。在一個(gè)簡(jiǎn)單系統(tǒng)里,組件發(fā)生問題的概率相對(duì)較低。從理論上說,系統(tǒng)越復(fù)雜,出問題的可能性越大。

解決這個(gè)問題有兩個(gè)方向,一個(gè)是讓部件可靠,讓組成簡(jiǎn)單。另一個(gè)方向就是不斷完善高可用方案來應(yīng)對(duì)故障。我們?cè)诘诙€(gè)方向上有更多的發(fā)揮空間。我們采用了多級(jí)、多類的高可用保障機(jī)制,結(jié)合故障定位及恢復(fù)策略,使得系統(tǒng)的可用性得到顯著提升。

一開始的時(shí)候,系統(tǒng)每天都在“冒火”,我們解決一個(gè)問題,就試著把這種解決方案固化下來,變成自動(dòng)運(yùn)維庫。到現(xiàn)在,我們的系統(tǒng)已經(jīng)可以處理絕大多數(shù)日常故障,并且可以根據(jù)局部資源使用情況預(yù)先做出平衡計(jì)算壓力的智能調(diào)整。

他說。 

回憶起麒麟云的往事,譚郁松感慨良多。和諸多國產(chǎn)芯片、國產(chǎn)系統(tǒng)一樣,麒麟云也經(jīng)歷了難忘的起步艱辛。

跑在純國產(chǎn)處理器上的麒麟云,有哪些不為人知的故事?

▲麒麟云界面

萬節(jié)點(diǎn)的云計(jì)算

做6400節(jié)點(diǎn)的云計(jì)算,其實(shí)源于麒麟云這群技術(shù)大牛的“理想國”。

IBM 曾經(jīng)斷言,世界上只需要五臺(tái)計(jì)算機(jī)就夠了,實(shí)際上現(xiàn)在五億臺(tái)計(jì)算機(jī)都遠(yuǎn)遠(yuǎn)不夠。但是如果用云的方法來理解計(jì)算機(jī),也許全世界只需要五朵云就真的夠了。

在我的理想中,一朵云應(yīng)該是一臺(tái)機(jī)器的形態(tài),反之亦然。

就是這樣簡(jiǎn)單粗暴的烏托邦理念,最終讓這群大牛完成了6400節(jié)點(diǎn)的云計(jì)算系統(tǒng)。

譚郁松說,這么多節(jié)點(diǎn)處于一個(gè)集群中,可以自由地分配算力,可以更靈活地滿足用戶對(duì)資源的動(dòng)態(tài)、彈性的需求。經(jīng)過特定優(yōu)化,對(duì)于需要各個(gè)節(jié)點(diǎn)高度協(xié)作的任務(wù),處在同一個(gè)業(yè)務(wù)集群在信息交互、資源調(diào)度和執(zhí)行性能上幾乎無折損。

云計(jì)算的特種兵

從2015年開始,兼容ARM指令集的飛騰芯片成為了一匹黑馬,在同樣是自主研發(fā)的芯片龍芯和申威的迭代空檔期,發(fā)力占領(lǐng)了大量安全可靠計(jì)算機(jī)市場(chǎng)?!帮w騰芯片+銀河麒麟系統(tǒng)”成為了安全可靠計(jì)算機(jī)標(biāo)配之一。

跑在純國產(chǎn)處理器上的麒麟云,有哪些不為人知的故事?

▲飛騰芯片

由于支持“飛騰芯片+麒麟系統(tǒng)”的自主可控架構(gòu),麒麟云受到了關(guān)鍵行業(yè)用戶的偏愛。這些機(jī)構(gòu)使用云計(jì)算,往往有著和一般商業(yè)公司不同的目的,所以絕大多數(shù)情況下,天津麒麟都會(huì)為他們定制開發(fā)云計(jì)算系統(tǒng)。

這些定制化,經(jīng)常要挑戰(zhàn)云計(jì)算的技術(shù)極限。

譚郁松講了一個(gè)故事。

某特殊領(lǐng)域需要定制一個(gè)云計(jì)算系統(tǒng)。

雖然系統(tǒng)規(guī)模不是很大,但是對(duì)技術(shù)要求卻很高。由于涉及到精密的控制操作,需要我們的系統(tǒng)保證極低的延時(shí)。對(duì)于一般的云計(jì)算系統(tǒng)來說,實(shí)時(shí)性一般不是他們考慮的問題。

這其中,涉及到優(yōu)先級(jí)的調(diào)度,包括可剝奪的策略;還涉及到對(duì)事件響應(yīng)的確認(rèn)機(jī)制。

當(dāng)時(shí)有很多大的友商也參與前期測(cè)試,但是最終很多企業(yè)做到的延時(shí)都在毫秒以上,只有我們成功把延時(shí)控制在了120多μs。

這種對(duì)延時(shí)的控制,需要從面向處理器、網(wǎng)絡(luò)以及軟件系統(tǒng)的全棧優(yōu)化,要對(duì)從上到下的系統(tǒng)有深刻的了解才能做到。我們能夠做到,感覺很驕傲。

從種種表現(xiàn)來看,麒麟云更像是一個(gè)云計(jì)算的特種兵。一些云行業(yè)的友商在其它方面很優(yōu)秀,但是卻不適合完成這些技術(shù)要求過高或者投入產(chǎn)出比不盡如人意的關(guān)鍵行業(yè)項(xiàng)目。

跑在純國產(chǎn)處理器上的麒麟云,有哪些不為人知的故事?

▲麒麟云為某機(jī)關(guān)辦公開發(fā)的云計(jì)算架構(gòu)

對(duì)于譚郁松和麒麟團(tuán)隊(duì)來說,關(guān)鍵行業(yè)的云計(jì)算項(xiàng)目需要耗費(fèi)巨大的心力,但是這些關(guān)系國計(jì)民生的系統(tǒng)卻更需要有人來做。這就是他們的使命感。

我的團(tuán)隊(duì),不少都是開源領(lǐng)域的資深貢獻(xiàn)者,有四個(gè)甚至是 OpenStack 開源社區(qū)的 core reviewer,他們?nèi)绻x開麒麟云,身價(jià)會(huì)遠(yuǎn)比現(xiàn)在拿到的年薪更高。但是他們都選擇在麒麟云為關(guān)鍵行業(yè)用戶提供定制服務(wù),一方面因?yàn)樗麄兊氖姑校硪环矫嬉彩且驗(yàn)?,他們?cè)谶@里能夠遇到的項(xiàng)目,在其他地方無論如何都碰不到。

挑戰(zhàn),對(duì)于工程師來說,是非常重要的。我們的感受是:從科學(xué)探索中多獲得的興奮是更強(qiáng)烈和持續(xù)的。

他對(duì)雷鋒網(wǎng)說。

后記

云計(jì)算,更多地以商業(yè)的面目出現(xiàn)在我們的認(rèn)知中,但是它顯然有更多的形象。

在龐大的基因數(shù)據(jù)面前,它為我們尋找答案;在浩渺的宇宙探索面前,它為我們贏得時(shí)間;在殘酷的國家戰(zhàn)爭(zhēng)面前,它為我們驅(qū)動(dòng)武器。

如果你也相信,每個(gè)人都有與生俱來的使命。那么你也許會(huì)理解,安全可靠的云計(jì)算系統(tǒng)麒麟云,對(duì)譚郁松來說有多重要。

本文作者史中(微信:Fungungun),雷鋒網(wǎng)主筆

雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。

分享:
相關(guān)文章

編輯

雷鋒網(wǎng)編輯,關(guān)注科技人文,安全、黑客及芯片。
當(dāng)月熱門文章
最新文章
請(qǐng)?zhí)顚懮暾?qǐng)人資料
姓名
電話
郵箱
微信號(hào)
作品鏈接
個(gè)人簡(jiǎn)介
為了您的賬戶安全,請(qǐng)驗(yàn)證郵箱
您的郵箱還未驗(yàn)證,完成可獲20積分喲!
請(qǐng)驗(yàn)證您的郵箱
立即驗(yàn)證
完善賬號(hào)信息
您的賬號(hào)已經(jīng)綁定,現(xiàn)在您可以設(shè)置密碼以方便用郵箱登錄
立即設(shè)置 以后再說