0
本文作者: 嘉嘉 | 2022-04-25 19:36 |
云化時(shí)代,虛擬機(jī)熱遷移(Live migration)是被大家廣泛關(guān)注的的熱點(diǎn)技術(shù),作為云計(jì)算平臺(tái)核心技術(shù)之一,虛擬機(jī)熱遷移也是信服云一直深入鉆研的底層技術(shù)。
那么信服云旗下的超融合產(chǎn)品在熱遷移上實(shí)力究竟如何?這場(chǎng)測(cè)試揭曉了答案。
虛擬機(jī)熱遷移指虛擬機(jī)從一臺(tái)宿主機(jī)遷移到另一臺(tái)宿主機(jī),確保業(yè)務(wù)始終運(yùn)行在可靠且資源充足的物理主機(jī)上,并且在遷移過(guò)程中盡可能的不中斷業(yè)務(wù)。
隨著越來(lái)越多的用戶(hù)將核心業(yè)務(wù)部署在云平臺(tái),業(yè)務(wù)應(yīng)用需要更高的SLA保障,可停機(jī)的窗口時(shí)間的要求越來(lái)越高,甚至提出了零停機(jī)的能力要求。特別是在如下場(chǎng)景中:
(1)物理主機(jī)的維護(hù),比如配件更換、服務(wù)維護(hù)。
(2)云平臺(tái)升級(jí),需要實(shí)現(xiàn)集群內(nèi)物理主機(jī)的滾動(dòng)熱升級(jí)。
(3)云平臺(tái)對(duì)集群內(nèi)進(jìn)行虛擬機(jī)運(yùn)行位置調(diào)度,獲得更優(yōu)的資源使用效率。
為了檢驗(yàn)信服云虛擬機(jī)熱遷移的真實(shí)能力表現(xiàn),信服云在真實(shí)環(huán)境中對(duì)Oracle業(yè)務(wù)承載下的虛擬機(jī)熱遷移進(jìn)行了測(cè)試,并和業(yè)界其他廠家進(jìn)行了對(duì)比。
↑ Oracle 1000用戶(hù)場(chǎng)景下的深信服超融合熱遷移
通過(guò)以上測(cè)試結(jié)果可看出,基于深信服超融合的熱遷移方案可以獲得平滑的業(yè)務(wù)連續(xù)性體驗(yàn),遷移得更快、更穩(wěn)。
對(duì)于承載了1000并發(fā)用戶(hù)的Oracle業(yè)務(wù)虛擬機(jī),深信服超融合承載的Oracle業(yè)務(wù)在遷移過(guò)程中性能僅抖動(dòng)了6s,其中業(yè)務(wù)中斷時(shí)間僅1s,上層業(yè)務(wù)可獲得近乎0中斷的平滑遷移體驗(yàn)。相較于業(yè)界其他超融合產(chǎn)品的測(cè)試結(jié)果,信服云的優(yōu)勢(shì)明顯。
深信服超融合能實(shí)現(xiàn)遠(yuǎn)超業(yè)界其他產(chǎn)品的平滑遷移體驗(yàn),源自多個(gè)底層核心技術(shù)的優(yōu)勢(shì)。其中一個(gè)關(guān)鍵技術(shù)是CPU節(jié)流算法,其基本原理如下:
在遷移初始階段,源主機(jī)通過(guò)協(xié)商機(jī)制在目的主機(jī)上啟動(dòng)一個(gè)同樣的虛擬機(jī),并將其置于靜默狀態(tài)。
然后源主機(jī)QEMU記錄虛擬機(jī)的所有內(nèi)存數(shù)據(jù)后,通過(guò)網(wǎng)絡(luò)傳輸?shù)侥康闹鳈C(jī),但傳輸過(guò)程中由于正在運(yùn)行的業(yè)務(wù)會(huì)讀寫(xiě)內(nèi)存數(shù)據(jù),新產(chǎn)生的內(nèi)存數(shù)據(jù)會(huì)在第一輪傳輸完成后重新記錄并按照同樣的方式傳輸?shù)侥康闹鳈C(jī),依次迭代下去,直到最后記錄的內(nèi)存數(shù)據(jù)滿(mǎn)足一個(gè)閾值后,源主機(jī)會(huì)停止運(yùn)行(即僅1s的業(yè)務(wù)中斷時(shí)長(zhǎng))。
QEMU將剩余的內(nèi)存數(shù)據(jù)一次性傳輸?shù)侥康闹鳈C(jī),然后目的主機(jī)開(kāi)始運(yùn)行,源主機(jī)關(guān)機(jī)。這個(gè)過(guò)程中可能產(chǎn)生依次迭代無(wú)法收斂的情況,將會(huì)降低虛擬機(jī)CPU利用率(即節(jié)流),使業(yè)務(wù)降低吞吐量,深信服超融合的優(yōu)化主要是設(shè)計(jì)了新的算法,綜合考慮多個(gè)指標(biāo),兼顧了遷移時(shí)間和業(yè)務(wù)受節(jié)流影響的時(shí)間,最終能夠降低遷移時(shí)間和業(yè)務(wù)受節(jié)流影響的時(shí)間。
該項(xiàng)技術(shù)的實(shí)現(xiàn),使得原本無(wú)法遷移完的場(chǎng)景,現(xiàn)在能夠成功遷移完,并領(lǐng)先業(yè)界水平;同時(shí),熱遷移最后downtime停機(jī)階段,ping網(wǎng)絡(luò)中斷時(shí)間不超過(guò)2秒(最佳測(cè)試結(jié)果是0s)。
除了CPU節(jié)流算法,深信服超融合在QEMU熱遷移壓縮算法優(yōu)化、磁盤(pán)熱遷移BITMAP數(shù)據(jù)塊粒度調(diào)整、熱點(diǎn)內(nèi)存臟數(shù)據(jù)延遲遷移機(jī)制、內(nèi)存熱遷移時(shí)間片動(dòng)態(tài)調(diào)整機(jī)制、磁盤(pán)熱遷移IO QoS動(dòng)態(tài)調(diào)整機(jī)制等技術(shù)上都有自己的創(chuàng)新設(shè)計(jì),后續(xù)《信服云黑板報(bào)》將陸續(xù)為大家?guī)?lái)信服云技術(shù)干貨的分享。
以上就是本期《信服云黑板報(bào)》關(guān)于虛擬機(jī)熱遷移的分享。關(guān)注“深信服科技”公眾號(hào),獲取更多技術(shù)干貨內(nèi)容哦!
雷峰網(wǎng)(公眾號(hào):雷峰網(wǎng))
雷峰網(wǎng)版權(quán)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。