0
本文作者: 章敏 | 2016-08-23 11:36 |
導(dǎo)讀:SIGCOMM對于ACM特別興趣小組來說是非常重要的年度會議,本會議主要研討內(nèi)容是數(shù)據(jù)在應(yīng)用,技術(shù),架構(gòu),和計(jì)算機(jī)通信協(xié)議上的交流。
摘要:在過去的一年半中,我們已經(jīng)在商業(yè)以太網(wǎng)(RoCEv2)上使用RDMA來支持一些微軟的高度可靠,延遲敏感的服務(wù)。本文介紹了我們在該過程中遇到的挑戰(zhàn),和解決這些問題的方案。為了使RoCEv2在虛擬局域網(wǎng)之外使用,我們設(shè)計(jì)了一個基于DSCP優(yōu)先級的流量控制(DSCP-PFC)機(jī)制,以確保大規(guī)模的部署。我們已經(jīng)解決了PFC引起的安全挑戰(zhàn)問題,包括死鎖(是的,它發(fā)生了?。?,RDMA傳輸活鎖,NIC PFC風(fēng)暴問題。我們也建立了監(jiān)控和管理系統(tǒng)以確保RDMA按預(yù)期的進(jìn)度工作。我們的實(shí)驗(yàn)展示了運(yùn)行大規(guī)模RoCEv2時的安全和可擴(kuò)展性問題都可以被解決,而且RDMA可以替代TCP用于數(shù)據(jù)中心內(nèi)部的通信,實(shí)現(xiàn)低延遲,低的處理器占用,和高吞吐量。
Chuanxiong Guo
任職:亞洲微軟高級軟件工程師經(jīng)理
研究方向:網(wǎng)絡(luò)化系統(tǒng)設(shè)計(jì)與規(guī)模性實(shí)現(xiàn),數(shù)據(jù)中心網(wǎng)絡(luò)(DCN),網(wǎng)絡(luò)安全,云計(jì)算,操作系統(tǒng)的網(wǎng)絡(luò)支持與應(yīng)用。
相關(guān)研究成果:
· Congestion Control for Large-Scale RDMA Deployments (2015 ,SIGCOMM)
· Datacast: A Scalable and Efficient Reliable Group Data Delivery Service For Data Centers (ACM,2012)
Via:ACM SIGCOMM 2016
PS : 本文由雷鋒網(wǎng)獨(dú)家編譯,未經(jīng)許可拒絕轉(zhuǎn)載!
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。