9
本文作者: 王強(qiáng) | 2015-05-28 15:30 |
今天上午攜程網(wǎng)官網(wǎng)和應(yīng)用的無法正常使用,官方回應(yīng)說服務(wù)器遭攻擊宕機(jī),恢復(fù)時(shí)間未定。馬上朋友圈里就有傳聞?wù)f攜程網(wǎng)數(shù)據(jù)庫被”物理刪除”,損失巨大。倘若傳言成真,攜程網(wǎng)這次可要”哭暈在廁所”了。
企業(yè)網(wǎng)站數(shù)據(jù)備份、災(zāi)難恢復(fù)向來不是個(gè)輕松的活計(jì)。一般來說大型網(wǎng)站都會(huì)在數(shù)據(jù)安全上不惜重金投入,耗費(fèi)大量人力物力來保護(hù)用戶和企業(yè)自己的信息。個(gè)人用戶保護(hù)自己重要的數(shù)據(jù),諸如照片、文檔之類的方法無非是在移動(dòng)硬盤、網(wǎng)絡(luò)云盤上復(fù)制一兩份,而企業(yè)級(jí)的數(shù)據(jù)管理要復(fù)雜得多。
以旅行網(wǎng)會(huì)員數(shù)據(jù)庫為例,大型企業(yè)的一種存放方式是”異地雙活”,也就是整套數(shù)據(jù)庫在兩個(gè)城市或是一個(gè)城市相隔較遠(yuǎn)的兩處中心同時(shí)運(yùn)行。任何時(shí)候一個(gè)中心出現(xiàn)嚴(yán)重事故,另一個(gè)中心能繼續(xù)維持服務(wù)運(yùn)行。這種方式要求兩個(gè)中心用高速專線連接,確保兩方存儲(chǔ)和更新的數(shù)據(jù)不出現(xiàn)沖突,因此成本不菲;另一種方式則不要求雙中心的數(shù)據(jù)隨時(shí)同步,而是備用中心每隔幾分鐘或幾小時(shí)與主數(shù)據(jù)庫同步一次,這種方式對(duì)成本和技術(shù)的要求就低些。
為了提高性能,目前很多高性能數(shù)據(jù)庫的存儲(chǔ)介質(zhì)都換成了閃存,像12306這種負(fù)載極大的網(wǎng)站甚至直接把庫放到服務(wù)器內(nèi)存里跑。企業(yè)使用的服務(wù)器穩(wěn)定性遠(yuǎn)強(qiáng)過家用PC,而且閃存系統(tǒng)都有RAID一類的容錯(cuò)保護(hù),一組SSD中有一兩個(gè)掛掉不會(huì)造成數(shù)據(jù)損失。除此之外整個(gè)數(shù)據(jù)庫每隔一定時(shí)間就會(huì)在另一套存儲(chǔ)系統(tǒng)(通常用機(jī)械硬盤)保存一份快照,這樣SSD萬一整體完蛋還能挽回大部分損失。最后,數(shù)據(jù)中心都有獨(dú)立的備份電源,就算外部短時(shí)間停電也可繼續(xù)運(yùn)行。
這么復(fù)雜的保護(hù)就能保證企業(yè)數(shù)據(jù)萬無一失了么?可惜世上無絕對(duì),任何方案也不可能做到百分之百的保險(xiǎn)。拿極端的例子講,如果幾個(gè)數(shù)據(jù)中心全部被暴力摧毀,就是神仙也救不了那些數(shù)據(jù)了。誠然這種情況發(fā)生的概率太低,一般也不用太擔(dān)心??墒瞧渌恍﹩栴}也可能讓IT部門好好喝一壺了。
一種非常可怕的事故就是擁有管理員權(quán)限的人,可能是黑客可能是一時(shí)大腦進(jìn)水的網(wǎng)站員工,惡意或者手滑刪掉了整個(gè)數(shù)據(jù)庫。就算是雙活異地備份也經(jīng)不住這種打擊,一瞬間存儲(chǔ)在閃存或內(nèi)存里的東西就全都灰飛煙滅了。以前大家用機(jī)械硬盤,還可以立刻用數(shù)據(jù)恢復(fù)軟件把刪除的文件快速找回來;現(xiàn)在用閃存或內(nèi)存,誤刪除操作根本不可能恢復(fù),只有去找離線存儲(chǔ)系統(tǒng)一段時(shí)間以前的備份了。從備份系統(tǒng)恢復(fù)數(shù)據(jù)速度相當(dāng)緩慢,而且免不了會(huì)丟失掉一部分最新更新的內(nèi)容。這次攜程網(wǎng)遇到的麻煩就有可能是這種形式。
還有一種災(zāi)難是系統(tǒng)崩潰。雖然服務(wù)器使用的操作系統(tǒng)都專為持久穩(wěn)定使用設(shè)計(jì),但也保不準(zhǔn)哪天就像windows藍(lán)屏一樣突然出錯(cuò)。尤其是系統(tǒng)升級(jí)更新時(shí)容易出這種幺蛾子,當(dāng)年工商銀行升級(jí)核心系統(tǒng)時(shí)就中過招。系統(tǒng)崩潰一般不會(huì)造成保存的數(shù)據(jù)損失,但重建系統(tǒng)、重新校驗(yàn)數(shù)據(jù)庫也是個(gè)費(fèi)時(shí)費(fèi)力的事兒。攜程這次也可能是這類問題。
天下沒有絕對(duì)安全的系統(tǒng),任何企業(yè)都逃不掉這個(gè)規(guī)律。不管這次攜程遇到的問題是嚴(yán)重的數(shù)據(jù)丟失還是輕一些的系統(tǒng)崩潰,希望他們能盡快解決問題,盡可能保護(hù)用戶的數(shù)據(jù)。其他IT公司乃至政府單位和個(gè)人也該從中吸取經(jīng)驗(yàn)教訓(xùn),時(shí)時(shí)刻刻繃緊數(shù)據(jù)安全這根弦。光是買了昂貴的系統(tǒng)是不頂用的,預(yù)防數(shù)據(jù)災(zāi)難最重要的還是保持高度警惕的心態(tài)。
【廣告】據(jù)說攜程網(wǎng)被“物理刪除”是因?yàn)檫@個(gè):http://www.knewbi.com/s/5566c2b3c3df6
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。