0
本文作者: 謝幺 | 2017-02-01 23:19 |
“從刪庫(kù)到跑路”,這句程序員用來(lái)自嘲的話差點(diǎn)成為現(xiàn)實(shí),所幸的是,這次刪庫(kù)的小哥沒(méi)有跑路。
2月1日,著名的代碼資源托管網(wǎng)站 Gitlab.com 的一位工程師在維護(hù)數(shù)據(jù)時(shí)不慎刪除約 300GB 的數(shù)據(jù),至發(fā)文時(shí)仍在恢復(fù)工作中。
據(jù)雷鋒網(wǎng)了解,此次事件發(fā)生在2月1日凌晨,肇事系統(tǒng)管理員徹夜加班工作,當(dāng)他疲倦不堪地進(jìn)行數(shù)據(jù)庫(kù)維護(hù)時(shí),不慎用 rm -rf 命令對(duì) 300GB 生產(chǎn)環(huán)境數(shù)據(jù)執(zhí)行了刪除操作,當(dāng)他清醒過(guò)來(lái)按下 ctrl + c 來(lái)停止刪除操作時(shí),卻只挽留了 4.5G 的數(shù)據(jù),其余所有數(shù)據(jù)消失殆盡。
據(jù)外媒報(bào)道,此次數(shù)據(jù)丟失的并非倉(cāng)庫(kù)的數(shù)據(jù),而是和倉(cāng)庫(kù)相關(guān)的 issue 以及合并請(qǐng)求操作。
按照常理,GitLab 應(yīng)該會(huì)對(duì)這些數(shù)據(jù)進(jìn)行有效備份,然而悲催的事情發(fā)生了,GitLab.com 號(hào)稱的五重備份機(jī)制:
常規(guī)備份(24小時(shí)一次)
自動(dòng)同步、LVM快照(24小時(shí)一次的)
Azure 備份(支隊(duì)NFS啟用,數(shù)據(jù)庫(kù)無(wú)效)
S3 備份
五大備份方法全部出現(xiàn)問(wèn)題。所幸的是,仍有一個(gè)“也許可行”的6小時(shí)前的數(shù)據(jù)備份,可能夠搶救回來(lái)一部分?jǐn)?shù)據(jù)。
至本文發(fā)布時(shí),Gitlab 方面已經(jīng)試圖該方式來(lái)逐步恢復(fù)數(shù)據(jù):
最后他們索性在 YouTube 上直播工程師恢復(fù)數(shù)據(jù),圍觀者眾多,甚是熱鬧:
對(duì)此,程序員們?cè)u(píng)價(jià)不一,有的覺(jué)得 Gitlab 也許用了假的備份,有的感慨開(kāi)夜車應(yīng)注意安全,有的吐槽運(yùn)維加班苦,應(yīng)該漲工資,甚至有不少網(wǎng)友覺(jué)得應(yīng)該將2月1日設(shè)立為“世界備份日”。
最后附上直播簡(jiǎn)介中的部分問(wèn)答內(nèi)容:
* 誰(shuí)干的?他(們)會(huì)被炒魷魚(yú)嗎?
他(們)只是犯了個(gè)工作失誤,不會(huì)被炒。
* 為什么數(shù)據(jù)恢復(fù)得這么慢?
因?yàn)闄C(jī)器的磁盤(pán)讀寫(xiě)速度限制。
* 數(shù)據(jù)庫(kù)一共多大?
310GB
* 恢復(fù)數(shù)據(jù)要多長(zhǎng)時(shí)間?有沒(méi)有預(yù)期?
至少要到 19 UTC (世界標(biāo)準(zhǔn)時(shí)間)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見(jiàn)轉(zhuǎn)載須知。