阿裡雲解釋史上最長大規模中斷:機房濕瞭

據DNSAdmin爆料:阿裡雲解釋瞭12月18日史上最長大規模中斷(15.5小時)的4大問題。12月25日,阿裡雲官方發佈說明,詳細解釋瞭此次中斷故障的過程、原因,以及改進措施。

簡而言之就是:阿裡雲冷機故障,引起瞭機房高溫,高溫觸發瞭消防噴淋,因為機器濕瞭,很多機器遇水損壞瞭,所以修瞭15個半小時。

阿裡雲解釋史上最長大規模中斷:機房濕瞭 阿裡雲 微新聞 第1張

據悉,阿裡雲此次服務中斷源於水冷系統出現故障,且長時間無法恢復正常,導致機房溫度升高,現場處置不及時又導致觸發消防噴淋,部分硬件遇水損壞,另外客戶在香港地域新購ECS等管控操作失敗,長時間無法擴容。從當天早上8點56分首次檢測到故障警告,次日凌晨0點30分所有服務恢復正常,歷時超過15個半小時。

阿裡雲承認,此次香港Region可用區C服務中斷事件,對很多客戶的業務產生重大影響,也是阿裡雲運營十多年來持續時間最長的一次大規模故障。並向所有受到故障影響的客戶公開致歉,稱將盡快處理賠償事宜。阿裡雲表示,將盡一切努力從此次事件中吸取經驗教訓,持續提升雲服務的穩定性。

不過話說回來,阿裡雲宕機瞭,就跟特斯拉自燃瞭一樣,大傢依舊會用阿裡雲。但這次事件對阿裡雲來說是一次大危機,一秒上億的交易量竟然能宕機這麼久,要修15個小時?難以想象是做瞭十幾年的雲服務廠商。不過話說回來,運維人員一定演練過各種疑難雜癥,技術方面肯定沒得說,但誰曾想到,服務器竟然是以這種形式損壞瞭。

另外還想說一點阿裡雲出瞭這種問題,它不是第一時間處理問題,而是去到處投訴侵權,有幾個相關的報道文章就被阿裡雲投訴說侵害瞭他們的名譽權,要求立刻刪除文章。

阿裡雲解釋史上最長大規模中斷:機房濕瞭 阿裡雲 微新聞 第2張

0
评论