Facebook在修復網站斷線問題之後,Facebook軟體工程總監Robert Johnson貼文表示此次網站斷線約2.5小時,是近4年來最嚴重的一次。
![]() |
Facebook 在修復網站斷線問題之後,Facebook 軟體工程總監 Robert Johnson 貼文表示此次網站斷線約 2.5 小時,是近 4 年來最嚴重的一次。他表示這次網站斷線的主要原因,是因為伺服器錯誤,自動系統在驗證資料時所導致的嚴重錯誤。
該自動系統原先的作用是檢查快取記憶體中是否有錯誤的數值,若有,則以資料庫中最新的數值予以取代。這套機制原本運作正常,不過一旦是資料庫中的數值錯誤,該自動系統便無法正常運作,導致每台伺服器均發出修正的要求,伺服器叢集瞬間被數十萬條要求流量灌爆而當機。
Robert Johnson 表示唯一的解決方法,便是立刻中斷該資料庫伺服器叢集的所有流量,這意味著要將整個網站關閉,直到資料庫修復完畢並解決了所有的問題之後,才逐漸開放使用者存取網站。
目前 Facebook 已經關閉該自動系統,並且將重新設計該自動系統以避免重蹈覆轍。
原文可詳見於此。

