上周五,互聯網的很大一部分突然中斷,無法訪問。起初看起來像是一場大規模的網絡攻擊,但最終卻發現只是Cloudflare自身系統內部的一個配置錯誤。
然而,由此產生的影響卻絕非微不足道,它暴露了當今在線服務之間緊密的相互聯系。
要點總結 Cloudflare 的一次更新引發了錯誤,導致一些主要網站和加密貨幣平臺短暫中斷。 該事件暴露了對集中式互聯網基礎設施的過度依賴。 Cloudflare已恢復服務,并計劃在未來的推廣中采取更強有力的安全措施。一次例行更新如何演變成全球性混亂
Cloudflare工程師正在部署安全修復程序時,發生了意想不到的連鎖反應。展開該公司一直在調整服務器處理HTTP請求的方式——這看似是一項簡單的改動。但這次更新卻禁用了一個關鍵的內部測試機制,導致舊代理服務器中一個長期存在的漏洞暴露出來。
這些代理服務器響應錯誤,拋出運行時錯誤,錯誤頁面幾乎瞬間便在網絡上傳播開來。Cloudflare 約 28% 的流量受到影響。大多數用戶看到的錯誤信息不超過 500 條,但此次中斷的影響范圍之廣,足以立即在社交平臺和加密貨幣交易所引起關注。
網站和加密貨幣服務陷入交火之中
隨著故障向外擴散,種類繁多的平臺紛紛離線。
社交網絡、創意應用、故障追蹤器以及主要的加密貨幣平臺都受到了影響。Coinbase 和 Kraken 是被迫暫時停機的最知名服務之一。一些基于 Solana 的平臺——包括 Jupiter、Raydium 和 Meteora——也無法訪問。去中心化金融
去中心化金融(DeFi)是指建立在公共區塊鏈上的與金融相關的去中心化應用程序(dApp)的大類。
與其說這是一次黑客攻擊,不如說這個問題凸顯了互聯網(無論是傳統的還是去中心化的)在多大程度上依賴于 Cloudflare 的基礎設施作為保護和路由層。
.dark-mode .read-more {background-color: #343a40 !important;}為什么只有部分 Cloudflare 服務出現故障?
有趣的是,并非所有 Cloudflare 的硬件都受到了相同的影響。較舊的 FL1 代理服務器受到的沖擊最大,而較新的 FL2 代理服務器則保持正常運行。受不同監管機構控制的區域,例如 Cloudflare 的中國網絡,也未受到此次事件的影響。
這種不均衡的影響表明,配置錯誤并沒有造成整個系統崩潰——只有特定的組件觸發了故障線。
恢復及后續發展
大約25分鐘后,Cloudflare撤銷了出錯的更改,流量恢復正常。該公司隨后概述了幾項旨在防止類似情況再次發生的措施:
推廣速度會更慢,驗證也會更加嚴格。 關鍵系統將進行更新,以增強其備用功能。 我們將重新設計錯誤處理路徑,以確保即使在發生故障時服務也能保持穩定。預計很快將發布更詳細的報告,觀察人士已經將此次事件與 11 月中旬 Cloudflare 的一次故障進行了比較。
更廣泛的趨勢:集中式基礎設施不斷暴露其局限性
此次事件與近期另一起宕機事件如出一轍——10月份AWS的故障導致美國和歐洲多款知名應用癱瘓。這兩起事件都指向同一個系統性缺陷:基礎設施過于集中容易造成單點故障,并帶來不成比例的嚴重后果。
人們對Arweave、Filecoin和Akash等去中心化網絡的興趣日益濃厚,正是源于這個問題。這些系統將存儲和計算資源分散到眾多獨立運營商處,理論上降低了大規模宕機的風險。然而,它們的挑戰依然在于可擴展性和速度——而這正是中心化服務提供商的優勢所在。
鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時間聯系我們修改或刪除,多謝。

