2025 年 10 月 20 日,AWS US-EAST-1 大當機造成全球網路服務大規模癱瘓,包括 Snapchat、Fortnite 等 App 皆受影響。為什麼全球網路都對單一雲端區域如此脆弱?本文將帶你了解這次雲端服務故障的根本原因與企業避險之道。
一、網路總公司出大事了
Amazon Web Services (AWS) 是世界上最大的網路「水電總公司」,供應著 Facebook、Netflix 甚至你常玩的遊戲 App 所需要的網路電力和空間。
| 議題分類 | 事件核心摘要 |
|---|---|
| 事件名稱 | AWS US-EAST-1 區域服務中斷 |
| 當機時間 | 超過 15 小時(持續時間長) |
| 受影響範圍 | 全球數千家企業和 App |
| 直接原因 | 兩個「內部小幫手」搶著更新地址,意外把「總部地址」刪掉了! |
全球數千個網站和 App,從 Snapchat 到銀行,統統像遇到大塞車一樣,超級超級慢甚至完全打不開。這場當機持續了十幾個小時,提醒我們:整個網路世界,都非常依賴這家「水電總公司」!
二、兩個小幫手如何搞垮網路?
1. 核心原因:內部地址簿大混亂
很多人以為是機房燒起來了,其實不是。問題出在一個叫 DynamoDB 的服務,它是 AWS 的「中央資料室」。
- 中央資料室 (DynamoDB): 儲存了所有 App 的用戶資料、交易紀錄等。
- 地址簿 (DNS): 負責告訴所有 App:「中央資料室」的地址在哪。
「水電總公司」內部有兩個「小幫手」負責更新地址簿。他們在極端情況下「同時」搶著寫入新地址,結果其中一個寫得比較慢的小幫手,反而誤把已經更新好的正確地址給清除了!
簡單來說:不是「資料室」壞了,而是「門牌號碼」被一個「小幫手吵架」的錯誤塗掉了,導致所有服務都找不到路,因此造成服務大亂!
2. 連鎖反應:服務癱瘓的三階段
「中央資料室」的地址一被清空,立刻引發了無法控制的連鎖反應:
- 總部地址不見了,所有服務都找不到資料室。
- 總公司(AWS)無法確認分店店面是不是空著,於是全部被鎖住,不讓新的 App 服務進駐或啟動。
- 即使資料室修好了,大量積壓的「網路連線請求」把「交通指揮中心」塞爆了,導致分店店面雖然有開門,但沒有網路線可以對外連線。
三、常見FAQ
Q1:如何避免下次再癱瘓?
跨區域/多區域部署:不要只用一個機房! 要在不同地理位置建立至少兩個「備用分店」。
Q2:總部當機,分店怎麼接手?
故障轉移:設定「智慧轉移機制」,一旦偵測到總部故障,就自動將所有用戶導航到備用分店去。
Q3:兩個分店的資料會同步嗎?
會!資料庫必須設定「即時同步」,確保兩個機房的用戶資料都一樣新。
Q4:做雙倍備援很花錢嗎?
服務等級協定:雙倍備援就像買保險,雖然價格高,但它能避免長時間當機帶來的巨大商業損失、用戶流失和品牌傷害。這是保護公司的必要投資。
更穩定的網路未來
這次 AWS 大當機是對全球數位基礎設施的一次警鐘。它證明了即使是世界上最大的「水電總公司」,也會因為一個小小的程式錯誤而癱瘓。未來,企業選擇服務時,服務可靠度(有沒有備用分店)將會比價格更重要。
若您對於最適合您的工作需求方案還有疑問,或希望了解更多企業採購、資安解決方案、團購方案與後續服務細節,歡迎隨時聯絡我們!
我們擁有專業顧問團隊,能依照您企業的產業性質、部門用途與預算範圍,協助量身打造最適合的電腦設備方案,讓您買得安心、用得放心。



