亞馬遜雲端服務(AWS)於本周一凌晨發生重大故障,影響全球數百項應用程式及網站。故障在美國東岸時間凌晨3時左右開始發生,美國東岸地區一個區域網關出現問題。AWS隨後確認原因後進行修復,不過部分服務於期間反應仍然十分緩慢、並出現錯誤率上升的情況。故障不止影響亞馬遜自家服務,還包括Snapchat、Roblox、Fortnite、Duolingo、Ring、Coinbase及Canva等,亦波及銀行應用程式、加密貨幣平台、聯合航空和達美航空等航空公司,以及多個社交媒體平台。
今次問題來自DynamoDB和彈性運算雲端(EC2)等核心服務,主要原因是DNS轉換出現問題,影響身份及存取管理服務(IAM)等AWS認證服務,引發連鎖問題。很多網站在使用AWS認證服務時,只會使用預設的us-east-1美國東部地區,一旦出現問題,就算本身其他伺服器或儲存無事,多個網站都會受到影響。AWS宣稱大部分服務於三小時內已恢復,但提醒部分用戶可能仍會遇到一些問題。
英國受影響的程度遠較美國嚴重,尤其是對網上銀行和政府服務造成衝擊,包括英國稅務局(HMRC)等,以及Lloyds Bank、Halifax及蘇格蘭銀行等主要銀行機構在英國遭受中斷,政府服務亦受波及。故障高峰期間,美國東岸時間早上6時12分錄得約12000項報告,而英國方面的中斷情況則更為持久且嚴重。
今次故障發生在美國東岸凌晨3時11分,當時大多數美國用戶仍在睡眠中,未有受到影響。待東岸用戶醒來之際,AWS已差不多修復好所有服務。英國情況則不同,故障發生時正值當地上午8時左右,大量用戶正在線上進行銀行交易和工作,因此受到的衝擊更為明顯,備受英國當地傳媒關注。
