H4:又是US-EAST-1,这次出事的根子在哪?
今早七点半刚过,伦敦那边用户就开始炸锅。Downdetector上投诉量直接拉满,Snapchat发不出消息,Disney+看不了剧,连Roblox和Fortnite这种日活千万的云游戏都卡成PPT。问题一扒,根子还是AWS,具体来说,是它的US-EAST-1区域。
这个区,老玩家都懂——北弗吉尼亚,AWS最早、最大、最核心的数据中心集群。全美一半以上的公有云流量都从这儿走,很多企业哪怕部署多可用区,主节点也默认扔在这儿。所以一旦它抖三抖,整个互联网都得打摆子。
AWS在健康仪表盘上写得很克制:“多个服务出现错误率上升和延迟增加”,原因定性为“运营问题”。目前颗粒度还不够,没说是硬件故障、软件更新翻车,还是内部网络震荡。但能确定的是,这不是局部服务的问题,而是底层基础设施出现了系统性扰动。
H4:连锁反应已经炸了
Coinbase直接认了,说大量用户无法访问,源头就是AWS。AI搜索公司Perplexity的CEO Aravind Srinivas在X上公开表态,网站不稳,原因是AWS出了状况,团队正在紧急处理。这说明不只是终端用户受影响,连依赖AWS跑模型、做推理的AI初创公司也被拖下水。
更关键的是,亚马逊自家也没躲过去。Prime Video、Alexa、甚至Amazon.com本体都出现了访问异常。这就有点尴尬了——你卖的是云,结果自己家应用也挂在自己云上,等于既当裁判又当运动员,还一起摔了跤。
市场反应很直接。盘前交易数据显示,亚马逊股价应声转跌。虽然这种波动通常不会持久,但如果恢复时间拉长,或者暴露出架构层面的脆弱性,投资者信心还是会打折扣。
H4:现在最关键是恢复路径清不清晰
从目前信息看,AWS团队已经在“并行推进多个恢复路径”。这话听着积极,但也侧面说明他们还没找到单一确定根因。如果是某个配置错误,修复应该很快;但如果是跨可用区的网络或供电问题,恢复就得按小时计。
我们来盘一盘:US-EAST-1常年被吐槽“过于集中”,业内早有“别把所有负载放Virginia”的提醒。可现实是,迁移成本高、依赖复杂,大多数公司图省事,还是往里堆。这次事件再次验证了一个老逻辑——云的集中化带来了效率,也带来了系统性风险。
H4:接下来怎么看?
短期看,就盯两点:一是AWS官方能不能给出明确的时间表和根因分析;二是有没有客户因此启动灾备切换或长期迁移评估。如果只是几小时的短暂中断,大概率事后复盘完就翻篇;但如果暴露了多层冗余失效,那明年云架构设计的风向,可能会重新往“去中心化”偏一偏。
说到底,AWS还是全球最稳的云厂商之一,出问题不可怕,关键是怎么收场。现在,全世界都在等他们交答卷。