亚马逊发现由于第8层错误导致的大规模AWS中断

0
47

亚马逊aws徽标

周二,亚马逊AWS大规模停运导致许多受欢迎的站点(例如Spotify,Netflix,Reddit,Pinterest等)停运了四个小时。如 似乎唯一可能导致此类故障的原因就像是大型DDOS或其他重大问题,问题的真相却有些令人尴尬。

根据亚马逊最近发布的声明,AWS中断实际上仅是OSI参考模型第8层问题或人为错误。看来,在从亚马逊删除一小部分服务器的过程中’在计费系统中,负责该操作的Amazon AWS员工精挑细选了该命令,而不是删除了比预期多的服务器。

太平洋标准时间上午9:37,经过授权的S3团队成员使用已建立的剧本执行了一条命令,该命令旨在为S3计费过程使用的S3子系统之一删除少量服务器。不幸的是,该命令的输入之一输入错误,并且输入 服务器集已被删除,超出了预期。

尽管几乎所有涉及人的事物都将永远存在人为错误,但亚马逊正在做出许多更改以确保做到这一点’如果再次发生,或者至少发生,则影响至少会大大降低。这包括对Amazon AWS员工用来从AWS云中删除服务器的工具进行修改,以更缓慢地删除容量,并确保容量绝不会降到维护服务所需的最低数量以下。此外,Amazon AWS还实施了新的更改,以在发生意外停机时缩短恢复时间。

 

资源: 亚马孙

发表评论

该网站使用Akismet减少垃圾邮件。 了解如何处理您的评论数据.