亚马逊是世界上最大的云服务提供商,2月28日星期二,亚马逊的一些网络服务连续瘫痪了5个小时。亚马逊现在公布了崩溃的原因,似乎罪魁祸首是一个打字错误。
该公司刚刚就系统崩溃发表了道歉声明,称原因是输入错误的命令。为了恢复系统,需要重新启动整个系统,这比预期的时间要长得多,因为亚马逊网络服务的增长速度非常快。该命令本应删除少量系统,但打印错误导致许多服务器关闭。
“在太平洋标准时间上午9:37,一个授权的S3团队成员使用一个既定的剧本执行了一个命令,该命令旨在删除S3计费流程使用的S3子系统之一的少量服务器,”Amazon解释说。不幸的是,该命令的一个输入输入不正确,并且删除了比预期更大的服务器集。无意中被移除的服务器支持另外两个S3子系统。”
该公司计划对其系统进行更改,以便将来不会因为这样的小错误而导致大规模的系统崩溃。为了解释原因,亚马逊向顾客道歉,
“我们想为这一事件给我们的客户造成的影响道歉。虽然我们对Amazon S3的长期可用性记录感到自豪,但我们知道这项服务对我们的客户、他们的应用程序和最终用户以及他们的业务有多么重要。我们将尽一切努力从这次事件中吸取教训,并利用它进一步提高我们的可用性。”
我们想知道你对这件事的看法。在下面发表评论!