Vor wenigen Tagen lösten Störungen bei Amazons Clouddienst S3 massive Probleme auf tausenden Internet-Seiten aus. Zunächst wurde vermutet, dass ein Hackerangriff die Ursache des Ausfalls gewesen sein könnte. Wie sich allerdings herausstellt hat, war dies keineswegs der Fall.
Der Internet-Gigant Amazon hat nun ein offizielles Statement zu den Störungen und Ausfällen vom vergangenen Dienstagabend veröffentlicht. Darüber hat auch Geekwire berichtet. An diesem Tag waren eine Vielzahl von Internet-Angeboten aufgrund der Störungen nicht mehr verfügbar. Auch große Anbieter wie beispielsweise Snapchat, Twitch und Slack waren zumindest teilweise betroffen. Darüber hinaus funktionierten einige von Amazon selbst zur Verfügung gestellte Dienste nicht: Nutzer klagten über Verbindungsprobleme mit dem Fire TV-Stick oder die digitale Sprachassistentin Alexa funktionierte in einigen Regionen der Vereinigten Staaten nicht mehr. Einige Medien vermuteten Hackerangriffe hinter den Ausfällen. Laut Aussage des Unternehmens sollen hingegen Mitarbeiter von Amazon selbst den Fehler verursacht haben.
Ausfall durch falschen Befehl verursacht
Das Team des Cloud-Dienstes "S3" hatte am Dienstag versucht, einen Fehler zu beheben, der zu erheblichen Beeinträchtigungen an internen Systemen führte. Dazu sollte eine geringe Anzahl von Servern des S3-Subsystems heruntergefahren werden. Einer der hierzu erforderlichen Befehle sei jedoch falsch eingegeben worden, sodass mehr Instanzen als ursprünglich geplant vom Netz gingen. Dies beeinflusste anschließend auch weitere Subsysteme: Ein Server, der für sämtliche Metadaten der sich im Norden von Virginia befindlichen Rechenzentren verantwortlich ist, wurde hiermit ebenfalls versehentlich offline genommen. Es dauerte im Anschluss mehrere Stunden, um die ausgefallenen Systeme wieder hochzufahren.
Auch wenn im Endeffekt kein Hackerangriff für die weitreichenden Ausfälle verantwortlich war, bleibt es weiterhin beunruhigend, dass ein scheinbar kleiner Fehler einzelner Mitarbeiter eine so große Störung verursachen konnte. Um einen ähnlichen Vorfall in Zukunft vermeiden zu können, möchte Amazon nun Verbesserungen an den eigenen Systemen vornehmen. Da die betroffenen S3-Systeme über Jahre hinweg kein einziges Mal vollständig neu gestartet wurden und die Systeme seitdem um einiges komplexer geworden sind, hat es vergleichsweise sehr lange gedauert, die Server wieder hochzufahren. Zuletzt entschuldigt sich Amazon noch bei allen Nutzern, die von den Problemen betroffen waren und verspricht, die Verfügbarkeit der eigenen Services in Zukunft weiterhin zu verbessern.




Zitieren