<< Themensammlung Netzwertig

Unter netzwertig veröffentlichen wir in unserem Blog Einschätzungen zu aktuellen digitalen Geschäftsmodellen und IT-Trends, Meldungen, Analysen, Reviews und Specials.

23.04.11Leser-Kommentare

Mehrtägige Störung: Amazon lässt das Social Web verstummen

Mehrere Tage lang waren Teile von Amazons Cloud-Diensten gestört. Viele bekannte Onlinedienste auf beiden Seiten des Atlantiks zwang dies in die Knie.

 

Startups, die Hosting und Rechenprozesse an einen Cloud-Anbieter auslagern, statt einen eigenen Serverpark zu betreiben, wissen um die damit verbundene Abhängigkeit. Eine hundertprozentige Verfügbarkeit existiert ohnehin nicht, und vor Ausfällen ist auch nicht gefeilt, wer seine eigene technische Infrastruktur errichtet.

Blöd ist jedoch, wenn sich unzählige Internetanbieter bei dem selben Cloud-Dienst einnisten und dieser dann über längere Zeit nicht ordnungsgemäß funktioniert. Genau das geschah dieser Tage bei Amazon: Zur Wochenmitte kam es zu Ausfällen einzelner Cloud-Dienste, die unter dem Dach der Amazon Web Services (AWS) vermarktet werden.

Die Downtimes von Amazons Elastic Compute Cloud and Relational Database Service bekamen Millionen von Internetnutzern zu spüren, die seit Mittwoch auf populäre Onlinedienste wie foursquare, Quora oder HootSuite zugreifen wollten. Alle diese nutzen Rechenkapazität von Amazon, statt eigenhändig eine kostspielige und arbeitsintensive Serverfarm zu betreiben.

Obwohl sich die Situation mittlerweile entschärft hat und viele der betroffenen Sites wieder ordnungsgemäß arbeiten können, weist Amazon auf seiner Status-Site noch immer auf Probleme bei seinem Rechenzentrum in North Virginia hin, von wo der Ausfall ausging. ReadWriteWeb bezeichnet die Störung als die bisher größte von Amazon jemals .

Amazons europäische Serveranlagen wiesen keinerlei Probleme auf. Startups aus dem deutschsprachigen Raum, deren AWS-Prozesse in North Virginia abgewickelt werden, gibt es jedoch einige:

Der Berliner Anbieter personalisierter Radiostreams Aupeo beispielsweise berichtete per Twitter über Störungen seiner auf AWS basierenden Gewinnspiel-Applikation bei Facebook. Auch der VoIP-Dienst und Skype-Konkurrent FriendCaller war betroffen , genauso wie das Social-Web-Statistik-Tool TwentyFeet und der Musik-Streaming-Service tunesBag.

tunesBag-Chef Hansjoerg Posch ließ uns wissen, dass manche Nutzer zwar mit Fehlermeldungen konfrontiert wurden, dass der Service für das Streaming aber auch auf andere Cloud-Provider setze.

Der Ausfall selbst scheint bei den betroffenen Onlineservices für weniger Verstimmung zu sorgen als die schlechte und langsame Kommunikation von Amazon. TwentyFeet-Gründer Martin Seibert unterstreicht, dass man dem umtriebigen Internetkonzern auch in Zukunft treu bleiben wolle. Denn eigentlich sei man begeistert von AWS.

Das Konzept des Public Cloud Computings jetzt ganz in Frage zu stellen, wäre mit Sicherheit der falsche Schluss. Die wichtigste Erkenntnis aus dem Ereignis ist wohl eher, dass das wahre Risiko in einer zu großen Konzentration auf einen einzigen Cloud-Anbieter liegt. Zumindest für die User ist es ein Unterschied, ob eine von ihnen geschätzte Website zwei Tage lang nicht erreichbar ist oder zehn parallel.

Alternativen zu AWS sind unter anderem Windows Azure, Rackspace oder Google App Engine.

Wart ihr von dem Ausfall betroffen? Welche Konsequenzen haltet ihr für erforderlich?

Kommentare

  • Konstantin Klein

    23.04.11 (19:02:03)

    Ohne zu erbsenzählerisch wirken zu wollen: Einen Bundesstaat North Virginia gibt es nicht, wohl aber eine Region Northern Virginia, was schlicht das nördliche Ende des Bundesstaates Virginia ist, gleichzeitig die Heimat vieler IT-Unternehmen und - zumindest als ich noch dort lebte - der größte Netz-Knotenpunkt der östlichen USA.

  • Carsten Pötter

    23.04.11 (19:03:40)

    Als Laie frage ich mich allerdings, ob es sich die betroffenen Dienste nicht zu einfach gemacht haben. Wenn ich die Amazon Beschreibung (https://aws.amazon.com/de/ec2/#features) richtig verstehe, kann ein Dienst mehrere Instanzen in regional unterschiedlichen Data Centers betreiben, so dass der Ausfall eines Data Centers nicht so dramatische Auswirkungen hätte wie man sie gerade erlebt hat.

  • Martin Weigert

    23.04.11 (19:09:36)

    Evtl liege ich falsch (bin diesbezüglich auch Laie), aber es könnte eine Preisfrage sein. Manche Startups haben womöglich einfach Geld sparen wollen (zumindest wurde es mir von einem so angedeutet, mit dem ich gesprochen habe) In diesem Kontext interessant ist z.B., dass Dropbox NICHT down war. Wobei Dropbox evtl lediglich Simple Storage von Amazon nutzt, und nicht EC2. K.a.

  • Martin Weigert

    23.04.11 (20:00:17)

    Danke Konstantin, da war ich zu voreilig. Ist geändert.

  • Oliver Springer

    23.04.11 (23:09:45)

    Interessant wäre in diesem Zusammenhang mal ein Vergleich, ob Unternehmen, die sich von einem großen Cloud-Anbieter abhängig machen, mehr oder weniger Down Times haben haben als solche, die auf eigene Infrastruktur setzen. Aus dem Bauch heraus tippe ich darauf, dass die Unternehmen, die sich auf einen Cloud-Anbieter verlassen, im Durchschnitt besser dastehen. Möglicherweise lohnt sich der Aufwand der Nutzung eines zweiten Anbieters. Sofern nur geringe Grundkosten anfallen (und etwa nach Traffic oder in Anspruch genommener Rechenkapazität abgerechnet wird), hält sich der Aufwand dafür ja in Grenzen.

  • bennos

    24.04.11 (02:42:25)

    mit EC2 und den angehangenen Services (Cloudwatch) kann man auch Failover Cluster aufsetzen und andere Instanzen z.B. in Europa anspringen lassen, wenn bestimmte PArameter eintreten. Allen Anbietern die Offline waren, kann man nur sagen,das Sie ihre Hausaufgaben nicht gemacht haben. Uptime wird immer wichtiger und jede grössere Webseite sollte eine ordentliche Failover Strategie haben in der auch ein ganzes RZ ausfallen kann und die Seite trotzdem UP ist. Mit heutiger Technik ist das nun wirklich nicht schwer. Der Kostenfaktor ist eine Ausrede. Noch nie war Server Kapazität so günstig einzukaufen wie aktuell.

  • Christian

    24.04.11 (22:44:33)

    Aus Sicht eines Softwareentwicklers kann ich den Cloud Hype noch nicht ganz teilen bzw. nachvollziehen. Mit 15 Jahren Erfahrung im Hosting mit virtuellen und dedizierten Servern ist uns so eine Riesenpanne noch nie passiert. Wenn ein Server mal down ist, dann knipst man eben einen Backupserver an, aber wenn eine Cloud down ist sieht's düster aus würde ich sagen. Überhaupt wüsste ich gern, wie die meist jungen Cloud Provider so eine hohe Uptime versprechen können obwohl ein wirklich größerer Unfall vielleicht noch nicht mal geprobt wurde? Für unsere Vorhaben halte ich uns daher erst mal aus der Cloud raus und administriere wohl oder übel eigene Server, auch wenn das etwas mehr Arbeit macht und nicht so cool ist :-)

  • Julia

    25.04.11 (12:51:21)

    Genau das war der Knackpunkt: mehrere dieser sogenannten »Availability Zones« versagten gleichzeitig: http://justinsb.posterous.com/aws-down-why-the-sky-is-falling

  • Martin Seibert (TwentyFeet)

    25.04.11 (13:51:08)

    Wir waren selbst auch betroffen und wären gerne direkt umgezogen. Das Problem war nicht, dass andere Availability-Zones nicht verfügbar gewesen wären, sondern dass man die Instanzen nicht "detachen" konnte. Auf diese Weise mussten wir entweder Daten verlieren oder warten. Nachdem die Sache schon 30 Stunden gedauert hatte, haben wir dann "Datenverlust" vorgezogen und sind woanders gestartet. Es gibt für die Zukunft nur wenig Optimierungsmöglichkeiten: 1. Häufiger Backups machen. 2. Mehr Geld investieren und nicht mehr nur von einer Zone oder einem Anbieter abhängig sein. Das ist natürlich einfach und zuverlässig aber eben auch teuer. Ich gehe davon aus, dass Amazon professionell auf diesen Ausfall reagieren wird. Ciao Martin

  • Manuel

    25.04.11 (14:21:27)

    Das Problem sehe ich nicht in der Cloud an sich, sondern (wie so häufig) im Budget der Kunden. Auch in der Cloud kann man eine hohe Verfügbarkeit erreichen, wenn man entsprechend Geld in die Hand nimmt. Der Preis steigt exponentiell mit der Verfügbarkeit. Die Frage ist halt, wie hochverfügbar ein Dienst sein muss. Wenn mein Evernote mit Gratisaccount mal ein paar Tage nicht geht, rege ich mich nicht auf. Wenn ich hingegen monatlich einen dreistelligen Betrag für ein gehostetes CRM bezahle, werde ich bei einem Ausfall recht schnell stinkig.

  • Martin Seibert (TwentyFeet)

    25.04.11 (14:26:35)

    Manuel: You name it. Die richtig (finanziell) fetten Dienste sind ja auch nicht down gewesen. :-)

  • Martin Weigert

    26.04.11 (09:14:09)

    Hier noch ein Artikel mit weiteren (technischen) Details und einem Vorschlag zur Schuldfrage.

  • Mario Meir-Huber

    09.08.11 (19:06:13)

    ... und schon wieder ist die Cloud down, diesmal war es ein Blitz in den Europäischen Rechenzentren. Wie man sich dagegen am Besten als Konsument der Dienste schützen kann habe ich hier beschrieben: Cloud ausfälle nach Blitzeinschlag

Diesen Beitrag kommentieren:

Die Kommentare können nur zwischen 9 und 16 Uhr
freigeschaltet werden. Wir bitten um Verständnis.

Um Spam zu vermeiden, schreiben Sie bitte die Buchstaben aus diesem Bild in das nebenstehende Formularfeld:

Das könnte Sie auch interessieren

Förderland-Newsletter

Wissen für Gründer und Unternehmer