IT-Sicherheit - warum Netflix sich selbst ständig angreift Netflix' Affen-Armee sorgt für "Resilienz"

Planet der Affen: Netflix und viele andere Unternehmen lassen sich regelmäßig von einer "Affen-Armee" angreifen. Ihre Mission: das Netflix-System ständig zu attackieren, um es so widerstandsfähig ("resilient") gegenüber Störungen von außen zu machen

Planet der Affen: Netflix und viele andere Unternehmen lassen sich regelmäßig von einer "Affen-Armee" angreifen. Ihre Mission: das Netflix-System ständig zu attackieren, um es so widerstandsfähig ("resilient") gegenüber Störungen von außen zu machen

Foto: AP

"Der Himmel kommt runter" - mit diesen vier Worten beschrieb im Frühjahr 2011 ein Kunde die Auswirkungen, die ein Ausfall bei Amazons Cloud-Dienst AWS für sein Unternehmen hatte. Er war nicht allein. Gleich reihenweise gingen Seiten in die Knie, nachdem die AWS-Software in einem Datencenter in Nord Virginia plötzlich angefangen hatte unkontrollierbar Sicherheitskopien der gelagerten Datenbestände anzulegen.

Eine Kettenreaktion, die den Cloud-Dienst schließlich in die Knie zwang. Teils stundenlang waren Unternehmen wie Reddit, Foursquare oder Quora nicht im Netz erreichbar. Eine Situation, die für solche Unternehmen dem Gau schon ziemlich nahe kommt.

Dabei sind Cloudangebote wie Amazons AWS für Unternehmen sehr praktisch: Sie bieten Flexibilität, ohne dass die Unternehmen selbst riesige Datencenter bauen müssen. Doch die Flexibilität hat ihren Preis: Nicht nur das Versagen der eigenen Software ist eine Gefahr. Kommt es beim Dienstleister zu Problemen, kann dies ebenfalls Konsequenzen für das eigene Geschäft haben.

Hauseigene "Affen-Armee" als Sparringspartner simuliert Angriffe

Netflix-Chef Reed Hastings dürfte - anders als vielen seiner Kollegen - der Teil-Kollaps der Amazon-Cloud damals keine schlaflosen Nächte bereitet haben. Der Streamingdienst war einer der wenigen Amazon-Kunden, die den Zusammenbruch ohne Auswirkungen überstand.

Denn der Informatiker, dessen erstes Startup Pure Software sein Geld damit verdiente, Unternehmen bei der Fehlerdiagnostik im eigenen System zu helfen, hat diese für sein eigenes Unternehmen quasi institutionalisiert. Weil Fehler geschehen, "und meist gerade dann, wenn man es am wenigsten erwartet" (O-Ton Netflix), lässt er sich ständig selbst angreifen, um die eigene Widerstandskraft zu erhöhen.

Sparringspartner ist Nettflix hauseigene "Affen-Armee", die "Simian Army". Ihre Mission: Das Netflix-System ständig zu attackieren, um es so widerstandsfähiger zu machen. "Wie bewaffnete Affen im Rechenzentrum, die wahllos Datengruppen im Rechenzentrum abknallen und Kabel anknabbern" - und der Kunde merkt nichts von alldem", beschreibt der Streamingdienst den gewollten Schaden, den die virtuellen Primaten regelmäßig im hauseigenen System anrichten.

Affenalarm von 9 bis 15.00 Uhr

Die Software, die aus verschiedenen "Monkeys" besteht, greift mehr als 1000 Mal pro Woche an, um das System damit sicherer zu gestalten. "Wir sind zu dem Schluss gekommen, dass es die beste Verteidigung gegen größere unerwartete Ausfälle ist, oft Fehler zu machen. Indem wir häufig Fehler verursachen, sorgen wir dafür, dass unsere Services auf eine resilientere Art und Weise gebaut werden", begründete die Netflix seine Vorgehensweise 2012 im Unternehmensblog.

Damit sie letztlich nicht selbst den Absturz der Systeme verursachen, dürfen die Affen allerdings nur in einem definierten Zeitfenster wüten: Nämlich zwischen 9 und 15 Uhr, damit sicherheitshalber jemand da ist, um im Falle eines Falles das System vor dem Kollaps zu retten

Und die Affen-Armee wächst kontinuierlich. Neben

- "Chaos-Monkey", einem Werkzeug, das auf Zufallsbasis einzelne Funktionsbereiche ausschaltet und

- "Chaos Gorilla", der dies in noch größerem Stil tut, gibt es mittlerweile auch den

- "Janitor Monkey". Wie sein Namensgeber, der Hausmeister, ist es sein Job, Überflüssiges im System zu identifizieren und dafür zu sorgen, dass es verschwindet.

- "Doctor-Monkey" wiederum unterzieht die Systeme wie ein virtueller Arzt regelmäßigen Gesundheitschecks.

- "Conformity-Monkey" sorgt dafür, das alle Systeme denselben Standard einhalten.

- Und "Latency-Monkey" seinerseits enttarnt mit Hilfe künstlich hervorgerufener Verzögerungen Schwachstellen.

- "Security-Monkey" wiederum ermöglicht es Netflix , nach Schwachstellen oder möglichen Sicherheitslücken Ausschau zu halten - und diese auszubessern, bevor mögliche Angreifer sie nutzen.

Längst tobt die Affenarmee nicht mehr nur bei Netflix. 2012 hat der Streaminganbieter damit begonnen, "seine Affen in die Freiheit zu entlassen" - sprich: die Baupläne für einzelne Mitglieder seiner Affenarmee zu veröffentlichen.

Und viele Unternehmen haben bereits zugegriffen. Neben IBM und Nike sollen unter anderem auch Yahoo und der 2013 von Google übernommene Verkehrsapp-Betreiber Waze auf die von Netflix veröffentlichten Baupläne zurückgegriffen haben.

Die Wiedergabe wurde unterbrochen.