Ausfall Services aufgrund Neustart/kaputter Festplatte

Publiziert: 13 January 2013 - Kategorie: tech

Am 12. Januar waren relativ viele unserer Services zwischen 7 und 12 Uhr nicht verfügbar. Der Grund dafür war, dass sich der Gateway eines Servers neustartete (weshalb ist noch unklar) und danach das interne VPN, das für die Services wichtig ist, nicht automatisch startete. Das Starten des VPN kann nur durch unsere Administratorinnen veranlasst werden.
Als wir den Ausfall bemerkten und das interne VPN wieder starteten, funktionierten die Services wieder wie gewohnt. Der betroffene Host ist historisch bedingt recht zentral in unserer Infrastruktur verankert, weshalb so viele Services von diesem Host abhängen und von diesem Ausfall betroffen waren. Wir sind stetig damit beschäftigt die Abhängigkeit der Services weiter zu entkoppeln, um das Ausmass eines Ausfalls immer wie kleiner zu halten. Dies ist ein recht langwieriger Prozess und braucht somit seine Zeit, geschieht aber stetig und oft ohne, dass ihr etwas davon bemerkt.

Ausserdem fiel in dieser Nacht eine Festplatte aus (ob dies zu dem Neustart führte, klären wir noch ab), die wir in den nächsten Tagen ersetzen werden. Es wird deshalb zu einem weiteren kurzen Unterbruch der Services kommen, weil wir den Host dafür herunterfahren müssen. Diese Arbeiten werden wir jedoch möglichst auf Randzeiten legen, weshalb die wenigsten von euch davon etwas bemerken werden.

Sobald wir wissen, wann die Festplatte ersetzt wird, werden wir euch informieren.