Wie die Jabber User unter euch sicher schon festgestellt haben, war der Server von gestern Abend bis heute Morgen, nicht verfügbar. Ich entschuldige mich schon einmal dafür, dass ich nicht Bescheid gegeben habe. Ich habe es schlicht versäumt.
Der genauere Grund für diesen Ausfall bestand darin, den laufendenen Xen-2.0.7 Root Server auf die aktuelle 3.0.2-2 Version zu heben. Geplant waren etwa zwei Stunden, also von 23Uhr bis etwa ein Uhr.
Da ich bereits Zugriff auf einen laufenden Xen3 Ubuntu Server hatte, erzeugte ich ein Image von eben diesen und spielte es auf meinen auf, nur um nach ein paar Anpassungen, diesen gleich wieder zu starten.
Bis zum Reboot lief auch alles wie nach Plan, doch die Kombination dhclient3 von Ubuntu, und dem DHCP von Schlund, ließen mich einen wunderschönen Sonnenaufgang über Darmstadt miterleben.
Warum dieses Problem bestand, kann ich nicht nachvollziehen. Ich sah über meine serielle Konsole nur, dass, egal welcher Kernel, das System nur bis zum starten des Cron Daemon kam, nur um gleich danach die Verbindung zur Konsole verlieren. Bei Schlund wird nach ca. 60 Sekunden die Verbindung getrennt, wenn nichts mehr passiert.
Ich glaubte irgendetwas sei bei meinem Kernel falsch und so blieb ein beträchtlicher Anteil meiner Nacht, beim kompilieren diverser Kernelvarianten hängen. Auch installierte ich zwei mal Sarge, allerdings mit keinem besserem Ergebnis, was doch sehr verwunderte, da vorher ein Sarge lief.
Der Lösung näher kam ich erst, als ich einen normalen Kernel ohne Xen Unterstützung kompilierte und in den single Modus startete. Der DHCP3 Client bekam zwar seine IP Adresse zugeteilt, doch gleichzeitig vermeldete er auch ein network is unreachable. Einige schwere Denkminuten und vielen lokalen Tests später (das Rettungssystem von Schlund ist wirklich goldwert) sowie einigen Telefonkontakt mit Schlund, fand ich einen passenden Eintrag im Ubuntu Forum.
Stutzig wurde ich vor allem dadurch, dass die standard Routen, wie hier:
Kernel IP routing table Destination Gateway Genmask Flags Metric Ref Use Iface default-gw * 255.255.255.255 UH 0 0 0 eth0 192.168.1.0 * 255.255.255.0 U 0 0 0 xenintbr default default-gw 0.0.0.0 UG 0 0 0 eth0
schlicht nicht vorhanden waren, was dann auch das „Network is unreachable“ erklärte. Daher startete auch kein SSH und sämtliche Dienste, die darauf aufbauen.
Der Hack der im Beitrag zu finden ist…:
I can now access teh network but not with teh solution that I give above. This is what works for me (fix I got from my network admin people):
for router in $new_routers; do
!!! hack
if [ “$new_subnet_arg” == ‘netmask 255.255.255.255’ ]; then route add -host $router dev $interface fi
!!! end of hack
route add default dev $interface gw $router $metric_arg done
… brachte dann auch endlich die Erlösung. Gegen 10Uhr konnte ich Xen wieder hochfahren und die Dienste wieder bereitstellen.
Heute Nacht werde ich dennoch den Kernel noch einmal tauschen, da der jetzige noch zuviel enthält, was ich nicht benötige und den Start des Servers nur unnötig hinauszögert.
Jetzt ist erstmal eine Dusche fällig.