ich hab hier 2 TestServer stehen, die mit Debian Etch installiert sind.
Auf Beiden läuft erfolgreich Heartbeat2 mit DRBD8, zur Zeit ist der Apache als Clusterdienst konfiguriert.
Das Übernehmen / Umwerfen klappt einwandfrei, das Shared Device
Code: Alles auswählen
/dev/drbd0
Code: Alles auswählen
/daten
Nun möchte ich im Clusterverbund Nagios ablegen und das ist mein Problem:
Die Nagios-Files liegen unter
Code: Alles auswählen
/etc/nagios2
/etc/nagios-plugins
/usr/share/nagios2
/usr/share/nagios-plugins
Man könnte es zwar zwischen den Rechnern syncen (rsync & Konsorten), das empfinde ich aber als unsauber, dafür ist DRBD zuständig.
Es geht aber leider nicht wie ich es gedacht habe.
Ich habe die betreffenden Directories und Files auf das drbd0 gemoved und dann unter den betreffenden Directories in /etc und /usr/share Symlinks angelegt.
Wenn ich dann den Cluster starte (CRM aktiviert!), hat der Clustermanager Probleme Nagios zu starten, weil er die (Config-)Files unter /etc nicht findet.
lrmd[28731]: 2008/01/14_16:53:46 info: RA output: (apache2_4:stop:stdout) Stopping web server (apache2)...
lrmd[28731]: 2008/01/14_16:53:46 info: RA output: (apache2_4:stop:stderr) grep:
lrmd[28731]: 2008/01/14_16:53:46 info: RA output: (apache2_4:stop:stderr) /etc/apache2/conf.d/nagios2.conf
lrmd[28731]: 2008/01/14_16:53:46 info: RA output: (apache2_4:stop:stderr) : Datei oder Verzeichnis nicht gefunden
lrmd[28731]: 2008/01/14_16:53:46 info: RA output: (apache2_4:stop:stderr)
lrmd[28731]: 2008/01/14_16:53:47 info: RA output: (apache2_4:stop:stdout) .
Wenn ich hingehe und Nagios wieder als Clusterdienst entferne und manuell später (nach ClusterStart mit /etc/init.d/nagios2 start) starte, rennt Nagios einwandfrei, auch auf dem Shared Device.# > ll /etc/apache2/conf.d/nagios2.conf
lrwxrwxrwx 1 root root 25 2008-01-14 16:56 /etc/apache2/conf.d/nagios2.conf -> /etc/nagios2/apache2.conf (das wiederum nach /daten/etc/nagios2/apache.conf verlinkt ist)
Ich glaube, dass das Einmounten des drbd0 auf /daten nicht ganz abgewartet wird und sofort (durch die Symlinks) darauf zugegriffen werden möchte. Da aber der Mount noch nicht ganz durch ist, war's das. Der Cluster startet nicht.
Ich würde gerne nach dem Mount ein kurzes Break von 5 Sekunden einbauen, damit man dem Mount etwas Zeit geben kann und danach erst die Services Apache-Nagios etc startet, finde aber keinen Ansatz dazu.
Hat hier Jemand Nagios2 erfolgreich in einem ClusterVerbund UND auf einem SharedDevice zum Laufen gebracht ?
Oder hat Jemand eine zündelnde Idee wie man den ClusterStart "abbremsen" kann und er ein wenig wartet, bis /daten korrekt vorhanden ist ?
Oder wie man nach dem DRBD-Mount automatisch ein "Break" einsetzt ?