Heartbeat2 mit DRBD8 und Nagios2

Alle weiteren Dienste, die nicht in die drei oberen Foren gehören.
Antworten
Benutzeravatar
Snoopy
Beiträge: 4297
Registriert: 17.11.2003 18:26:56
Lizenz eigener Beiträge: MIT Lizenz
Wohnort: Rh.- Pflz.

Heartbeat2 mit DRBD8 und Nagios2

Beitrag von Snoopy » 14.01.2008 19:38:08

Hi,

ich hab hier 2 TestServer stehen, die mit Debian Etch installiert sind.
Auf Beiden läuft erfolgreich Heartbeat2 mit DRBD8, zur Zeit ist der Apache als Clusterdienst konfiguriert.
Das Übernehmen / Umwerfen klappt einwandfrei, das Shared Device

Code: Alles auswählen

/dev/drbd0
wird einwandfrei beim Umschalten als

Code: Alles auswählen

/daten
eingebunden, die Konsistenz ist i.O.

Nun möchte ich im Clusterverbund Nagios ablegen und das ist mein Problem:
Die Nagios-Files liegen unter

Code: Alles auswählen

/etc/nagios2
/etc/nagios-plugins
/usr/share/nagios2
/usr/share/nagios-plugins
Diese Files würde ich gerne auf das Shared Device legen, um Konsistenz der Daten zu erhalten.
Man könnte es zwar zwischen den Rechnern syncen (rsync & Konsorten), das empfinde ich aber als unsauber, dafür ist DRBD zuständig.

Es geht aber leider nicht wie ich es gedacht habe. :?
Ich habe die betreffenden Directories und Files auf das drbd0 gemoved und dann unter den betreffenden Directories in /etc und /usr/share Symlinks angelegt.
Wenn ich dann den Cluster starte (CRM aktiviert!), hat der Clustermanager Probleme Nagios zu starten, weil er die (Config-)Files unter /etc nicht findet.
lrmd[28731]: 2008/01/14_16:53:46 info: RA output: (apache2_4:stop:stdout) Stopping web server (apache2)...
lrmd[28731]: 2008/01/14_16:53:46 info: RA output: (apache2_4:stop:stderr) grep:
lrmd[28731]: 2008/01/14_16:53:46 info: RA output: (apache2_4:stop:stderr) /etc/apache2/conf.d/nagios2.conf
lrmd[28731]: 2008/01/14_16:53:46 info: RA output: (apache2_4:stop:stderr) : Datei oder Verzeichnis nicht gefunden
lrmd[28731]: 2008/01/14_16:53:46 info: RA output: (apache2_4:stop:stderr)
lrmd[28731]: 2008/01/14_16:53:47 info: RA output: (apache2_4:stop:stdout) .
# > ll /etc/apache2/conf.d/nagios2.conf
lrwxrwxrwx 1 root root 25 2008-01-14 16:56 /etc/apache2/conf.d/nagios2.conf -> /etc/nagios2/apache2.conf (das wiederum nach /daten/etc/nagios2/apache.conf verlinkt ist)
Wenn ich hingehe und Nagios wieder als Clusterdienst entferne und manuell später (nach ClusterStart mit /etc/init.d/nagios2 start) starte, rennt Nagios einwandfrei, auch auf dem Shared Device.

Ich glaube, dass das Einmounten des drbd0 auf /daten nicht ganz abgewartet wird und sofort (durch die Symlinks) darauf zugegriffen werden möchte. Da aber der Mount noch nicht ganz durch ist, war's das. Der Cluster startet nicht.

Ich würde gerne nach dem Mount ein kurzes Break von 5 Sekunden einbauen, damit man dem Mount etwas Zeit geben kann und danach erst die Services Apache-Nagios etc startet, finde aber keinen Ansatz dazu. :(

Hat hier Jemand Nagios2 erfolgreich in einem ClusterVerbund UND auf einem SharedDevice zum Laufen gebracht ?
Oder hat Jemand eine zündelnde Idee wie man den ClusterStart "abbremsen" kann und er ein wenig wartet, bis /daten korrekt vorhanden ist ?
Oder wie man nach dem DRBD-Mount automatisch ein "Break" einsetzt ?

Antworten