ich habe Nagios installiert und konfiguriert. Nagios läuft auf einem Server und überprüft die Dienste auf 2 anderen. Über das nrpe-plugin werden auf einem der beiden Server zusätzliche Checks (etwa CPU-Last, Prozessanzahl) durchgeführt.
Diese Checks werden offenbar auch korrekt durchgeführt. Der Server mit dem nrpe-server loggt regelmäßig derartige Dinge:
Code: Alles auswählen
Feb 8 16:47:32 dsxx-xxx-xxx-xx nrpe[15233]: Connection from xxx.xxx.xxx.xxx port 53758
Feb 8 16:47:32 dsxx-xxx-xxx-xx nrpe[15233]: Host address checks out ok
Feb 8 16:47:32 dsxx-xxx-xxx-xx nrpe[15233]: Handling the connection...
Feb 8 16:47:32 dsxx-xxx-xxx-xx nrpe[15233]: Host is asking for command 'check_mysql' to be run...
Feb 8 16:47:32 dsxx-xxx-xxx-xx nrpe[15233]: Running command: /usr/lib/nagios/plugins/check_mysql --check-slave
Feb 8 16:47:32 dsxx-xxx-xxx-xx nrpe[15233]: Command completed with return code 2 and output: Access denied for user: 'nagios@localhost' (Using password: NO)
Feb 8 16:47:32 dsxx-xxx-xxx-xx nrpe[15233]: Return Code: 2, Output: Access denied for user: 'nagios@localhost' (Using password: NO)
Feb 8 16:47:32 dsxx-xxx-xxx-xx nrpe[15233]: Connection from xxx.xxx.xxx.xxx closed.
Code: Alles auswählen
[1139409698] Nagios 1.3 starting... (PID=31188)
Im Log stehen ab und zu auch ein paar Zeilen:
Code: Alles auswählen
[1139402923] SERVICE ALERT: myhost;total_procs;CRITICAL;SOFT;2;PROCS CRITICAL: 209 processes
[1139402983] SERVICE ALERT: myhost;total_procs;CRITICAL;SOFT;3;PROCS CRITICAL: 204 processes
[1139403043] SERVICE ALERT: myhost;total_procs;CRITICAL;HARD;4;PROCS CRITICAL: 206 processes
[1139403253] SERVICE ALERT: myhost;http;CRITICAL;SOFT;1;CRITICAL - Socket timeout after 10 seconds
[1139403313] SERVICE ALERT: myhost;http;CRITICAL;SOFT;2;CRITICAL - Socket timeout after 10 seconds
[1139403343] SERVICE ALERT: myhost;total_procs;WARNING;HARD;4;PROCS WARNING: 185 processes
[1139403373] SERVICE ALERT: myhost;http;CRITICAL;SOFT;3;CRITICAL - Socket timeout after 10 seconds
[1139403433] SERVICE ALERT: myhost;http;CRITICAL;HARD;4;CRITICAL - Socket timeout after 10 seconds
Wie kann ich der Sache nun auf den Grund gehen? Kann man Nagios dazu bringen etwas mehr zu loggen? Hab leider kein Option für derartiges Debugging gefunden (in der Art wie es beim nagios-nrpe-server möglich ist).
Irgendwelche Tipps?