Interpretation Munin-Werte

Alle weiteren Dienste, die nicht in die drei oberen Foren gehören.
Antworten
shecki
Beiträge: 10
Registriert: 06.01.2010 10:06:15

Interpretation Munin-Werte

Beitrag von shecki » 08.03.2010 10:11:40

Moin,

Ich frage mich schon seit längerem, wie man die Interrupt-Übersicht bei Munin interpretiert, bzw. was mit die diversen Interrupts sagen, was sie tun. Konkret geht es um den Graphen namens "Individual Interrupts". Dort finden sich einige Interrupts und ich hab schon selber etwas gesucht, aber bisher noch nichts gefunden, wie man diese Werte interpretieren sollte und welche Werte denn zum Beispiel ein Problem darstellen könnten und welche nicht.

Betriebssystem des überwachten Hosts ist Debian lenny, Kernel: 2.6.26-2-amd64, Munin-Version 1.2.6-10~lenny1

Hintergrund ist der, dass wir versuchen, raus zu finden, warum auf diesen Rechnern, die als VMware Server 2.0.2 Host dienen, die Load stetig ansteigt und eventuell sind ja diverse Interrupt-Werte viel zu hoch und könnten Aufschluss bieten. Zumindest sind wir nach ca. einem Jahr Suche nach der Ursache dieses Problems ziemlich gefrustet und das einzige was klar ist, dass mit Deinstallieren der VMware Tools das Load-Verhalten besser wird, aber zulasten eines schlechteren IO-Verhaltens, was auch ungut ist.

Hilfe zu beiden Themen, Munin und VMware Load wäre toll ;)
Wobei zu letzterem die diversen Tuning-Tipps die man in den VMware-Foren so findet bereits ausprobiert wurden...

shecki
Beiträge: 10
Registriert: 06.01.2010 10:06:15

Re: Interpretation Munin-Werte

Beitrag von shecki » 12.03.2010 10:46:36

Da es wohl schwer wird, wen zu finden, der mir allgemeingültige Antworten geben kann, versuchen wir es doch mal mit spezifischen ;)

1) Welcher Interrupt zeigt mir Festplattenzugriffe an, sofern es einen solchen gibt? ata_piix bietet sich namenstechnisch an, aber mit "nur" ca. 25 Interrupts pro Sekunde steht er doch deutlich hinter anderen zurück, was mich daran zweifeln lässt, dass es der passende ist. Zumal es auf einem anderen Rechner einen Interrupt namens ide1 gibt, der bei 500-600m pro Sekunde liegt, also wohl 500-600 Millionen Interrupts, was ich als sehr hoch empfinde...

2) Was ist "function call interrupts" ? Auf einem System liegt dieser Wert bei ca. 250m (also 250 Millionen) auf 2 anderen bei 100-300. Der größte Unterschied zwischen den Systemen ist dabei, auf dem mit dem hohen Wert laufen die VMs mit VMware Tools auf den beiden anderen ohne. Alle drei Systeme sind reine VMware Hosts mit VMware Server 2.0.x


Hintergrund meiner Fragen sind beständig steigende Load-Werte auf diesen Hosts, die von munin rein dem userspace zugeordnet werden, die Systemlast bleibt also an sich gleich. Durch try and error wissen wir schon, dass durch das Weglassen der VMware Tools in den VMs dieser Loadzuwachs zumindest verringert, bzw. wohl vermieden werden kann, was aber andere Probleme mit sich bringt.

Es wäre daher interessant zu wissen, ob und wie man das Hostsystem tunen kann, damit es eben mit den VMware-Tools zurecht kommt und dieser Loadzuwachs vermieden wird. Dabei haben wir einige immer wieder genannte "Standards" schon durchprobiert, bisher ohne wirklichen Erfolg. Daher nun der Versuch, mal in die Tiefe gewisser Dinge vorzustoßen, um vielleicht selber noch Ideen zu entwickeln.

Antworten