wir haben bei uns ein relativ dringendes Problem, nämlich hängen sich bei uns in relativ großen (ca. 2 Wochen), unregelmäßigen Abständen virtuelle Maschinen auf (soll heißen 100% CPU-Auslastung, keine Verbindung über SSH oder andere Dienste mehr möglich, auch nicht über die virsh console), die ich dann auch nicht über virsh beenden kann.
Nach einiger Recherche habe ich gesehen, dass das Problem seit 2011 schon besteht und in irgendeiner Form mit mit libvirt zusammenhängt.
Wenn ich den Dienst neu starte (service libvirt-bin restart), laufen die Maschinen (sowohl Windows als auch Linux) normal weiter als wäre nichts gewesen.
Wir verwenden noch die oldstable (Squeeze) mit Kernel 2.6.32-5-amd64.
Auf dem Server laufen 9 virtuelle Maschinen (eine davon Windows 7, eine Win Server 2008 als Terminalserver) eigentlich mit einer relativ normalen Auslastung (bei den Windows Maschinen zu Stoßzeiten maximal 80%).
Es hängen sich übrigens nur maximal 2 Maschinen gleichzeitig auf, meistens Windows-Terminalserver und der Mailserver (Debian). In den Logs der beiden Maschinen findet sich aber kein Hinweis auf den Fehler, weshalb wie gesagt für mich nur libvirt als Fehlerquelle infrage kommt, da der Neustart des Dienstes das Problem behebt.
Server hat 8 CPUs (Xeon) mit je 2,4 GHz
64 GB Ram (davon 16 dem Server 2008 zugewiesen, sowie 2 CPUs/ 4 virtuelle CPUs)
Die virtuellen Maschinen teilen sich keine Ressourcen.
Programmversionen:
kvm 1:1.1.2+dfsg-2~bpo60+1
libvirt-bin 0.9.12-4~bpo60+1
qemu-kvm 0.12.5+dfsg-5+squeeze9
qemu-utils 0.12.5+dfsg-3squeeze2
/var/log/libvirt ist geflutet mit folgender Fehlermeldung:
Code: Alles auswählen
2013-06-07 09:13:39.146+0000: 1817: error : qemuMonitorTextGetBalloonInfo:716 : operation failed: could not query memory balloon allocation
Hat eine(r) von euch vielleicht schon ein ähnliches Problem gehabt und einen Tip für mich?
Gruß
Broco