[kvm] Merkwürdiger Kernelfehler

Welches Modul/Treiber für welche Hardware, Kernel compilieren...
Antworten
HBlatt
Beiträge: 2
Registriert: 06.09.2016 20:44:27

[kvm] Merkwürdiger Kernelfehler

Beitrag von HBlatt » 07.09.2016 10:13:06

Hallo liebe Debianer,

mir ist etwas merkwürdiges über den Weg gelaufen im Zusammenhang mit (openstack + nova + ) libvirt + kvm + qemu. Wenn ich eine neue Instanz in QEmu starte (egal welche, probiert mit Ubuntu, Debian, Knoppix, verschiedene Versionen) wirft mein Kernel ein Fehler:

Code: Alles auswählen

kernel: [3522129.932294] ------------[ cut here ]------------
kernel: [3522129.932914] kernel BUG at /build/linux-7z1rSb/linux-3.16.7-ckt25/arch/x86/kvm/x86.c:293!
kernel: [3522129.933453] invalid opcode: 0000 [#14] SMP 
kernel: [3522129.934206] Modules linked in: nf_conntrack_netlink ebt_arp ebt_among ip6table_raw ip6table_mangle nf_conntrack_ipv6 nf_defrag_ipv6 iptable_nat nf_nat_ipv4
 nf_nat xt_connmark iptable_mangle xt_mac xt_tcpudp nf_conntrack_ipv4 nf_defrag_ipv4 xt_comment xt_physdev xt_set xt_conntrack nf_conntrack ip_set_hash_net ip_set nfnetlink vhost_net vhost mac
vtap macvlan tun iptable_raw ebtable_filter ebtables ip6table_filter ip6_tables iptable_filter ip_tables binfmt_misc bridge stp llc x_tables nbd openvswitch gre vxlan libcrc32c crc32c_generic 
ib_iser rdma_cm iw_cm ib_cm ib_sa ib_mad ib_core ib_addr iscsi_tcp libiscsi_tcp libiscsi scsi_transport_iscsi nfsd auth_rpcgss oid_registry nfs_acl nfs lockd fscache sunrpc snd_hda_codec_realt
ek snd_hda_codec_generic adt7475 hwmon_vid snd_hda_intel snd_hda_controller snd_hda_codec snd_hwdep nouveau powernow_k8 mxm_wmi snd_pcm kvm_amd ppdev hp_wmi sparse_keymap rfkill evdev snd_time
r kvm video sp5100_tco ttm drm_kms_helper drm serio_raw pcspkr edac_mce_amd i2c_algo_bit snd soundcore i2c_piix4 edac_core i2c_core k8temp wmi parport_pc shpchp parport button processor therma
l_sys autofs4 ext4 crc16 mbcache jbd2 sg sd_mod crc_t10dif crct10dif_generic sr_mod cdrom crct10dif_common ata_generic ohci_pci psmouse pata_atiixp floppy ahci libahci libata ehci_pci ohci_hcd
 ehci_hcd scsi_mod tg3 ptp pps_core libphy usbcore usb_common [last unloaded: ebtables]
kernel: [3522129.936012] CPU: 0 PID: 9002 Comm: CPU 0/KVM Tainted: G      D       3.16.0-4-amd64 #1 Debian 3.16.7-ckt25-2+deb8u3
kernel: [3522129.939873] Hardware name: Hewlett-Packard HP Compaq dc5750 Microtower/0A64h, BIOS 786E3 v02.22 04/18/2007
kernel: [3522129.939873] task: ffff880003790c20 ti: ffff880002ebc000 task.ti: ffff880002ebc000
kernel: [3522129.939873] RIP: 0010:[<ffffffffa0344005>]  [<ffffffffa0344005>] kvm_spurious_fault+0x5/0x10 [kvm]
kernel: [3522129.939873] RSP: 0018:ffff880002ebfd70  EFLAGS: 00010046
kernel: [3522129.939873] RAX: ffff8800ba2fd000 RBX: ffff880010d34010 RCX: ffff8800ba2fd000
kernel: [3522129.939873] RDX: 0000000000000000 RSI: 000000000000000f RDI: ffff880010d34010
kernel: [3522129.939873] RBP: ffff880010d34010 R08: 0000000000000000 R09: 0000000000000000
kernel: [3522129.939873] R10: 000000000035be51 R11: 0000000000000000 R12: 0000000000000000
kernel: [3522129.939873] R13: 0000000000000000 R14: 00000000002625a0 R15: ffff880000080040
kernel: [3522129.939873] FS:  00007f37fcf97700(0000) GS:ffff8800bfa00000(0000) knlGS:0000000000000000
kernel: [3522129.939873] CS:  0010 DS: 0000 ES: 0000 CR0: 000000008005003b
kernel: [3522129.939873] CR2: 00007f380ea0f000 CR3: 00000000ba5c0000 CR4: 00000000000007f0
kernel: [3522129.939873] Stack:
kernel: [3522129.939873]  ffffffffa03b85dc ffffffffa03b3300 ffff880010d34010 0000000000000000
kernel: [3522129.939873]  0000000000000000 0000000000000000 00000000002625a0 ffff880000080040
kernel: [3522129.939873]  ffffffffa034f8c7 0000000000000202 ffff880002ebffd8 ffff880003790c20
kernel: [3522129.939873] Call Trace:
kernel: [3522129.939873]  [<ffffffffa03b85dc>] ? cr8_write_interception+0x7c/0x12c [kvm_amd]
kernel: [3522129.939873]  [<ffffffffa03b3300>] ? svm_vcpu_run+0x100/0x4c0 [kvm_amd]
kernel: [3522129.939873]  [<ffffffffa034f8c7>] ? kvm_arch_vcpu_ioctl_run+0xb17/0x1110 [kvm]
kernel: [3522129.939873]  [<ffffffffa034bb02>] ? kvm_arch_vcpu_load+0x172/0x1d0 [kvm]
kernel: [3522129.939873]  [<ffffffffa033aa41>] ? kvm_vcpu_ioctl+0x2f1/0x590 [kvm]
kernel: [3522129.939873]  [<ffffffff8109d237>] ? put_prev_entity+0x57/0x350
kernel: [3522129.939873]  [<ffffffff8109c0a6>] ? set_next_entity+0x56/0x70
kernel: [3522129.939873]  [<ffffffff810a2e71>] ? pick_next_task_fair+0x6e1/0x820
kernel: [3522129.939873]  [<ffffffff811ba9af>] ? do_vfs_ioctl+0x2cf/0x4b0
kernel: [3522129.939873]  [<ffffffff811bac11>] ? SyS_ioctl+0x81/0xa0
kernel: [3522129.939873]  [<ffffffff81516228>] ? page_fault+0x28/0x30
kernel: [3522129.939873]  [<ffffffff8151420d>] ? system_call_fast_compare_end+0x10/0x15
kernel: [3522129.939873] Code: 84 00 00 00 00 00 b8 00 04 00 00 e9 77 ff ff ff 66 0f 1f 44 00 00 49 81 fd 00 08 00 00 75 b3 eb c0 0f 1f 44 00 00 66 66 66 66 90 <0f> 0b 
66 0f 1f 84 00 00 00 00 00 66 66 66 66 90 41 55 49 89 f2 
kernel: [3522129.939873] RIP  [<ffffffffa0344005>] kvm_spurious_fault+0x5/0x10 [kvm]
kernel: [3522129.939873]  RSP <ffff880002ebfd70>
kernel: [3522129.939873] ---[ end trace 4de2a7be85644213 ]---
Debian Jessie
Kernel Paket linux-image-3.16.0-4-amd64 Version 3.16.7-ckt25
Libvirt 2.1.0
QEmu 2.1.2

Wenn ich in die Quelldatei von arch/x86/kvm/x86.c:293 reinschaue sehe ich da einige einstellung zur APIC-Verwaltung, daher habe ich für die VMs APIC deaktiviert (war vorher aktiviert), brachte leider keine Besserung.
Grundsätzlich funktioniert die Virtualisierung, wenn ich kvm deaktiviert lasse starten die VMs ordnungsgemäß. Allerdings sind sie ohne KVM so langsam dass sie praktisch nicht benutzbar sind.

Hat jemand einen Tipp für mich wie ich weiter vorgehen kann um dieses Problem zu beseitigen?

Bedanke mich im Vorraus,
Viele Grüße
Hamlet

rendegast
Beiträge: 15041
Registriert: 27.02.2006 16:50:33
Lizenz eigener Beiträge: MIT Lizenz

Re: [kvm] Merkwürdiger Kernelfehler

Beitrag von rendegast » 07.09.2016 13:31:37

Du könntest es mit kernel (4.6) / qemu (2.5)
aus jessie-backports versuchen.


Libvirt 2.1.0
? testing?

Code: Alles auswählen

$ apt-cache policy libvirt0
libvirt0:
  Installiert:           1.2.9-9+deb8u3
  Installationskandidat: 1.2.9-9+deb8u3
  Versionstabelle:
     2.1.0-2 0
        100 http://ftp.de.debian.org/debian/ unstable/main amd64 Packages
        101 http://ftp.de.debian.org/debian/ testing/main amd64 Packages
 *** 1.2.9-9+deb8u3 0
        500 http://security.debian.org/ jessie/updates/main amd64 Packages
        100 /var/lib/dpkg/status
     1.2.9-9+deb8u2 0
        500 http://ftp.de.debian.org/debian/ jessie/main amd64 Packages
mfg rendegast
-----------------------
Viel Eifer, viel Irrtum; weniger Eifer, weniger Irrtum; kein Eifer, kein Irrtum.
(Lin Yutang "Moment in Peking")

Benutzeravatar
pdreker
Beiträge: 8298
Registriert: 29.07.2002 21:53:30
Lizenz eigener Beiträge: MIT Lizenz
Wohnort: Nürnberg

Re: [kvm] Merkwürdiger Kernelfehler

Beitrag von pdreker » 02.10.2016 22:34:07

Abgesehen davon, dass ich mich erstmal rendegast anschließe (aktuelle Version versuchen), habe ich mal mein Google-Fu angeworfen und dabei das hier gefunden. Da hat jemand exakt das gleiche Oops getroffen, interessanterweise auf exakt der gleichen HW (HP dc5750), nur ca. 10 Minor-Revisions des Kernels früher (3.6 statt 3.16).

Sprich massiv für einen Bug, nur leider ist es gefährlich aus 2 Datenpunkten zu interprolieren, *wo* der Bug ist... Da es 2mal die gleiche HW ist, könnte es natürlich auch ein FUCKUP in der HP Hardware/BIOS sein, aber ich will den Teufel nicht an die Wand malen.

Kernel updaten, qemu/libvirt updaten und nochmal versuchen.

lg,
Patrick
Definitely not a bot...
Jabber: pdreker@debianforum.de

rendegast
Beiträge: 15041
Registriert: 27.02.2006 16:50:33
Lizenz eigener Beiträge: MIT Lizenz

Re: [kvm] Merkwürdiger Kernelfehler

Beitrag von rendegast » 03.10.2016 00:13:09

HBlatt hat geschrieben: kernel: [3522129.939873] Hardware name: Hewlett-Packard HP Compaq dc5750 Microtower/0A64h, BIOS 786E3 v02.22 04/18/2007
Vom HP-Support, google 1. Treffer:
HP Compaq Business Desktop System BIOS (786E3 BIOS) Systemsoftware-Manager-Symbol
2.36 Rev. A 12 Dez 2011
Groesse MB: 3.5
Vorh.: 2.35 Rev. A 13 Aug 2008
Weiterhin gibt es aktualisierte firmware für broadcom (tg3, s.o.)
Broadcom Integrated NIC Firmware Update for Microsoft Windows
2.0 Rev. A 3 Mai 2010
Groesse MB: 4.7
Vorh.: 1.0 Rev. A 1 Mrz 2010
und einige Festplatten und CD.
mfg rendegast
-----------------------
Viel Eifer, viel Irrtum; weniger Eifer, weniger Irrtum; kein Eifer, kein Irrtum.
(Lin Yutang "Moment in Peking")

HBlatt
Beiträge: 2
Registriert: 06.09.2016 20:44:27

Re: [kvm] Merkwürdiger Kernelfehler

Beitrag von HBlatt » 04.10.2016 18:19:56

Hallo zusammen,

Halleluja jungs, ihr seit echt meine Rettung! Einige Stunden hat mich das gekostet.

Die Versionen sind aus sid, da ich Openstack aus sid installieren musste, Openstack Mitaka ist leider noch nicht stable.

Mein Vorgehen war erstmal sämtliche Konfigurationsdateien zu betrachten und die anzupassen. Nachdem das nichts gebracht hat libvirt+qemu+kernel in verschiedenen Versionen testen (sid / stable). Dann habe ich noch versucht das offizielle aktuelle Git-Repo von KVM zu klonen, das mit dem Kernel zu kompilieren und dieses Modul zu benutzen. Hat leider auch nicht funktioniert. Nach einigem internem KVM debuggen (gdb) kam ich auch nicht zum Ziel, daher stand ich kurz davor einen Bugreport ans KVM-Team über die Mailingliste zu posten. Bis ihr mir gerade den entscheidenden Hinweis gegeben habt ;-)

Scheint so als wurde bezüglich Virtualisierung im Bios was verändert. Jedenfalls mit dem aktuellen Bios (dem geupdateten, also Version 2.36 Rev. A(12 Dez 2011)) geht es ohne Probleme.

Danke euch!

Viele Grüße
HBlatt

Antworten