Ich habe hier auf mehreren Fujitsu RX500 S7 ein Debian 7 am laufen. In den letzten Wochen ist es wiederholt passiert, dass die Server bei vergleichsweise hoher IO-Load abgestürzt sind. Im Log ist leider nicht viel zu finden. Auf einer der seriellen Konsolen habe ich noch ein Stück Kernel-Trace gefunden:
Code: Alles auswählen
[352587.732425] Call Trace:
[352587.732427] [<ffffffff810daea4>] ? __purge_vmap_area_lazy+0x47/0x187
[352587.732429] [<ffffffff810dbba7>] ? vm_unmap_aliases+0x15f/0x16e
[352587.732431] [<ffffffff8102ef9c>] ? change_page_attr_set_clr+0xda/0x31e
[352587.732433] [<ffffffff8110a441>] ? dentry_kill+0x123/0x12e
[352587.732435] [<ffffffff8102f206>] ? change_page_attr_clear+0x26/0x2b
[352587.732437] [<ffffffff81030000>] ? reserve_memtype+0x59/0x2c9
[352587.732438] [<ffffffff8102f889>] ? _set_memory_wb+0x1a/0x1f
[352587.732440] [<ffffffff810303f0>] ? kernel_map_sync_memtype+0x68/0xb2
[352587.732442] [<ffffffff810305c5>] ? reserve_pfn_range+0x18b/0x1b0
[352587.732444] [<ffffffff810d22aa>] ? remap_pfn_range+0x94/0x306
[352587.732446] [<ffffffff81105caa>] ? path_openat+0x319/0x33a
[352587.732448] [<ffffffff810ce551>] ? pte_offset_kernel+0x16/0x35
[352587.732449] [<ffffffff812436cf>] ? mmap_mem+0x85/0x96
[352587.732452] [<ffffffff810d6313>] ? mmap_region+0x26e/0x44a
[352587.732454] [<ffffffff810d68eb>] ? sys_mmap_pgoff+0x110/0x160
[352587.732456] [<ffffffff81354212>] ? system_call_fastpath+0x16/0x1b
[352587.836297] BUG: soft lockup - CPU#4 stuck for 23s! [dmidecode:119805]
[352587.836298] Modules linked in: ipmi_si ipmi_poweroff ipmi_devintf ipmi_msghandler nfsd nfs nfs_acl auth_rpcgss fscache lockd sunrpc xfs loop snd_pcm snd_page_alloc snd_timer iTCO_wdt acpi_cpufreq sb_edac coretemp crc32c_intel ghash_clmulni_intel snd i2c_i801 i2c_core mperf iTCO_vendor_support ioatdma edac_core aesni_intel aes_x86_64 soundcore evdev pcspkr acpi_power_meter processor aes_generic thermal_sys cryptd container button ext4 crc16 jbd2 mbcache dm_mod ata_generic usbhid hid sg qla2xxx ata_piix scsi_transport_fc sd_mod libata scsi_tgt crc_t10dif ehci_hcd usbcore igb megaraid_sas usb_common scsi_mod dca [last unloaded: ipmi_msghandler]
Code: Alles auswählen
Linux hjad-gts2-de31 3.2.0-4-amd64 #1 SMP Debian 3.2.51-1 x86_64 GNU/Linux
Hat jemand einen Tip, wie ich hier dem Fehler näher kommen kann?
Gruss, René