kernel bug?

Welches Modul/Treiber für welche Hardware, Kernel compilieren...
Antworten
Benutzeravatar
gagamail
Beiträge: 110
Registriert: 21.08.2002 16:21:48
Wohnort: wien
Kontaktdaten:

kernel bug?

Beitrag von gagamail » 11.04.2005 20:48:36

hi leute!

ich habe heute ein 'apt-get upgrade' durchgeführt. dabei ist mir der rechner komplett verstorben. ohne meldungen in den 'messages'. danach habe ich den server rebootet, und beim booten scheint er hängen geblieben zu sein. remote ließ er mich nicht einloggen:

login as: <user>
System bootup in progress - please wait

Password:

ende. mehr war nicht.
über einen browser habe ich festgestellt, dass er den apache bereits gestartet hatte (statische webseiten waren ok), aber zb mysqld noch nicht (db errors bei dyn seiten).

erst durch einen neuerlichen reboot (immer über aus - einschalten), bootete er vollständig und jetzt läuft auch alles wieder.

ich poste auch die meldungen die ich in den 'messages' diesbezüglich entdeckt habe. vielleicht kann mir hier wer sagen, was da los war/ist?
ich verwende sarge unter vmware (hostsystem ist redhat - das hatte keine probleme).
nowhere:/var/log# uname -a
Linux nowhere 2.4.27-2-686 #1 Thu Jan 20 11:10:41 JST 2005 i686 GNU/Linux
nowhere:/var/log#
lief jetzt gerade 50tage durch und heute gerade beim upgrade tritt das problem auf.

vielleicht hat jemand einen hinweis für mich. danke und lg, christian


beim ersten hänger schrieb er keine einträge über syslog.
beim 2ten hänger kam folgendes:

Apr 11 16:17:17 nowhere kernel: kernel BUG at memory.c:377!
Apr 11 16:17:17 nowhere kernel: invalid operand: 0000
Apr 11 16:17:17 nowhere kernel: CPU: 0
Apr 11 16:17:17 nowhere kernel: EIP: 0010:[zap_page_range+52/528] Tainted: PF
Apr 11 16:17:17 nowhere kernel: EFLAGS: 00010206
Apr 11 16:17:17 nowhere kernel: eax: cbdbd000 ebx: cf771c60 ecx: 40b33000 edx: cbdbd408
Apr 11 16:17:17 nowhere kernel: esi: ff8e6000 edi: cf771c60 ebp: 40b33000 esp: cbdbfe64
Apr 11 16:17:17 nowhere kernel: ds: 0018 es: 0018 ss: 0018
Apr 11 16:17:17 nowhere kernel: Process apache (pid: 985, stackpage=cbdbf000)
Apr 11 16:17:17 nowhere kernel: Stack: c122bfe0 cbdbe350 bffffaec c134b908 00000001 407b2000 00000001 403b3000
Apr 11 16:17:17 nowhere kernel: cbdbd404 00000000 40419000 cbdbd408 cbdbad80 ff8e6000 cf771c60 40b33000
Apr 11 16:17:17 nowhere kernel: c012cdbf cf771c60 40b33000 ff8e6000 cbdbade0 cf771c60 00000000 cbdbe000
Apr 11 16:17:17 nowhere kernel: Call Trace: [exit_mmap+175/304] [mmput+75/192] [do_exit+127/624] [collect_signal+176/240] [sig_exit+17
2/176]
Apr 11 16:17:17 nowhere kernel: [dequeue_signal+101/208] [do_signal+458/696] [restore_sigcontext+283/320] [sys_sigreturn+241/272] [sign
al_return+20/24]
Apr 11 16:17:17 nowhere kernel:
Apr 11 16:17:17 nowhere kernel: Code: 0f 0b 79 01 a1 9e 23 c0 8b 44 24 2c 8d 99 00 00 40 00 89 cf
Apr 11 16:18:11 nowhere kernel: <1>Unable to handle kernel paging request at virtual address fffffff3
Apr 11 16:18:11 nowhere kernel: printing eip:
Apr 11 16:18:11 nowhere kernel: c012c2f3
Apr 11 16:18:11 nowhere kernel: Oops: 0000
Apr 11 16:18:11 nowhere kernel: CPU: 0
Apr 11 16:18:11 nowhere kernel: EIP: 0010:[find_vma+67/112] Tainted: PF
Apr 11 16:18:11 nowhere kernel: EFLAGS: 00010206
Apr 11 16:18:11 nowhere kernel: eax: ffffffeb ebx: 40c417a8 ecx: cbdba960 edx: 00000003
Apr 11 16:18:11 nowhere kernel: esi: cf771d00 edi: cf771d1c ebp: 40c417a8 esp: cbd97ef4
Apr 11 16:18:11 nowhere kernel: ds: 0018 es: 0018 ss: 0018
Apr 11 16:18:11 nowhere kernel: Process apache (pid: 989, stackpage=cbd97000)
Apr 11 16:18:11 nowhere kernel: Stack: cf771d00 00000007 c0118492 cf771d00 40c417a8 40aacaf0 00000000 cbd97f98
Apr 11 16:18:11 nowhere kernel: c014872b caee91c0 00000806 cbd96000 00000000 00026202 000041e8 00030001
Apr 11 16:18:11 nowhere kernel: 000003ea 00000021 00000000 00000000 00000000 00001000 00000000 00001000
Apr 11 16:18:11 nowhere kernel: Call Trace: [do_page_fault+130/1337] [cached_lookup+27/112] [path_release+21/64] [sys_lstat64+77/144]
[do_page_fault+0/1337]
Apr 11 16:18:11 nowhere kernel: [error_code+52/60]
Apr 11 16:18:11 nowhere kernel:
Apr 11 16:18:11 nowhere kernel: Code: 39 58 08 76 1a 39 58 04 89 c1 76 07 8b 52 0c 85 d2 75 ea 85
Apr 11 16:19:03 nowhere kernel: kernel BUG at mmap.c:740!
Apr 11 16:19:03 nowhere kernel: invalid operand: 0000
Apr 11 16:19:03 nowhere kernel: CPU: 0
Apr 11 16:19:03 nowhere kernel: EIP: 0010:[find_vma_prev+140/192] Tainted: PF
Apr 11 16:19:03 nowhere kernel: EFLAGS: 00010203
Apr 11 16:19:03 nowhere kernel: eax: cb5ba900 ebx: cbdba7e0 ecx: cb5ba918 edx: ca4fbf94
Apr 11 16:19:03 nowhere kernel: esi: 4055b000 edi: cb5ba918 ebp: cf771d00 esp: ca4fbf58
Apr 11 16:19:03 nowhere kernel: ds: 0018 es: 0018 ss: 0018
Apr 11 16:19:03 nowhere kernel: Process sshd (pid: 1008, stackpage=ca4fb000)
Apr 11 16:19:03 nowhere kernel: Stack: cf771d00 00004000 00000000 4055b000 c012c791 cf771d00 4055b000 ca4fbf94
Apr 11 16:19:03 nowhere kernel: 4055b000 cbdb6a80 4055a000 cf771d04 00000000 00002000 cbdb6a80 cb5ba900
Apr 11 16:19:03 nowhere kernel: cf771d00 cf771d1c 00000000 bffff248 c012c9e2 cf771d00 4055b000 00003cf0
Apr 11 16:19:03 nowhere kernel: Call Trace: [do_munmap+113/640] [sys_munmap+66/112] [system_call+51/56]
Apr 11 16:19:03 nowhere kernel:
Apr 11 16:19:03 nowhere kernel: Code: 0f 0b e4 02 aa 9e 23 c0 89 d8 5b 5e 5f 5d c3 39 5d 00 eb ea
Apr 11 16:22:07 nowhere kernel: <1>Unable to handle kernel paging request at virtual address 0007fff0
Apr 11 16:22:07 nowhere kernel: printing eip:
Apr 11 16:22:07 nowhere kernel: c012c2f3
Apr 11 16:22:07 nowhere kernel: Oops: 0000
Apr 11 16:22:07 nowhere kernel: CPU: 0
Apr 11 16:22:07 nowhere kernel: EIP: 0010:[find_vma+67/112] Tainted: PF
Apr 11 16:22:07 nowhere kernel: EFLAGS: 00010206
Apr 11 16:22:07 nowhere kernel: eax: 0007ffe8 ebx: bfffdbb0 ecx: cbdba7e0 edx: 00080000
Apr 11 16:22:07 nowhere kernel: esi: cf771d00 edi: cf771d1c ebp: bfffdbb0 esp: ca251ef4
Apr 11 16:22:07 nowhere kernel: ds: 0018 es: 0018 ss: 0018
Apr 11 16:22:07 nowhere kernel: Process sh (pid: 1038, stackpage=ca251000)
Apr 11 16:22:07 nowhere kernel: Stack: cf771d00 00000006 c0118492 cf771d00 bfffdbb0 40134e20 00000000 00000000
Apr 11 16:22:07 nowhere kernel: 00000007 05b6719b 000048ed ca250000 00000000 00008803 00000000 00030001
Apr 11 16:22:07 nowhere kernel: cf649b80 c1307320 c013ec3e cf649b80 cbce2920 cf771d00 cbdba180 cf771d00
Apr 11 16:22:07 nowhere kernel: Call Trace: [do_page_fault+130/1337] [chrdev_open+94/112] [do_brk+327/560] [sys_brk+239/304] [do_page_
fault+0/1337]
Apr 11 16:22:07 nowhere kernel: [error_code+52/60]
Apr 11 16:22:07 nowhere kernel:
Apr 11 16:22:07 nowhere kernel: Code: 39 58 08 76 1a 39 58 04 89 c1 76 07 8b 52 0c 85 d2 75 ea 85
Apr 11 18:54:43 nowhere syslogd 1.4.1#16: restart.

Benutzeravatar
Joghurt
Beiträge: 5244
Registriert: 30.01.2003 15:27:31
Wohnort: Hamburg
Kontaktdaten:

Beitrag von Joghurt » 11.04.2005 21:47:25

Vielleicht wurde die CPU zu heiss. Es kann auch sein, dass dein Speicher hinüber ist. Lass mal memtest86+ über Nacht durchlaufen.

(http://www.memtest.org, gibt es auch als Debianpaket, das trägt sich dann in grubs menu.lst ein)

Benutzeravatar
gagamail
Beiträge: 110
Registriert: 21.08.2002 16:21:48
Wohnort: wien
Kontaktdaten:

Beitrag von gagamail » 12.04.2005 16:07:25

das problem ist, dass hier nicht nur mein virtueller server in einer vmware session laufen, sondern auch andere produktive. d.h., wir können den server nicht so ohne weiteres für einige stunden ausser betrieb nehmen, um memtest laufen zu lassen. leider.

auf dem hostsystem (auf dem der vmware server läuft) ist kein problem in den messages zu erkennen. nur mein virtueller server hatte gestern diesen ausreißer.

sonst noch ideen oder vorschläge oder muß ich mich damit abfinden und warten, dass es einfach nicht mehr passiert?

lg, christian

Antworten