kernel bug? Rechner freeze!

Welches Modul/Treiber für welche Hardware, Kernel compilieren...
Antworten
Liffi
Beiträge: 2345
Registriert: 02.10.2004 01:33:05

kernel bug? Rechner freeze!

Beitrag von Liffi » 10.07.2007 11:25:53

In letzter Zeit häufen sich bei mir die Abstürze und ich muß z.T. 5 oder 6 mal starten bevor ich länger als 2 Minuten arbeiten kann (dann läuft der Rechner aber auch wirklich, bis ich ihn ausmache).
Bisher lieferten mir die logs keine brauchbaren Hinweise, bis dann heute morgen tatsächlich was ins syslog geschrieben wurde.
Meine Frage dazu: kann man damit was anfangen?
Nach der ersten Phrase zu googlen bringt unheimlich viele Treffer, die ich aber nicht als sonderlich brauchbar empfinde.

Ich benutze debian etch und der Kernel ist 2.6.18-4-k7, habe aber auch schon ohne Erfolg den ohne den k7 Zusatz benutzt.
Hier der Auszug aus dem Syslog:

Code: Alles auswählen

Jul 10 11:01:30 desktop kernel: BUG: unable to handle kernel paging request at virtual address 0010007f
Jul 10 11:01:30 desktop kernel:  printing eip:
Jul 10 11:01:30 desktop kernel: c0139c70
Jul 10 11:01:30 desktop kernel: *pde = 00000000
Jul 10 11:01:30 desktop kernel: Oops: 0000 [#1]
Jul 10 11:01:30 desktop kernel: SMP 
Jul 10 11:01:30 desktop kernel: Modules linked in: nvidia ipv6 ppdev lp button ac battery fuse loop snd_cmipci gameport snd_pcm_oss snd_mixer_oss snd_pcm snd_page_alloc snd_opl3_lib snd_hwdep snd_mpu401_uart snd_seq_dummy snd_seq_oss snd_seq_midi snd_seq_midi_event parport_pc parport serio_raw snd_seq floppy via_ircc rtc pcspkr tsdev usblp snd_timer snd_rawmidi snd_seq_device psmouse irda evdev via_agp shpchp pci_hotplug crc_ccitt i2c_viapro i2c_core agpgart snd soundcore ext3 jbd mbcache sha256 aes dm_crypt dm_mirror dm_snapshot dm_mod ide_generic ide_cd cdrom ide_disk usbhid via82cxxx 8139cp generic ide_core 8139too via_rhine mii ehci_hcd uhci_hcd usbcore thermal processor fan
Jul 10 11:01:30 desktop kernel: CPU:    0
Jul 10 11:01:30 desktop kernel: EIP:    0060:[<c0139c70>]    Tainted: P      VLI
Jul 10 11:01:30 desktop kernel: EFLAGS: 00210206   (2.6.18-4-k7 #1) 
Jul 10 11:01:30 desktop kernel: EIP is at acct_collect+0x4a/0x142
Jul 10 11:01:30 desktop kernel: eax: 17025b61   ebx: dfceeca0   ecx: ee3fe000   edx: 00100077
Jul 10 11:01:30 desktop kernel: esi: 17129b61   edi: 0000000b   ebp: ee3ffeb8   esp: ee3ffe88
Jul 10 11:01:30 desktop kernel: ds: 007b   es: 007b   ss: 0068
Jul 10 11:01:30 desktop kernel: Process perlpanel (pid: 3203, ti=ee3fe000 task=dff80000 task.ti=ee3fe000)
Jul 10 11:01:30 desktop kernel: Stack: dfceeb40 dff80000 00000001 c011fb3d 0000000b 0000000b 0000000a 00000000 
Jul 10 11:01:30 desktop kernel:        00000000 dfceeb40 dfc0b11c 0000000b dff80000 c0120164 0000000b dfc0b11c 
Jul 10 11:01:30 desktop kernel:        dfc0b10c c0127c7a ee3fffbc ee3fff94 ee3fff14 dff80464 ee3fe000 b7f53ff4 
Jul 10 11:01:30 desktop kernel: Call Trace:
Jul 10 11:01:30 desktop kernel:  [<c011fb3d>] do_exit+0x17e/0x730
Jul 10 11:01:30 desktop kernel:  [<c0120164>] sys_exit_group+0x0/0xd
Jul 10 11:01:30 desktop kernel:  [<c0127c7a>] get_signal_to_deliver+0x391/0x3b7
Jul 10 11:01:30 desktop kernel:  [<c0104b8e>] do_general_protection+0x0/0x17a
Jul 10 11:01:30 desktop kernel:  [<c0102391>] do_notify_resume+0x70/0x5cd
Jul 10 11:01:30 desktop kernel:  [<c0117858>] try_to_wake_up+0x35b/0x365
Jul 10 11:01:30 desktop kernel:  [<c012649b>] __sigqueue_alloc+0x37/0x69
Jul 10 11:01:30 desktop kernel:  [<c01273ae>] specific_send_sig_info+0x8a/0x94
Jul 10 11:01:30 desktop kernel:  [<c01275bd>] force_sig_info+0x7b/0x83
Jul 10 11:01:30 desktop kernel:  [<c0104c9a>] do_general_protection+0x10c/0x17a
Jul 10 11:01:30 desktop kernel:  [<c0104b8e>] do_general_protection+0x0/0x17a
Jul 10 11:01:30 desktop kernel:  [<c0102ce6>] work_notifysig+0x13/0x19
Jul 10 11:01:30 desktop kernel: Code: 01 00 00 8b 80 84 00 00 00 31 f6 85 c0 74 3b 83 c0 34 e8 3c 68 ff ff 89 e1 81 e1 00 e0 ff ff 8b 01 8b 80 84 00 00 00 8b 10 eb 0b <8b> 42 08 2b 42 04 8b 52 0c 01 c6 85 d2 75 f1 8b 01 8b 80 84 00 
Jul 10 11:01:30 desktop kernel: EIP: [<c0139c70>] acct_collect+0x4a/0x142 SS:ESP 0068:ee3ffe88
Jul 10 11:01:30 desktop kernel:  <1>Fixing recursive fault but reboot is needed!

gms
Beiträge: 7798
Registriert: 26.11.2004 20:08:38
Lizenz eigener Beiträge: MIT Lizenz

Beitrag von gms » 14.07.2007 21:53:58

schau mal ob der Rechner ohne dem "perlpanel" stabiler läuft, wenn nicht, dann versuche einmal einen neueren ( möglichst den neuesten ) Kernel, wenns dann immernoch diese Abstürze gibt, würde ich mich an die Linux Kernel Mailing Liste ( vorher aber noch sicherstellen, daß der Fehler auch auftritt, wenn der Kernel nicht tainted ist, sprich auch versuchen den Fehler ohne nvidia zu reproduzieren )

Gruß
gms

meti
Beiträge: 559
Registriert: 19.12.2004 14:00:47
Lizenz eigener Beiträge: MIT Lizenz

Beitrag von meti » 14.07.2007 22:02:41

Mach mal dringend einen Speichertest (memtest86)

Das schaut mir nach nem defekten Speicherriegel aus - ich hatte so ein Problem vor einem haben Jahr auch.

Liffi
Beiträge: 2345
Registriert: 02.10.2004 01:33:05

Beitrag von Liffi » 20.07.2007 10:05:38

neuer Kernel ist da, das Problem tritt auch ohne PerlPanel auf (wenn auch gefühlt nicht mehr so häufig).
Es trat auch mit grml 0.9 auf. Ich denke mal, daß es dann an der Hardware liegt.
Memtest86 hab ich ein paar Mal durchlaufen lassen, ohne Erfolg.

Benutzeravatar
Silke
Beiträge: 559
Registriert: 17.05.2005 15:58:20
Wohnort: Hannover
Kontaktdaten:

Beitrag von Silke » 20.07.2007 10:08:49

Überprüf mal die Temperatur von deinem System. Stichwort: lmsensors (oder nach dem Absturz direkt im BIOS nachsehen und ein paar Grad draufrechnen).

Falls es ein Überhitzungsproblem ist, kann Saubermachen helfen. Oder Rechner zuschrauben, falls er offen läuft ;-)
Der Vorteil der Klugheit liegt darin, dass man sich dumm stellen kann. Das Gegenteil ist schon schwieriger.
- Kurt Tucholsky -

Liffi
Beiträge: 2345
Registriert: 02.10.2004 01:33:05

Beitrag von Liffi » 21.07.2007 09:56:49

Silke hat geschrieben: Falls es ein Überhitzungsproblem ist, kann Saubermachen helfen. Oder Rechner zuschrauben, falls er offen läuft ;-)
wow... das mit den Sensoren ist... erschreckend.
VCore: +1.68 V (min = +3.86 V, max = +3.71 V) ALARM
+3.3V: +3.28 V (min = +3.33 V, max = +4.06 V) ALARM
+5V: +4.97 V (min = +5.51 V, max = +5.48 V) ALARM
+12V: +12.40 V (min = +11.49 V, max = +9.30 V) ALARM
-12V: -13.35 V (min = -2.66 V, max = -1.75 V) ALARM
-5V: -5.30 V (min = +5.10 V, max = +0.03 V) ALARM
V5SB: +5.51 V (min = +5.81 V, max = +5.67 V) ALARM
VBat: +3.44 V (min = +3.12 V, max = +1.06 V) ALARM
fan1: 2463 RPM (min = 0 RPM, div = 4)
fan2: 0 RPM (min = 1599 RPM, div = 4) ALARM
temp1: +39°C (high = +53°C, hyst = -33°C) sensor = thermistor
temp2: +67.0°C (high = +80°C, hyst = +75°C) sensor = thermistor
Ich glaube, so langsam wird die Ursache meiner Abstürze klar. Auch wenn ich die Ausgaben zum Teil nicht ganz nachvollziehen kann... ALARM klingt nicht ganz gut ;-).
Neues Netzteil muß her, richtig?

EDIT::Die ALARM Dinger haben meinen Blick aufs wesentlich verdrängt. Eigentlich sehen die Werte ganz in Ordnung aus (so wie ich das beurteilen kann...)

Benutzeravatar
Joghurt
Beiträge: 5244
Registriert: 30.01.2003 15:27:31
Wohnort: Hamburg
Kontaktdaten:

Beitrag von Joghurt » 21.07.2007 12:11:26

Liffi hat geschrieben:Memtest86 hab ich ein paar Mal durchlaufen lassen, ohne Erfolg.
Ein paar Mal? Reden wir von dem gleichen memtest? Es gibt IIRC zwei in Debian, ein kommandozeilentool, welches nur einen oberflächlichen Test macht und das memtest86, welches direkt gebootet wird. Dort dauert ein gründlicher Speichertest schonmal ein paar Stunden. Du kannst dort im Menü einstellen, welche Tests er machen soll, kann sein, dass der Defaultmäßig nur ein paar einfache Tests macht.

Benutzeravatar
KBDCALLS
Moderator
Beiträge: 22454
Registriert: 24.12.2003 21:26:55
Lizenz eigener Beiträge: MIT Lizenz
Wohnort: Dortmund
Kontaktdaten:

Beitrag von KBDCALLS » 21.07.2007 12:31:50

Liffi hat geschrieben:
Silke hat geschrieben: Falls es ein Überhitzungsproblem ist, kann Saubermachen helfen. Oder Rechner zuschrauben, falls er offen läuft ;-)
wow... das mit den Sensoren ist... erschreckend.
VCore: +1.68 V (min = +3.86 V, max = +3.71 V) ALARM
+3.3V: +3.28 V (min = +3.33 V, max = +4.06 V) ALARM
+5V: +4.97 V (min = +5.51 V, max = +5.48 V) ALARM
+12V: +12.40 V (min = +11.49 V, max = +9.30 V) ALARM
-12V: -13.35 V (min = -2.66 V, max = -1.75 V) ALARM
-5V: -5.30 V (min = +5.10 V, max = +0.03 V) ALARM
V5SB: +5.51 V (min = +5.81 V, max = +5.67 V) ALARM
VBat: +3.44 V (min = +3.12 V, max = +1.06 V) ALARM
fan1: 2463 RPM (min = 0 RPM, div = 4)
fan2: 0 RPM (min = 1599 RPM, div = 4) ALARM
temp1: +39°C (high = +53°C, hyst = -33°C) sensor = thermistor
temp2: +67.0°C (high = +80°C, hyst = +75°C) sensor = thermistor
I

EDIT::Die ALARM Dinger haben meinen Blick aufs wesentlich verdrängt. Eigentlich sehen die Werte ganz in Ordnung aus (so wie ich das beurteilen kann...)
Wenn die 3.3 Volt Spanung bis über 4 Volt klettern kann dann nennst du das in Ordnung. ? Wenn ich von +- 5 % ausgehe dann dürften die Spannung zwischen 3.4650 und 3.1350
schwanken und teilweise liegen die Toleranzen noch darunter.
Was haben Windows und ein Uboot gemeinsam?
Kaum macht man ein Fenster auf, gehen die Probleme los.

EDV ist die Abkürzung für: Ende der Vernunft

Bevor du einen Beitrag postest:
  • Kennst du unsere Verhaltensregeln
  • Lange Codezeilen/Logs gehören nach NoPaste, in Deinen Beitrag dann der passende Link dazu.

Liffi
Beiträge: 2345
Registriert: 02.10.2004 01:33:05

Beitrag von Liffi » 22.07.2007 00:00:48

Joghurt hat geschrieben:
Liffi hat geschrieben:Memtest86 hab ich ein paar Mal durchlaufen lassen, ohne Erfolg.
Ein paar Mal? Reden wir von dem gleichen memtest? Es gibt IIRC zwei in Debian, ein kommandozeilentool, welches nur einen oberflächlichen Test macht und das memtest86, welches direkt gebootet wird. Dort dauert ein gründlicher Speichertest schonmal ein paar Stunden. Du kannst dort im Menü einstellen, welche Tests er machen soll, kann sein, dass der Defaultmäßig nur ein paar einfache Tests macht.
das direkt gebootete... hat so ~2h gedauert pro Test. (wobei ich nur den default Test hab ablaufen lassen... keine Ahnung, wie gründlich der war...)
KBDCALLS hat geschrieben:Wenn die 3.3 Volt Spanung bis über 4 Volt klettern kann dann nennst du das in Ordnung. ? Wenn ich von +- 5 % ausgehe dann dürften die Spannung zwischen 3.4650 und 3.1350
schwanken und teilweise liegen die Toleranzen noch darunter.
können denn diese min/max Werte überhaupt stimmen?

Antworten