Seit kurzem ständig Kernel Panic

Welches Modul/Treiber für welche Hardware, Kernel compilieren...
Antworten
Benutzeravatar
Luxuslurch
Moderator
Beiträge: 2091
Registriert: 14.09.2008 09:41:54

Seit kurzem ständig Kernel Panic

Beitrag von Luxuslurch » 24.01.2011 08:43:18

Hallo,

mein (vollaktuelles, vollkommen ohne Fremdquellen auskommendes, 32-bittiges mit Gnome laufendes) Squeeze macht seit ca. 10 Tagen große Probleme. Ich habe fast täglich eine Kernel Panic, d.h. nur noch unendlich viele Zeilen code auf meinem Schirm und überhaupt keine Möglichkeit mehr, ordnungsgemäß runterzufahren. Das passiert vor allem beim Aufwachen aus dem Tiefschlaf, vereinzelt aber auch einfach so zwischendurch (dann wird kurz vorher noch ein Kernel Oops gemeldet).

Jetzt würde ich gerne Auszüge aus diversen log-Dateien präsentieren, finde aber beim besten Willen nicht, wo so etwas gespeichert wird?

Danke für den Einstieg!
Debian Stable.
Der Mod spricht rot.

Benutzeravatar
towo
Beiträge: 4546
Registriert: 27.02.2007 19:49:44
Lizenz eigener Beiträge: GNU Free Documentation License

Re: Seit kurzem ständig Kernel Panic

Beitrag von towo » 24.01.2011 09:52:15

Naja

/var/log/kern.log
/var/log/messages
/var/log/syslog

sind die üblichen Verdächtigen.

Nur häufig wird bei einer Kernel-Panic nicht mehr viel geloggt, liegt in der Natur der Sache.

Benutzeravatar
Luxuslurch
Moderator
Beiträge: 2091
Registriert: 14.09.2008 09:41:54

Re: Seit kurzem ständig Kernel Panic

Beitrag von Luxuslurch » 24.01.2011 10:43:52

Danke towo, ich hatte ernsthaft Probleme, von all den Dateien die wesentlichen logs ausfindig zu machen!

Ich habe in /var/log/messages so ziemlich die Nachrichten gefunden, die kurz vor dem Absturz zu sehen waren: NoPaste-Eintrag35225
Zum Kontext kann ich nichts sagen, ich habe gerade Iceweasel offen gehabt und vermutlich auch Evolution, mehr nicht.

Gestern Abend krachte es gleich 2x, weswegen ich noch einen weiteren Auszug präsentiere: NoPaste-Eintrag35226
In dem Fall kann man die Ursache wohl auf die CD im Laufwerk zurückführen. Aber: Ist das ein Grund, um abzuschmieren?

Kann irgendjemand mehr mit diesen Nachrichten anfangen?

PS: kerneloops berichtet auch von einem dort hinterlegten Bericht. Aber ist der mit unsichtbarer Tinte geschrieben?

PPS: hier wäre noch der Auszug aus dem syslog für den ersten crash: NoPaste-Eintrag35227
Debian Stable.
Der Mod spricht rot.

Benutzeravatar
novalix
Beiträge: 1909
Registriert: 05.10.2005 12:32:57
Lizenz eigener Beiträge: MIT Lizenz
Wohnort: elberfeld

Re: Seit kurzem ständig Kernel Panic

Beitrag von novalix » 24.01.2011 18:30:42

Hi,

hier hatte jemand einen ähnlichen Fehler, der vom nvidia-Treiber herrührte. Das wäre dann aber eine Fremdquelle, afaik.
Andererseits steht in einem Deiner Logs metacity sei "tainted". Vieleicht ist das eine Spur.

Groetjes, niels
Das Wem, Wieviel, Wann, Wozu und Wie zu bestimmen ist aber nicht jedermannns Sache und ist nicht leicht.
Darum ist das Richtige selten, lobenswert und schön.

Benutzeravatar
spiralnebelverdreher
Beiträge: 1298
Registriert: 23.12.2005 22:29:03
Lizenz eigener Beiträge: GNU Free Documentation License
Wohnort: Frankfurt am Main

Re: Seit kurzem ständig Kernel Panic

Beitrag von spiralnebelverdreher » 24.01.2011 21:10:33

Hast Du irgendwas an der Systemkonfiguration geändert in den letzten Wochen? Weitere Festplatte eingebaut oder eine getauscht, DVD-Laufwerk ausgetauscht? Ist dein Netzteil ausreichend dimensioniert, um alle Komponenten zuverlässig mit Strom zu versorgen?

Benutzeravatar
TobiSGD
Beiträge: 539
Registriert: 28.06.2010 16:10:06
Lizenz eigener Beiträge: GNU General Public License
Wohnort: Hannover

Re: Seit kurzem ständig Kernel Panic

Beitrag von TobiSGD » 24.01.2011 23:24:37

Wenn plötzlich solche Symptome auftreten, würde ich erstmal einen grundlegenden Hardware-Check machen, also zumindest:
- Memtest86+ oder was ähnliches, wie GoldMemory
- Festplattentest des Herstellers
- Temperaturen unter Vollast prüfen
- Rechner mal öffnen und auf dem Mainboard nach ausgebeulten Kondensatoren schauen
- eventuell mal das Netzteil auf Verdacht tauschen, falls gerade möglich
Registered Linux User #501265
Workstation: Slackware64 -current XFCE
Laptop: Slackware64 -current XFCE
Server: Debian Squeeze i686 CLI

Benutzeravatar
Luxuslurch
Moderator
Beiträge: 2091
Registriert: 14.09.2008 09:41:54

Re: Seit kurzem ständig Kernel Panic

Beitrag von Luxuslurch » 25.01.2011 09:34:27

An dem System wurde nicht rumgebastelt. Aber merkwürdig ist schon, dass das erst seit einer Neuinstallation vor ca. zwei Wochen auftritt. Vorher lief aber auch Squeeze, und das ohne jede Kernel Panic... Das ganze ist übrigens ein Laptop, hier die Ausgabe von lspci: NoPaste-Eintrag35228

Naja, und gestern Nacht ist er dann wieder hops gegangen: Beim Runterfahren hing ein Prozess (anscheinend cronjob, wie die logs (NoPaste-Eintrag35229 zeigen), dann der Absturz. Das Phänomen tritt wohl häufiger auf, wenn runtergefahren oder aus dem Tiefschlaf aufgewacht werden soll. ACPI-Probleme? Oder, wie ich es auf anderen Laptops schon häufiger gesehen habe, irgendwelche Interferenzen mit der WLAN-Karte?

Ich habe mir derweilen mal einen neuen Kernel kompiliert, um ins Blaue hinein mal eine Fehlerquelle auszuschließen. Festplattentests und Memtests werden jetzt noch folgen. Die Temperaturen habe ich eigentlich immer im Blick, sind nie ein Problem geworden.

Mal weiter beobachten - bin für jeden heißen Tipp offen.

PS: Was heißt es eigentlich, wenn 'metacity tainted' ist? Ich kann dazu nichts finden im großen, weiten Netz.
Debian Stable.
Der Mod spricht rot.

Benutzeravatar
spiralnebelverdreher
Beiträge: 1298
Registriert: 23.12.2005 22:29:03
Lizenz eigener Beiträge: GNU Free Documentation License
Wohnort: Frankfurt am Main

Re: Seit kurzem ständig Kernel Panic

Beitrag von spiralnebelverdreher » 25.01.2011 14:14:38

Luxuslurch hat geschrieben:Mal weiter beobachten - bin für jeden heißen Tipp offen.
Ob der Tipp heiß ist, weiß ich nicht. Ich hatte ähnliche Probleme bisher an zwei älteren Desktop PCs.

Im ersten Fall waren einige Elektrolykondensatoren auf dem Mainboard kaputt (sah man denen auch an). Memtest berichtete wiederholt einzelne Speicherfehler in unterschiedlichen Speicherbereichen - aber nur wenn der Rechner lange aus und nicht vorgewärmt war. Nach einigen Minuten Aufwärmzeit brachte Memtest stundenlang keine Fehler zutage. Abstürze erfolgten manchmal auch erst nach langer Laufzeit. Ich vermute, dass beim erstan Laden von Systembibliotheken ins RAM beim Booten einige Bytes korrupt wurden, dies aber erst bei deren Gebrauch (nach längerer Zeit) zu den Abstürzen führte. Nach dem Austausch der Kondensatoren waren die Probleme fort und sind es immer noch.

Im zweiten Fall hatte memtest jede Menge fehlerhaften Speicher entdeckt. So viel, dass es schon ein Wunder war, dass der PC manchmal 20 Minuten lief bis zum Absturz. Ich habe die Speichermodule herausgenommen, theatralisch den Staub weg geblasen und sie wieder eingesetzt. Seitdem läuft der Rechner wieder ohne Probleme (entgegen meinen Erwartungen) und ich gelte als Hardware-Guru ;-)

Benutzeravatar
novalix
Beiträge: 1909
Registriert: 05.10.2005 12:32:57
Lizenz eigener Beiträge: MIT Lizenz
Wohnort: elberfeld

Re: Seit kurzem ständig Kernel Panic

Beitrag von novalix » 25.01.2011 16:01:41

Luxuslurch hat geschrieben: PS: Was heißt es eigentlich, wenn 'metacity tainted' ist? Ich kann dazu nichts finden im großen, weiten Netz.
Weiss ich auch nicht. Ist mir nur in den Logs aufgefallen. Beim Kernel bedeutet "Tainted", dass er von Modulen, die nicht aus dem Mainline stammen "befleckt" ist. Das ist häufig die eigentliche Fehlerquelle.
Bei Metacity könnte das aber auch heissen, dass Miguel de Izcaza mal in den Quellcode geschaut hat.

Interessanterweise findet man einige Einträge mit Absturzproblemen, wenn man nach dem string guhgelt (neueste Rechtschreibung).
Allerdings wird nirgends darauf eingegangen. Wahrscheinlich hat der String einfach nur das Pech häufig in der Nähe zu sein, wenn shit happens.

Groetjes, niels
Das Wem, Wieviel, Wann, Wozu und Wie zu bestimmen ist aber nicht jedermannns Sache und ist nicht leicht.
Darum ist das Richtige selten, lobenswert und schön.

Benutzeravatar
Luxuslurch
Moderator
Beiträge: 2091
Registriert: 14.09.2008 09:41:54

Re: Seit kurzem ständig Kernel Panic

Beitrag von Luxuslurch » 25.01.2011 22:06:12

Hmm... der selbstgebastelte Kernel 2.6.36.3 zeigt ein vergleichbares Verhalten (vorhin wieder Kernel Panic), das war wohl nix.

Also ich habe meine Aufmerksamkeit gerade auf das Modul btusb gelegt. Das scheint, in Kombination mit rfkill, bluetooth das Modul iwl3945 wohl öfters am richtig nachladen zu hindern (irgendwie, keine Ahnung). Dies machte sich bei mir dadurch bemerkbar, ich vergaß es zu erwähnen, dass bei jedem Suspend/Hibernate folgende Fehlermeldung auftrat:

Code: Alles auswählen

btusb_bulk_complete: hci0 urb HEXAZAHLENKOMBI failed to resubmit (1)
Ich habe mir wenig Gedanken gemacht, weil es eigentlich wochenlang problemlos klappte, aber in letzter Zeit...

Bluetooth verwende ich nie, also habe ich alle Dienste gestoppt, das Modul btusb in die /etc/modprobe.d/blacklist eingetragen... und jetzt wieder ein bisschen Hoffnung. Jedenfalls ist die Warnung jetzt weg, und ich werde das ganze mal wieder beobachten. Leider blinkt jetzt meine LED für's wlan ständig, aber das ist ne andere Geschichte... tbc.
Debian Stable.
Der Mod spricht rot.

Benutzeravatar
Luxuslurch
Moderator
Beiträge: 2091
Registriert: 14.09.2008 09:41:54

Re: Seit kurzem ständig Kernel Panic

Beitrag von Luxuslurch » 27.01.2011 08:46:22

Nein, das blacklisten von bluetooth hat nichts gebracht...

>> zwei neue Abstürze in den letzten 36 Stunden (einmal beim Aufwachen, einmal einfach so zwischendrin (mit äußerst geringer Last))
>> 13 Stunden memtest+ fördern 0 Fehler zutage
>> Festplatte mit smartmontools überwacht... keine Probleme
>> Neuer Kernel bringt auch nichts
>> Verdächtige Kernel-Module blacklisten bringt auch nichts
>>>> So kann das nicht weitergehen!

Bin weiter offen für Ideen (ich glaube auch schon an Viren und/oder Außerirdische).
Debian Stable.
Der Mod spricht rot.

Benutzeravatar
TobiSGD
Beiträge: 539
Registriert: 28.06.2010 16:10:06
Lizenz eigener Beiträge: GNU General Public License
Wohnort: Hannover

Re: Seit kurzem ständig Kernel Panic

Beitrag von TobiSGD » 27.01.2011 11:06:24

Hast du denn jetzt mal die Hardware-Tests gemacht? All das rumgebastel am OS bringt ja nichts, wenn es dann die Hardware ist, die nicht mitspielt.
Registered Linux User #501265
Workstation: Slackware64 -current XFCE
Laptop: Slackware64 -current XFCE
Server: Debian Squeeze i686 CLI

Benutzeravatar
Luxuslurch
Moderator
Beiträge: 2091
Registriert: 14.09.2008 09:41:54

Re: Seit kurzem ständig Kernel Panic

Beitrag von Luxuslurch » 27.01.2011 12:24:42

luxuslurch schrieb:
>> 13 Stunden memtest+ fördern 0 Fehler zutage
>> Festplatte mit smartmontools überwacht... keine Probleme
Auch das Festplatten-Tool aus dem Bios heraus lief fehlerfrei durch. Gibt es noch andere Tests? Andere logs, die vielleicht mehr Information zu Tage fördern könnten?
Debian Stable.
Der Mod spricht rot.

rendegast
Beiträge: 15041
Registriert: 27.02.2006 16:50:33
Lizenz eigener Beiträge: MIT Lizenz

Re: Seit kurzem ständig Kernel Panic

Beitrag von rendegast » 27.01.2011 18:29:50

...
Jan 23 20:38:44 hpux kernel: [ 8739.146387] Call Trace:
Jan 23 20:38:44 hpux kernel: [ 8739.146391] [<c109b51f>] ? handle_mm_fault+0x29f/0x959
Jan 23 20:38:44 hpux kernel: [ 8739.146395] [<c109e966>] ? vma_link+0x4e/0x68
Jan 23 20:38:44 hpux kernel: [ 8739.146399] [<c109fc88>] ? mmap_region+0x328/0x444
Jan 23 20:38:44 hpux kernel: [ 8739.146404] [<c126f927>] ? do_page_fault+0x2f1/0x307
Jan 23 20:38:44 hpux kernel: [ 8739.146407] [<c126f636>] ? do_page_fault+0x0/0x307
Jan 23 20:38:44 hpux kernel: [ 8739.146411] [<c126de8b>] ? error_code+0x73/0x78
Jan 23 20:38:44 hpux kernel: [ 8739.146413] Code: d8 e8 82 b8 1c 00 8d 45 44 e8 7a b8 1c 00 83 7e 3c 00 75 19 89 5e 3c 8b 53 08 8d 4e 34 8d 43 04 31 ff 89 4b 08 89 46 34 89 56 38 <89> 0a fe 45 44 fe 03 85 ff 74 0c a1 3c 8e 4b c1 89 fa e8 e6 bc
...
Scheint der Kernel selbst zu sein, der hier Probleme hat, "mm".
(Kurze Recherche,
zBsp. bei Problemen des radeon-Moduls dort "radeon" oder "drm" gesehen,
bei Problemen des nvidia stand dort "nv_....")

(Wenn es nicht die Hardware (Speicher) ist)


-> Anderen (neueren? vanilla?) Kernel versuchen? 2.6.36.3, 2.6.37.
Kompilieren würde ich den dann aber auf einem anderen System ;)
mfg rendegast
-----------------------
Viel Eifer, viel Irrtum; weniger Eifer, weniger Irrtum; kein Eifer, kein Irrtum.
(Lin Yutang "Moment in Peking")

Benutzeravatar
Luxuslurch
Moderator
Beiträge: 2091
Registriert: 14.09.2008 09:41:54

Re: Seit kurzem ständig Kernel Panic

Beitrag von Luxuslurch » 28.01.2011 08:25:34

Hm.... der selbstkompilierte Kernel hat ja auch gesponnen. Jetzt habe ich mir mal den 2.6.37-trunk aus experimental installiert, und natürlich schmiert auch der ab. Der Knackpunkt diesmal: der Tiefschlafbefehl. Der Ablauf ist häufig folgender: Ich klicke auf 'Ruhezustand', der Xserver verabschiedet sich, prinzipiell müsste er jetzt die Sitzung speichern, tut er aber nicht. Ich kann den Laptop nur noch mit lang anhaltendem Druck auf den An-/Ausknopf bedienen. Heute früh fahre ich dann wieder hoch, er wacht aus dem Tiefschlaf auf (?!), ich darf noch die Meldung über ein verschicktes Kerneloops lesen, ca. 15 Sekunden später friert das System komplett ein.

Immerhin sind bei dieser Art von Crash die logs halbwegs vollständig, wohingegen bei der spontanen Art, einfach mal so einzufrieren gar nichts mehr geht. Naja, vielleicht hier der neueste Auszug aus /var/log/messages: NoPaste-Eintrag35230.

Ich erkenne leider nicht viel in den logs. Da ist m.E. so manches schief. Aber was zur Hölle...??
Debian Stable.
Der Mod spricht rot.

rendegast
Beiträge: 15041
Registriert: 27.02.2006 16:50:33
Lizenz eigener Beiträge: MIT Lizenz

Re: Seit kurzem ständig Kernel Panic

Beitrag von rendegast » 31.01.2011 05:56:21

Vor dem sleep mal Module entladen?
iwlagn (wegen der wiederholten RFKILL-Meldungen)
e1000e?

i915 entladen geht wohl nicht wegen KMS,
dann mal einen alternativen Grafiktreiber (vesa, fbdev) versuchen?
(nur um festzustellen, ob hier das Problem liegt)
Dabei auch das Laden des entsprechenden Kernelmoduls unterbinden.
mfg rendegast
-----------------------
Viel Eifer, viel Irrtum; weniger Eifer, weniger Irrtum; kein Eifer, kein Irrtum.
(Lin Yutang "Moment in Peking")

Benutzeravatar
Evox
Beiträge: 173
Registriert: 25.04.2009 13:33:52
Wohnort: localhost

Re: Seit kurzem ständig Kernel Panic

Beitrag von Evox » 31.01.2011 06:41:50

Liest / Hört sich nach ein Temporären Hardwarefehler an. Früher hat man dazu "kalte Lötstelle" gesagt. Es kann alles in Ordnung sein aber ein Hardwareteil macht Probleme bei bestimmte Situationen. Mal darauf achtet was man macht ? Viele Grafische Anwendungen werden genutzt (zb. Videos schauen ,Gaming , Flashplayer ) ?
You Disapeared In The Darkness Of The Night...

Benutzeravatar
Luxuslurch
Moderator
Beiträge: 2091
Registriert: 14.09.2008 09:41:54

Re: Seit kurzem ständig Kernel Panic

Beitrag von Luxuslurch » 31.01.2011 21:12:37

Danke für eure weiteren Ideen. Bisher bin ich noch nicht wieder in die Verlegenheit gekommen etwas anderes auszuprobieren, alldiwei das System seit knapp drei Tagen ohne Beanstandung läuft. Fragt mich nicht warum. Zwischendurch kamen ja wieder einige updates, unter anderem der libc, also vielleicht gar nicht mal so unbedeutend?

Wie gesagt, danke für eure Hinweise. Wenn's noch einmal kracht, werde ich es sicher ausprobieren. Derweilen ist ja erst mal Ruhe. Wobei mir Evox' Zweifel an meiner Hardwarestabilität natürlich noch ein bisschen zu denken geben. Ich habe den Laptop erst vor 6 Wochen gekauft, aber er war ja schon gebraucht... naja, mal schauen.
Debian Stable.
Der Mod spricht rot.

Benutzeravatar
jgollers
Beiträge: 17
Registriert: 16.10.2002 16:59:14
Lizenz eigener Beiträge: MIT Lizenz

Re: Seit kurzem ständig Kernel Panic

Beitrag von jgollers » 19.02.2011 17:25:56

Hallo!

Ich hatte ein ganz ähnliches Problem. Da aber auf dem entsprechenden Rechner auch noch ein Lenny stabil lief, habe ich einen Hardwarefehler erst einmal ausgeschlossen und mal nachgeschaut was Lenny anders macht als Squeeze. Der Grund für die zahlreichen "Kernel Panic"-Meldungen war bei mir folgender Sachverhalt: Der Grafikkartentreiber für meine ATI-Karte benötigt unter Squeeze nicht freie Firmware um DRM/DRI zu unterstützen. Also mußte ich das Paket "firmware-linux-nonfree" nachinstallieren. Seit der Installation ist nicht eine einzige Kernel Panic aufgetreten.

Jörg Gollers

Antworten