[gelöst] Automatisches Neustarten bei Kernel-Oops

Warum Debian und/oder eine seiner Spielarten? Was muss ich vorher wissen? Wo geht es nach der Installation weiter?
Antworten
Benutzeravatar
Gharika
Beiträge: 209
Registriert: 28.09.2004 16:51:51
Lizenz eigener Beiträge: GNU Free Documentation License

[gelöst] Automatisches Neustarten bei Kernel-Oops

Beitrag von Gharika » 15.12.2005 12:17:16

Hallo,

mein kleiner privater Server (Debian Sarge) hat einen kaputten Speicherbaustein. Nach ca. 1-2 Wochen Dauerbetrieb gibt es immer einen Kernel-Oops. Das Problem ist klar und auch die Lösung, nur dauert es noch etwas bis ich mir einen neuen Speichherbaustein besorgen werde.

Bis dahin dachte ich daran, Linux automatisch neu zu booten, wenn der Fehler auftritt, weil er jetzt einfach stehen bleibt - ist halt das Default-Verhalten.

Nun meine Frage, wie mache ich es, das bei dem besagten Problem automatisch ein Neustart durchgeführt wird? Hoffentlich nicht Kernel neu kompileren ;-)

Hoffnungsvoll,
Gharika
Zuletzt geändert von Gharika am 22.12.2005 10:29:14, insgesamt 1-mal geändert.
Beleidigungen sind die Argumente derer, die unrecht haben.

-- Jean Jacques Rousseau

cosmac
Beiträge: 4579
Registriert: 28.03.2005 22:24:30

Beitrag von cosmac » 15.12.2005 17:00:59

hi,

wenn du einen 2.6er Kernel hast, sollte das hier reichen:

Code: Alles auswählen

echo "1"  > /proc/sys/kernel/panic_on_oops
echo "42" > /proc/sys/kernel/panic
Die erste Variable bewirkt, dass auf "oops" nach einigen Sekunden "panic" folgt.
Die zweite loest nach der angegebenen Anzahl von Sekunden einen Reboot aus.
Ganz neugierige schauen sich "man proc" an ;)

Leider muss man die beiden Variablen nach jedem Booten neu einstellen. Fuer sowas
erstelle ich mir in "/etc/init.d" jeweils ein eigenes Init-Script mit "skeleton" als Vorlage.
Wenn man das normalerweise anders macht, moege man mir bitte widersprechen.
Beware of programmers who carry screwdrivers.

Benutzeravatar
Gharika
Beiträge: 209
Registriert: 28.09.2004 16:51:51
Lizenz eigener Beiträge: GNU Free Documentation License

Beitrag von Gharika » 15.12.2005 18:32:58

Das sieht sehr vielversprechend aus, werde ich mal ausprobieren. Danke!
Beleidigungen sind die Argumente derer, die unrecht haben.

-- Jean Jacques Rousseau

Benutzeravatar
Gharika
Beiträge: 209
Registriert: 28.09.2004 16:51:51
Lizenz eigener Beiträge: GNU Free Documentation License

Beitrag von Gharika » 16.12.2005 10:37:51

Also, stehen bleibt der Rechner nun nicht mehr, aber er kommt nicht mehr von alleine "Hoch". Irgendwas passt noch nicht, er macht eher einen shutdown, aber ausschalten tut er sich auch nicht. Muß ich noch irgendwas einstellen, damit er einen reboot fährt?

Kann der sich überhaupt aus so einem Hardwarefehler wieder selber rausmanövrieren?

Wenn sich nun jemand fragt, wie ich den zum "Kollaps" bringe? Er dient auch als PVR und wenn man ihn paar Stunden an den Videodaten rumrechnen läßt, dann bekommt man ihn schneller zum Absturz, aber dauert auch schon noch 3-4h bis er auf den Fehler läuft. Unter "normaler" Last halt 2-3 Wochen. Das nur zum Hintergrund.
Beleidigungen sind die Argumente derer, die unrecht haben.

-- Jean Jacques Rousseau

Benutzeravatar
Teddybear
Beiträge: 3163
Registriert: 07.05.2005 13:52:55
Lizenz eigener Beiträge: GNU Free Documentation License
Wohnort: Altomünster
Kontaktdaten:

Beitrag von Teddybear » 17.12.2005 23:19:31

hi...

wenn das alles so nicht klappt, mit /proc und dergleichen...

wie wäre es, wenn du einfach durch eintag in der crontab den rechner wöchentlich einmal rebooten lässt...

greetz Sascha
Versuchungen sollte man nachgeben. Wer weiß, ob sie wiederkommen!
Oscar Wilde

Mod-Voice / My Voice

nepos
Beiträge: 5238
Registriert: 05.01.2005 10:08:12

Beitrag von nepos » 18.12.2005 11:54:05

Bringt aber nur was, wenn die Kiste noch nicht abgestuerzt ist...

Benutzeravatar
Gharika
Beiträge: 209
Registriert: 28.09.2004 16:51:51
Lizenz eigener Beiträge: GNU Free Documentation License

Beitrag von Gharika » 22.12.2005 10:33:17

Danke für die Hilfe!

Der Support von Shuttle (der Server ist ein Barebone von Shuttle) hat mir weitergeholfen. Der Lüfteranschluß war kaputt, der ging nur komplett an oder aus, keine Regelung. Deswegen überhitzte der Speicher mit der Zeit und versagte.

Der Trick war einfach einen anderen Lüfteranschluß zu nehmen auf dem Board und alles istt ok. Nun läuft wieder alles wie gewohnt total stabil. Selten so einen guten Support erlebt. Habe schon lange keine Garantie mehr, trotztem wurde sofort der richtige Hinweis gegeben und auch noch angeboten kostenlos (!) einen neuen Lüfter zu schicken, wenn es nicht der Stecker wäre. Und das ganze auch noch bei einer kostenlosen Hotline.

Bis zum nächsten Problem ;-)

Gharika
Beleidigungen sind die Argumente derer, die unrecht haben.

-- Jean Jacques Rousseau

Antworten