Rechner findet manchmal Partition nicht und bootet dann nich

Welches Modul/Treiber für welche Hardware, Kernel compilieren...
Antworten
macMeck
Beiträge: 26
Registriert: 08.03.2003 17:37:18
Wohnort: Karlsruhe

Rechner findet manchmal Partition nicht und bootet dann nich

Beitrag von macMeck » 28.05.2007 23:02:26

Hallo zusammen,

ich habe auf meinem Server ein ganz komisches Phänomen. Ab und zu weigert sich der Rechner einfach, vernünftig hochzufahren. Es ist aber nicht erkenntlich, was in zu dem Verhalten bewegt. Wenn man ihn danach resettet, funktioniert er wieder wie gewohnt. Die Fehlermeldung ist diese hier:

Code: Alles auswählen

Begin: Waiting for root file system... ...
Done.
	Check root= bootarg cat /proc/cmdline
	or missing modules, devices: cat /proc/modules ls /dev
ALERT! /dev/hda2 does not exist. Dropping to a shell!
Der Kernel ist ein 2.6.20... Ich werd irgendwie nicht so schlau draus. Offensichtlich findet er ja die Partition nicht. Aber wie kann die denn weg sein, und beim nächsten Reboot wieder da?

Danke euch schon mal,
macMeck

rendegast
Beiträge: 15041
Registriert: 27.02.2006 16:50:33
Lizenz eigener Beiträge: MIT Lizenz

Beitrag von rendegast » 29.05.2007 04:41:17

Kabelprobleme?
BIOSeinstellungen geändert? Übertaktet?
Netzteil? sodaß beim Starten für die Platten und/oder Mainboard nicht genügend Leistung da ist?
Chipsatz Kühler/Lüfter verstaubt, sodaß Hitzeprobleme auftreten?

Plattenelektronik? > SMART abfragen
mfg rendegast
-----------------------
Viel Eifer, viel Irrtum; weniger Eifer, weniger Irrtum; kein Eifer, kein Irrtum.
(Lin Yutang "Moment in Peking")

Benutzeravatar
utkin
Beiträge: 1157
Registriert: 23.08.2005 22:42:22
Lizenz eigener Beiträge: GNU Free Documentation License
Wohnort: Erfurt

Beitrag von utkin » 29.05.2007 12:00:58

Klingt mir auch eher nach irgendeinem Hardware-Fehler.


Gruß, utkin
Debian GNU/Linux SID

macMeck
Beiträge: 26
Registriert: 08.03.2003 17:37:18
Wohnort: Karlsruhe

Beitrag von macMeck » 01.06.2007 10:33:55

rendegast hat geschrieben:Kabelprobleme?
BIOSeinstellungen geändert? Übertaktet?
Netzteil? sodaß beim Starten für die Platten und/oder Mainboard nicht genügend Leistung da ist?
Chipsatz Kühler/Lüfter verstaubt, sodaß Hitzeprobleme auftreten?

Plattenelektronik? > SMART abfragen
Hm, Kabelprobleme glaube ich jetzt eher nicht, weil es ja manchmal geht und manchmal nicht. BIOS nicht gändert, auch nicht übertaktet. Netzteil könnte ich mir schon eher vorstellen, das ist vielleicht etwas schwächlich für den ganzen Kram, der da mittlerweile eingebaut ist. Schaue ich mir mal genau an.

Was würde mir SMART sagen, wenn es einen Fehler festgestellt hat, bzw. wie frage ich das genau ab?

Danke euch,
macMeck

macMeck
Beiträge: 26
Registriert: 08.03.2003 17:37:18
Wohnort: Karlsruhe

Beitrag von macMeck » 01.06.2007 13:17:14

Hi, was mir aber grade noch einfällt: Das Phänomen tritt manchmal auch bei einem reboot auf. Da sollten die Platten doch eigentlich schon angelaufen sein und die Stromproblematik nicht mehr wirklich zum tragen kommen, oder?

rendegast
Beiträge: 15041
Registriert: 27.02.2006 16:50:33
Lizenz eigener Beiträge: MIT Lizenz

Beitrag von rendegast » 01.06.2007 14:28:10

Was würde mir SMART sagen, wenn es einen Fehler festgestellt hat, bzw. wie frage ich das genau ab?
Paket smartmontools:

Code: Alles auswählen

SMART im BIOS "enable" == Abfrage des Health-Status durch das BIOS
smartctl -s on -S on -o on DEVICE
schaltet alle SMART-Sachen der Platte ein

Code: Alles auswählen

smartctl -a DEVICE
fragt alle SMART-Werte ab

Insbesondere ist die Ausgabe von

Code: Alles auswählen

smartctl -l error DEVICE
smartctl -A DEVICE
interessant.

Falls DEVICE eine SATA-Platte ist und keine Ausgaben erfolgen, versuche den zusätzlichen Parameter

Code: Alles auswählen

-d ata

Da sollten die Platten doch eigentlich schon angelaufen sein und die Stromproblematik nicht mehr wirklich zum tragen kommen, oder?
Das kann ich nicht beurteilen.
mfg rendegast
-----------------------
Viel Eifer, viel Irrtum; weniger Eifer, weniger Irrtum; kein Eifer, kein Irrtum.
(Lin Yutang "Moment in Peking")

Benutzeravatar
cirrussc
Beiträge: 6582
Registriert: 26.04.2007 19:47:06
Lizenz eigener Beiträge: MIT Lizenz

Beitrag von cirrussc » 01.06.2007 14:44:30

macMeck hat geschrieben:Hi, was mir aber grade noch einfällt: Das Phänomen tritt manchmal auch bei einem reboot auf. Da sollten die Platten doch eigentlich schon angelaufen sein und die Stromproblematik nicht mehr wirklich zum tragen kommen, oder?
Die Stromspitzen sind beim Start(der HDD) in der Tat sehr hoch, aber nur ms, und werden durch Kondensatoren auf der Plattenelektronik gepuffert. Hat also nicht so viel Einfluss auf das NT.
Mechanische, elektriche Defekte lassen sich wie rendegast sagt schön mit smartmontools entdecken.

gruss cirrussc

Benutzeravatar
Tintom
Moderator
Beiträge: 3069
Registriert: 14.04.2006 20:55:15
Wohnort: Göttingen

Beitrag von Tintom » 01.06.2007 16:16:05

Wenn die Elektronik i.O. ist liegt es am Kernel.
Ich würde testweise mal die Laufwerksbezeichnungen auf feste Werte einstellen.
Auf der Sidux-Seite[1] wird erklärt, wie es funktioniert.

[1] http://manual.sidux.com/de/part-uuid-de.htm

macMeck
Beiträge: 26
Registriert: 08.03.2003 17:37:18
Wohnort: Karlsruhe

Beitrag von macMeck » 03.06.2007 17:19:14

Okay cool, ich habe mir das mit dem persistent naming angeschaut und für die /etc/fstab schon mal umgesetzt. In die menu.lst aber noch nicht. Ich will erstmal abwarten, ob das evtl. schon reicht... Danke in jedem Fall für den Tipp!

Eine andere Thematik ist noch, dass eine Platte SMART Fehler gemeldet hat. Ich hatte früher mal Probleme mit der Platte, aber seit ich sie mal Low-Level formatiert hatte, läuft sie eigentlich wunderbar. Im SMART Log stehen momentan 200 Fehler drin. Ich bin mir jetzt nicht sicher, ob die einfach nicht mehr als 200 Fehler mitprotokollieren kann, oder ob einfach keine mehr auftreten. Die Hoffnung wäre ja, dass neue Fehler im Log bleiben, alte dafür verschwinden. Ist das so? Die Fehler sind bei einer Lifetime von 114 Stunden aufgetreten, aktuell hat die Platte 1150 Stunden auf dem Buckel. Daher die Frage: Würden neue Fehler protokolliert? Kann man das Platten-Log irgendwie zurücksetzen?

Danke für jeden Tipp...
macMeck

Benutzeravatar
cirrussc
Beiträge: 6582
Registriert: 26.04.2007 19:47:06
Lizenz eigener Beiträge: MIT Lizenz

Beitrag von cirrussc » 03.06.2007 17:59:02

hi,
macMeck hat geschrieben:Eine andere Thematik ist noch, dass eine Platte SMART Fehler gemeldet hat. Ich hatte früher mal Probleme mit der Platte, aber seit ich sie mal Low-Level formatiert hatte, läuft sie eigentlich wunderbar.
Da wird sie wohl ein paar def. Sektoren haben die beim Low-Level Format ausgelagert wurden.

Code: Alles auswählen

smartctl -A /dev/hdx
bei ID 5 Reallocated_Sector_Ct schauen
macMeck hat geschrieben:Würden neue Fehler protokolliert?
Ja, hatte schon mehr als 500 gesehen.
macMeck hat geschrieben: Kann man das Platten-Log irgendwie zurücksetzen?
Nö.

Die ist aber ziemlich verdächtig und nicht mehr sehr vertrauenswürig.
Bei einem Selftest (Lesetest der Plattenoberfläche durch Plattencontroller) dürfen auf keinem Fall Fehler auftauchen

Code: Alles auswählen

smartctl -t long /dev/hdx
Wie lange das dauert:

Code: Alles auswählen

smartctl -c /dev/hdx
"Extended self-test routine
recommended polling time: ( X ) minutes."
Ergebnis:

Code: Alles auswählen

smartctl -l selftest /dev/hdx
Es gibt HDD's welche 15.000h halten und welche die bei 1min aussteigen. Und es gibt welche die nach SMART vollkommen i.O. sind aber nicht mal mehr richtig erkannt werden.

gruss cirrussc

macMeck
Beiträge: 26
Registriert: 08.03.2003 17:37:18
Wohnort: Karlsruhe

Beitrag von macMeck » 04.06.2007 00:28:56

Prima, danke für die Aufklärung. Werde den Selftest mal genauer unter die Lupe nehmen...

macMeck
Beiträge: 26
Registriert: 08.03.2003 17:37:18
Wohnort: Karlsruhe

Beitrag von macMeck » 09.06.2007 09:22:15

Hi nochmal,
auch wenn das jetzt hier etwas OT wird, aber mir stellt sich grad ne Frage: In dem angegebenen sidux manual zum persisten naming steht, dass man ein mkinitcpio initramfs image braucht... wie krieg ich das denn hin?
initramfs ist im Kernel aktiviert, ich nehm mal an, dass ich die initramfs-tools auch noch brauche und damit irgendwas anstellen muss. Aber wie sieht's mit initcpio aus? Da hab ich überhaupt nichts dazu gefunden :?

macMeck

rendegast
Beiträge: 15041
Registriert: 27.02.2006 16:50:33
Lizenz eigener Beiträge: MIT Lizenz

Beitrag von rendegast » 09.06.2007 16:36:13

Bisher habe ich drei Typen initrd gesehen:
- Image eines ext2fs, gezippt (SuSE)
- ein cramfs (Debian initrd-tools)
- ein cpio-Archiv, gezippt (Debian initramfs-tools, openSuse)

Bei den initrd-tools kann der Typ eingestellt werden:

Code: Alles auswählen

/etc/mkinitrd/mkinitrd.conf:
MKIMAGE='mkcramfs %s %s > /dev/null'
(default-Einstellung)

Änderungen wären nicht trivial,
Unter sarge gab es kein initramfs-Paket, also musste ich tricksen:
[ $VERSION = 2.6.16-my -o $VERSION = 2.6.16.16-my ] && {
MKIMAGE='cd %s &&	find . | sort -u | cpio -H newc --create | gzip -cn9 > %s'
}
mfg rendegast
-----------------------
Viel Eifer, viel Irrtum; weniger Eifer, weniger Irrtum; kein Eifer, kein Irrtum.
(Lin Yutang "Moment in Peking")

Antworten