RAID 1 und Ausfall einer HD
-
- Beiträge: 11
- Registriert: 15.01.2009 08:57:21
RAID 1 und Ausfall einer HD
Hallo an alle,
ich bin neu hier im Forum und auch kein Linux Guru / Spezialist oder ähnliches. Ich habe seit eininger Zeit hier mitgelesen und auch Anregungen und Lösungen gefunden. Ich habe jetzt trotzdem folgendes Problem:
Mein Debian Server ist wie folgt:
hda = 80 GB mit Debian - System
hdc + hdd = Software-RAID1 mit 150 GB für Daten.
Die HD's sind 160 GB, ich habe vorsichtshalber die HD's mit 150 GB für RAID partitioniert
Nachts wird der Rechner heruntergefahren und morgens wieder gestartet. Soweit kein Problem. Heute Morgen hat das BIOS des PC die hdc nicht mehr erkannt, d.h. Ausfall einer HD aus dem RAID1.
Wie geht man jetzt am besten vor?
- Defekte Platte austauschen ist klar.
- Gibt es eine Möglichkeit die Daten, die jetzt auf der 2. Platte liegen noch irgenwie zu sichern?
- Die neue Platte mit gleicher Größe muß jetzt partitioniert werden auf 150 GB für RAID1 und der Rest als Swap. Wie mach ich das ohne die Daten auf der anderen Platte zu verlieren? Für's einrichten der HD's habe ich bei der Installation die dortige Oberfläche benutzt. Wie komme ich da wieder hin?
- Dann muß man dem System noch mitteilen, daß es eine neue Platte gibt und er die Daten synchronisieren muß.
Vielen Dank im voraus an alle.
Knut
ich bin neu hier im Forum und auch kein Linux Guru / Spezialist oder ähnliches. Ich habe seit eininger Zeit hier mitgelesen und auch Anregungen und Lösungen gefunden. Ich habe jetzt trotzdem folgendes Problem:
Mein Debian Server ist wie folgt:
hda = 80 GB mit Debian - System
hdc + hdd = Software-RAID1 mit 150 GB für Daten.
Die HD's sind 160 GB, ich habe vorsichtshalber die HD's mit 150 GB für RAID partitioniert
Nachts wird der Rechner heruntergefahren und morgens wieder gestartet. Soweit kein Problem. Heute Morgen hat das BIOS des PC die hdc nicht mehr erkannt, d.h. Ausfall einer HD aus dem RAID1.
Wie geht man jetzt am besten vor?
- Defekte Platte austauschen ist klar.
- Gibt es eine Möglichkeit die Daten, die jetzt auf der 2. Platte liegen noch irgenwie zu sichern?
- Die neue Platte mit gleicher Größe muß jetzt partitioniert werden auf 150 GB für RAID1 und der Rest als Swap. Wie mach ich das ohne die Daten auf der anderen Platte zu verlieren? Für's einrichten der HD's habe ich bei der Installation die dortige Oberfläche benutzt. Wie komme ich da wieder hin?
- Dann muß man dem System noch mitteilen, daß es eine neue Platte gibt und er die Daten synchronisieren muß.
Vielen Dank im voraus an alle.
Knut
- minimike
- Beiträge: 5616
- Registriert: 26.03.2003 02:21:19
- Lizenz eigener Beiträge: neue BSD Lizenz
- Wohnort: Köln
-
Kontaktdaten:
Re: RAID 1 und Ausfall einer HD
Musst du nicht wirklich. Du tauschst die defekte Platte aus und startest dann den Rechner. Ist der Rechner online dann anmelden und die neue Platte nach dem selben Schema wie die alte noch vorhandene Platte dann Partitionieren. Sicherheitshalber System neustarten. Nach Neustart dann Anmelden. Im System dann mit mdadm die Partiotionen on the Fly hinzufügen. Beispiel:
Wobei hda1 ja die verbliebene Platte von md0 ist, hdc1 wird so hinzugefügt. Das kannst gleich für alle Partitionen machen. MDADM arbeitet dann nacheinander ab. Das hinzufügen komplettiert den Raid 1 wieder zu zwei Devices. Bei einem Raid 5 würde ich das in INIT 1 machen. Bei Raid 1 kannst du das auch während des Serverbetriebes tätigen. Schau aber das auf dem Teil ne Stunde lang nichts wirklich heftig läuft. So lange kannst du bei 160 GB maximal rechnen
Zu Überprüfen mit
Code: Alles auswählen
madam --manage -a /dev/md0 /dev/hdc1
Zu Überprüfen mit
Code: Alles auswählen
cat /proc/mdstat
"Lennart Poettering is one of those typical IT leaders..." "like Linus Torvalds and Theo de Raadt?" "more like Bozo the Clown" After all, now a good employee of Microsoft
Re: RAID 1 und Ausfall einer HD
Ggf. noch die Konfig anpassen /etc/mdadm.conf und die Statusinformationen mit mdadm --detail /dev/md0 anzeigen lassen.
Oh, yeah!
-
- Beiträge: 11
- Registriert: 15.01.2009 08:57:21
Re: RAID 1 und Ausfall einer HD
Dank an minikike und Duff
Ihr habt mir erstmal weitergeholfen.
Mal sehen wie es weitergeht.
Knut
Ihr habt mir erstmal weitergeholfen.
minimike hat geschrieben:undCode: Alles auswählen
madam --manage -a /dev/md0 /dev/hdc1
Code: Alles auswählen
cat /proc/mdstat
Jetzt läuft erstmal die Synchronisation.Duff hat geschrieben:Code: Alles auswählen
mdadm --detail /dev/md0
Mal sehen wie es weitergeht.
Knut
Re: RAID 1 und Ausfall einer HD
Hast du deine Konfig denn auch angepasst (/etc/mdadm.conf )?
Oh, yeah!
-
- Beiträge: 11
- Registriert: 15.01.2009 08:57:21
Re: RAID 1 und Ausfall einer HD
Hallo Duff,
Was soll ich daran ändern?
Die /etc/mdadm.conf sieht wie folgt aus:Duff hat geschrieben:Hast du deine Konfig denn auch angepasst (/etc/mdadm.conf )?
Code: Alles auswählen
DEVICE partitions
ARRAY /dev/md0 level=raid1 num-devices=2 UUID=033f7282:277cebef:e2d80d13:071f6992
devices=/dev/hdc1,/dev/hdd1
-
- Beiträge: 11
- Registriert: 15.01.2009 08:57:21
Re: RAID 1 und Ausfall einer HD
Hallo,
ich habe ja nicht die ganze Zeit beim Rechner gewartet und war zwischendurch mal weg.
Die defekte HD scheint nicht das einzige Problem zu sein, wie ich auf dem Monitor jetzt sehe.
Wie ich aus obiger Meldung ersehen kann ,ist auch noch die hdd defekt. Und hier waren die Daten drauf.
Wenn ich die ursprüngliche Platte hdc wieder ans laufen bekomme, könnte man die Daten retten? und WIE?
Oder das Retten der Daten von hdd noch möglich?
Zur Erinnerung:
Mein RAID1 bestand aus hdc + hdd.
Heute ist hdc kaputt gegangen und wird jetzt ersetzt.
Läuft das Synchronisieren mehrmals durch? Der PC ha jetzt schon zum 3. Mal wieder von Vorne angefangen.
Dank im Voraus.
Knut
ich habe ja nicht die ganze Zeit beim Rechner gewartet und war zwischendurch mal weg.
Die defekte HD scheint nicht das einzige Problem zu sein, wie ich auf dem Monitor jetzt sehe.
Code: Alles auswählen
Jan 15 12:30:43 localhost -- MARK --
Jan 15 12:45:32 localhost kernel: hdd: dma_intr: status=0x51 { DriveReady SeekComplete Error }
Jan 15 12:45:32 localhost kernel: hdd: dma_intr: error=0x40 { UncorrectableError }, LBAsect=123035172, high=7, low=5594660, sector=123033919
Jan 15 12:45:32 localhost kernel: end_request: I/O error, dev hdd, sector 123033919
Jan 15 12:45:35 localhost kernel: hdd: dma_intr: status=0x51 { DriveReady SeekComplete Error }
Jan 15 12:45:35 localhost kernel: hdd: dma_intr: error=0x40 { UncorrectableError }, LBAsect=123035172, high=7, low=5594660, sector=123033927
Wenn ich die ursprüngliche Platte hdc wieder ans laufen bekomme, könnte man die Daten retten? und WIE?
Oder das Retten der Daten von hdd noch möglich?
Zur Erinnerung:
Mein RAID1 bestand aus hdc + hdd.
Heute ist hdc kaputt gegangen und wird jetzt ersetzt.
Läuft das Synchronisieren mehrmals durch? Der PC ha jetzt schon zum 3. Mal wieder von Vorne angefangen.
Dank im Voraus.
Knut
- king-crash
- Beiträge: 750
- Registriert: 08.08.2006 12:07:56
- Lizenz eigener Beiträge: MIT Lizenz
Re: RAID 1 und Ausfall einer HD
Sicher, dass das die Platte ist? Schau doch mal was von SMART kommt.
-
- Beiträge: 11
- Registriert: 15.01.2009 08:57:21
Re: RAID 1 und Ausfall einer HD
Hi,
Bei smartctl -a /dev/hdc (neue Platte im RAID1) meldet SMART keine Fehler.
Es scheint daß neue Platten notwendig sind. zumindes eine Weitere.
Wie bekomme ich jetzt die Daten von gesichert.
Eine Datensicherung gibt es, die ist aber von Di. und MI wurden viele Daten eingegeben. die jetzt weg wären.
Oder kann man die Daten von der alten hdd aus dem RAID1 noch retten, wenn die Platte ans laufen kommt?
Danke
Knut
Bei smartctl -a /dev/hdd (alte Platte im RAID1) meldet SMART dass dort einige Fehler sind.king-crash hat geschrieben:Sicher, dass das die Platte ist? Schau doch mal was von SMART kommt.
Bei smartctl -a /dev/hdc (neue Platte im RAID1) meldet SMART keine Fehler.
Es scheint daß neue Platten notwendig sind. zumindes eine Weitere.
Wie bekomme ich jetzt die Daten von gesichert.
Eine Datensicherung gibt es, die ist aber von Di. und MI wurden viele Daten eingegeben. die jetzt weg wären.
Oder kann man die Daten von der alten hdd aus dem RAID1 noch retten, wenn die Platte ans laufen kommt?
Danke
Knut
- king-crash
- Beiträge: 750
- Registriert: 08.08.2006 12:07:56
- Lizenz eigener Beiträge: MIT Lizenz
Re: RAID 1 und Ausfall einer HD
Na wenn de eine von den alten Platten noch ans laufen bekommst ist das natürlich kein Problem.
Einfach mit dd auf die andere rüberkopieren.
Einfach mit dd auf die andere rüberkopieren.
-
- Beiträge: 11
- Registriert: 15.01.2009 08:57:21
Re: RAID 1 und Ausfall einer HD
Hi,
wie geschrieben bin ich kein Linux Guru.
Wie soll das mit
Da bei der Installation von Debian die Festplatten als RAID eingerichtet und formatiert wurden. Mit Welchem Dateisystem (ext3, ...) kann ich dann darauf zugreifen? Zumal ich für dd auch die Sektorgröße und andere Parameter benötige.
Danke
Knut
wie geschrieben bin ich kein Linux Guru.
Wie soll das mit
gehen?king-crash hat geschrieben:Einfach mit dd auf die andere rüberkopieren.
Da bei der Installation von Debian die Festplatten als RAID eingerichtet und formatiert wurden. Mit Welchem Dateisystem (ext3, ...) kann ich dann darauf zugreifen? Zumal ich für dd auch die Sektorgröße und andere Parameter benötige.
Danke
Knut
-
- Beiträge: 11
- Registriert: 15.01.2009 08:57:21
Re: RAID 1 und Ausfall einer HD
Hi,
Mit dem synchronisieren des RAID ist der Rechner immernoch beschäftigt.
Da auch immer wieder bei c. 40% Fehlermeldungen auftreten, wird der Vorgang wieder von Vorne gestartet. Kann man das Abbrechen?
Danke
Knut
Mit dem synchronisieren des RAID ist der Rechner immernoch beschäftigt.
Da auch immer wieder bei c. 40% Fehlermeldungen auftreten, wird der Vorgang wieder von Vorne gestartet. Kann man das Abbrechen?
Danke
Knut
- minimike
- Beiträge: 5616
- Registriert: 26.03.2003 02:21:19
- Lizenz eigener Beiträge: neue BSD Lizenz
- Wohnort: Köln
-
Kontaktdaten:
Re: RAID 1 und Ausfall einer HD
Ja
mdadm --manage --help
mdadm --manage --help
"Lennart Poettering is one of those typical IT leaders..." "like Linus Torvalds and Theo de Raadt?" "more like Bozo the Clown" After all, now a good employee of Microsoft
-
- Beiträge: 11
- Registriert: 15.01.2009 08:57:21
Re: RAID 1 und Ausfall einer HD
Hi minimike
Danke für den Tipp.
Wie kann ich jetzt auf die Daten zugreifen? Wie muß ich die /dev/hdd ins System mounten, daß ich auf die Daten zugreifen kann?
Danke
Knut
Danke für den Tipp.
Wenn ich erstmal die Daten gesichert habe, ist mir das RAID1 erstmal egal.minimike hat geschrieben:Ja
mdadm --manage --help
Wie kann ich jetzt auf die Daten zugreifen? Wie muß ich die /dev/hdd ins System mounten, daß ich auf die Daten zugreifen kann?
Danke
Knut
-
- Beiträge: 11
- Registriert: 15.01.2009 08:57:21
Re: RAID 1 und Ausfall einer HD
Hi,
Wenn ich mdadm --manage --stop /dev/md0 eingebe, dann kommt diese Meldung:
mdadm ist immernoch dabei den Datenabgleich vorzunehmen.
Ich habe jetzt in einem alten Rechner die defekte Platte eingebaut. Die Platte wurde im BIOS erkannt und auch der Rechner
ist von einer Knoppix CD gestartet. Ich werde im Knoppix-Forum mal nachfragen wie ich die Daten von dort sichern kann.
Wieso kann man nicht ganz normal über das FileSystem auf die Daten zugreifen?
Solange der Rechner mit der synchronisation beschäftigt ist. gibt es wohl keine Möglichkeit auf die Daten zuzugreifen.
Danke
Knut
minimike hat geschrieben:Ja
mdadm --manage --help
Wenn ich mdadm --manage --stop /dev/md0 eingebe, dann kommt diese Meldung:
Code: Alles auswählen
md: md0 still in use.
mdadm: fail to stop array /dev/md0: Device or resource busy
Ich habe jetzt in einem alten Rechner die defekte Platte eingebaut. Die Platte wurde im BIOS erkannt und auch der Rechner
ist von einer Knoppix CD gestartet. Ich werde im Knoppix-Forum mal nachfragen wie ich die Daten von dort sichern kann.
Wieso kann man nicht ganz normal über das FileSystem auf die Daten zugreifen?
Solange der Rechner mit der synchronisation beschäftigt ist. gibt es wohl keine Möglichkeit auf die Daten zuzugreifen.
Danke
Knut
- minimike
- Beiträge: 5616
- Registriert: 26.03.2003 02:21:19
- Lizenz eigener Beiträge: neue BSD Lizenz
- Wohnort: Köln
-
Kontaktdaten:
Re: RAID 1 und Ausfall einer HD
Nein
Wenn du den Rechner von einem Raid bootest auch wenn nur eine Platte läuft ist der Raid aktiv und wird benutzt. Du kannst aber die neue Platte on the Fly aus dem Raid entfernen.
Wenn du den Rechner von einem Raid bootest auch wenn nur eine Platte läuft ist der Raid aktiv und wird benutzt. Du kannst aber die neue Platte on the Fly aus dem Raid entfernen.
"Lennart Poettering is one of those typical IT leaders..." "like Linus Torvalds and Theo de Raadt?" "more like Bozo the Clown" After all, now a good employee of Microsoft
-
- Beiträge: 11
- Registriert: 15.01.2009 08:57:21
Re: RAID 1 und Ausfall einer HD
Hi,
Ich habe gerade in der /etc/fstab die Zeile /dev/md0 /srv .... auskommentiert und dann einen reboot durchgeführt.
Nach dem Neustart konnte ich dann mit mdadm --manage --stop /dev/md0 das RAID anhalten.
Mit einem mount /dev/hdd1 /srv wollte ich die Platte mit den Daten ins System laden. /dev/hdd1 ist die Partition auf der Festplatte, die die gesuchten Daten enthalten sollte. Die Partition wurde auch geladen, allerdings zeigt er mit in dem Verzeichnis /srv keine Inhalte an.
Ich muß wohl in den sauren Apfel beißen und ein Tag Arbeit ist weg. Besser ein Tag als eine Woche, einen Monat oder ein Jahr.
Was mich am meisten Ärgert ist, daß im letzten Jahr als ich kaum Datensicherungen gemacht habe, alles ohne Probleme durchgelaufen ist. Jetzt mit fast regelmäßiger Sicherung geht nichts mehr.
Das ganze hat auch was positives. Ich weis jetzt, daß bei Ausfall einer HD im RAID1 man nicht unbedingt auf die anderen Daten zugreifen kann.
Knut
Ich, in meiner naivität, dachte das man bei RAID auch auf die Daten zugreifen kann, wenn nur eine Platte im RAID ist.minimike hat geschrieben:Wenn du den Rechner von einem Raid bootest auch wenn nur eine Platte läuft ist der Raid aktiv und wird benutzt. Du kannst aber die neue Platte on the Fly aus dem Raid entfernen.
Ich habe gerade in der /etc/fstab die Zeile /dev/md0 /srv .... auskommentiert und dann einen reboot durchgeführt.
Nach dem Neustart konnte ich dann mit mdadm --manage --stop /dev/md0 das RAID anhalten.
Mit einem mount /dev/hdd1 /srv wollte ich die Platte mit den Daten ins System laden. /dev/hdd1 ist die Partition auf der Festplatte, die die gesuchten Daten enthalten sollte. Die Partition wurde auch geladen, allerdings zeigt er mit in dem Verzeichnis /srv keine Inhalte an.
Ich muß wohl in den sauren Apfel beißen und ein Tag Arbeit ist weg. Besser ein Tag als eine Woche, einen Monat oder ein Jahr.
Was mich am meisten Ärgert ist, daß im letzten Jahr als ich kaum Datensicherungen gemacht habe, alles ohne Probleme durchgelaufen ist. Jetzt mit fast regelmäßiger Sicherung geht nichts mehr.
Das ganze hat auch was positives. Ich weis jetzt, daß bei Ausfall einer HD im RAID1 man nicht unbedingt auf die anderen Daten zugreifen kann.
Knut
- minimike
- Beiträge: 5616
- Registriert: 26.03.2003 02:21:19
- Lizenz eigener Beiträge: neue BSD Lizenz
- Wohnort: Köln
-
Kontaktdaten:
Re: RAID 1 und Ausfall einer HD
Du kannst drauf zugreifen! Nur wenn du den Raid benutzen tust in dem du ihm z.B. gemountest hast kannst du ihn natürlich nicht stoppen. Zu Strafe mal Debian in einer virtuellen Maschine installieren und mit mdadm arbeiten
Hat der auch wirklich gemountet? df -h und ls sind recht auskunftfreudig

Hat der auch wirklich gemountet? df -h und ls sind recht auskunftfreudig
"Lennart Poettering is one of those typical IT leaders..." "like Linus Torvalds and Theo de Raadt?" "more like Bozo the Clown" After all, now a good employee of Microsoft
-
- Beiträge: 11
- Registriert: 15.01.2009 08:57:21
Re: RAID 1 und Ausfall einer HD
Hallo und vielen Dank an alle
die mir halfen mein Problem zu lösen.
Leider hat es nicht so geklappt wie gedacht.
Auf die Daten von den RAID Festplatten habe ich keinen Zugriff erhalten.
auch wenn ich aus der /etc/fstab den Eintrag für das /dev/md0 auskommentiere und den Rechner neu starte,
habe ich die Platte mit mount /dev/hdc1 /srv versucht zu mounten. Das mounten hat auch ohne Fehlermeldung funktioniert.
Ich konnte dennoch am Mountpoint /srv keine Daten der Festplatte sehen.
Auch beim Versuch mit Knoppix auf die Daten der anderen Festplatte zuzugreifen brachte keinen erfolg. Dort konnte ich zwar zwei Ordner
sehen, aber die Ordner mit den wichtigen Daten erschienen mit einem führenden ? und die waren mit den Rechten lrwxrwxrwx versehen.
Ein Zugriff auf den Inhalt der Ordner habe ich dann auch nicht hinbekommen.
Es scheint das beide Festplatten aus dem RAID1 kaputt gegangen sind. Soll vorkommen.
Ich habe erstmal den Rechner so eingerichtet, daß man erstmal weiterarbeiten kann. Neue Festplatten sind auf dem Weg.
Jetzt sind halt die Daten von DI zurückgesichert und die Mitarbeiter müssen jetzt halt einen halben Tag nach arbeiten.
So dramatisch ist der Verlust halt nicht, nur ägerlich.
Was kann man zukünftig tun? Hardware-RAID oder Software-RAID. Beides hat seine Vor- und Nachteile.
Meine Idee für die Zukunft ist, trotz RAID die Daten in ein Archiv auf einer weiteren HD abzulegen und regelmäßiger Sichern.
Man den Mitarbeitern aber auch nicht zumuten, das das System alle 5 min eine Datensicherung durchführt. Ein bischen Verlust ist immer.
Erstmal vielen Dank
Knut
die mir halfen mein Problem zu lösen.
Leider hat es nicht so geklappt wie gedacht.
Auf die Daten von den RAID Festplatten habe ich keinen Zugriff erhalten.
auch wenn ich aus der /etc/fstab den Eintrag für das /dev/md0 auskommentiere und den Rechner neu starte,
habe ich die Platte mit mount /dev/hdc1 /srv versucht zu mounten. Das mounten hat auch ohne Fehlermeldung funktioniert.
Ich konnte dennoch am Mountpoint /srv keine Daten der Festplatte sehen.
Auch beim Versuch mit Knoppix auf die Daten der anderen Festplatte zuzugreifen brachte keinen erfolg. Dort konnte ich zwar zwei Ordner
sehen, aber die Ordner mit den wichtigen Daten erschienen mit einem führenden ? und die waren mit den Rechten lrwxrwxrwx versehen.
Ein Zugriff auf den Inhalt der Ordner habe ich dann auch nicht hinbekommen.
Es scheint das beide Festplatten aus dem RAID1 kaputt gegangen sind. Soll vorkommen.
Ich habe erstmal den Rechner so eingerichtet, daß man erstmal weiterarbeiten kann. Neue Festplatten sind auf dem Weg.
Jetzt sind halt die Daten von DI zurückgesichert und die Mitarbeiter müssen jetzt halt einen halben Tag nach arbeiten.
So dramatisch ist der Verlust halt nicht, nur ägerlich.
Was kann man zukünftig tun? Hardware-RAID oder Software-RAID. Beides hat seine Vor- und Nachteile.
Meine Idee für die Zukunft ist, trotz RAID die Daten in ein Archiv auf einer weiteren HD abzulegen und regelmäßiger Sichern.
Man den Mitarbeitern aber auch nicht zumuten, das das System alle 5 min eine Datensicherung durchführt. Ein bischen Verlust ist immer.
Erstmal vielen Dank
Knut