RAID 1 und Ausfall einer HD

Du kommst mit der Installation nicht voran oder willst noch was nachfragen? Schau auch in den "Tipps und Tricks"-Bereich.
Antworten
KnutKatzner
Beiträge: 11
Registriert: 15.01.2009 08:57:21

RAID 1 und Ausfall einer HD

Beitrag von KnutKatzner » 15.01.2009 10:06:11

Hallo an alle,

ich bin neu hier im Forum und auch kein Linux Guru / Spezialist oder ähnliches. Ich habe seit eininger Zeit hier mitgelesen und auch Anregungen und Lösungen gefunden. Ich habe jetzt trotzdem folgendes Problem:

Mein Debian Server ist wie folgt:
hda = 80 GB mit Debian - System
hdc + hdd = Software-RAID1 mit 150 GB für Daten.
Die HD's sind 160 GB, ich habe vorsichtshalber die HD's mit 150 GB für RAID partitioniert

Nachts wird der Rechner heruntergefahren und morgens wieder gestartet. Soweit kein Problem. Heute Morgen hat das BIOS des PC die hdc nicht mehr erkannt, d.h. Ausfall einer HD aus dem RAID1.

Wie geht man jetzt am besten vor?
- Defekte Platte austauschen ist klar.
- Gibt es eine Möglichkeit die Daten, die jetzt auf der 2. Platte liegen noch irgenwie zu sichern?
- Die neue Platte mit gleicher Größe muß jetzt partitioniert werden auf 150 GB für RAID1 und der Rest als Swap. Wie mach ich das ohne die Daten auf der anderen Platte zu verlieren? Für's einrichten der HD's habe ich bei der Installation die dortige Oberfläche benutzt. Wie komme ich da wieder hin?
- Dann muß man dem System noch mitteilen, daß es eine neue Platte gibt und er die Daten synchronisieren muß.

Vielen Dank im voraus an alle.

Knut

Benutzeravatar
minimike
Beiträge: 5616
Registriert: 26.03.2003 02:21:19
Lizenz eigener Beiträge: neue BSD Lizenz
Wohnort: Köln
Kontaktdaten:

Re: RAID 1 und Ausfall einer HD

Beitrag von minimike » 15.01.2009 10:30:21

Musst du nicht wirklich. Du tauschst die defekte Platte aus und startest dann den Rechner. Ist der Rechner online dann anmelden und die neue Platte nach dem selben Schema wie die alte noch vorhandene Platte dann Partitionieren. Sicherheitshalber System neustarten. Nach Neustart dann Anmelden. Im System dann mit mdadm die Partiotionen on the Fly hinzufügen. Beispiel:

Code: Alles auswählen

madam --manage -a /dev/md0 /dev/hdc1
Wobei hda1 ja die verbliebene Platte von md0 ist, hdc1 wird so hinzugefügt. Das kannst gleich für alle Partitionen machen. MDADM arbeitet dann nacheinander ab. Das hinzufügen komplettiert den Raid 1 wieder zu zwei Devices. Bei einem Raid 5 würde ich das in INIT 1 machen. Bei Raid 1 kannst du das auch während des Serverbetriebes tätigen. Schau aber das auf dem Teil ne Stunde lang nichts wirklich heftig läuft. So lange kannst du bei 160 GB maximal rechnen

Zu Überprüfen mit

Code: Alles auswählen

cat /proc/mdstat
"Lennart Poettering is one of those typical IT leaders..." "like Linus Torvalds and Theo de Raadt?" "more like Bozo the Clown" After all, now a good employee of Microsoft

Benutzeravatar
Duff
Beiträge: 6321
Registriert: 22.03.2005 14:36:03
Wohnort: /home/duff

Re: RAID 1 und Ausfall einer HD

Beitrag von Duff » 15.01.2009 10:41:30

Ggf. noch die Konfig anpassen /etc/mdadm.conf und die Statusinformationen mit mdadm --detail /dev/md0 anzeigen lassen.
Oh, yeah!

KnutKatzner
Beiträge: 11
Registriert: 15.01.2009 08:57:21

Re: RAID 1 und Ausfall einer HD

Beitrag von KnutKatzner » 15.01.2009 11:31:36

Dank an minikike und Duff
Ihr habt mir erstmal weitergeholfen.
minimike hat geschrieben:

Code: Alles auswählen

madam --manage -a /dev/md0 /dev/hdc1
und

Code: Alles auswählen

cat /proc/mdstat
Duff hat geschrieben:

Code: Alles auswählen

mdadm --detail /dev/md0
Jetzt läuft erstmal die Synchronisation.
Mal sehen wie es weitergeht.

Knut

Benutzeravatar
Duff
Beiträge: 6321
Registriert: 22.03.2005 14:36:03
Wohnort: /home/duff

Re: RAID 1 und Ausfall einer HD

Beitrag von Duff » 15.01.2009 12:37:48

Hast du deine Konfig denn auch angepasst (/etc/mdadm.conf )?
Oh, yeah!

KnutKatzner
Beiträge: 11
Registriert: 15.01.2009 08:57:21

Re: RAID 1 und Ausfall einer HD

Beitrag von KnutKatzner » 15.01.2009 12:58:07

Hallo Duff,
Duff hat geschrieben:Hast du deine Konfig denn auch angepasst (/etc/mdadm.conf )?
Die /etc/mdadm.conf sieht wie folgt aus:

Code: Alles auswählen

DEVICE partitions
ARRAY /dev/md0 level=raid1 num-devices=2 UUID=033f7282:277cebef:e2d80d13:071f6992
   devices=/dev/hdc1,/dev/hdd1
Was soll ich daran ändern?

KnutKatzner
Beiträge: 11
Registriert: 15.01.2009 08:57:21

Re: RAID 1 und Ausfall einer HD

Beitrag von KnutKatzner » 15.01.2009 13:09:00

Hallo,

ich habe ja nicht die ganze Zeit beim Rechner gewartet und war zwischendurch mal weg.
Die defekte HD scheint nicht das einzige Problem zu sein, wie ich auf dem Monitor jetzt sehe.

Code: Alles auswählen

Jan 15 12:30:43 localhost -- MARK --
Jan 15 12:45:32 localhost kernel: hdd: dma_intr: status=0x51 { DriveReady SeekComplete Error }
Jan 15 12:45:32 localhost kernel: hdd: dma_intr: error=0x40 { UncorrectableError }, LBAsect=123035172, high=7, low=5594660, sector=123033919
Jan 15 12:45:32 localhost kernel: end_request: I/O error, dev hdd, sector 123033919
Jan 15 12:45:35 localhost kernel: hdd: dma_intr: status=0x51 { DriveReady SeekComplete Error }
Jan 15 12:45:35 localhost kernel: hdd: dma_intr: error=0x40 { UncorrectableError }, LBAsect=123035172, high=7, low=5594660, sector=123033927
Wie ich aus obiger Meldung ersehen kann ,ist auch noch die hdd defekt. Und hier waren die Daten drauf.

Wenn ich die ursprüngliche Platte hdc wieder ans laufen bekomme, könnte man die Daten retten? und WIE?
Oder das Retten der Daten von hdd noch möglich?

Zur Erinnerung:
Mein RAID1 bestand aus hdc + hdd.
Heute ist hdc kaputt gegangen und wird jetzt ersetzt.
Läuft das Synchronisieren mehrmals durch? Der PC ha jetzt schon zum 3. Mal wieder von Vorne angefangen.

Dank im Voraus.

Knut

Benutzeravatar
king-crash
Beiträge: 750
Registriert: 08.08.2006 12:07:56
Lizenz eigener Beiträge: MIT Lizenz

Re: RAID 1 und Ausfall einer HD

Beitrag von king-crash » 15.01.2009 13:11:05

Sicher, dass das die Platte ist? Schau doch mal was von SMART kommt.

KnutKatzner
Beiträge: 11
Registriert: 15.01.2009 08:57:21

Re: RAID 1 und Ausfall einer HD

Beitrag von KnutKatzner » 15.01.2009 13:47:46

Hi,
king-crash hat geschrieben:Sicher, dass das die Platte ist? Schau doch mal was von SMART kommt.
Bei smartctl -a /dev/hdd (alte Platte im RAID1) meldet SMART dass dort einige Fehler sind.
Bei smartctl -a /dev/hdc (neue Platte im RAID1) meldet SMART keine Fehler.

Es scheint daß neue Platten notwendig sind. zumindes eine Weitere.

Wie bekomme ich jetzt die Daten von gesichert.
Eine Datensicherung gibt es, die ist aber von Di. und MI wurden viele Daten eingegeben. die jetzt weg wären.

Oder kann man die Daten von der alten hdd aus dem RAID1 noch retten, wenn die Platte ans laufen kommt?

Danke
Knut

Benutzeravatar
king-crash
Beiträge: 750
Registriert: 08.08.2006 12:07:56
Lizenz eigener Beiträge: MIT Lizenz

Re: RAID 1 und Ausfall einer HD

Beitrag von king-crash » 15.01.2009 14:01:33

Na wenn de eine von den alten Platten noch ans laufen bekommst ist das natürlich kein Problem.
Einfach mit dd auf die andere rüberkopieren.

KnutKatzner
Beiträge: 11
Registriert: 15.01.2009 08:57:21

Re: RAID 1 und Ausfall einer HD

Beitrag von KnutKatzner » 15.01.2009 15:11:32

Hi,
wie geschrieben bin ich kein Linux Guru.

Wie soll das mit
king-crash hat geschrieben:Einfach mit dd auf die andere rüberkopieren.
gehen?

Da bei der Installation von Debian die Festplatten als RAID eingerichtet und formatiert wurden. Mit Welchem Dateisystem (ext3, ...) kann ich dann darauf zugreifen? Zumal ich für dd auch die Sektorgröße und andere Parameter benötige.

Danke
Knut

KnutKatzner
Beiträge: 11
Registriert: 15.01.2009 08:57:21

Re: RAID 1 und Ausfall einer HD

Beitrag von KnutKatzner » 15.01.2009 15:14:31

Hi,

Mit dem synchronisieren des RAID ist der Rechner immernoch beschäftigt.

Da auch immer wieder bei c. 40% Fehlermeldungen auftreten, wird der Vorgang wieder von Vorne gestartet. Kann man das Abbrechen?

Danke
Knut

Benutzeravatar
minimike
Beiträge: 5616
Registriert: 26.03.2003 02:21:19
Lizenz eigener Beiträge: neue BSD Lizenz
Wohnort: Köln
Kontaktdaten:

Re: RAID 1 und Ausfall einer HD

Beitrag von minimike » 15.01.2009 15:22:26

Ja
mdadm --manage --help
"Lennart Poettering is one of those typical IT leaders..." "like Linus Torvalds and Theo de Raadt?" "more like Bozo the Clown" After all, now a good employee of Microsoft

KnutKatzner
Beiträge: 11
Registriert: 15.01.2009 08:57:21

Re: RAID 1 und Ausfall einer HD

Beitrag von KnutKatzner » 15.01.2009 16:08:12

Hi minimike

Danke für den Tipp.
minimike hat geschrieben:Ja
mdadm --manage --help
Wenn ich erstmal die Daten gesichert habe, ist mir das RAID1 erstmal egal.
Wie kann ich jetzt auf die Daten zugreifen? Wie muß ich die /dev/hdd ins System mounten, daß ich auf die Daten zugreifen kann?

Danke
Knut

KnutKatzner
Beiträge: 11
Registriert: 15.01.2009 08:57:21

Re: RAID 1 und Ausfall einer HD

Beitrag von KnutKatzner » 15.01.2009 17:02:03

Hi,
minimike hat geschrieben:Ja
mdadm --manage --help

Wenn ich mdadm --manage --stop /dev/md0 eingebe, dann kommt diese Meldung:

Code: Alles auswählen

md: md0 still in use.
mdadm: fail to stop array /dev/md0: Device or resource busy
mdadm ist immernoch dabei den Datenabgleich vorzunehmen.

Ich habe jetzt in einem alten Rechner die defekte Platte eingebaut. Die Platte wurde im BIOS erkannt und auch der Rechner
ist von einer Knoppix CD gestartet. Ich werde im Knoppix-Forum mal nachfragen wie ich die Daten von dort sichern kann.

Wieso kann man nicht ganz normal über das FileSystem auf die Daten zugreifen?
Solange der Rechner mit der synchronisation beschäftigt ist. gibt es wohl keine Möglichkeit auf die Daten zuzugreifen.

Danke
Knut

Benutzeravatar
minimike
Beiträge: 5616
Registriert: 26.03.2003 02:21:19
Lizenz eigener Beiträge: neue BSD Lizenz
Wohnort: Köln
Kontaktdaten:

Re: RAID 1 und Ausfall einer HD

Beitrag von minimike » 15.01.2009 17:26:48

Nein

Wenn du den Rechner von einem Raid bootest auch wenn nur eine Platte läuft ist der Raid aktiv und wird benutzt. Du kannst aber die neue Platte on the Fly aus dem Raid entfernen.
"Lennart Poettering is one of those typical IT leaders..." "like Linus Torvalds and Theo de Raadt?" "more like Bozo the Clown" After all, now a good employee of Microsoft

KnutKatzner
Beiträge: 11
Registriert: 15.01.2009 08:57:21

Re: RAID 1 und Ausfall einer HD

Beitrag von KnutKatzner » 15.01.2009 18:52:22

Hi,
minimike hat geschrieben:Wenn du den Rechner von einem Raid bootest auch wenn nur eine Platte läuft ist der Raid aktiv und wird benutzt. Du kannst aber die neue Platte on the Fly aus dem Raid entfernen.
Ich, in meiner naivität, dachte das man bei RAID auch auf die Daten zugreifen kann, wenn nur eine Platte im RAID ist.

Ich habe gerade in der /etc/fstab die Zeile /dev/md0 /srv .... auskommentiert und dann einen reboot durchgeführt.
Nach dem Neustart konnte ich dann mit mdadm --manage --stop /dev/md0 das RAID anhalten.
Mit einem mount /dev/hdd1 /srv wollte ich die Platte mit den Daten ins System laden. /dev/hdd1 ist die Partition auf der Festplatte, die die gesuchten Daten enthalten sollte. Die Partition wurde auch geladen, allerdings zeigt er mit in dem Verzeichnis /srv keine Inhalte an.

Ich muß wohl in den sauren Apfel beißen und ein Tag Arbeit ist weg. Besser ein Tag als eine Woche, einen Monat oder ein Jahr.
Was mich am meisten Ärgert ist, daß im letzten Jahr als ich kaum Datensicherungen gemacht habe, alles ohne Probleme durchgelaufen ist. Jetzt mit fast regelmäßiger Sicherung geht nichts mehr.
Das ganze hat auch was positives. Ich weis jetzt, daß bei Ausfall einer HD im RAID1 man nicht unbedingt auf die anderen Daten zugreifen kann.

Knut

Benutzeravatar
minimike
Beiträge: 5616
Registriert: 26.03.2003 02:21:19
Lizenz eigener Beiträge: neue BSD Lizenz
Wohnort: Köln
Kontaktdaten:

Re: RAID 1 und Ausfall einer HD

Beitrag von minimike » 15.01.2009 21:07:08

Du kannst drauf zugreifen! Nur wenn du den Raid benutzen tust in dem du ihm z.B. gemountest hast kannst du ihn natürlich nicht stoppen. Zu Strafe mal Debian in einer virtuellen Maschine installieren und mit mdadm arbeiten ;)
Hat der auch wirklich gemountet? df -h und ls sind recht auskunftfreudig
"Lennart Poettering is one of those typical IT leaders..." "like Linus Torvalds and Theo de Raadt?" "more like Bozo the Clown" After all, now a good employee of Microsoft

Benutzeravatar
Duff
Beiträge: 6321
Registriert: 22.03.2005 14:36:03
Wohnort: /home/duff

Re: RAID 1 und Ausfall einer HD

Beitrag von Duff » 16.01.2009 08:52:25

Und der Befehl mount ohne weitere Parameter.
Oh, yeah!

KnutKatzner
Beiträge: 11
Registriert: 15.01.2009 08:57:21

Re: RAID 1 und Ausfall einer HD

Beitrag von KnutKatzner » 16.01.2009 12:02:46

Hallo und vielen Dank an alle
die mir halfen mein Problem zu lösen.

Leider hat es nicht so geklappt wie gedacht.
Auf die Daten von den RAID Festplatten habe ich keinen Zugriff erhalten.
auch wenn ich aus der /etc/fstab den Eintrag für das /dev/md0 auskommentiere und den Rechner neu starte,
habe ich die Platte mit mount /dev/hdc1 /srv versucht zu mounten. Das mounten hat auch ohne Fehlermeldung funktioniert.
Ich konnte dennoch am Mountpoint /srv keine Daten der Festplatte sehen.
Auch beim Versuch mit Knoppix auf die Daten der anderen Festplatte zuzugreifen brachte keinen erfolg. Dort konnte ich zwar zwei Ordner
sehen, aber die Ordner mit den wichtigen Daten erschienen mit einem führenden ? und die waren mit den Rechten lrwxrwxrwx versehen.
Ein Zugriff auf den Inhalt der Ordner habe ich dann auch nicht hinbekommen.
Es scheint das beide Festplatten aus dem RAID1 kaputt gegangen sind. Soll vorkommen.

Ich habe erstmal den Rechner so eingerichtet, daß man erstmal weiterarbeiten kann. Neue Festplatten sind auf dem Weg.
Jetzt sind halt die Daten von DI zurückgesichert und die Mitarbeiter müssen jetzt halt einen halben Tag nach arbeiten.
So dramatisch ist der Verlust halt nicht, nur ägerlich.

Was kann man zukünftig tun? Hardware-RAID oder Software-RAID. Beides hat seine Vor- und Nachteile.
Meine Idee für die Zukunft ist, trotz RAID die Daten in ein Archiv auf einer weiteren HD abzulegen und regelmäßiger Sichern.
Man den Mitarbeitern aber auch nicht zumuten, das das System alle 5 min eine Datensicherung durchführt. Ein bischen Verlust ist immer.

Erstmal vielen Dank

Knut

Antworten