Raid5 startet nicht mehr mdadm.conf merkwürdig???

Alle weiteren Dienste, die nicht in die drei oberen Foren gehören.
Antworten
warhammer
Beiträge: 92
Registriert: 17.12.2008 07:51:40

Raid5 startet nicht mehr mdadm.conf merkwürdig???

Beitrag von warhammer » 26.11.2009 08:14:42

Hallo,

irgendwie hat sich mein Raid5 zerlegt.
So wie es für mich aussieht scheinen zwei der drei Platten in sync zu sein und die dritte Platte steht bei diesen beiden auf defekt.
Die dritte Platte ist aber der Meinung das alles io ist.
Eigentlich hätte ich aber erwartet das das RAID auch mit zwei Platten noch funktioniert.

... ich hoffe irgendwer kann mir helfen wie ich mein Raid wieder zum laufen bekomme...



Was genau passiert ist und einige Logs/Statusmeldungen:


heute beim booten sind einige meiner DomUs nicht gestartet mit ziemlich merkwürdigen Fehlermeldungen.

Ergebnis meine beiden Raid5 (md6 und md7 werden nicht gestartet).
Unter /proc/mdstat sind die beiden arrays auch nicht aufgetaucht.

Ein mdadm-startall sagt folgendes:

Code: Alles auswählen

homenet:/var/log# mdadm-startall 
W: mdadm: using ARRAYs defined in existing mdadm.conf. 
Assembling MD array md6...failed (no devices found). 
Assembling MD array md7...failed (no devices found). 
Generating udev events for MD arrays...done. 
verständlich, da die mdadm.conf so aussieht:

Code: Alles auswählen

# definitions of existing MD arrays 
ARRAY /dev/md2 level=raid1 num-devices=2 UUID=00903d67:fe1030bf:5b5dd82e:f6ad96b0 
ARRAY /dev/md3 level=raid1 num-devices=2 UUID=5b9337e8:45374fbc:5b5dd82e:f6ad96b0 
ARRAY /dev/md5 level=raid1 num-devices=2 UUID=368f5d54:03461f06:9a6bca80:945ceb0c 
ARRAY /dev/md6 level=raid1 num-devices=2 UUID=462287c6:41174ddc:9a6bca80:945ceb0c 
ARRAY /dev/md7 level=raid1 num-devices=2 UUID=4439bb1d:0f83f4a4:9a6bca80:945ceb0c 
--> md6 und md7 sollten aber RAID5 sein...

Code: Alles auswählen

homenet:/var/log# mdadm --examine /dev/sda7 (sdb7 sieht genauso aus) 
/dev/sda7: 
Magic : a92b4efc 
Version : 0.90.00 
UUID : b017dbb9:f79b6629:fa41d330:c2df6d6e (local to host homenet) 
Creation Time : Sat Nov 14 08:47:15 2009 
Raid Level : raid5 
Used Dev Size : 860168192 (820.32 GiB 880.81 GB) 
Array Size : 1720336384 (1640.64 GiB 1761.62 GB) 
Raid Devices : 3 
Total Devices : 3 
Preferred Minor : 7 

Update Time : Tue Nov 24 22:23:45 2009 
State : clean 
Active Devices : 2 
Working Devices : 2 
Failed Devices : 1 
Spare Devices : 0 
Checksum : d750cc58 - correct 
Events : 5430 

Layout : left-symmetric 
Chunk Size : 64K 

Number Major Minor RaidDevice State 
this 0 8 7 0 active sync /dev/sda7 

0 0 8 7 0 active sync /dev/sda7 
1 1 8 23 1 active sync /dev/sdb7 
2 2 0 0 2 faulty removed 

Code: Alles auswählen

homenet:/var/log# mdadm --examine /dev/sdc7 
/dev/sdc7: 
Magic : a92b4efc 
Version : 0.90.00 
UUID : b017dbb9:f79b6629:fa41d330:c2df6d6e (local to host homenet) 
Creation Time : Sat Nov 14 08:47:15 2009 
Raid Level : raid5 
Used Dev Size : 860168192 (820.32 GiB 880.81 GB) 
Array Size : 1720336384 (1640.64 GiB 1761.62 GB) 
Raid Devices : 3 
Total Devices : 3 
Preferred Minor : 7 

Update Time : Tue Nov 24 20:22:43 2009 
State : active 
Active Devices : 3 
Working Devices : 3 
Failed Devices : 0 
Spare Devices : 0 
Checksum : d7508e61 - correct 
Events : 2233 

Layout : left-symmetric 
Chunk Size : 64K 

Number Major Minor RaidDevice State 
this 2 8 39 2 active sync /dev/sdc7 

0 0 8 7 0 active sync /dev/sda7 
1 1 8 23 1 active sync /dev/sdb7 
2 2 8 39 2 active sync /dev/sdc7
Zuletzt geändert von Saxman am 26.11.2009 08:36:37, insgesamt 1-mal geändert.
Grund: Code Tags eingefügt

warhammer
Beiträge: 92
Registriert: 17.12.2008 07:51:40

Re: Raid5 startet nicht mehr mdadm.conf merkwürdig???

Beitrag von warhammer » 27.11.2009 13:28:56

... nachdem ja offensichtlich keiner eine Idee hat, hier nun meine (gelungene) Rettung.

1.) Wiederherstellen der richtigen mdadm.conf
homenet:~# mdadm --examine --scan
ARRAY /dev/md7 level=raid5 num-devices=3 UUID=b017dbb9:f79b6629:fa41d330:c2df6d6e
ARRAY /dev/md6 level=raid5 num-devices=3 UUID=8c68def9:a01f65a8:fa41d330:c2df6d6e
ARRAY /dev/md5 level=raid1 num-devices=2 UUID=368f5d54:03461f06:9a6bca80:945ceb0c
ARRAY /dev/md3 level=raid1 num-devices=2 UUID=5b9337e8:45374fbc:5b5dd82e:f6ad96b0
ARRAY /dev/md2 level=raid1 num-devices=2 UUID=00903d67:fe1030bf:5b5dd82e:f6ad96b0
-> Kopieren der korrigierten Einträge für md6 und md7

2.) Raid wieder startbar bekommen.
Wie im examine der einzelnen Partitionen zu sehen ist, scheint das Problem an der hdc zu liegen, die noch als aktiv erkannt wird und auch eine andere Prüfsumme hat.
2.1.) erste Idee: Platte einfach physikalisch ausbauen
Da hatte ich keine Lust zu und das ganze muss ja auch anders funktionieren ohne gleich den ganzen Server runterzufahren.
2.2.) mdadm.conf
Standardeinstelllung: DEVICE partitions -> durchsucht alle Partitionen nach RAID Einträgen. Das entspricht bei mir folgender manueller Einstellung:
DEVICE /dev/sda2 /dev/sda3 /dev/sda5 /dev/sda6 /dev/sda7 /dev/sdb2 /dev/sdb3 /dev/sdb5 /dev/sdb6 /dev/sdb7 /dev/sdc6 /dev/sdc7
-> Entfernen der Einträge von /dev/sdc6 und /dev/sdc7. Damit kennt md diese Partitionen nicht mehr und verwendet sie auch nicht.

3.) Raid starten
homenet:~# mdadm-startall
--> /dev/md6 und /dev/md7 starten wieder

4.) fehlerhafte Partitionen sdc6 bzw. sdc7 mit mdadm /dev/md6 -r /dev/sdc6 (bzw jeweils 7) aus dem Raid entfernen

5.) mdadm.conf wieder auf DEVICE partitions stellen oder /dev/sdc6 und /dev/sdc7 händisch hinzufügen

6.) Partitionen wieder mit mdadm /dev/md6 -a /dev/sdc6 bzw. 7 wieder hinzufügen

Antworten