Festplattenfehler - von Einzel-Platte auf RAID1 umgezogen

Du kommst mit der Installation nicht voran oder willst noch was nachfragen? Schau auch in den "Tipps und Tricks"-Bereich.
zoox
Beiträge: 19
Registriert: 23.02.2008 13:51:01

Festplattenfehler - von Einzel-Platte auf RAID1 umgezogen

Beitrag von zoox » 25.03.2008 14:15:16

Hallo liebe Debian-Gemeinde,

Hab am Wochenende auf meinem Server ein Software Raid-1 mit zwei WD Raptor 150 GB Platten eingerichtet und umgezogen.
Vorher war mein Linux nur auf einer 320 GB Seagate Festplatte installiert. Habs so hinbekommen, dass der Server
von der Seagate-Platte den Grub lädt, und von dort das Debian-System auf den Raid-Platten bootet.

System: Debian 4.0
Kernel:2.6.23.8

Platten-Konstellation:

sda -> 320 GB Seagate Barracuda

sdb -> 150 GB WD Raptor
sdc -> 150 GB WD Raptor

md -> Raid1 aus sdb und sdc

Ziel soll irgendwann sein, die Seagate-Platte abzustecken und die Raptor-Platten auf sda und sdb zu bringen.

Hab den Grub auch auf die Raid-Platten installiert.
Wenn ich die Seagate-Platte abstecke, erscheint Grub wie gewollt, aber der Bootvorgang stoppt irgendwann mit einer Kernel Panic....

Das ist jetzt nicht unbedingt mein Problem, der Server läuft auch so, zwar nicht optimal aber das kriege ich schon irgendwie hin.

Hab heute morgen als ich ins Büro gekommen bin die Meldung im Anhang gesehen und würde gern wissen was das Problem ist...
Der Server funktioniert eigentlich tadellos auf den Raptor-Platten.

Code: Alles auswählen

sd 3:0:0:0: [sdc] 293046768 512-byte hardware sectors (150040 MB)
sd 3:0:0:0: [sdc] Write Protect is off
sd 3:0:0:0: [sdc] Mode Sense: 00 3a 00 00
sd 3:0:0:0: [sdc] Write cache: enabled, read cache: enabled, doesn't support DPO or FUA
ata3.00: exception Emask 0x0 SAct 0x0 SErr 0x40000000 action 0x2 frozen
ata3.00: cmd c8/00:f8:e6:a2:15/00:00:00:00:00/ed tag 0 cdb 0x0 data 126976 in
         res 40/00:00:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout)
ata3: port is slow to respond, please be patient (Status 0xd0)
ata3: device not ready (errno=-16), forcing hardreset
ata3: hard resetting port
ata3: SATA link up 1.5 Gbps (SStatus 113 SControl 310)
ata3.00: configured for UDMA/33
ata3: EH complete
sd 2:0:0:0: [sdb] 293046768 512-byte hardware sectors (150040 MB)
sd 2:0:0:0: [sdb] Write Protect is off
sd 2:0:0:0: [sdb] Mode Sense: 00 3a 00 00
sd 2:0:0:0: [sdb] Write cache: enabled, read cache: enabled, doesn't support DPO or FUA
ata3.00: exception Emask 0x0 SAct 0x0 SErr 0x40000000 action 0x2 frozen
ata3.00: cmd 25/00:08:e6:62:45/00:01:0d:00:00/e0 tag 0 cdb 0x0 data 135168 in
         res 40/00:00:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout)
ata3: port is slow to respond, please be patient (Status 0xd0)
ata3: device not ready (errno=-16), forcing hardreset
ata3: hard resetting port
ata3: SATA link up 1.5 Gbps (SStatus 113 SControl 310)
ata3.00: configured for UDMA/33
ata3: EH complete
sd 2:0:0:0: [sdb] 293046768 512-byte hardware sectors (150040 MB)
sd 2:0:0:0: [sdb] Write Protect is off
sd 2:0:0:0: [sdb] Mode Sense: 00 3a 00 00
sd 2:0:0:0: [sdb] Write cache: enabled, read cache: enabled, doesn't support DPO or FUA
ata3.00: exception Emask 0x0 SAct 0x0 SErr 0x40000000 action 0x2 frozen
ata3.00: cmd c8/00:f8:66:37:1a/00:00:00:00:00/ed tag 0 cdb 0x0 data 126976 in
         res 40/00:00:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout)
ata3: port is slow to respond, please be patient (Status 0xd0)
ata3: device not ready (errno=-16), forcing hardreset
ata3: hard resetting port
ata3: SATA link up 1.5 Gbps (SStatus 113 SControl 310)
ata3.00: configured for UDMA/33
ata3: EH complete
sd 2:0:0:0: [sdb] 293046768 512-byte hardware sectors (150040 MB)
sd 2:0:0:0: [sdb] Write Protect is off
sd 2:0:0:0: [sdb] Mode Sense: 00 3a 00 00
sd 2:0:0:0: [sdb] Write cache: enabled, read cache: enabled, doesn't support DPO or FUA
ata3.00: exception Emask 0x0 SAct 0x0 SErr 0x40000000 action 0x2 frozen
ata3.00: cmd c8/00:f8:b6:b1:cb/00:00:00:00:00/ec tag 0 cdb 0x0 data 126976 in
         res 40/00:00:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout)
ata3: port is slow to respond, please be patient (Status 0xd0)
ata3: device not ready (errno=-16), forcing hardreset
ata3: hard resetting port
ata3: SATA link up 1.5 Gbps (SStatus 113 SControl 310)
ata3.00: configured for UDMA/33
ata3: EH complete
sd 2:0:0:0: [sdb] 293046768 512-byte hardware sectors (150040 MB)
sd 2:0:0:0: [sdb] Write Protect is off
sd 2:0:0:0: [sdb] Mode Sense: 00 3a 00 00
sd 2:0:0:0: [sdb] Write cache: enabled, read cache: enabled, doesn't support DPO or FUA
ata3.00: exception Emask 0x0 SAct 0x0 SErr 0x40000000 action 0x2 frozen
ata3.00: cmd 25/00:08:f6:85:a6/00:00:10:00:00/e0 tag 0 cdb 0x0 data 4096 in
         res 40/00:00:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout)
ata3: port is slow to respond, please be patient (Status 0xd0)
ata3: device not ready (errno=-16), forcing hardreset
ata3: hard resetting port
ata3: SATA link up 1.5 Gbps (SStatus 113 SControl 310)
ata3.00: configured for UDMA/33
ata3: EH complete
sd 2:0:0:0: [sdb] 293046768 512-byte hardware sectors (150040 MB)
sd 2:0:0:0: [sdb] Write Protect is off
sd 2:0:0:0: [sdb] Mode Sense: 00 3a 00 00
sd 2:0:0:0: [sdb] Write cache: enabled, read cache: enabled, doesn't support DPO or FUA
ata3.00: exception Emask 0x0 SAct 0x0 SErr 0x40000000 action 0x2 frozen
ata3.00: cmd 25/00:08:ce:c1:a2/00:00:10:00:00/e0 tag 0 cdb 0x0 data 4096 in
         res 40/00:00:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout)
ata3: port is slow to respond, please be patient (Status 0xd0)
ata3: device not ready (errno=-16), forcing hardreset
ata3: hard resetting port
ata3: SATA link up 1.5 Gbps (SStatus 113 SControl 310)
ata3.00: configured for UDMA/33
ata3: EH complete
sd 2:0:0:0: [sdb] 293046768 512-byte hardware sectors (150040 MB)
sd 2:0:0:0: [sdb] Write Protect is off
sd 2:0:0:0: [sdb] Mode Sense: 00 3a 00 00
sd 2:0:0:0: [sdb] Write cache: enabled, read cache: enabled, doesn't support DPO or FUA
Vielleicht kann mir jemand sagen, was die Meldung bedeuted?

Vielen Dank im Voraus!

gruss
ZooX

zoox
Beiträge: 19
Registriert: 23.02.2008 13:51:01

Re: Festplattenfehler - von Einzel-Platte auf RAID1 umgezogen

Beitrag von zoox » 17.04.2008 20:55:18

Vielleicht kann mir dann jemand sagen wie ich meine Raid-Platten gefahrlos auf sda,sdb bekomme und das System ohne Seagate-Platte zum Laufen bringe?

Dachte ich bekomms alleine hin, aber irgendwie will nix funktionieren....

gruss
ZooX

Mictlan
Beiträge: 596
Registriert: 03.09.2007 11:55:28

Re: Festplattenfehler - von Einzel-Platte auf RAID1 umgezogen

Beitrag von Mictlan » 18.04.2008 10:01:06

die Meldung bekomm ich wenn eine externe Festplatte in Standby gegangen ist und nicht schnell genug wieder aufwacht....

kanns sein dass eine deiner Platten ins Standby rutscht und einfach zu lange zum wiederanlaufen braucht?

was mir da etwas sorgen macht ist dass sowohl sdb als auch sdc betroffen sind.... also beide raid platten....
wie oft tritt das auf?

zoox
Beiträge: 19
Registriert: 23.02.2008 13:51:01

Re: Festplattenfehler - von Einzel-Platte auf RAID1 umgezogen

Beitrag von zoox » 18.04.2008 10:26:28

Hi,

woran kann ich erkennen ob meine Festplatten in den Standby-Modus gehen?

Wie oft und wann die Meldung kommt weiß ich nicht, wenn ich mir die Ausgabe von dmesg anzeigen lasse, wiederholt sich die Meldung bis zum Anfang...

Dnake und gruss
ZooX

Mictlan
Beiträge: 596
Registriert: 03.09.2007 11:55:28

Re: Festplattenfehler - von Einzel-Platte auf RAID1 umgezogen

Beitrag von Mictlan » 18.04.2008 10:35:53

smartctl bzw hdparm bzw sdparm sind bei dem Thema deine freunde :-)

zB

Code: Alles auswählen

yuma:~# hdparm -C /dev/hda

/dev/hda:
 drive state is:  active/idle
yuma:~# hdparm -C /dev/sdc

/dev/sdc:
 drive state is:  standby

zoox
Beiträge: 19
Registriert: 23.02.2008 13:51:01

Re: Festplattenfehler - von Einzel-Platte auf RAID1 umgezogen

Beitrag von zoox » 18.04.2008 11:15:19

ok, danke!

hdparm gibt bei mir das aus:

Code: Alles auswählen

debian:/# hdparm -C /dev/sdb

/dev/sdb:
 drive state is:  active/idle
debian:/# hdparm -C /dev/sdc

/dev/sdc:
 drive state is:  unknown
debian:/#

Mictlan
Beiträge: 596
Registriert: 03.09.2007 11:55:28

Re: Festplattenfehler - von Einzel-Platte auf RAID1 umgezogen

Beitrag von Mictlan » 18.04.2008 14:37:42

unknown is komsich.....
-C Check the current IDE power mode status, which will always be
one of unknown (drive does not support this command),
active/idle (normal operation), standby (low power mode, drive
has spun down), or sleeping (lowest power mode, drive is com‐
pletely shut down). The -S, -y, -Y, and -Z flags can be used to
manipulate the IDE power modes.
das würde bedeuten dass das nicht geht....

was sagt bei dir cat /proc/mdstat ?

bzw ein hdparm -tT /dev/sdc

zoox
Beiträge: 19
Registriert: 23.02.2008 13:51:01

Re: Festplattenfehler - von Einzel-Platte auf RAID1 umgezogen

Beitrag von zoox » 18.04.2008 15:23:04

das bringt mir cat /proc/mdstat

Code: Alles auswählen

debian:/# cat /proc/mdstat
Personalities : [raid1]
md1 : active raid1 sdb5[0] sdc5[2](F)
      146271680 blocks [2/1] [U_]

md0 : active raid1 sdb1[0] sdc1[2](F)
      248896 blocks [2/1] [U_]

unused devices: <none>
und das hdparm:

Code: Alles auswählen

debian:/# hdparm -tT /dev/sdc

/dev/sdc:
read() failed: Input/output error
 Timing buffered disk reads:  read() failed: Input/output error
Ich fürchte das hört sich nicht gut an......

Sarem_Avuton
Beiträge: 546
Registriert: 16.12.2004 09:58:27
Wohnort: Leipzig

Re: Festplattenfehler - von Einzel-Platte auf RAID1 umgezogen

Beitrag von Sarem_Avuton » 18.04.2008 22:02:41

Hallo,

dein Raid ist im fail state
[2/1] [U_]
.
Entweder ist sdc tot oder heist anders. Mach noch mal

Code: Alles auswählen

dmesg | grep /dev/sd

und 
 cat /proc/partitions
Grüße Jörg

zoox
Beiträge: 19
Registriert: 23.02.2008 13:51:01

Re: Festplattenfehler - von Einzel-Platte auf RAID1 umgezogen

Beitrag von zoox » 18.04.2008 22:17:29

Hallo,

Code: Alles auswählen

dmesg | grep /dev/sd

gibt bei mir nix aus, dafür aber:

Code: Alles auswählen

dmesg | grep sdc

sd 3:0:0:0: [sdc] Result: hostbyte=DID_BAD_TARGET driverbyte=DRIVER_OK,SUGGEST_OK
end_request: I/O error, dev sdc, sector 0
Buffer I/O error on device sdc, logical block 0
Buffer I/O error on device sdc, logical block 1
Buffer I/O error on device sdc, logical block 2
sd 3:0:0:0: [sdc] Result: hostbyte=DID_BAD_TARGET driverbyte=DRIVER_OK,SUGGEST_OK
end_request: I/O error, dev sdc, sector 0
Buffer I/O error on device sdc, logical block 0
Buffer I/O error on device sdc, logical block 3
Buffer I/O error on device sdc, logical block 4
Buffer I/O error on device sdc, logical block 5
Buffer I/O error on device sdc, logical block 6
Buffer I/O error on device sdc, logical block 7
Buffer I/O error on device sdc, logical block 8
sd 3:0:0:0: [sdc] Result: hostbyte=DID_BAD_TARGET driverbyte=DRIVER_OK,SUGGEST_OK
end_request: I/O error, dev sdc, sector 0
denke das bewirkt was ähnliches ;-)

Code: Alles auswählen

cat /proc/partitions

major minor  #blocks  name

   8     0  312571224 sda
   8     1     248976 sda1
   8     2          1 sda2
   8     5  312319633 sda5
   8    16  146523384 sdb
   8    17     248976 sdb1
   8    18          1 sdb2
   8    21  146271793 sdb5
   8    32  146523384 sdc
   8    33     248976 sdc1
   8    34          1 sdc2
   8    37  146271793 sdc5
   9     0     248896 md0
   9     1  146271680 md1
 253     0  309600256 dm-0
 253     1    2715648 dm-1

Vielen Dank für eure Hilfe!

Mictlan
Beiträge: 596
Registriert: 03.09.2007 11:55:28

Re: Festplattenfehler - von Einzel-Platte auf RAID1 umgezogen

Beitrag von Mictlan » 21.04.2008 12:10:02

versuch einfach mal den rechner neuzustarten... vllt hilfts ja was....

wenns nix hilft und eventuell sdc gar nimma hochkommt (dh in /proc/partitions nimma drin steht) is die platte defekt (oder daten/stromkabel steckt nicht richtig)

zoox
Beiträge: 19
Registriert: 23.02.2008 13:51:01

Re: Festplattenfehler - von Einzel-Platte auf RAID1 umgezogen

Beitrag von zoox » 21.04.2008 13:34:52

Hallo,

hab gehört ich kann den standby/sleep Modus im laufenden Betrieb mit hdparm deaktivieren und dann das Raid-Array rebuilden.
(Vermutlich liegt es einfach am sleep-Modus und die Platte wacht zu langsam auf...)
In der manpage von hdparm finde ich nur die Option "-s", kann ich die Option risikolos testen oder kann ich damit was ruinieren?

Auf dem Server wird bereits gearbeitet, kann ihn frühestens heute Abend neu starten...

Vielen Dank und Gruss
ZooX

Mictlan
Beiträge: 596
Registriert: 03.09.2007 11:55:28

Re: Festplattenfehler - von Einzel-Platte auf RAID1 umgezogen

Beitrag von Mictlan » 21.04.2008 15:20:23

-s bzw -S kannst du absolut risikolos testen....

zoox
Beiträge: 19
Registriert: 23.02.2008 13:51:01

Re: Festplattenfehler - von Einzel-Platte auf RAID1 umgezogen

Beitrag von zoox » 21.04.2008 15:46:02

Danke!

Das hats ergeben:

Code: Alles auswählen

debian:/# hdparm -s 0 /dev/sdc

/dev/sdc:
 setting power-up in standby to 0 (off)
 HDIO_DRIVE_CMD(powerup_in_standby) failed: Input/output error
Ich versuchs heute Abend nach nem Reboot wieder, vielleicht hilfts....

Mictlan
Beiträge: 596
Registriert: 03.09.2007 11:55:28

Re: Festplattenfehler - von Einzel-Platte auf RAID1 umgezogen

Beitrag von Mictlan » 21.04.2008 17:48:42

zoox hat geschrieben:Danke!

Das hats ergeben:

Code: Alles auswählen

debian:/# hdparm -s 0 /dev/sdc

/dev/sdc:
 setting power-up in standby to 0 (off)
 HDIO_DRIVE_CMD(powerup_in_standby) failed: Input/output error
Ich versuchs heute Abend nach nem Reboot wieder, vielleicht hilfts....
das hab ich erwartet.... schau aber bei dem reboot glei ob auch die kabel alle passen.... (bei nem 19" ding würd ichs halt vorher mal nur mit nem reboot probiern)

zoox
Beiträge: 19
Registriert: 23.02.2008 13:51:01

Re: Festplattenfehler - von Einzel-Platte auf RAID1 umgezogen

Beitrag von zoox » 22.04.2008 08:42:14

Hi,

also nach dem reboot wird die Festplatte wieder im idle-Modus erkannt.

Muss ich nun das Raid-Array mit

Code: Alles auswählen

mdadm /dev/md0 --re-add /dev/sdc1
mdadm /dev/md1 --re-add /dev/sdc5
rebuilden? Wenn ich das richtig verstehe ist im Array nur eine Festplatte vorhanden:

Code: Alles auswählen

debian:/# cat /proc/mdstat
Personalities : [raid1]
md1 : active raid1 sdb5[0]
      146271680 blocks [2/1] [U_]

md0 : active raid1 sdb1[0]
      248896 blocks [2/1] [U_]

unused devices: <none>
Kann man das gefahrlos im laufenden Betrieb machen?

Mictlan
Beiträge: 596
Registriert: 03.09.2007 11:55:28

Re: Festplattenfehler - von Einzel-Platte auf RAID1 umgezogen

Beitrag von Mictlan » 22.04.2008 11:06:50

ja kannst du ohne probleme machen! das einzige was du bemerken wirst ist ein leichter performanceeinbruch während des rebuilds.... aber bei den platten wird das sowieso nicht lang dauern. ich würde dir auch raten mit dem zweiten mdadm-readd zu warten bis das erste fertig ist ;)

genauere (sprechendere) Infos zum Status deines Raids bekommst du von mdadm --detail /dev/md0

zoox
Beiträge: 19
Registriert: 23.02.2008 13:51:01

Re: Festplattenfehler - von Einzel-Platte auf RAID1 umgezogen

Beitrag von zoox » 23.04.2008 10:50:50

Hallo,

also der rebuild hat ohne Probleme funktioniert, die Platten laufen wieder syncron und im idle-Modus.

Aber jetzt erhalte ich mit dmesg wieder die gleiche Meldung wie im allerersten Post :cry:

Mictlan
Beiträge: 596
Registriert: 03.09.2007 11:55:28

Re: Festplattenfehler - von Einzel-Platte auf RAID1 umgezogen

Beitrag von Mictlan » 23.04.2008 12:07:13

zoox hat geschrieben: Aber jetzt erhalte ich mit dmesg wieder die gleiche Meldung wie im allerersten Post :cry:
aber sie bleiben syncron?

zoox
Beiträge: 19
Registriert: 23.02.2008 13:51:01

Re: Festplattenfehler - von Einzel-Platte auf RAID1 umgezogen

Beitrag von zoox » 23.04.2008 13:36:48

ja, die laufen syncron (oder synchron?):

Code: Alles auswählen

debian:/# mdadm --detail /dev/md1
/dev/md1:
        Version : 00.90.03
  Creation Time : Sat Mar 22 21:34:45 2008
     Raid Level : raid1
     Array Size : 146271680 (139.50 GiB 149.78 GB)
    Device Size : 146271680 (139.50 GiB 149.78 GB)
   Raid Devices : 2
  Total Devices : 2
Preferred Minor : 1
    Persistence : Superblock is persistent

    Update Time : Wed Apr 23 13:20:37 2008
          State : clean
 Active Devices : 2
Working Devices : 2
 Failed Devices : 0
  Spare Devices : 0

           UUID : 37e93c25:bbd5fa30:7ed15d81:f7ae31dc
         Events : 0.185180

    Number   Major   Minor   RaidDevice State
       0       8       21        0      active sync   /dev/sdb5
       1       8       37        1      active sync   /dev/sdc5


Mictlan
Beiträge: 596
Registriert: 03.09.2007 11:55:28

Re: Festplattenfehler - von Einzel-Platte auf RAID1 umgezogen

Beitrag von Mictlan » 23.04.2008 13:56:04

gut dann passts eh!

den fehler bekomm ich bei meiner platte auch hin und wieder, bisher is sie aber noch nie rausgeflogen oder hatte irgendwelche probleme....
überprüf mal für die nächsten wochen jedem morgen ob die noch sync sind und wenn sie das bleiben dann ignoriers mal.... den fehler haben hier einige und keiner (auch google nicht) weiß was genaueres....

zoox
Beiträge: 19
Registriert: 23.02.2008 13:51:01

Re: Festplattenfehler - von Einzel-Platte auf RAID1 umgezogen

Beitrag von zoox » 23.04.2008 16:17:47

Ok, dann bin ich nun (zum Glück) wieder bei meiner Ausgangssituation.

Vielen Dank, dass du mir geholfen hast wieder dahin zu kommen ;-)

Vielleicht weiß trotzdem jemand was die Meldung bedeuted bzw. wie ich sie wieder wegkriege.

gruss
ZooX

Mictlan
Beiträge: 596
Registriert: 03.09.2007 11:55:28

Re: Festplattenfehler - von Einzel-Platte auf RAID1 umgezogen

Beitrag von Mictlan » 23.04.2008 16:36:30

zoox hat geschrieben:Ok, dann bin ich nun (zum Glück) wieder bei meiner Ausgangssituation.

Vielen Dank, dass du mir geholfen hast wieder dahin zu kommen ;-)
keine ursache :-)

Mictlan
Beiträge: 596
Registriert: 03.09.2007 11:55:28

Re: Festplattenfehler - von Einzel-Platte auf RAID1 umgezogen

Beitrag von Mictlan » 24.04.2008 11:24:21

zoox hat geschrieben:Vielleicht weiß trotzdem jemand was die Meldung bedeuted bzw. wie ich sie wieder wegkriege.
schau dir mal diesen Thread an: SATA-Platte hat Schluckauf

zoox
Beiträge: 19
Registriert: 23.02.2008 13:51:01

Re: Festplattenfehler - von Einzel-Platte auf RAID1 umgezogen

Beitrag von zoox » 28.04.2008 13:35:03

hmmm, muss ich mal ausprobieren. Hab die Platten in einem Schnellwechselrahmen verbaut...

Antworten