Bookworm mit alten Kernel wg 9260-8i SAS Controller

Welches Modul/Treiber für welche Hardware, Kernel compilieren...
Antworten
Astralix
Beiträge: 4
Registriert: 02.11.2024 10:55:40
Lizenz eigener Beiträge: MIT Lizenz

Bookworm mit alten Kernel wg 9260-8i SAS Controller

Beitrag von Astralix » 02.11.2024 11:16:41

Hallo!

Ich in in eine Falle geraten.

Ich habe mein Debian aktualisiert und zunächst "nur" in die UEFI Falle getappt. Das Problem ist wohl, dass die verfügbare MegaRAID Version das Abschalten des UEFI Boot erfordert. Mein Mainboard ist aber so alt, dass es das noch nicht hat. Danach ist mir aber aufgefallen, dass die RAID Partition auf "Überprüfung beim Start" stand also fstab Option 2 statt 0. Hat man das System fertig booten lassen, war es kein Problem auf das System zuzugreifen und die MegaRAID CLI zu verwenden.

Nun habe ich aber (zum ersten Mal) Einen HDD Error bekommen und wollte mit der CLI nachsehen, welches Laufwerk betroffen ist und die HDD wechseln. Leider kann ich nun plötzlich die CLI nicht mehr aufrufen. Ein Update kann ich aber ebenfalls nicht mehr durchführen, weil es keine Unterstützung für die 9260-8i Controller mehr gibt. Scheinbar wird der MegaRAID Treiber aus irgendeinem Grund garnicht mehr geladen beim Start.

Meine Idee ist nun, dass ich einen älteren Kernel installiere um zunächst das RAID wieder in Ordnung zu bringen.
Danach ist dann zu entscheiden, welcher bezahlbare MegaRAID Controller (-16i Linie?) noch eine Weile unterstützt wird und ob man die "Hot" tauschen kann, oder ob ich altes und neues RAID nebeneinander aufbauen muss zum umkopieren.

Um dieses Chaos zu beseitigen, wäre ich für ein paar Tips sehr dankbar.

Vorhandener MegaRAID Treiber ist 17.05.02-01
Fehler beim Boot ist FW in fault state Code: 0x10000 sub code 0x0
megasas_transition_to_ready timed out

Mehr Infos zum Kernel kommen, wenn ich den Server zu Hause habe. Hier muss ich einen Monitor und eine Tastatur zwischen PC und Server teilen.

rhHeini
Beiträge: 2702
Registriert: 20.04.2006 20:44:10

Re: Bookworm mit alten Kernel wg 9260-8i SAS Controller

Beitrag von rhHeini » 02.11.2024 11:49:16

Servus, ich glaube nicht dass der Kernel das Problem ist sondern diese MEGAcli-Software. Die ist uralt und spielt mt einem aktuellen Debian nicht mehr zusammen.

Meine Erfahrung von vor ungefähr 2 Jahren: hab versucht die letzte verfügbare MEGAcli-Version auf meinen Fileserver mit UEFI und einem 9271 zu installieren. Danach war der Server platt. Eine Neuinstallation des Systems behob das Problem (ohne dieses MEGACLI usw. Zeugs). Ich lebe damit dass ich zur Verwaltung des RAIDs eine parallele Win7-Installation mit einer Windows-Version booten muss.

Benutzeravatar
heisenberg
Beiträge: 4123
Registriert: 04.06.2015 01:17:27
Lizenz eigener Beiträge: MIT Lizenz

Re: Bookworm mit alten Kernel wg 9260-8i SAS Controller

Beitrag von heisenberg » 02.11.2024 12:43:14

Bitte mal genauere konkrete Systemausgaben:
  • Bitte mal genaue Spezifikation des RAID-Controllers (lspci -v -s xx:yy.zz . Was xx, yy, und zz sind findest Du ohne die Ausgabe von -s bei lspci heraus). Mit der Spezifikation kann man dann besser im Internet recherchieren.
  • Exakt welche Befehle gibst Du ein? Exakt welche (Fehler-) Ausgaben erhältst Du?
  • Welche relevanten Meldungen sind im Kernel-Log bzgl. des RAID-Controllers (dmesg, bzw. /var/log/kern.log)

Astralix
Beiträge: 4
Registriert: 02.11.2024 10:55:40
Lizenz eigener Beiträge: MIT Lizenz

Re: Bookworm mit alten Kernel wg 9260-8i SAS Controller

Beitrag von Astralix » 03.11.2024 10:30:36

Super, dass sich hier gleich jemand meldet und helfen möchte.
Übermorgen habe ich den Server zu Hause und dann ein ttyS0 aktiviert, damit man leichter cut and paste machen kann.

lspci identifiziert den RAID Controller als

Code: Alles auswählen

03:00.0 RAID bus controller: Broadcom / LSI MegaRAID SAS 2108 [Liberator] (rev 05)
Subsystem: IBM ServeRAID M5015 SAS/SATA Controller 
... Flags / IO / Memory ...
Capabilities: [50] Power Management version 3
Capabilities: [68] Express Endpoint, MSI 00
Capabilities: [d0] Vital Product Data
Capabilities: [a8] MSI: Enable- Count=1/1 Maskable- 64bit+
Capabilities: [c0] MSI-X: Enable- Count=15 Masked-
Capabilities: [100] Advanced Error Reporting
Capabilities: [138] Power Budgeting <?>
Kernel modules: megaraid_sas
Beim Boot gibt es zwei Meldungen etwa 197 Sekunden nach Start:

Code: Alles auswählen

megaraid_sas 0000:03:00.0: FW in FAULT state, Fault code:0x10000 subcode:0x0 func:megasas_transition_to_ready
megaraid_sas 0000:03:00.0: Failed from megasas_init_fw 6540
Danach gibt es dann die dependency Fehler von systemd und ich lande in der maintenance console.

Die Typenbezeichnungen von diesen Controllern sind komplett verwirrend, vermutlich weil die Produktsparte oder Company zu oft hin und her verkauft wurde. Auf meiner Rechnung steht M5015 9260-8i
M5015 scheint immerhin einmal in dem ganzen Debug vorzukommen.

Astralix
Beiträge: 4
Registriert: 02.11.2024 10:55:40
Lizenz eigener Beiträge: MIT Lizenz

Re: Bookworm mit alten Kernel wg 9260-8i SAS Controller

Beitrag von Astralix » 03.11.2024 13:12:39

Ich habe noch mal per alien auf die aktuelle megacli aktualisiert, die für diese controller Serie heruntergeladen werden kann, das ist dann 17.05.06.00_MSM_Linux-x64.
Die Kommandos, die ich eingebe sind z.B.

Code: Alles auswählen

# megacli -AdpAllInfo -aAll
Exit Code: 0x0
Wenn ich einen spezifischen Adapter angebe, um mir Status oder Konfiguration anzusehen, dann sieht das so aus:

Code: Alles auswählen

megacli -LDInfo -L0 -a0

User specified controller is not present.
Failed to get CpController object.

Exit Code: 0x01

Benutzeravatar
heisenberg
Beiträge: 4123
Registriert: 04.06.2015 01:17:27
Lizenz eigener Beiträge: MIT Lizenz

Re: Bookworm mit alten Kernel wg 9260-8i SAS Controller

Beitrag von heisenberg » 03.11.2024 13:20:57

Astralix hat geschrieben:

Code: Alles auswählen

FW in FAULT state, Fault code:0x10000 subcode:0x0 func:megasas_transition_to_ready
Zu der Logmeldung gibt's ein diverse Google-Suchergebnisse. Die könntest Du mal durcharbeiten, ob's da Erkenntnisse gibt.

rhHeini
Beiträge: 2702
Registriert: 20.04.2006 20:44:10

Re: Bookworm mit alten Kernel wg 9260-8i SAS Controller

Beitrag von rhHeini » 03.11.2024 13:29:01

Ein paar Worte zur Nomenklatur dieser Controller.

Wir haben es hier mit dem LSI Logic Chipsatz 2108 zu tun, der für den Controller verwendet wird. Ist ein SAS6-Controllerchip.

LSI baut selber Controllerplatinen basierend auf dem Chipsatz. Die werden typischerweise so wie 9260-8i benannt. Das 8i steht dabei für 8 interne Ports.

Es gibt da aber auch Nachbauten von den grossen Serverfirmen wie IBM, Dell, Fujitsu ... Die benutzen zwar die Platinen und das Hardware-Design von LSI, können aber mehr oder weniger leicht modifiziert sein, z.B. durch Weglassen von Ports, modifizierter Firmware, ... und werden dann teilweise anders benannt. In diesem Beispiel von IBM M5015. Bei Dell heissen die dann PERC irgendetwas.

Es könnte jetzt sein das das Original-LSI/Broadcom megacli diesen IBM M5015 nicht mag weil der sich anders meldet als die Original-Controller.

Benutzeravatar
heisenberg
Beiträge: 4123
Registriert: 04.06.2015 01:17:27
Lizenz eigener Beiträge: MIT Lizenz

Re: Bookworm mit alten Kernel wg 9260-8i SAS Controller

Beitrag von heisenberg » 03.11.2024 13:45:13

Eine Erkenntnis aus dem kurzen überfliegen der Suchergebnisse ist schon mal, dass es für den Controller wohl ein Alternatives Kommandozeilenprogramm gibt: storcli

Das kann man auch mal probieren.

Astralix
Beiträge: 4
Registriert: 02.11.2024 10:55:40
Lizenz eigener Beiträge: MIT Lizenz

Re: Bookworm mit alten Kernel wg 9260-8i SAS Controller

Beitrag von Astralix » 03.11.2024 21:25:45

@heisenberg:
Die Suchergebnisse beziehen sich viel auf ein Problem, wenn im BIOS des Mainboards UEFI nicht aktiviert ist oder ähnliches. Das hat mein MB (noch) nicht.
Und das hat bis vor kurzem nur den Start des Treibers verzögert, so dass die durch das RAID zur Verfügung gestellte Partition bei der Systemüberprüfung noch nicht zur Verfügung stand.
Nach der Änderung, dass die Partition nicht mehr beim Start geprüft wird, hat das System das RAID später problemlos eingebunden.

Das System lief auch weiter mit der defekten HDD, nach einem Reboot tut es das aber nun nicht mehr. Der Controller wird vom Treiber nicht mehr korrekt erkannt. Das journal gibt dazu folgendes aus:
5128
5129
5130

@rhHeini:
Ich habe das MegaRAID Tool aus dem Downloadbereich des 9260-8i genommen und per Alien umgebaut. Ich habe da keine aktuelle Version probiert, da in diesen diese Controller Serie nicht mehr als unterstützt gelistet wird. Aber diese ist auch aus 2013? Ich bin eher geneigt, dass die Firmware den Controller nicht mehr korrekt einbindet, sonst gäbe es obige Meldungen nicht. Die MegaCLI fragt einfach den Treiber und der sagt "keine Controller, keine Fehler."

@heisenberg:
Das Programm storcli findet sich bei Broadcom in einer noch älteren Version als die MegaCLI, wenn man es für den 9260-8i sucht. Ich lade trotzdem mal die neue Variante, aber ich denke es ist ein Problem mit dem Treiber...

Antworten