Problem mit Docker in Pacemaker-Cluster auf Debian

Alle weiteren Dienste, die nicht in die drei oberen Foren gehören.
Antworten
floder91
Beiträge: 1
Registriert: 01.02.2024 11:28:50

Problem mit Docker in Pacemaker-Cluster auf Debian

Beitrag von floder91 » 01.02.2024 12:16:47

Hallo liebe Community,

ich stehe vor einem komplexen Problem, mit Docker und Pacemaker auf Debian 11 und 12 je in einem Cluster-Setup.

Systemkonfiguration:
Ich betreibe zwei Debian-Server (je Debian 11 & 12) in einem Pacemaker-Cluster. Die Konfiguration beinhaltet Komponenten wie DRBD, LVM, und Docker.

Das Problem:
Wenn der aktive Knoten (Node1) neu gestartet wird, tritt ein Blockierungsproblem auf und der Server muss hart im ESX gestoppt werden. Danach schwenkt der Cluster zum anderen Knoten (Node2). Bei einem Neustart des zweiten Servers kann es vorkommen, dass entweder ein sofortiger Rückschwenk zum Node1 stattfindet oder dasselbe Blockierungsproblem auftritt und der Node2 hart gestoppt werden muss.

Log-Auszüge, die mir aufgefallen sind:

Code: Alles auswählen

Feb  1 09:58:15 server-name pacemaker-execd[1040]: notice: Docker-socket-rsc_stop_0[2319222] error output [ Warning: Stopping docker.service, but it can still be activated by: ]
Feb  1 09:58:15 server-name pacemaker-execd[1040]: notice: Docker-socket-rsc_stop_0[2319222] error output [   docker.socket ]
Feb  1 09:58:35 server-name pacemaker-execd[1040]: notice: Giving up on Docker-socket-rsc stop (rc=0): timeout (elapsed=19988ms, remaining=12ms)
Auszug CRM-Config:

Code: Alles auswählen

primitive Docker-socket-rsc systemd:docker.socket \
        meta migration-threshold=2 \
        op monitor interval=20 timeout=60 on-fail=restart
CRM-Status:

Code: Alles auswählen

    * Docker-socket-rsc (systemd:docker.socket):         FAILED server-name1-1 (blocked)
Bisherige Versuche:
Ich habe Anpassungen an der Konfiguration vorgenommen, um das Problem zu lösen, einschließlich des Hinzufügens einer Stop-Operation für den Dienst, aber bisher ohne Erfolg.

Hat jemand in der Community ähnliche Erfahrungen gemacht oder hat Vorschläge, wie man dieses spezifische Problem beim Neustart von Nodes und dem damit verbundenen Umschwenken des Clusters angehen könnte?

Jeder Hinweis oder Ratschlag wäre sehr willkommen.

Vielen Dank im Voraus für eure Hilfe und Ideen!
FloDer

Antworten