Auf einem server1 habe ich eine Freigabe, die auf anderen Servern gemountet wird. Das ist ja auch eigentlich kein Problem. Die Server stehen zwar bundesweit verteilt und sind über ein MPLS verbunden, aber auch das dürfte ja nicht das Problem sein. Insgesamt funktioniert das ja auch wochen-/monatelang ohne Probleme.
Doch dann rennt der server2, auf dem die Freigabe gemountet ist, Amok.
Wobei halt die Auslastung eigentlich nocht hoch ist. Zum Teil bekomme ich auch Zombie-Prozesse.top - 16:15:49 up 36 days, 4:36, 3 users, load average: 17.97, 17.45, 17.07
Tasks: 308 total, 1 running, 307 sleeping, 0 stopped, 0 zombie
Cpu(s): 0.2%us, 0.0%sy, 0.0%ni, 99.8%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st
Mem: 4146764k total, 4005108k used, 141656k free, 238496k buffers
Swap: 2104504k total, 60788k used, 2043716k free, 2694392k cached
Selbst ein
bringt nichts. Ich habe dann auch schon auf den Servern die Dienste nfs-common und nfs-kernel-server neu gestartet. Auch kein Erfolg.umount -l /mnt/share
Ein
bringt dann folgendesmount -vvv /mnt/share
Die Angabe timeo und nfsvers habe ich mal testweise mit reingenommen. Kommt aber das gleiche bei raus.mount: fstab path: "/etc/fstab"
mount: lock path: "/etc/mtab~"
mount: temp path: "/etc/mtab.tmp"
mount: spec: "server1:/home/share"
mount: node: "/mnt/share"
mount: types: "nfs"
mount: opts: "rw,users,noauto,timeo=1,nfsvers=3"
mount: external mount: argv[0] = "/sbin/mount.nfs"
mount: external mount: argv[1] = "server1:/home/share"
mount: external mount: argv[2] = "/mnt/share"
mount: external mount: argv[3] = "-v"
mount: external mount: argv[4] = "-o"
mount: external mount: argv[5] = "rw,noexec,nosuid,nodev,noauto,users,timeo=1,nfsvers=3"
mount.nfs: trying server1 prog 100003 vers 3 prot TCP port 2049
mount.nfs: trying server1 prog 100005 vers 3 prot UDP port 59609
Auf dem server1 steht in der syslog dann das
Der mount auf server2 bleibt stehen und in der syslog taucht das hier aufserver1 mountd[10435]: authenticated mount request from server2:1000 for /home/share (/home/share)
Hier die exports auf server1
[3114147.120233] nfs: server1 not responding, timed out
[3114147.120295] nfs: RPC call returned error 88
[3114147.120396] nfs: RPC call returned error 88
server1 hat die nfs-version"/home/share" *(rw,no_root_squash,sync,no_subtree_check)
server2 (der die Freigabe mountet)nfs-common 1:1.2.2-4squeeze2
nfs-kernel-server 1:1.2.2-4squeeze2
nfs-common 1:1.1.2-6.28.201007201157
nfs-kernel-server 1:1.1.2-6.28.201007201157