[gelöst] Netzwerkprobleme Ursachenermittlung?

Einrichten des lokalen Netzes, Verbindung zu anderen Computern und Diensten.
Antworten
sebholl
Beiträge: 153
Registriert: 09.11.2010 17:12:46
Lizenz eigener Beiträge: GNU General Public License

[gelöst] Netzwerkprobleme Ursachenermittlung?

Beitrag von sebholl » 03.07.2013 18:05:19

Hallo,
in unserem PC-Raum sind 21 (baugleiche) PC und ein Server über einen Gigabit-Switch miteinander vernetzt. Der Server ist relativ neu, die PC sind etwa 4 Jahre alt. Technische Daten kann ich bei Bedarf nachliefern, vermute diese abere eher nebensächlich. Der Squeeze-Server ist für DHCP, DNS und LDAP zuständig. Grundsätzlich läuft eigentlich alles wunschgemäß. Auf den PC ist größtenteils noch Squeeze, einige sind bereits auf Wheezy hochgezogen. Da auf den Rechnern keine Daten zu verlieren sind, kann ich durchaus experimentieren.
Leider treten in unregelmäßigen Abständen Verbindungsprobleme auf, es sind nie alle Rechner betroffen und immer andere ohne erkennbares Muster. Bisweilen dauert es sehr lange bis einzelne Rechner eine IP-Adresse erhalten und gelegentlich bricht die Verbindung zwischendrin einfach ab. Sowohl bei dist-upgrade Versuchen als auch bei Installation per Netinstall-CD ist das eher störend.
Hat jemand einen Tipp, wie ich die Ursache systematisch aufspüren kann (Hardware / Software / Verkabelung). Da die Fehler in keiner Weise vorhersehbar oder reproduzierbar sind, stehe ich vor einem Rätsel. Der Server ist vermutlich nicht das Problem, weil der Fehler auch bei einem testweise angeschlossenen Uraltserver auftritt.
Gibt es zur Not eine Möglichkeit, bei Netinstall/Upgrade die Installation bei Netzwerkausfall zu pausieren und bei verfügbarer Verbindung fortzusetzen? Dann könnte ich zumindest weitermachen, bis das Problem gefunden / behoben ist.
Gruß
Zuletzt geändert von sebholl am 09.07.2013 21:51:21, insgesamt 1-mal geändert.

slu
Beiträge: 2242
Registriert: 23.02.2005 23:58:47

Re: Netzwerkprobleme Ursachenermittlung?

Beitrag von slu » 03.07.2013 18:26:00

... Switch?
Was sagt /var/log/syslog zu diesem Zeitpunkt?
Was bedeutet "Bisweilen dauert es sehr lange bis einzelne Rechner eine IP-Adresse erhalten und gelegentlich bricht die Verbindung zwischendrin einfach ab.".
Gruß
slu

Das Server Reinheitsgebot:
Debian Bookworm, sonst nichts.

Stolzer Gewinner der Jessie Release Wette:
https://wiki.debianforum.de/Jessie_Release_Wette#SIEGER

Cae
Beiträge: 6349
Registriert: 17.07.2011 23:36:39
Wohnort: 2130706433

Re: Netzwerkprobleme Ursachenermittlung?

Beitrag von Cae » 03.07.2013 18:28:26

Baugleiche PCs? Ploetzliche Verbindungsabbrueche im Subnetz? Guck' mal nach, ob jeder eine eigene MAC-Adresse hat... ;)

Gruss Cae
If universal surveillance were the answer, lots of us would have moved to the former East Germany. If surveillance cameras were the answer, camera-happy London, with something like 500,000 of them at a cost of $700 million, would be the safest city on the planet.

—Bruce Schneier

sebholl
Beiträge: 153
Registriert: 09.11.2010 17:12:46
Lizenz eigener Beiträge: GNU General Public License

Re: Netzwerkprobleme Ursachenermittlung?

Beitrag von sebholl » 03.07.2013 21:22:32

Jeder PC hat eine andere MAC-Adresse, hatte ich bereits kontrolliert aber vergessen zu erwähnen.
/var/log/syslog
Auf dem Server oder dem Client? Ich kann morgen nachsehen, falls ich den Fehler hinbekomme.
Bisweilen dauert es sehr lange bis einzelne Rechner eine IP-Adresse erhalten und gelegentlich bricht die Verbindung zwischendrin einfach ab.".
Wenn die Rechner starten und ich mich sofort als root auf der Konsole einlogge zeigt ifconfig in der Regel direkt eine IP-Adresse auf. Ab und an kommt es vor, dass dies erst nach etwa 30s geschieht.
Zwischendurch abbrechen bedeutet, dass eine Installation mit der Netinstall-CD mit dem Hinweis abbricht, dass keine Netzwerkverbindung verfügbar ist, aber notwendig wäre.

Wie könnte ich prüfen, ob es am Switch liegt? Leider habe ich keinen anderen Switch dieser Größe zur Verfügung. Da manchmal ja auch alles funktioniert würde mir ein probeweiser Austausch kaum Gewissheit bringen.

hec_tech
Beiträge: 1094
Registriert: 28.06.2007 21:49:36
Wohnort: Wien
Kontaktdaten:

Re: Netzwerkprobleme Ursachenermittlung?

Beitrag von hec_tech » 03.07.2013 23:07:19

Dreh mal auf dem Switch Portfast auf. Das sollte DHCP usw sehr beschleunigen. Wenn STP auf dem Switch auf den Access Ports aktiv ist kann das zu Problemen fühen. Portfast aber nicht auf Trunk Ports aktivieren das kann nette Loops verursachen. Kommt aber ganze auf die Netzwerkstruktur an.
Ich habe irgendwie die Vermutung dass die Leases ablaufen und nicht rechtzeitig eine neue Lease bekommen.

Poste mal die Config vom Switch vieleicht sieht man da ja was.

Benutzeravatar
unitra
Beiträge: 646
Registriert: 15.06.2002 21:09:38
Lizenz eigener Beiträge: MIT Lizenz
Wohnort: 127.128.129.130

Re: Netzwerkprobleme Ursachenermittlung?

Beitrag von unitra » 04.07.2013 00:38:57

sebholl hat geschrieben:Hallo,
in unserem PC-Raum sind 21 (baugleiche) PC und ein Server über einen Gigabit-Switch miteinander vernetzt. Der Server ist relativ neu, die PC sind etwa 4 Jahre alt.
...
Leider treten in unregelmäßigen Abständen Verbindungsprobleme auf, es sind nie alle Rechner betroffen und immer andere ohne erkennbares Muster.
Bisweilen dauert es sehr lange bis einzelne Rechner eine IP-Adresse erhalten und gelegentlich bricht die Verbindung zwischendrin einfach ab. Sowohl bei dist-upgrade Versuchen als auch bei Installation per Netinstall-CD ist das eher störend.
...
DHCP ist UDP, ausserdem Broadcast traffic. D.h Broadcast geht an alle Hosts in einer "Broadcast" Domäne, ausser an den Sender.
Der Switch fluttet alle Ports ausser den Port von wo die Broadcast ausgeht.
Die Frage ist hier, was passiert mit dem DHCPDISCOVER
http://en.wikipedia.org/wiki/DHCP#Technical_details

1 DHCPDISCOVER
2 DHCPOFFER
3 DHCPREQUEST
4 DHCPACK
sebholl hat geschrieben: Hat jemand einen Tipp, wie ich die Ursache systematisch aufspüren kann (Hardware / Software / Verkabelung). Da die Fehler in keiner Weise vorhersehbar oder reproduzierbar sind, stehe ich vor einem Rätsel. Der Server ist vermutlich nicht das Problem, weil der Fehler auch bei einem testweise angeschlossenen Uraltserver auftritt.
Gibt es zur Not eine Möglichkeit, bei Netinstall/Upgrade die Installation bei Netzwerkausfall zu pausieren und bei verfügbarer Verbindung fortzusetzen? Dann könnte ich zumindest weitermachen, bis das Problem gefunden / behoben ist.
Gruß
Schliesse Wireshark an des Netz an und schaue was mit der DHCP Kommunikation passiert, die Reihenfolge ist oben aufgeschrieben, ggfls den wikilink benutzen.

Vielleicht hat das Netzwerk zu viel "Broadcast" traffic, oder es gibt irgendwo im Netz eine physikalische Schleife, (Spanning Tree) prüfe die Vekabelung.
Eine Schleife kann einen "Broadcast Storm" führen der die ganze Kommunikation im LAN lahmlegt, die Rechner sind nur damit beschäftigt Broadcast Anfragen zu empfangen. Der Switch ist auch nur noch mit flutten der Broadcasts beschäftigt und verwirft MAC Addressen aus der CAM Tabelle. http://en.wikipedia.org/wiki/CAM_Table

Prüfe die Verkabelung zwischen dem Default Gateway und dem Switch, wie groß dimensioniert ist der Router? Eventuell hat der Router ein Problem, das ist aber erst einmal unwahrscheinlich.

Cae
Beiträge: 6349
Registriert: 17.07.2011 23:36:39
Wohnort: 2130706433

Re: Netzwerkprobleme Ursachenermittlung?

Beitrag von Cae » 04.07.2013 04:59:14

unitra hat geschrieben:oder es gibt irgendwo im Netz eine physikalische Schleife, (Spanning Tree) prüfe die Vekabelung.
Das kann (zum Glueck, da aufwaendig zu debuggen) nicht sein, weil ein Doof-Switch bei 'ner dauerhaften Schleife ab dem ersten Paket tot ist. Das wird dann froehlich zwischen den gebrueckten Ports hin- und hergesendet und legt den internen Bus vom Switch lahm. Allerdings dauert das seine Zeit; wenn der Switch gelegentlich stromlos ist, koennte es in die Richtung gehen. Sind die Ping-Zeiten normal oder steigen sie kontinuierlich an, bis dann irgendwann die Verbindungen ein Timeout bekommen?

Gruss Cae
If universal surveillance were the answer, lots of us would have moved to the former East Germany. If surveillance cameras were the answer, camera-happy London, with something like 500,000 of them at a cost of $700 million, would be the safest city on the planet.

—Bruce Schneier

hec_tech
Beiträge: 1094
Registriert: 28.06.2007 21:49:36
Wohnort: Wien
Kontaktdaten:

Re: Netzwerkprobleme Ursachenermittlung?

Beitrag von hec_tech » 04.07.2013 13:23:17

Es wäre von Vorteil wenn wir wissen würden um welchen Switch es sich handelt.
Wenn es sich um sinnvolle Geräte handelt könnte man diese Probleme durch Konfigurationen einfach Beheben. Ich meine da Port shutdowns bei Broadcaststorms usw.
Solange man aber nicht weiß wie was verkabelt ist und ob das der einzige Switch im Netzwerk ist oder es nur eine Raum oder Stockwerksswitch ist wird es kompliziert.

sebholl
Beiträge: 153
Registriert: 09.11.2010 17:12:46
Lizenz eigener Beiträge: GNU General Public License

Re: Netzwerkprobleme Ursachenermittlung?

Beitrag von sebholl » 04.07.2013 15:53:40

Der Switch ist ein Netgear GS748TPS. Habe diesen heute mit dem aktuellen Firmwarepaket versorgt und auf "Factory-Defaults" gesetzt.VLAN ist deaktiviert. Die Config des Switch kann ich posten, wenn mir jemand erklärt, wie man die auslesen kann. Entweder übersehe ich in der Anleitung was oder es ist nicht beschrieben.
Der Switch versorgt einen Gebäudekomplex in dem keine anderen Switches sind (zumindest sollten keine da sein). Die Glasfaserverbindungen zu den anderen Gebäuden habe ich zur Fehlersuche entfernt. Habe heute begonnen die Verkabelung nachzuverfolgen, Dokumentation gibts natürlich keine. Dazu muss ich stundenlang durch diverse Kriechkeller krabbeln um überall dran zu kommen, daher werde ich erst mal alles abklemmen was den Raum verlässt und dann weitersuchen.
Wireshark werde ich in dem Zusammenhang auch ausprobieren.
Danke schon mal an alle für die vielen Tipps bzw. Hintergrundinformationen.

syslog-Auszug eines Clients bei dem der Fehler während Netinstall-Versuch auftrat (beim Punkt Softwareauswahl):

Code: Alles auswählen

in-target: Verbindung mit ftp.... nicht möglich (158.36.191.142)-connect (110: Die Wartezeit für die Verbindung ist abgelaufen)
in-target: E:Einige Archive konnten nicht heruntergeladen werden...

Zur gleichen Zeit gab es im syslog des servers keinen Eintrag. Kurz zuvor tauchen dort die Meldungen auf, dass der o.g. Client (Anhand MAC-Adresse identifizierbar) gerne eine IP-Adresse hätte und diese zugeteilt wurden. Also:
DHCPDISCOVER
DHCPOFFER
DHCPREQUEST for...
DHCPACK OK ...
Die restlichen Einträge in dem ungefähren Zeitraum betrafen andere PC, die auch von DHCP versorgt werden wollten. Genau eine Anfrage pro MAC-Adresse. Die Logdatei vom Server habe ich auf meinen USB-Stick gezogen um sie von zu Hause hier zu posten, leider steckt der Stick jetzt noch am Server. :oops:

slu
Beiträge: 2242
Registriert: 23.02.2005 23:58:47

Re: Netzwerkprobleme Ursachenermittlung?

Beitrag von slu » 04.07.2013 18:43:47

sebholl hat geschrieben:Der Switch ist ein Netgear GS748TPS. Habe diesen heute mit dem aktuellen Firmwarepaket versorgt und auf "Factory-Defaults" gesetzt.VLAN ist deaktiviert.
Mit diesem Switch bzw. dem Vorgänger hatte ich auch schon meine Freude, allerdings war der dann dauerhaft extrem langsam.
sebholl hat geschrieben: Die Config des Switch kann ich posten, wenn mir jemand erklärt, wie man die auslesen kann. Entweder übersehe ich in der Anleitung was oder es ist nicht beschrieben.
Sollte nicht nötig sein wenn er jetzt erst mal im default Modus läuft, denk daran ein Passwort zu setzten!
sebholl hat geschrieben: Der Switch versorgt einen Gebäudekomplex in dem keine anderen Switches sind (zumindest sollten keine da sein). Die Glasfaserverbindungen zu den anderen Gebäuden habe ich zur Fehlersuche entfernt. Habe heute begonnen die Verkabelung nachzuverfolgen, Dokumentation gibts natürlich keine. Dazu muss ich stundenlang durch diverse Kriechkeller krabbeln um überall dran zu kommen, daher werde ich erst mal alles abklemmen was den Raum verlässt und dann weitersuchen.
Das ist ein sehr guter Ansatz. Kann es sein das die Probleme nur auftauchen wenn jemand Zugriff auf eine Netzwerkdose hat?
sebholl hat geschrieben:Wireshark werde ich in dem Zusammenhang auch ausprobieren.
Unbedingt den broadcast traffic anschauen.
sebholl hat geschrieben:

Code: Alles auswählen

in-target: Verbindung mit ftp.... nicht möglich (158.36.191.142)-connect (110: Die Wartezeit für die Verbindung ist abgelaufen)
in-target: E:Einige Archive konnten nicht heruntergeladen werden...

Zur gleichen Zeit gab es im syslog des servers keinen Eintrag. Kurz zuvor tauchen dort die Meldungen auf, dass der o.g. Client (Anhand MAC-Adresse identifizierbar) gerne eine IP-Adresse hätte und diese zugeteilt wurden. Also:
DHCPDISCOVER
DHCPOFFER
DHCPREQUEST for...
DHCPACK OK ...
Die restlichen Einträge in dem ungefähren Zeitraum betrafen andere PC, die auch von DHCP versorgt werden wollten. Genau eine Anfrage pro MAC-Adresse.

Dann dürfte das nicht das Problem sein.
Zuletzt geändert von Saxman am 04.07.2013 19:09:01, insgesamt 1-mal geändert.
Grund: Quote gefixt, Danke für die Meldung
Gruß
slu

Das Server Reinheitsgebot:
Debian Bookworm, sonst nichts.

Stolzer Gewinner der Jessie Release Wette:
https://wiki.debianforum.de/Jessie_Release_Wette#SIEGER

hec_tech
Beiträge: 1094
Registriert: 28.06.2007 21:49:36
Wohnort: Wien
Kontaktdaten:

Re: Netzwerkprobleme Ursachenermittlung?

Beitrag von hec_tech » 04.07.2013 19:52:27

Ok also wir reden von Netgear naja ich denke mal der gehört zu der Art von Switches wo man Konfigurationen nicht speichern oder einfach exportieren kann wie bei Cisco oder HP.
Soviel ich da sehe kann dieser Switch Storm Control. Damit kannst du Limits für Broadcasts setzen. Sobald ein Schwellenwert erreicht ist dreht der Switch den Port ab.
Weiters kann der Switch auch Kabeltests. Schaue dir mal die Werte der einzelnen Kabeln an.

slu
Beiträge: 2242
Registriert: 23.02.2005 23:58:47

Re: Netzwerkprobleme Ursachenermittlung?

Beitrag von slu » 04.07.2013 20:25:44

hec_tech hat geschrieben:Ok also wir reden von Netgear naja ich denke mal der gehört zu der Art von Switches wo man Konfigurationen nicht speichern oder einfach exportieren kann wie bei Cisco oder HP.
Doch kann man als Script exportieren, kann dir gerade nur nicht auswendig die Menüpunkte sagen.
Gruß
slu

Das Server Reinheitsgebot:
Debian Bookworm, sonst nichts.

Stolzer Gewinner der Jessie Release Wette:
https://wiki.debianforum.de/Jessie_Release_Wette#SIEGER

dufty
Beiträge: 378
Registriert: 21.09.2012 21:09:05

Re: Netzwerkprobleme Ursachenermittlung?

Beitrag von dufty » 04.07.2013 20:26:24

hec_tech hat geschrieben:Ok also wir reden von Netgear naja ich denke mal der gehört zu der Art von Switches wo man Konfigurationen nicht speichern oder einfach exportieren kann wie bei Cisco oder HP.
Soso, die doku sagt was anderes: Handbook -> configuration -> upload

Der Switch hat übrigens auch ein Log ;)

sebholl
Beiträge: 153
Registriert: 09.11.2010 17:12:46
Lizenz eigener Beiträge: GNU General Public License

Re: Netzwerkprobleme Ursachenermittlung?

Beitrag von sebholl » 04.07.2013 20:57:40

slu hat geschrieben:(...), denk daran ein Passwort zu setzten!
Glaubst du etwa dass password ungeeignet sei? :D
slu hat geschrieben: Das ist ein sehr guter Ansatz. Kann es sein das die Probleme nur auftauchen wenn jemand Zugriff auf eine Netzwerkdose hat?
Nein, das Problem trat auch auf, wenn alle anderen schon Feierabend hatten. :cry: Aber wer weiß schon, ob da irgendein Spezialist eine tolle Idee hatte bevor er nach Hause ging.

Ein Log hat der Switch jetzt dann wohl nicht mehr, das dürfte beim Zurücksetzen über den Jordan gegangen sein. Aber mal sehen was dort weiterhin auftaucht.

Kabeltest funktioniert anscheinend nur mit dem Internetexplorer. :?

sebholl
Beiträge: 153
Registriert: 09.11.2010 17:12:46
Lizenz eigener Beiträge: GNU General Public License

[gelöst]Re: Netzwerkprobleme Ursachenermittlung?

Beitrag von sebholl » 08.07.2013 21:22:27

Mittlerweile kann ich definitiv sagen, dass der Switch der Übeltäter ist. Ich konnte einen anderen Switch auftreiben, mit dem läuft alles einwandfrei. Leider hat der nur zu wenige Ports. Bleibt also noch die Konfigurationen der beiden Switches zu vergleichen und ggf. am Netgear Änderungen vorzunehmen. Ich setze also mal auf gelöst und schaue ob der Swicth noch zu retten ist.
Nochmals danke an alle für die Tipps und Hinweise.

charno
Beiträge: 636
Registriert: 28.06.2004 20:24:34

Re: [gelöst]Re: Netzwerkprobleme Ursachenermittlung?

Beitrag von charno » 08.07.2013 21:37:36

sebholl hat geschrieben:Ich setze also mal auf gelöst und schaue ob der Swicth noch zu retten ist.
Viel Glück mit dem Switch.

Wenn du den Thread auf Gelöst setzen willst musst du den ersten Post bearbeiten, sonst bleibt der Titel für den Thread ;-)
"Wer sich nicht bewegt, spürt seine Fesseln nicht." - Rosa Luxemburg

Antworten