[gelöst] Netzwerkprobleme Ursachenermittlung?
-
- Beiträge: 153
- Registriert: 09.11.2010 17:12:46
- Lizenz eigener Beiträge: GNU General Public License
[gelöst] Netzwerkprobleme Ursachenermittlung?
Hallo,
in unserem PC-Raum sind 21 (baugleiche) PC und ein Server über einen Gigabit-Switch miteinander vernetzt. Der Server ist relativ neu, die PC sind etwa 4 Jahre alt. Technische Daten kann ich bei Bedarf nachliefern, vermute diese abere eher nebensächlich. Der Squeeze-Server ist für DHCP, DNS und LDAP zuständig. Grundsätzlich läuft eigentlich alles wunschgemäß. Auf den PC ist größtenteils noch Squeeze, einige sind bereits auf Wheezy hochgezogen. Da auf den Rechnern keine Daten zu verlieren sind, kann ich durchaus experimentieren.
Leider treten in unregelmäßigen Abständen Verbindungsprobleme auf, es sind nie alle Rechner betroffen und immer andere ohne erkennbares Muster. Bisweilen dauert es sehr lange bis einzelne Rechner eine IP-Adresse erhalten und gelegentlich bricht die Verbindung zwischendrin einfach ab. Sowohl bei dist-upgrade Versuchen als auch bei Installation per Netinstall-CD ist das eher störend.
Hat jemand einen Tipp, wie ich die Ursache systematisch aufspüren kann (Hardware / Software / Verkabelung). Da die Fehler in keiner Weise vorhersehbar oder reproduzierbar sind, stehe ich vor einem Rätsel. Der Server ist vermutlich nicht das Problem, weil der Fehler auch bei einem testweise angeschlossenen Uraltserver auftritt.
Gibt es zur Not eine Möglichkeit, bei Netinstall/Upgrade die Installation bei Netzwerkausfall zu pausieren und bei verfügbarer Verbindung fortzusetzen? Dann könnte ich zumindest weitermachen, bis das Problem gefunden / behoben ist.
Gruß
in unserem PC-Raum sind 21 (baugleiche) PC und ein Server über einen Gigabit-Switch miteinander vernetzt. Der Server ist relativ neu, die PC sind etwa 4 Jahre alt. Technische Daten kann ich bei Bedarf nachliefern, vermute diese abere eher nebensächlich. Der Squeeze-Server ist für DHCP, DNS und LDAP zuständig. Grundsätzlich läuft eigentlich alles wunschgemäß. Auf den PC ist größtenteils noch Squeeze, einige sind bereits auf Wheezy hochgezogen. Da auf den Rechnern keine Daten zu verlieren sind, kann ich durchaus experimentieren.
Leider treten in unregelmäßigen Abständen Verbindungsprobleme auf, es sind nie alle Rechner betroffen und immer andere ohne erkennbares Muster. Bisweilen dauert es sehr lange bis einzelne Rechner eine IP-Adresse erhalten und gelegentlich bricht die Verbindung zwischendrin einfach ab. Sowohl bei dist-upgrade Versuchen als auch bei Installation per Netinstall-CD ist das eher störend.
Hat jemand einen Tipp, wie ich die Ursache systematisch aufspüren kann (Hardware / Software / Verkabelung). Da die Fehler in keiner Weise vorhersehbar oder reproduzierbar sind, stehe ich vor einem Rätsel. Der Server ist vermutlich nicht das Problem, weil der Fehler auch bei einem testweise angeschlossenen Uraltserver auftritt.
Gibt es zur Not eine Möglichkeit, bei Netinstall/Upgrade die Installation bei Netzwerkausfall zu pausieren und bei verfügbarer Verbindung fortzusetzen? Dann könnte ich zumindest weitermachen, bis das Problem gefunden / behoben ist.
Gruß
Zuletzt geändert von sebholl am 09.07.2013 21:51:21, insgesamt 1-mal geändert.
Re: Netzwerkprobleme Ursachenermittlung?
... Switch?
Was sagt /var/log/syslog zu diesem Zeitpunkt?
Was bedeutet "Bisweilen dauert es sehr lange bis einzelne Rechner eine IP-Adresse erhalten und gelegentlich bricht die Verbindung zwischendrin einfach ab.".
Was sagt /var/log/syslog zu diesem Zeitpunkt?
Was bedeutet "Bisweilen dauert es sehr lange bis einzelne Rechner eine IP-Adresse erhalten und gelegentlich bricht die Verbindung zwischendrin einfach ab.".
Gruß
slu
Das Server Reinheitsgebot:
Debian Bookworm, sonst nichts.
Stolzer Gewinner der Jessie Release Wette:
https://wiki.debianforum.de/Jessie_Release_Wette#SIEGER
slu
Das Server Reinheitsgebot:
Debian Bookworm, sonst nichts.
Stolzer Gewinner der Jessie Release Wette:
https://wiki.debianforum.de/Jessie_Release_Wette#SIEGER
Re: Netzwerkprobleme Ursachenermittlung?
Baugleiche PCs? Ploetzliche Verbindungsabbrueche im Subnetz? Guck' mal nach, ob jeder eine eigene MAC-Adresse hat... ![Wink ;)](./images/smilies/icon_wink.gif)
Gruss Cae
![Wink ;)](./images/smilies/icon_wink.gif)
Gruss Cae
If universal surveillance were the answer, lots of us would have moved to the former East Germany. If surveillance cameras were the answer, camera-happy London, with something like 500,000 of them at a cost of $700 million, would be the safest city on the planet.
—Bruce Schneier
-
- Beiträge: 153
- Registriert: 09.11.2010 17:12:46
- Lizenz eigener Beiträge: GNU General Public License
Re: Netzwerkprobleme Ursachenermittlung?
Jeder PC hat eine andere MAC-Adresse, hatte ich bereits kontrolliert aber vergessen zu erwähnen.
Zwischendurch abbrechen bedeutet, dass eine Installation mit der Netinstall-CD mit dem Hinweis abbricht, dass keine Netzwerkverbindung verfügbar ist, aber notwendig wäre.
Wie könnte ich prüfen, ob es am Switch liegt? Leider habe ich keinen anderen Switch dieser Größe zur Verfügung. Da manchmal ja auch alles funktioniert würde mir ein probeweiser Austausch kaum Gewissheit bringen.
Auf dem Server oder dem Client? Ich kann morgen nachsehen, falls ich den Fehler hinbekomme./var/log/syslog
Wenn die Rechner starten und ich mich sofort als root auf der Konsole einlogge zeigt ifconfig in der Regel direkt eine IP-Adresse auf. Ab und an kommt es vor, dass dies erst nach etwa 30s geschieht.Bisweilen dauert es sehr lange bis einzelne Rechner eine IP-Adresse erhalten und gelegentlich bricht die Verbindung zwischendrin einfach ab.".
Zwischendurch abbrechen bedeutet, dass eine Installation mit der Netinstall-CD mit dem Hinweis abbricht, dass keine Netzwerkverbindung verfügbar ist, aber notwendig wäre.
Wie könnte ich prüfen, ob es am Switch liegt? Leider habe ich keinen anderen Switch dieser Größe zur Verfügung. Da manchmal ja auch alles funktioniert würde mir ein probeweiser Austausch kaum Gewissheit bringen.
Re: Netzwerkprobleme Ursachenermittlung?
Dreh mal auf dem Switch Portfast auf. Das sollte DHCP usw sehr beschleunigen. Wenn STP auf dem Switch auf den Access Ports aktiv ist kann das zu Problemen fühen. Portfast aber nicht auf Trunk Ports aktivieren das kann nette Loops verursachen. Kommt aber ganze auf die Netzwerkstruktur an.
Ich habe irgendwie die Vermutung dass die Leases ablaufen und nicht rechtzeitig eine neue Lease bekommen.
Poste mal die Config vom Switch vieleicht sieht man da ja was.
Ich habe irgendwie die Vermutung dass die Leases ablaufen und nicht rechtzeitig eine neue Lease bekommen.
Poste mal die Config vom Switch vieleicht sieht man da ja was.
- unitra
- Beiträge: 646
- Registriert: 15.06.2002 21:09:38
- Lizenz eigener Beiträge: MIT Lizenz
- Wohnort: 127.128.129.130
Re: Netzwerkprobleme Ursachenermittlung?
DHCP ist UDP, ausserdem Broadcast traffic. D.h Broadcast geht an alle Hosts in einer "Broadcast" Domäne, ausser an den Sender.sebholl hat geschrieben:Hallo,
in unserem PC-Raum sind 21 (baugleiche) PC und ein Server über einen Gigabit-Switch miteinander vernetzt. Der Server ist relativ neu, die PC sind etwa 4 Jahre alt.
...
Leider treten in unregelmäßigen Abständen Verbindungsprobleme auf, es sind nie alle Rechner betroffen und immer andere ohne erkennbares Muster.
Bisweilen dauert es sehr lange bis einzelne Rechner eine IP-Adresse erhalten und gelegentlich bricht die Verbindung zwischendrin einfach ab. Sowohl bei dist-upgrade Versuchen als auch bei Installation per Netinstall-CD ist das eher störend.
...
Der Switch fluttet alle Ports ausser den Port von wo die Broadcast ausgeht.
Die Frage ist hier, was passiert mit dem DHCPDISCOVER
http://en.wikipedia.org/wiki/DHCP#Technical_details
1 DHCPDISCOVER
2 DHCPOFFER
3 DHCPREQUEST
4 DHCPACK
Schliesse Wireshark an des Netz an und schaue was mit der DHCP Kommunikation passiert, die Reihenfolge ist oben aufgeschrieben, ggfls den wikilink benutzen.sebholl hat geschrieben: Hat jemand einen Tipp, wie ich die Ursache systematisch aufspüren kann (Hardware / Software / Verkabelung). Da die Fehler in keiner Weise vorhersehbar oder reproduzierbar sind, stehe ich vor einem Rätsel. Der Server ist vermutlich nicht das Problem, weil der Fehler auch bei einem testweise angeschlossenen Uraltserver auftritt.
Gibt es zur Not eine Möglichkeit, bei Netinstall/Upgrade die Installation bei Netzwerkausfall zu pausieren und bei verfügbarer Verbindung fortzusetzen? Dann könnte ich zumindest weitermachen, bis das Problem gefunden / behoben ist.
Gruß
Vielleicht hat das Netzwerk zu viel "Broadcast" traffic, oder es gibt irgendwo im Netz eine physikalische Schleife, (Spanning Tree) prüfe die Vekabelung.
Eine Schleife kann einen "Broadcast Storm" führen der die ganze Kommunikation im LAN lahmlegt, die Rechner sind nur damit beschäftigt Broadcast Anfragen zu empfangen. Der Switch ist auch nur noch mit flutten der Broadcasts beschäftigt und verwirft MAC Addressen aus der CAM Tabelle. http://en.wikipedia.org/wiki/CAM_Table
Prüfe die Verkabelung zwischen dem Default Gateway und dem Switch, wie groß dimensioniert ist der Router? Eventuell hat der Router ein Problem, das ist aber erst einmal unwahrscheinlich.
Re: Netzwerkprobleme Ursachenermittlung?
Das kann (zum Glueck, da aufwaendig zu debuggen) nicht sein, weil ein Doof-Switch bei 'ner dauerhaften Schleife ab dem ersten Paket tot ist. Das wird dann froehlich zwischen den gebrueckten Ports hin- und hergesendet und legt den internen Bus vom Switch lahm. Allerdings dauert das seine Zeit; wenn der Switch gelegentlich stromlos ist, koennte es in die Richtung gehen. Sind die Ping-Zeiten normal oder steigen sie kontinuierlich an, bis dann irgendwann die Verbindungen ein Timeout bekommen?unitra hat geschrieben:oder es gibt irgendwo im Netz eine physikalische Schleife, (Spanning Tree) prüfe die Vekabelung.
Gruss Cae
If universal surveillance were the answer, lots of us would have moved to the former East Germany. If surveillance cameras were the answer, camera-happy London, with something like 500,000 of them at a cost of $700 million, would be the safest city on the planet.
—Bruce Schneier
Re: Netzwerkprobleme Ursachenermittlung?
Es wäre von Vorteil wenn wir wissen würden um welchen Switch es sich handelt.
Wenn es sich um sinnvolle Geräte handelt könnte man diese Probleme durch Konfigurationen einfach Beheben. Ich meine da Port shutdowns bei Broadcaststorms usw.
Solange man aber nicht weiß wie was verkabelt ist und ob das der einzige Switch im Netzwerk ist oder es nur eine Raum oder Stockwerksswitch ist wird es kompliziert.
Wenn es sich um sinnvolle Geräte handelt könnte man diese Probleme durch Konfigurationen einfach Beheben. Ich meine da Port shutdowns bei Broadcaststorms usw.
Solange man aber nicht weiß wie was verkabelt ist und ob das der einzige Switch im Netzwerk ist oder es nur eine Raum oder Stockwerksswitch ist wird es kompliziert.
-
- Beiträge: 153
- Registriert: 09.11.2010 17:12:46
- Lizenz eigener Beiträge: GNU General Public License
Re: Netzwerkprobleme Ursachenermittlung?
Der Switch ist ein Netgear GS748TPS. Habe diesen heute mit dem aktuellen Firmwarepaket versorgt und auf "Factory-Defaults" gesetzt.VLAN ist deaktiviert. Die Config des Switch kann ich posten, wenn mir jemand erklärt, wie man die auslesen kann. Entweder übersehe ich in der Anleitung was oder es ist nicht beschrieben.
Der Switch versorgt einen Gebäudekomplex in dem keine anderen Switches sind (zumindest sollten keine da sein). Die Glasfaserverbindungen zu den anderen Gebäuden habe ich zur Fehlersuche entfernt. Habe heute begonnen die Verkabelung nachzuverfolgen, Dokumentation gibts natürlich keine. Dazu muss ich stundenlang durch diverse Kriechkeller krabbeln um überall dran zu kommen, daher werde ich erst mal alles abklemmen was den Raum verlässt und dann weitersuchen.
Wireshark werde ich in dem Zusammenhang auch ausprobieren.
Danke schon mal an alle für die vielen Tipps bzw. Hintergrundinformationen.
syslog-Auszug eines Clients bei dem der Fehler während Netinstall-Versuch auftrat (beim Punkt Softwareauswahl):
Zur gleichen Zeit gab es im syslog des servers keinen Eintrag. Kurz zuvor tauchen dort die Meldungen auf, dass der o.g. Client (Anhand MAC-Adresse identifizierbar) gerne eine IP-Adresse hätte und diese zugeteilt wurden. Also:
DHCPDISCOVER
DHCPOFFER
DHCPREQUEST for...
DHCPACK OK ...
Die restlichen Einträge in dem ungefähren Zeitraum betrafen andere PC, die auch von DHCP versorgt werden wollten. Genau eine Anfrage pro MAC-Adresse. Die Logdatei vom Server habe ich auf meinen USB-Stick gezogen um sie von zu Hause hier zu posten, leider steckt der Stick jetzt noch am Server.![Redface :oops:](./images/smilies/icon_redface.gif)
Der Switch versorgt einen Gebäudekomplex in dem keine anderen Switches sind (zumindest sollten keine da sein). Die Glasfaserverbindungen zu den anderen Gebäuden habe ich zur Fehlersuche entfernt. Habe heute begonnen die Verkabelung nachzuverfolgen, Dokumentation gibts natürlich keine. Dazu muss ich stundenlang durch diverse Kriechkeller krabbeln um überall dran zu kommen, daher werde ich erst mal alles abklemmen was den Raum verlässt und dann weitersuchen.
Wireshark werde ich in dem Zusammenhang auch ausprobieren.
Danke schon mal an alle für die vielen Tipps bzw. Hintergrundinformationen.
syslog-Auszug eines Clients bei dem der Fehler während Netinstall-Versuch auftrat (beim Punkt Softwareauswahl):
Code: Alles auswählen
in-target: Verbindung mit ftp.... nicht möglich (158.36.191.142)-connect (110: Die Wartezeit für die Verbindung ist abgelaufen)
in-target: E:Einige Archive konnten nicht heruntergeladen werden...
Zur gleichen Zeit gab es im syslog des servers keinen Eintrag. Kurz zuvor tauchen dort die Meldungen auf, dass der o.g. Client (Anhand MAC-Adresse identifizierbar) gerne eine IP-Adresse hätte und diese zugeteilt wurden. Also:
DHCPDISCOVER
DHCPOFFER
DHCPREQUEST for...
DHCPACK OK ...
Die restlichen Einträge in dem ungefähren Zeitraum betrafen andere PC, die auch von DHCP versorgt werden wollten. Genau eine Anfrage pro MAC-Adresse. Die Logdatei vom Server habe ich auf meinen USB-Stick gezogen um sie von zu Hause hier zu posten, leider steckt der Stick jetzt noch am Server.
![Redface :oops:](./images/smilies/icon_redface.gif)
Re: Netzwerkprobleme Ursachenermittlung?
Mit diesem Switch bzw. dem Vorgänger hatte ich auch schon meine Freude, allerdings war der dann dauerhaft extrem langsam.sebholl hat geschrieben:Der Switch ist ein Netgear GS748TPS. Habe diesen heute mit dem aktuellen Firmwarepaket versorgt und auf "Factory-Defaults" gesetzt.VLAN ist deaktiviert.
Sollte nicht nötig sein wenn er jetzt erst mal im default Modus läuft, denk daran ein Passwort zu setzten!sebholl hat geschrieben: Die Config des Switch kann ich posten, wenn mir jemand erklärt, wie man die auslesen kann. Entweder übersehe ich in der Anleitung was oder es ist nicht beschrieben.
Das ist ein sehr guter Ansatz. Kann es sein das die Probleme nur auftauchen wenn jemand Zugriff auf eine Netzwerkdose hat?sebholl hat geschrieben: Der Switch versorgt einen Gebäudekomplex in dem keine anderen Switches sind (zumindest sollten keine da sein). Die Glasfaserverbindungen zu den anderen Gebäuden habe ich zur Fehlersuche entfernt. Habe heute begonnen die Verkabelung nachzuverfolgen, Dokumentation gibts natürlich keine. Dazu muss ich stundenlang durch diverse Kriechkeller krabbeln um überall dran zu kommen, daher werde ich erst mal alles abklemmen was den Raum verlässt und dann weitersuchen.
Unbedingt den broadcast traffic anschauen.sebholl hat geschrieben:Wireshark werde ich in dem Zusammenhang auch ausprobieren.
sebholl hat geschrieben:Code: Alles auswählen
in-target: Verbindung mit ftp.... nicht möglich (158.36.191.142)-connect (110: Die Wartezeit für die Verbindung ist abgelaufen) in-target: E:Einige Archive konnten nicht heruntergeladen werden...
Zur gleichen Zeit gab es im syslog des servers keinen Eintrag. Kurz zuvor tauchen dort die Meldungen auf, dass der o.g. Client (Anhand MAC-Adresse identifizierbar) gerne eine IP-Adresse hätte und diese zugeteilt wurden. Also:
DHCPDISCOVER
DHCPOFFER
DHCPREQUEST for...
DHCPACK OK ...
Die restlichen Einträge in dem ungefähren Zeitraum betrafen andere PC, die auch von DHCP versorgt werden wollten. Genau eine Anfrage pro MAC-Adresse.
Dann dürfte das nicht das Problem sein.
Zuletzt geändert von Saxman am 04.07.2013 19:09:01, insgesamt 1-mal geändert.
Grund: Quote gefixt, Danke für die Meldung
Grund: Quote gefixt, Danke für die Meldung
Gruß
slu
Das Server Reinheitsgebot:
Debian Bookworm, sonst nichts.
Stolzer Gewinner der Jessie Release Wette:
https://wiki.debianforum.de/Jessie_Release_Wette#SIEGER
slu
Das Server Reinheitsgebot:
Debian Bookworm, sonst nichts.
Stolzer Gewinner der Jessie Release Wette:
https://wiki.debianforum.de/Jessie_Release_Wette#SIEGER
Re: Netzwerkprobleme Ursachenermittlung?
Ok also wir reden von Netgear naja ich denke mal der gehört zu der Art von Switches wo man Konfigurationen nicht speichern oder einfach exportieren kann wie bei Cisco oder HP.
Soviel ich da sehe kann dieser Switch Storm Control. Damit kannst du Limits für Broadcasts setzen. Sobald ein Schwellenwert erreicht ist dreht der Switch den Port ab.
Weiters kann der Switch auch Kabeltests. Schaue dir mal die Werte der einzelnen Kabeln an.
Soviel ich da sehe kann dieser Switch Storm Control. Damit kannst du Limits für Broadcasts setzen. Sobald ein Schwellenwert erreicht ist dreht der Switch den Port ab.
Weiters kann der Switch auch Kabeltests. Schaue dir mal die Werte der einzelnen Kabeln an.
Re: Netzwerkprobleme Ursachenermittlung?
Doch kann man als Script exportieren, kann dir gerade nur nicht auswendig die Menüpunkte sagen.hec_tech hat geschrieben:Ok also wir reden von Netgear naja ich denke mal der gehört zu der Art von Switches wo man Konfigurationen nicht speichern oder einfach exportieren kann wie bei Cisco oder HP.
Gruß
slu
Das Server Reinheitsgebot:
Debian Bookworm, sonst nichts.
Stolzer Gewinner der Jessie Release Wette:
https://wiki.debianforum.de/Jessie_Release_Wette#SIEGER
slu
Das Server Reinheitsgebot:
Debian Bookworm, sonst nichts.
Stolzer Gewinner der Jessie Release Wette:
https://wiki.debianforum.de/Jessie_Release_Wette#SIEGER
Re: Netzwerkprobleme Ursachenermittlung?
Soso, die doku sagt was anderes: Handbook -> configuration -> uploadhec_tech hat geschrieben:Ok also wir reden von Netgear naja ich denke mal der gehört zu der Art von Switches wo man Konfigurationen nicht speichern oder einfach exportieren kann wie bei Cisco oder HP.
Der Switch hat übrigens auch ein Log
![Wink ;)](./images/smilies/icon_wink.gif)
-
- Beiträge: 153
- Registriert: 09.11.2010 17:12:46
- Lizenz eigener Beiträge: GNU General Public License
Re: Netzwerkprobleme Ursachenermittlung?
Glaubst du etwa dass password ungeeignet sei?slu hat geschrieben:(...), denk daran ein Passwort zu setzten!
![Very Happy :D](./images/smilies/icon_biggrin.gif)
Nein, das Problem trat auch auf, wenn alle anderen schon Feierabend hatten.slu hat geschrieben: Das ist ein sehr guter Ansatz. Kann es sein das die Probleme nur auftauchen wenn jemand Zugriff auf eine Netzwerkdose hat?
![Crying or Very sad :cry:](./images/smilies/icon_cry.gif)
Ein Log hat der Switch jetzt dann wohl nicht mehr, das dürfte beim Zurücksetzen über den Jordan gegangen sein. Aber mal sehen was dort weiterhin auftaucht.
Kabeltest funktioniert anscheinend nur mit dem Internetexplorer.
![Confused :?](./images/smilies/icon_confused.gif)
-
- Beiträge: 153
- Registriert: 09.11.2010 17:12:46
- Lizenz eigener Beiträge: GNU General Public License
[gelöst]Re: Netzwerkprobleme Ursachenermittlung?
Mittlerweile kann ich definitiv sagen, dass der Switch der Übeltäter ist. Ich konnte einen anderen Switch auftreiben, mit dem läuft alles einwandfrei. Leider hat der nur zu wenige Ports. Bleibt also noch die Konfigurationen der beiden Switches zu vergleichen und ggf. am Netgear Änderungen vorzunehmen. Ich setze also mal auf gelöst und schaue ob der Swicth noch zu retten ist.
Nochmals danke an alle für die Tipps und Hinweise.
Nochmals danke an alle für die Tipps und Hinweise.
Re: [gelöst]Re: Netzwerkprobleme Ursachenermittlung?
Viel Glück mit dem Switch.sebholl hat geschrieben:Ich setze also mal auf gelöst und schaue ob der Swicth noch zu retten ist.
Wenn du den Thread auf Gelöst setzen willst musst du den ersten Post bearbeiten, sonst bleibt der Titel für den Thread
![Wink ;-)](./images/smilies/icon_wink.gif)
"Wer sich nicht bewegt, spürt seine Fesseln nicht." - Rosa Luxemburg