Froschs Blog

Computer und was das Leben sonst noch so zu bieten hat

Zur Website | Impressum

Fehlersuche im Netzwerk

16. März 2011 um 20:23 Uhr von Atari-Frosch

Schon direkt nach dem Hochfahren des Rechners (ca. 12:00 Uhr) bemerkte ich heute Probleme: Das Einloggen in die IRC-Bouncer dauerte ungewöhnlich lange, und icedove beschwerte sich über timeouts und holte nur einen Teil der Mails ab. Ins Blog konnte ich mich auch noch mühsam einloggen, aber der Seitenaufbau dauerte. Da die meisten meiner Bouncer und Mailpostfächer sowie das Blog auf meinem Server liegen, vermutete ich das Problem zunächst einmal dort.

Der ssh-Login ging noch flüssig, aber mit dem Aufruf des mc wurde alles sehr stockend. Ich fand nach längerem Warten heraus, daß der postfix einige Dateien in /var/spool/postfix/defer und in /var/spool/postfix/deferred rumliegen hat. Also stoppte ich den Mailserver und löschte diese Dateien raus — an der Konsole, nicht im mc, weil das ewig dauerte. Aber es änderte sich nichts. Ich startete den Mailserver neu und loggte mich wieder aus.

Beim Versuch, mich (per Webinterface) bei Twitter einzuloggen, wurde dann klar, daß es nicht an meinem Server liegen kann. Ich bekam erst gar keine Daten, und beim zweiten Versuch kam zwar die Login-Seite, aber nach dem Login passierte wieder nichts mehr. Schon am Vorabend hatte ich zwischendurch bemerkt, daß die doch recht datenreiche Twitter-Website manchmal nur sehr träge ludt, aber von Twitter kennt man das ja gelegentlich. So nebenbei erinnerte ich mich daran, daß ich schon seit ein paar Tagen kein Youtube-Video mehr flüssig abspielen konnte, die Übertragung stockte immer massiv. Ich mußte immer warten, bis das Video im Cache stand, dann konnte ich es nochmal flüssig abspielen. Aber auch da dachte ich, daß Youtube vielleicht ein Problem hätte, auch wenn andere User mir sagten, daß dieses Problem bei ihnen nicht bekannt sei.

Ich pingte diverse Hosts an, und überall passierte dasselbe: rund 20 % Paketverlust, vereinzelt auch mal bis 33 %. Kein Wunder, daß der Rechner mit keinem Dienst richtig reden konnte. Bevor ich mich auf die Fehlersuche machte, ging ich erstmal duschen.

14:30 Uhr: Weil mir der Kundenberater bei der Telekom das sowieso vorschlagen würde, nehme ich dem Router, dem Switch und dem DSL-Modem erstmal kurz den Strom weg, warte ein paar Sekunden und klemme sie wieder an. Keine Änderung. Dann hänge ich das Notebook mit ins LAN und versuche es damit — es könnte ja immerhin sein, daß am PC die Onboard-Netzwerkkarte den Geist aufgibt; die Symptome wären dafür recht typisch. Aber das Notebook hat die gleichen Probleme; zunächst bekommt es nicht einmal eine IP-Adresse vom Router (der macht auch DHCP; der PC hat allerdings eine feste IP). Eine Serie ping an den Router bringt — 20 % packet loss.

Ich tausche das Netzwerkkabel zwischen Router und Switch. Danach ist die Verbindung von PC und Notebook zum Router stabil, aber nach außen habe ich immer noch die gleichen Paketverluste. Zeit, die Telekom zu belästigen.

Beim ersten Anruf verstehe ich den Sprachcomputer nur sehr schlecht, in der Leitung höre ich eine Art Kratzen, und nach etwa zehn Sekunden ist die Verbindung weg. Der zweite Versuch bringt eine einwandfreie Verbindung. Der Sprachcomputer fragt mich einiges ab und verbindet mich dann zu einer Kundenberaterin. Die fragt mich den gleichen Kram nochmal ab — Technik ist toll, vor allem, wenn man sie auch nutzt ... Jedenfalls weiß sie zwar etwas von einer Großstörung, von der sei ich aber nicht betroffen, und die betroffenen Kunden könnten sich auch gar nicht ins Internet einloggen. Wir stellen also fest, daß das Problem bei mir lokal liegen müßte.

Da ich jetzt im LAN stabile Verhältnisse habe — PC kann Notebook ohne Paketverlust floodpingen, Notebook in Richtung PC genauso, und beide können den Router ohne Paketverlust floodpingen —, gehe ich davon aus, daß das Problem hinter dem Router liegt. Ich tausche also das Netzwerkkabel zwischen Router und DSL-Modem. Keine Änderung. Auch der Wechsel des Netzwerkkabels zwischen DSL-Modem und Splitter ändert nichts. Dieses Kabel wäre durchaus ein Kandidat für die Fehlerursache gewesen, denn es ist über die Hälfte ziemlich stark in sich verdreht und hat an einer Stelle einen Riß in der äußeren Ummantelung. Aber auch mit dem neuen Kabel (also wirklich neu im Sinne von neu gekauft) von nur 50 cm Länge habe ich weiterhin Paketverluste.

Ein Versuch zwischendurch: Ich setze zwischen Router und Switch wieder das alte Netzwerkkabel ein, weil das Ersatzkabel kürzer ist und der Router dann mitten im Flur als Stolperfalle liegen muß. Erstaunlicherweise habe ich jetzt damit weiterhin stabilen Kontakt zwischen den Rechnern und zum Router („stabil” = kein Paketverlust bei floodping).

Um sicherzugehen, floodpinge ich außer meinem Server auch mal noch zwei weitere Hosts im Internet, aber da habe ich die gleichen Paketverluste.

Ein weiterer Anruf bei der Telekom wird fällig (ca. 17:00 Uhr). Der Sprachcomputer weiß diesesmal schon, daß ich schonmal angerufen hatte, und stellte seine Fragen nicht nochmal. Nur ob ich damit einverstanden wäre, daß das Gespräch aufgezeichnet wird und ich hinterher noch ein paar Fragen zur Qualität beantworte, wird wieder gefragt. Diesmal sage ich ja. Dann kommt nochmal ein Klingelsignal — und dann nichts mehr. Nach geschätzten 1,5 Minuten ist dann die Computerstimme wieder da und will mir ein paar Fragen über die Qualität des Gesprächs stellen, das gar nicht stattgefunden hat ...

Ich lege auf und bemühe nochmals die Wahlwiederholung. Diesesmal kommt das Gespräch wieder zustande. Ob das jetzt Zufall ist, daß der erste Anruf immer in die Hose geht, kann ich nicht beurteilen. Immerhin bringt man es fertig, sich an meinen ersten Anruf zu erinnern (im dem Sinne, daß die wichtigsten Infos daraus gespeichert wurden und auch dem jetzt männlichen Kundenberater zur Verfügung stehen), sodaß ich nicht alles nochmal von vorn erzählen muß. Das ist ja auch schon ein gewisser Fortschritt.

Der Kundenberater erzählt, daß die Großstörung mittlerweile behoben worden ist. Ich frage also, ob er mal von seiner Position aus mein DSL-Modem testen kann, denn da ich es vom Protokoll her nicht als Netzwerkgerät sehen kann, kann ich es auch nicht anpingen. Ein DSL-Modem ist ein sogenanntes transparentes Netzwerkgerät ohne eigene IP-Adresse, also wie ein einfacher Switch (es gibt auch Switches mit IP-Adresse, sowas Schickes habe ich aber hier nicht). Somit ist es für die Netzwerkprotokolle (TCP/IP) genauso unsichtbar wie ein Kabel. Ich hatte aber darauf gehofft, daß man von der Telekom aus mit anderen Protokollen vielleicht doch gezielt darauf zugreifen und seine Datendurchlässigkeit messen könne; zumindest dieser Kundenberater ist dazu aber wohl nicht in der Lage.

Allerdings schickt er einen Leitungs-Reset los. Ein erneuter Floodping auf den Server zeigt aber keine Änderung: 20 % Paketverlust. Der Kundenberater meint, nach dem Leitungs-Reset solle ich nochmal den Router kurz vom Strom trennen und es dann erneut probieren. Er werde die Technik informieren. Dann will er noch meine Handy-Nummer wissen. Das Problem: Wenn wirklich ein Techniker zu mir kommt und sich herausstellt, daß der Router in Richtung Netz die Pakete frißt, dann kriege ich eine fette Rechnung ...

Nach diesem zweiten Gespräch trenne ich also nochmals den Router vom Netz, warte, bis die Verbindung wieder steht, und lasse erneut einen Floodping auf den Server los. Der Paketverlust liegt bei mehreren Versuchen erst bei 18, dann bei 12, dann bei 9, dann bei 7 %. Aber er ist vorhanden und weiterhin groß genug, um weder Webseiten noch Mail abrufen oder mich ins IRC einloggen zu können. Zwischendurch trifft eine SMS auf meinem Handy ein, in der mir die Telekom mitteilt, welche Ticket-ID dem Problem zugewiesen wurde.

Zwei Stunden nach dem Gespräch habe ich einen regulären Paketverlust von im Schnitt 10 %. Der Reset könnte also teilweise etwas gebracht haben, aber es reicht nicht, um mit der Leitung arbeiten zu können.

Aktueller Stand: Ich bin mit meiner UMTS-Tagesflat im Netz. Ein Floodping auf meine aktuelle IP-Adresse von außen her bestätigt einen Paketverlust von 11 %. Jetzt kann ich wohl nur noch drauf warten, was von der Telekom her passiert, denn ich bin mit meinem Latein am Ende.

[Update 2011-03-17 13:40] Telekom meldete um 11:08 Uhr, sie haben das Ticket geschlossen, „kein Fehler gefunden”. Ich habe wieder 20 % Paketverlust. Wie kann ich messen, wo die Pakete verlorengehen? [/Update]

Kommentieren

Bitte beachte die Kommentarregeln!

XHTML: Du kannst diese Tags verwenden: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>