XDMCP Verbindung friert ein

Hallo,

Ich habe folgendes Problem.
Es läuft ein OpenSuse 11.2 Server, auf dem sich USER mit ThinClient’s per XDMCP verbinden.

1 - 2 mal Täglich zu ganz unterschiedlichen Zeiten, wird die Sitzung immer langsamer, bis sie schließlich “einfriert” und der ThinClient neu gestartet werden muss.

Leider finde ich in keinerlei Logdateien einen Hinweis, was hier passiert.

Hat jemand einen Anhaltspunkt zur Suche oder gar das gleiche Problem?

Hallo zusammen,

Wie dünn sind die Clients denn? Ein paar Informationen über deren Ausbau wären nicht schlecht. Sind alle betroffen? Tritt der Fehler bei bestimmten Aktionen auf oder ist er nicht reproduzierbar? Geht es sofort nach dem Neustart wieder problemlos?

Was das ist, kann ich Dir auch nicht sagen. Aber ein paar Tipps zur Fehlersuche. Erstmal solltest Du das Problem eingrenzen. Ich würde als nächstes folgendes tun:

Wenn der Client langsam wird, mit dem Befehl


top

auf dem Server erst einmal feststellen, ob der Server ausgelastet ist und warum. Wie hoch ist der load average und wird die swap Partition benutzt? Welche Programme stehen oben mit welchen Werten? Eine Ursache eines solchen Verhaltens könnte z. B. intensives Swappen des Servers sein. Lösung: Speicherriegel kaufen und einbauen. :wink: Das Fehlerbild spricht dagegen aber zur Sicherheit würde ich auch thermische Probleme beim Server ausschließen. Einmal schauen, wie heiß das Ding ist, dauert ja nicht lange.

Stellt sich heraus, dass der Server nicht ausgelastet ist, würde ich als Nächstes die Netzwerkverbindung auf dem Server mitloggen. Da Du ja X als Dienst zur Verfügung stellst, kannst Du ja sicher auch eine grafische Oberfläche auf dem Server starten. Dann würde ich wireshark zum mitlesen der Pakete nehmen. Ansonsten eben tcpdump. Es könnte auch eine Netzwerkstörung sein. Da gibt es viele Möglichkeiten. Ich würde als erstes an intensives Broadcasten irgendwelcher Metainformationen denken, das das Netz auslastet, oder an einen zu kleinen TCP-Puffer. Hmmm, benutzt XDMCP nicht UDP?

Ein


netstat -apnee

auf dem Server könnte auch hilfreich sein, um eine eventuelle Netzwerkstörung zu finden. In welchem Zustand befindet sich die Verbindung? Wie sehen die queues (Recv-Q Send-Q) aus?

Das passt auch nicht wirklich zu Deinem Fehlerbild. Aber aus Erfahrung habe ich mir angewöhnt als Erstes immer Kabelprobleme und Störstrahlung auszuschließen. Ich habe mich zu oft totgesucht, um am Ende festzustellen, dass einfach ein Stecker nicht richtig drin war.

Und nun fällt mir erstmal nichts mehr ein.

Liebe Grüße

Erik

Hallo Erik,
erst mal “Danke” für die Tipps

vorweg die Informationen, hätte ich auch gleich posten können.

Der Server hat 2 quad core Prozessoren und 24 GB Hauptspeicher
es Arbeiten im schnitt 30 User auf dem Server
Der load zeigt im Schnitt unter 1%
Swap wird nicht angefasst.
auch der Rest zeigt gar keine Auffälligkeiten.
Temperatur des Servers ist normal

Die Clients haben 512 MB Arbeitsspeicher.

Der Fehler tritt sporadisch auf. Manchmal nach 1 Stunde manchmal erst nach 6 Stunden.
Dann auch nicht bei allen Usern, sondern nur bei einem.
Nach dem Neustart kann ohne Probleme sofort weiter gearbeitet werden.

Ich lasse diese Woche mal ein paar Sachen mitlaufen:
wireshark

und schreibe jede Minute in ein Log:
top -bn1 | head -25

Eventuell finde ich was, ich berichte weiter.

Danke mal für die Hinweise.

Absturz erfolgte,
Client ist einfach eingefroren. Maus lies sich nicht mehr bewegen, Gerät musste ausgeschaltet werden.

Top zeigt keine Auffälligkeiten.
Ein Jop, der von dem ThinClient aus mit nohup gestartet wurde, schrieb noch schön weiter seine Logs.
Der ThinClient antwortet noch auf Ping.
Wireshark zeigt keine fehlgeschlagenen Pakete.

Betriebszeit etwas über 8 Stunden.

Hallo zusammen,

Hast Du noch per remote Zugriff auf den gestorbenen Client z. B. mit ssh? Wenn er auf ping antwortet, dann lebt er ja noch. Welche Graka ist in den Clients eingebaut? Ich kenne solches Verhalten von meinem Notebook mit einer ATI-Karte. Bei manchen Aktionen friert die GUI reproduzierbar ein. Shellzugriff geht noch und nach dem Neustart der GUI ist alles wieder gut. Daher die Vermutung, dass es vielleicht die Graka bzw. deren Modul sein könnte.

Liebe Grüße

Erik