Client χάνουν την σύνδεση με τον server LTSP 12.04.3

Ξεκίνησε από tsarmis, 04 Δεκ 2013, 01:19:19 ΠΜ

« προηγούμενο - επόμενο »

tsarmis

Καλησπέρα,

Η υποδομή έχει ως εξής:
Κεντρικό switch 100Mbps TL-SF1024
Server Pentium D στα 2.8Ghz, 2 Gb RAM, SATA 500Gb HDD, 2 κάρτες δικτύου Realtek 8139D σε bond.
Client όλα με Pentium 4 1.7Ghz:
1 FAT με 1024 RAM
5 FAT με 512 RAM
2 THIN με 256 RAM
1 THIN με 384 RAM

Τα client μπουτάρουν κανονικά και αρκετά γρήγορα λόγο του bond. Λειτουργούν κανονικά για περίπου 2 με 3 λεπτά και μπαίνουν σε σελίδες στο internet για παράδειγμα χωρίς πρόβλημα. Μετά ξαφνικά στου επόπτες χάνονται ένα μετά το άλλο και τα client παγώνουν, αν και το ποντίκι κουνιέται κανονικά.
Το πρόβλημα υπάρχει και αν καταργήσω το bond και κάνουν boot λιγότερα client με μια κάρτα στον server.
Δοκίμασα να βάλω 2 client μόνο, 1 FAT με 1024 και 1 FAT με 512, και γίνεται το ίδιο.
Δοκίμασα επίσης να κάνω αυτό με την 512 RAM THIN, και πάλι το ίδιο.

Μόλις χάσουν την σύνδεση με τον server, σε ifconfig στον server μου βγάζει πολλά error στην κάρτα δικτύου που ήταν συνδεδεμένα τα client. Επίσης ο server δεν έχει πρόσβαση στο internet μόλις χάσουν την σύνδεση τα client.

Υπάρχει περίπτωση να φταίει το modem/router speedtouch 516 του σχολείου?
Το switch να έχει κάποιο πρόβλημα?
Έχω διαβάσει εδώ οτι οι Realtek γενικά να αποφεύγονται γιατί δεν υποστηρίζουν το flow control, αλλά στο δικό μας setup και όλα ταυτόχρονα αν τα βάλω να κάνουν boot δεν έχω πρόβλημα, όταν είναι ενεργό το bond.
Έχει πρόβλημα η δομημένη καλωδίωση?

Απο πού να αρχίσω να ψάχνω?

alkisg

Αν τα παίζουν όλοι οι clients όπως λες, τότε φταίει ο server, οπότε επικεντρώνεσαι εκεί.
Αν έστω και ένας client συνεχίζει να δουλεύει, τότε είναι άλλο θέμα.

Το flow control δεν έχει σχέση με σένα αφού δεν έχεις δίκτυο μεικτής ταχύτητας (1000/100), εσένα είναι όλο 100ρι.
Το speedtouch να συνδέεται με το switch, αλλά να μη συνδέονται απευθείας στο speedtouch ο server ή clients του εργαστηρίου.

Δοκίμασε να συνδέσεις για λίγο το server απευθείας στο switch χωρίς να περνάει από καλωδίωση τοίχου.
Επίσης, βάλε κι αυτό στο lts.conf:
NBD_SWAP_THRESHOLD=2222

tsarmis

Τα client χάνουν την σύνδεση όλα. Στους epoptes βλέπεις να τα χάνει το ένα μετά το άλλο, μέχρι που δεν μένει κανένα. Άρα λές είναι θέμα του setup στον server.
Αυτό που με προβληματίζει είναι οτι όταν γίνεται αυτό, ο server χάνει την σύνδεση με το δίκτυο γενικά, δεν μπαίνει ούτε internet, ούτε ping το modem/router δεν κάνει.

Απο τη στιγμή που δεν έχω θέμα με το flow control, άρα κρατάω και το bond.

To speedtouch έχει μια LAN και πάει πάνω στο switch. Θα κάνω δοκιμή και με άλλο modem/router που έχει 4 LAN και θα βάλω server και 3 client για να δω αν έχει διαφορά.

Στον server, πέρα απο το NBD_SWAP τί άλλο μπορώ να δώ?
Μήπως να τον κάνω format και fresh install, μιας και η εγκατάσταση είναι καινούρια ετσι κι αλλιώς και δεν έχει τίποτα μέσα.

alkisg

Αν θες έλα και από το http://ts.sch.gr/wiki/IRC να το δούμε live.

Δοκίμασε και μέτρηση ταχύτητας δικτύου, https://alkisg.mysch.gr/steki/index.php?topic=3324.0
και, όταν το πάθει ο server, τρέξε και "dmesg" μήπως δεις μηνύματα λάθους του kernel...

tsarmis

#4
Τελικά μετά απο δοκιμή με server στημένο σε Virtual Machine, καταλήξαμε με την βοήθεια του alkisg οτι όντος το πρόβλημα είναι στο hardware του server.

Για να μην πολυλογώ, δυο μέρες κάναμε τεστ σε CPU, GPU, HDD, RAM, LAN Speed κτλ κτλ. Όλα ήταν καλά.
Μέχρι που σε μια αλλαγή θύρας PCI της κάρτας δικτύου, αποφάσισα να ξεκολλήσω το αυτοκόλλητο πάνω απο το chip της κάρτας δικτύου για να δώ τι chip είχε.
Το Ubuntu την αναγνώριζε σαν RTL8139 με driver τον 8139too, ΑΛΛΑ η κάρτα είχε chipset TEL8139D (www.tenda.cn)
Κάποιο, όπως αποδείχτηκε, κακό "κλώνο" του RTL8139D.

Να αναφέρω οτι το LTSP δεν παίζει σωστά ούτε με την onboard RTL8111, την οποία και κάναμε disable απο το bios.

Αφαιρέθηκαν και οι δυο κάρτες και βρήκα απο άλλο PC μια κάρτα δικτύου με chipset RTL8139C. Την έβαλα επάνω, και όλα δούλεψαν άψογα. Τώρα το μόνο που μένει, είναι Δευτέρα πρωί να βάλω αλλη μια με RTL8139C και να δοκιμάσω και το bond, και θα είμαστε μια χαρά.

alkisg, Ευχαριστώ, και θα επανέλθω στο post με τα νεότερα. Οι κάρτες θα πάνε πίσω στον πωλητή για πίστωση.

Ερώτηση:
Για να πάρουν αρίθμηση απο την αρχή οι κάρτες δικτύου (δλδ eth0, eth1 αντί eth3, eth4) αρκεί η ακόλουθη εντολή?
Κώδικας: bash
sudo rm /etc/udev/rules.d/70-persistent-net.rules
sudo reboot

alkisg

Καλησπέρα,

ναι, εκτός αν προτιμάς να τα αλλάξεις με το χέρι, οπότε δίνεις
sudo gedit /etc/udev/rules.d/70-persistent-net.rules
προσαρμόζεις όπως θες και μετά reboot.

Το προβληματικό hardware γαμώτο πάντα προκαλεί πολύ παίδεμα!!! :)

tsarmis

Τελικά έγινε εγκατάσταση 2 καρτών δικτύου με chipset RTL8129C και λειτουργούν σε bond.
Απο client αφήσαμε 7 FAT (2 με 1024 RAM και 5 με 512 RAM).

Απο την πρώτες δοκιμές όλα φαίνονται OK. Ο server πιάνει ταχύτητα 175 ~ 190Mbps, οπότε πολύ κοντά στο θεωρητικό 200.
Σε δοκιμή που έγινε 4 client παίζανε ταυτόχρονα κάποιο βίντεο απο youtube, χωρίς ιδιαίτερα προβλήματα.  Αυτά με 1G RAM δεν είχαν και καθόλου κολλήματα, ενώ αυτά με 512Mb κατα διαστήματα έχαναν και κάποιο frame. Αναμενόμενο.

Τώρα μένει να το τεστάρουν και οι μαθητές και να πάρουμε feedback και απο εκεί.