gPXE connection time out

Ξεκίνησε από Δημήτρης Δαλαγιώργος, 02 Φεβ 2011, 10:00:01 ΠΜ

« προηγούμενο - επόμενο »

Δημήτρης Δαλαγιώργος

gPXE Connection timed out.

Τι μπορεί να φταίει; Εφόσον ξεκινήσουν με windows τα μηχανάκια παίρνουν IP και συνδέονται στο Internet, αλλά όταν ξεκινάνε με το gPXE μόνο μια φορά είδα να παίρνουν IP. Υπάρχει τρόπος ν' αυξήσω το time out; Κάτι άλλο που θα μπορούσα να δοκιμάσω;
Ενάντια στην ηλιθιότητα, ακόμα και οι θεοί, μάταια αγωνίζονται.
Friedrich Schiller

apapakL

Φαίνεται οτι δεν παίρνει καν ip από το dhcp server... Έχει μπουτάρει αυτός ο υπολογιστής ξανά σαν thin/fat client?

Δημήτρης Δαλαγιώργος

Παράθεση από: apapakl στις 02 Φεβ 2011, 10:17:16 ΠΜ
Φαίνεται οτι δεν παίρνει καν ip από το dhcp server... Έχει μπουτάρει αυτός ο υπολογιστής ξανά σαν thin/fat client?
Όχι, κανένας τους. Έχω δει όμως να παίρνει ip σ' αυτή τη φάση που δείχνει η φωτογραφία...
Ενάντια στην ηλιθιότητα, ακόμα και οι θεοί, μάταια αγωνίζονται.
Friedrich Schiller

alkisg

Από τον server σου, ανέβασε το αποτέλεσμα των παρακάτω εντολών:
ip -oneline -family inet addr show
cat /etc/dnsmasq.d/ltsp.conf
grep dnsmasq /var/log/daemon.log | tail -n 50


Η δικτυακή σου εγκατάσταση είναι η προτεινόμενη; Δηλαδή το ρόλο του DHCP server τον παίζει ο router, και είναι όλα τα μηχανήματα σε ένα switch;

Δημήτρης Δαλαγιώργος

Για το αποτέλεσμα των παραπάνω εντολών θα πρέπει να περιμένουμε μέχρι την ερχόμενη δευτέρα που θα ξαναπάω στο ολοήμερο. Όσο για τη δεύτερη ερώτηση, ναι ip παίρνουν απ' τον router, και είναι όλα πάνω στο ίδιο switch.
Ενάντια στην ηλιθιότητα, ακόμα και οι θεοί, μάταια αγωνίζονται.
Friedrich Schiller

ioarvanit

Γεια σας παιδιά και μπράβο για την απίστευτη δουλειά που έχετε κάνει με το Ubuntu LTSP για τα σχολικά εργαστήρια.

Πριν λίγες ημέρες έστησα και το δικό μου εργαστήριο το οποίο αποτελείται από 8 fat client και 3 thin. Ακολούθησα τις οδηγίες που παρέχονται από την τεχνική στήριξη του Σχολικού δικτύου και όλα κύλισαν ομαλά, εκτός από το συγκεκριμένο πρόβλημα "gPXE connection time out" το οποίο εμφανίζεται σε 2 fat client (υπολογιστές με ίδιο hardware) και στα 3 thin (και αυτοί με ίδιο hardware).

Ο τρόπος δικτύωσης είναι ο προτεινόμενος (το ρόλο του DHCP server τον παίζει ο router, και είναι όλα τα μηχανήματα σε ένα switch)

Στις 2 εικόνες που επισυνάπτω φαίνονται τα μηνύματα που εμφανίζονται κατά την εκκίνηση των υπολογιστών που παρουσιάζουν το πρόβλημα (σε αυτούς όπως και σε άλλους έκανα εγκατάσταση το ltsp-loader 0.6.21 για windows).

Έτρεξα και τις εντολές που πρότεινε ο Άλκης στον server και πήρα τα εξής αποτελέσματα:

ip -oneline -family inet addr show

1: lo    inet 127.0.0.1/8 scope host lo
2: eth0    inet 10.150.5.179/24 brd 10.150.5.255 scope global eth0


cat /etc/dnsmasq.d/ltsp.conf
# Υπόδειγμα /etc/dnsmasq.d/ltsp.conf για χρήση του dnsmasq ως
# proxy DHCP server για εγκαταστάσεις LTSP σε σχολικά εργαστήρια.
# Ο proxy DHCP server δίνει τις απαραίτητες πληροφορίες για την εκκίνηση
# των τερματικών (boot filename και tftp-server) χωρίς όμως να αναθέτει
# διευθύνσεις IP. Έτσι, μπορεί να συνεχίσει να χρησιμοποιείται ο router
# του σχολείου ως DHCP server χωρίς να χρειάζεται καμία ρύθμιση.
# Το κυρίως αρχείο ρυθμίσεων του dnsmasq είναι στο /etc/dnsmasq.conf,
# ενώ το παρόν αρχείο προστίθεται κι αυτό στις ρυθμίσεις του.
# Τροποποιήστε το αρχείο ανάλογα με τις ανάγκες σας.

# Αποσχολιάστε το παρακάτω εάν θέλετε να μη λειτουργεί ο dnsmasq ως DNS server.
# port=0

# Να καταγράφονται οι πληροφορίες DHCP στα αρχεία καταγραφής του συστήματος.
log-dhcp

# Εάν έχετε πρόβλημα με τον προεγκατεστημένο tftp server (tftpd-hpa), μπορείτε
# να τον απεγκαταστήσετε και στη συνέχεια να ορίσετε ότι θέλετε ο dnsmasq να
# λειτουργεί και ως tftp server, αποσχολιάζοντας το παρακάτω:
#enable-tftp

# Ο ριζικός κατάλογος, όταν χρησιμοποιείται ο dnsmasq ως tftp server.
tftp-root=/var/lib/tftpboot

# Η επιλογή rootpath για πρόσβαση σε NFS (δεν χρησιμοποιείται σε Ubuntu).
dhcp-option=17,/opt/ltsp/i386

# Το αρχείο εκκίνησης (boot filename). Είναι σχετικό ως προς το tftp-root.
dhcp-boot=/ltsp/i386/pxelinux.0

# Να μη χρησιμοποιείται multicast.
dhcp-option=vendor:PXEClient,6,2b

# Να μη γίνεται επαναχρησιμοποίηση των πεδίων servername και filename της DHCP
# εγγραφής (structure) ως χώρος επιπλέον επιλογών. Αυτό γίνεται για να μην
# μπερδεύονται κάποιοι παλιοί πελάτες DHCP, όπως το ipconfig.
dhcp-no-override

# Εμφάνιση ενός boot μενού από το οποίο τα τερματικά μπορούν να επιλέξουν
# αν θα ξεκινήσουν από το δίκτυο ή από τον τοπικό δίσκο.
# Η τοπική εκκίνηση δουλεύει μόνο με PXE κάρτες και όχι με το gPXE.
pxe-prompt=Press F8 for boot menu, 3

# Γνωστοί τύποι: x86PC, PC98, IA64_EFI, Alpha, Arc_x86,
# Intel_Lean_Client, IA32_EFI, BC_EFI, Xscale_EFI και X86-64_EFI
# Υποχρεωτικά παραλείπεται το .0 από το pxelinux, δείτε man dnsmasq.
pxe-service=X86PC, Boot from network, /ltsp/i386/pxelinux

# Η υπηρεσία εκκίνησης με αριθμό 0 είναι ειδική: προτρέπει τον πελάτη
# PXE να εγκαταλείψει την εκκίνηση από δίκτυο και να ξεκινήσει τοπικά.
pxe-service=X86PC, Boot from local hard disk, 0

# Αν δοθεί κάποιος άλλος αριθμός υπηρεσίας αντί για διαδρομή αρχείου,
# τότε ο πελάτης PXE θα ψάξει στο δίκτυο γι' αυτήν την υπηρεσία.
#pxe-service=x86PC, Install windows from RIS server, 1

# Στο παρακάτω εύρος διευθύνσεων (dhcp-range) το dnsmasq θα δουλεύει ως
# proxy DHCP server, δηλαδή θα παρέχει τις απαραίτητες πληροφορίες για
# την εκκίνηση (boot filename, tftp-server) αλλά όχι διευθύνσεις IP.
# Οποιαδήποτε διεύθυνση εντός του subnet μπορεί να χρησιμοποιηθεί.
# Βάλτε τη διεύθυνση του LTSP server απλά για ευκολία.
dhcp-range=10.150.5.179,proxy

# Στο παρακάτω εύρος ο dnsmasq θα δουλεύει σαν κανονικός DHCP server
# (όχι σαν proxy), ώστε να δίνει διευθύνσεις σε περιπτώσεις εγκαταστάσεων
# με 2 κάρτες δικτύου.
dhcp-range=192.168.0.20,192.168.0.254,8h

# Αν ο dnsmasq χρησιμοποιηθεί σαν κανονικός DHCP server, τότε μπορείτε
# αν θέλετε να δηλώσετε στατικές IP στα τερματικά ως εξής:
#dhcp-host=00:20:e0:3b:13:af,10.150.5.111,client111,infinite



grep dnsmasq /var/log/daemon.log | tail -n 50

Feb 10 13:51:38 server dnsmasq-dhcp[1101]: 846349870 Available DHCP subnet: 10.150.5.179/255.255.255.0
Feb 10 13:51:38 server dnsmasq-dhcp[1101]: 846349870 Vendor class: PXEClient:Arch:00000:UNDI:002001
Feb 10 13:51:38 server dnsmasq-dhcp[1101]: 846349870 PXE(eth0) 20:cf:30:72:46:2e proxy
Feb 10 13:51:38 server dnsmasq-dhcp[1101]: 846349870 tags: eth0
Feb 10 13:51:38 server dnsmasq-dhcp[1101]: 846349870 bootfile name: /ltsp/i386/pxelinux.0
Feb 10 13:51:38 server dnsmasq-dhcp[1101]: 846349870 sent size:  1 option: 53:message-type  02
Feb 10 13:51:38 server dnsmasq-dhcp[1101]: 846349870 sent size:  4 option: 54:server-identifier  10.150.5.179
Feb 10 13:51:38 server dnsmasq-dhcp[1101]: 846349870 sent size:  9 option: 60:vendor-class  50:58:45:43:6c:69:65:6e:74
Feb 10 13:51:38 server dnsmasq-dhcp[1101]: 846349870 sent size: 17 option: 97:client-machine-id  00:e0:10:36:a1:8a:d5:df:11:b0:d6:20:cf...
Feb 10 13:51:38 server dnsmasq-dhcp[1101]: 846349870 sent size: 91 option: 43:vendor-encap  06:01:03:08:07:80:00:01:0a:96:05:b3:09...
Feb 10 13:51:42 server dnsmasq-dhcp[1101]: 846349870 Available DHCP subnet: 10.150.5.179/255.255.255.0
Feb 10 13:51:42 server dnsmasq-dhcp[1101]: 846349870 Vendor class: PXEClient:Arch:00000:UNDI:002001
Feb 10 13:51:46 server dnsmasq-dhcp[1101]: 846349870 Available DHCP subnet: 10.150.5.179/255.255.255.0
Feb 10 13:51:46 server dnsmasq-dhcp[1101]: 846349870 Vendor class: PXEClient:Arch:00000:UNDI:002001
Feb 10 13:51:46 server dnsmasq-dhcp[1101]: 846349870 PXE(eth0) 10.150.5.180 20:cf:30:72:46:2e /ltsp/i386/pxelinux.0
Feb 10 13:51:46 server dnsmasq-dhcp[1101]: 846349870 tags: eth0
Feb 10 13:51:46 server dnsmasq-dhcp[1101]: 846349870 bootfile name: /ltsp/i386/pxelinux.0
Feb 10 13:51:46 server dnsmasq-dhcp[1101]: 846349870 next server: 10.150.5.179
Feb 10 13:51:46 server dnsmasq-dhcp[1101]: 846349870 sent size:  1 option: 53:message-type  05
Feb 10 13:51:46 server dnsmasq-dhcp[1101]: 846349870 sent size:  4 option: 54:server-identifier  10.150.5.179
Feb 10 13:51:46 server dnsmasq-dhcp[1101]: 846349870 sent size:  9 option: 60:vendor-class  50:58:45:43:6c:69:65:6e:74
Feb 10 13:51:46 server dnsmasq-dhcp[1101]: 846349870 sent size: 17 option: 97:client-machine-id  00:e0:10:36:a1:8a:d5:df:11:b0:d6:20:cf...
Feb 10 13:51:46 server dnsmasq-dhcp[1101]: 846349870 sent size: 35 option: 43:vendor-encap  47:04:80:00:00:00:0a:17:03:50:72:65:73...
Feb 11 11:38:12 server dnsmasq[1097]: started, version 2.52 cachesize 150
Feb 11 11:38:12 server dnsmasq[1097]: compile time options: IPv6 GNU-getopt DBus I18N DHCP TFTP
Feb 11 11:38:12 server dnsmasq-dhcp[1097]: DHCP, IP range 192.168.0.20 -- 192.168.0.254, lease time 8h
Feb 11 11:38:12 server dnsmasq-dhcp[1097]: DHCP, proxy on subnet 10.150.5.179
Feb 11 11:38:12 server dnsmasq[1097]: reading /etc/resolv.conf
Feb 11 11:38:12 server dnsmasq[1097]: using nameserver 194.63.238.4#53
Feb 11 11:38:12 server dnsmasq[1097]: using nameserver 194.63.237.4#53
Feb 11 11:38:12 server dnsmasq[1097]: using nameserver 194.63.239.164#53
Feb 11 11:38:12 server dnsmasq[1097]: using nameserver 10.150.5.10#53
Feb 11 11:38:12 server dnsmasq[1097]: read /etc/hosts - 8 addresses
Feb 11 11:39:11 server dnsmasq[1097]: reading /etc/resolv.conf
Feb 11 11:39:11 server dnsmasq[1097]: using nameserver 194.63.238.4#53
Feb 11 11:39:11 server dnsmasq[1097]: using nameserver 194.63.237.4#53
Feb 11 11:39:11 server dnsmasq[1097]: using nameserver 194.63.239.164#53
Feb 11 11:39:11 server dnsmasq[1097]: using nameserver 10.150.5.10#53
Feb 11 11:42:46 server dnsmasq-dhcp[1097]: 1248493815 Available DHCP subnet: 10.150.5.179/255.255.255.0
Feb 11 11:42:46 server dnsmasq-dhcp[1097]: 1248493815 client provides name: lab3
Feb 11 11:42:46 server dnsmasq-dhcp[1097]: 1248493815 Vendor class: MSFT 5.0

Καμμια πρόταση;

alkisg

Για αρχή, δοκίμασε με μια πιο καινούργια έκδοση του gPXE, που επισυνάπτω. Λέγεται iPXE αντί για gPXE επειδή βασίζεται στο πιο καινούργιο http://ipxe.org.

Αν δεν παίξει με την καινούργια έκδοση, δοκίμασε με στατικές IP στους clients, όπως περιγράφω εδώ.

ioarvanit

Άλκη σε ευχαριστώ για την γρήγορη απάντηση. Θα το δοκιμάσω Δευτέρα πρωί πρωί και θα κοινοποιήσω τα αποτελέσματα

Δημήτρης Γκίνης

Δεν ξέρω αν πιάσει στην δική σας περίπτωση παιδιά, από ότι διαβάζω δεν έχετε τα ίδια συμπτώματα με εμένα, αλλά στην περίπτωση του δικού μου εργαστηρίου όπου εμφανιζόταν σε κάποιους clients το gPXE connection time out (οι οποίοι ας σημειωθεί ότι είχαν μπουτάρει κανονικά μέσω δικτύου τουλάχιστον 1 φορά), και αφού δοκίμασα διάφορες συνταγές του γιατρού (βλ. Άλκης ) τελικά την λύση έδωσε το εξής (συμβουλή του ιδίου γιατρού): βγάλσιμο του καλωδίου τροφοδοσίας, πάτημα κανά δυο φορές του κουμπιού ON προκειμένου να γίνει πλήρης εκφόρτιση, επανασύνδεση της τροφοδοσίας και όλα ΟΚ.

ioarvanit

Άλκη δοκίμασα αρχικά με το ipxe iso αρχικά όπως μου πρότεινες και έγινε το εξής παράδοξο: Οι Η/Υ που είχαν το πρόβλημα δεν μπόρεσαν πάλι να κάνουν boot (connection time out) με το cd και αφού δοκίμασα 2-3 φορές είπα να ξαναδοκιμάσω με το gpxe το οποίο το είχα εγκαταστήσει όπως είπα σε προηγούμενο μήνυμα από τα windows. Ε λοιπόν αυτή τη φορά έκαναν κανονικά boot! Μου φάνηκε περίεργο και το ξαναδοκίμασα (έκανα restart και άφησα πάλι να φορτώσει το gpxe) και δούλεψαν και πάλι.

Αργότερα άνοιξα όλους τους Η/Υ του εργαστηρίου (και μαζί και αυτούς που είχαν πρόβλημα) και άφησα να φορτώσουν τα windows για να κάνω κάποιες αναβαθμίσεις και εκεί. Αφού τελείωσα ξαναδοκίμασα να κάνω network boot και πάλι οι 3 Η/Υ που είχαν αρχικά το πρόβλημα δεν κατάφεραν να φορτώσουν (connection time out)!

Έκανα πάλι την ίδια διαδικασία (πρώτα το ipxe iso από το οποίο δεν καταφέρνουν να bootάρουν και μετά με το gpxe) και τότε πάλι δούλεψαν μια χαρά!

Ύστερα από πολλές δοκιμές διαπιστώνω το εξής με τους 3 συγκεκριμένους Η/Υ: Στην περίπτωση που κάνουν boot με windows μετά χρειάζεται να δοκιμάσω μια φορά με το ipxe (που δεν θα bootάρει) και μετά δουλεύουν μια χαρά με το gpxe!

Ομολογώ ότι είμαι λίγο μπερδεμένος...


apapakL

#10
Δεν ξέρω αν έχει κάποια σχέση αλλά, κοίτα αν στις ρυθμίσεις των καρτών δικτύου έχουν δηλωθεί χειροκίνητα φυσικές δ/νσεις ( mac addresses) από τα windows...
Είχα παρόμοιο πρόβλημα με μια χειροκίνητη mac address δ/νση στη κάρτα δικτύου που είχα δηλώσει μέσα από τα windows... Βέβαια δήλωσα χειροκίνητα την ίδια με την mac του διπλανού Η/Υ  :o. Έτσι στην επόμενη επανεκκίνηση ως LTSP client φόρτωνε όποιος άνοιγε πρώτος... :o... Άρα κάτι πρέπει να cashάρεται στο switch ή στο router...

Δημήτρης Δαλαγιώργος

Παράθεση από: alkisg στις 02 Φεβ 2011, 10:52:01 ΠΜ
Από τον server σου, ανέβασε το αποτέλεσμα των παρακάτω εντολών:
ip -oneline -family inet addr show
cat /etc/dnsmasq.d/ltsp.conf
grep dnsmasq /var/log/daemon.log | tail -n 50


Έχουμε και λέμε λοιπόν:
localadm@server:~$ ip -oneline -family inet addr show
1: lo    inet 127.0.0.1/8 scope host lo
2: eth0    inet 10.143.78.134/24 brd 10.143.78.255 scope global eth0


Ενάντια στην ηλιθιότητα, ακόμα και οι θεοί, μάταια αγωνίζονται.
Friedrich Schiller

alkisg

Παράθεση από: ioarvanit στις 14 Φεβ 2011, 06:39:08 ΜΜ
Ύστερα από πολλές δοκιμές διαπιστώνω το εξής με τους 3 συγκεκριμένους Η/Υ: Στην περίπτωση που κάνουν boot με windows μετά χρειάζεται να δοκιμάσω μια φορά με το ipxe (που δεν θα bootάρει) και μετά δουλεύουν μια χαρά με το gpxe!

Επομένως και γι' αυτές τις κάρτες μόνο, στο gPXE κάτι δεν αρχικοποιείται σωστά, ενώ στο iPXE κάτι άλλο δεν δουλεύει. Για σωστή λύση, θα χρειαστεί να επικοινωνήσεις με τους developers είτε στο irc είτε καλύτερ στην mailing list.

Εναλλακτικά δοκίμασε τη μέθοδο που πρότεινα παραπάνω, που δεν χρειάζεται DHCP server:
https://alkisg.mysch.gr/steki/index.php?topic=1451.msg24373#msg24373

alkisg

Παράθεση από: Δημήτρης Δαλαγιώργος στις 21 Φεβ 2011, 03:15:22 ΜΜ
Έχουμε και λέμε λοιπόν:
localadm@server:~$ ip -oneline -family inet addr show
1: lo    inet 127.0.0.1/8 scope host lo
2: eth0    inet 10.143.78.134/24 brd 10.143.78.255 scope global eth0


Από το daemon.log.txt φαίνεται να δουλεύει κανονικά ο dnsmasq, οπότε δεν βλέπω γιατί να μην παίρνει το boot filename ο client.
Δοκίμασε κι εσύ με τη μέθοδο που πρότεινα παραπάνω που δεν χρειάζεται proxy DHCP server:
https://alkisg.mysch.gr/steki/index.php?topic=1451.msg24373#msg24373

Δηλαδή από το rom-o-matic φτιάχνετε ένα customized gpxe.lkrn και κάνετε με αυτό overwrite το αρχείο C:\win32-loader\pxe.lkrn στους clients.

exanemou

στο εργαστηριο με fat 1gbit και 16θυρο 1000αρι switch και server με μια καρτα δικτυου  παρατηρηθηκαν τα εξης




  • σε fat με διαφορετική καρτα δικτυου απο τους υπολοιπους fat οταν προσπαθει να εκκινησει απο το δικτυο στην οθονη αναφερονται τα εξης:

    gpxe 1.0.0  open source boot firmware- http:etherboot.org
    features:AoE HTTP SCSI DnS TFTP bzimage comboot ELF MULTIBOOT PXE PXEXT
    No more network device
    Reboot and select proper boot device or insert boot media in selected Boot device and press a key


    αν πατησω καποιο  πληκτρο ο fat πηγαινει στον πινακα επιλογης λειτουργικου και αν επιλεξω UBUNTU (εχω κανει και αυτονομη εγκτατσταση UBUNTU ) μπορω να μπω στο INTERNET (αρα δεν φταιει καλωδιο ή μπριζα ,σωστα;)




  • σε δυο fat με διαφορετικη καρτα δικτυου απο τον προηγουμενο,  για τους οποιους αναφερθηκα σε αλλο θεμα  https://alkisg.mysch.gr/steki/index.php?topic=3684.msg37569#msg37569  υπαρχουν φορες που εμφανιζεται το ιδιο παραπανω μηνυμα και τοτε τους τερματιζω ,κλεινω το διακοπτη ON/OFF και το προβλημα επιλυεται .
    Με τον προηγουμενο fat η μεθοδος αυτη δεν τελεσφορησε.
    Υπαρχει καποια λυση και για αυτους τους δυο ή πρεπει να εφαρμοζω την ιδια μεθοδο οποτε εμφανίζεται το προβλημα;




  • εμφανιστηκε σε δυο Η/Υ  στην οθονη συνδεσης στο δικτυο,  πολυ γρηγορο αναβοσβησμα της οθονης το οποιο επιλυθηκε με επανεκκινηση και εκτοτε δεν επανεμφανιστηκε .Που οφειλεται; σε ρυθμιση οθονης, καρτας ή κατι άλλο;