edit 09/08/2008: Και τα τρία βιβλία ανανεώθηκαν. Όλα πλέον φαίνονται 100% ΟΚ, μόνο λίγες επικεφαλίδες του τετραδίου μαθητή και του βιβλίου καθηγητή φαίνονται μεν σωστά αλλά δεν αντιγράφονται σωστά επειδή μου έλειπαν κάποιες γραμματοσειρές.
Μαθαίνοντας το νέο λειτουργικό μου (Ubuntu 8.04.1), έπεσα πάνω σε μια εντολή η οποία επιτρέπει την αποσυμπίεση των .pdf αρχείων, ώστε να είναι δυνατή η μετέπειτα επεξεργασία τους από πρόγραμμα. Με την ευκαιρία λοιπόν αποφάσισα να φτιάξω ένα προγραμματάκι για να διορθώσω το γνωστό πρόβλημα των αρχείων .pdf της ΑΕΠΠ (από το Παιδαγωγικό Ινστιτούτο), τα οποία σε κάμποσα σημεία δεν δείχνουν ελληνικά, αλλά και στα σημεία που δείχνουν ελληνικά δεν γίνεται σωστά αντιγραφή / επικόλληση, ούτε αναζήτηση.
Συγκεκριμένα τα .pdf των βιβλίων έχουν 3 (τουλάχιστον) προβλήματα:
1. Λάθος cmap που αντιστοιχεί σε cp1252 αντί για cp1253, και έτσι αν πάμε να αντιγράψουμε τη λέξη "Αλγόριθμοι" επικολλάται στη συνέχεια ως "Áëãüñéèìïé".
2. Λάθος Encoding σε Fonts (WinAnsiEncoding), το οποίο εκτός από το παραπάνω πρόβλημα κάνει και πολλά σημεία του βιβλίου να μην δείχνουν καν ελληνικά, όχι μόνο να μην αντιγράφονται.
3. Λάθος Differences σε Encoding, με αποτέλεσμα πάλι να μη γίνεται αντιγραφή ή αναζήτηση.
Τα πρώτα αποτελέσματα είναι ενθαρρυντικά. Εν ολίγοις, διόρθωσα το πρόβλημα (1) και νομίζω (αν δε βαρεθώ να ασχολούμαι μαζί τους στο μεταξύ) ότι μπορώ να διορθώσω και τα (2) και (3). Επομένως τώρα
το βιβλίο μαθητή είναι σε μεγάλο ποσοστό ΟΚ, και τα άλλα δύο σε μικρότερο ποσοστό.
Μην ψάχνετε "λογική" για το σε ποια σημεία είναι σωστά και σε ποια όχι, η (λάθος) κατανομή των encodings έγινε αυτοματοποιημένα από το πρόγραμμα που χρησιμοποίησαν για την παραγωγή των pdf. Έτσι μπορεί εγώ να έχω διορθώσει 900 από τα 1000 encodings και να έχω καλύψει μόνο το 10% του βιβλίου, ή αντίθετα.
Έδεσα και τα πολλά μικρά .pdf σε 3 μεγάλα, όποιος θέλει τα κατεβάζει, αλλά αν θέλετε
μην τα δημοσιεύετε σε άλλες ιστοσελίδες αλλά βάλτε σύνδεσμο σε αυτό το θέμα (
https://alkisg.mysch.gr/steki/index.php?topic=1436.0), ώστε να υπάρχει ανατροφοδότηση για πιθανά λάθη.