Γενικό Λύκειο > Γ΄ Λυκείου

Βιβλία ΑΕΠΠ (pdf) - διορθωμένα για αντιγραφή/αναζήτηση

(1/6) > >>

alkisg:
edit 09/08/2008: Και τα τρία βιβλία ανανεώθηκαν. Όλα πλέον φαίνονται 100% ΟΚ, μόνο λίγες επικεφαλίδες του τετραδίου μαθητή και του βιβλίου καθηγητή φαίνονται μεν σωστά αλλά δεν αντιγράφονται σωστά επειδή μου έλειπαν κάποιες γραμματοσειρές.

Μαθαίνοντας το νέο λειτουργικό μου (Ubuntu 8.04.1), έπεσα πάνω σε μια εντολή η οποία επιτρέπει την αποσυμπίεση των .pdf αρχείων, ώστε να είναι δυνατή η μετέπειτα επεξεργασία τους από πρόγραμμα. Με την ευκαιρία λοιπόν αποφάσισα να φτιάξω ένα προγραμματάκι για να διορθώσω το γνωστό πρόβλημα των αρχείων .pdf της ΑΕΠΠ (από το Παιδαγωγικό Ινστιτούτο), τα οποία σε κάμποσα σημεία δεν δείχνουν ελληνικά, αλλά και στα σημεία που δείχνουν ελληνικά δεν γίνεται σωστά αντιγραφή / επικόλληση, ούτε αναζήτηση.

Συγκεκριμένα τα .pdf των βιβλίων έχουν 3 (τουλάχιστον) προβλήματα:
1. Λάθος cmap που αντιστοιχεί σε cp1252 αντί για cp1253, και έτσι αν πάμε να αντιγράψουμε τη λέξη "Αλγόριθμοι" επικολλάται στη συνέχεια ως "Áëãüñéèìïé".
2. Λάθος Encoding σε Fonts (WinAnsiEncoding), το οποίο εκτός από το παραπάνω πρόβλημα κάνει και πολλά σημεία του βιβλίου να μην δείχνουν καν ελληνικά, όχι μόνο να μην αντιγράφονται.
3. Λάθος Differences σε Encoding, με αποτέλεσμα πάλι να μη γίνεται αντιγραφή ή αναζήτηση.

Τα πρώτα αποτελέσματα είναι ενθαρρυντικά. Εν ολίγοις, διόρθωσα το πρόβλημα (1) και νομίζω (αν δε βαρεθώ να ασχολούμαι μαζί τους στο μεταξύ) ότι μπορώ να διορθώσω και τα (2) και (3). Επομένως τώρα το βιβλίο μαθητή είναι σε μεγάλο ποσοστό ΟΚ, και τα άλλα δύο σε μικρότερο ποσοστό.
Μην ψάχνετε "λογική" για το σε ποια σημεία είναι σωστά και σε ποια όχι, η (λάθος) κατανομή των encodings έγινε αυτοματοποιημένα από το πρόγραμμα που χρησιμοποίησαν για την παραγωγή των pdf. Έτσι μπορεί εγώ να έχω διορθώσει 900 από τα 1000 encodings και να έχω καλύψει μόνο το 10% του βιβλίου, ή αντίθετα.

Έδεσα και τα πολλά μικρά .pdf σε 3 μεγάλα, όποιος θέλει τα κατεβάζει, αλλά αν θέλετε μην τα δημοσιεύετε σε άλλες ιστοσελίδες αλλά βάλτε σύνδεσμο σε αυτό το θέμα (https://alkisg.mysch.gr/steki/index.php?topic=1436.0), ώστε να υπάρχει ανατροφοδότηση για πιθανά λάθη.

alkisg:
Και για του λόγου το αληθές, μερικά παραδείγματα αντιγραφής / επικόλλησης από τα διορθωμένα βιβλία:

Σελίδα 211 Βιβλίου Μαθητή:

--- Παράθεση ---Η συνάρτηση είναι ένας τύπος υποπρογράμματος που υπολογίζει και ε-
πιστρέφει μόνο μία τιμή με το όνομά της (όπως οι μαθηματικές συναρτή-
σεις).
Η διαδικασία είναι ένας τύπος υποπρογράμματος που μπορεί να εκτε-
λεί όλες τις λειτουργίες ενός προγράμματος.
--- Τέλος παράθεσης ---

Σελίδα 113 Τετραδίου Μαθητή:

--- Παράθεση ---11.1. Προσδοκώμενα αποτελέσματα
  Μέχρι τώρα είχες εργαστεί σε ένα παραδοσιακό περιβάλλον προγραμματισμού,
που κυρίως ενδιαφέρεται για το πρόγραμμα και όχι για το περιβάλλον εργασίας του
χρήστη. Σε αυτό το κεφάλαιο έρχεσαι σε επαφή με σύγχρονα γραφικά περιβάλλοντα
προγραμματισμού που παρέχουν ιδιαίτερες δυνατότητες επικοινωνίας του προ-
γράμματος με το χρήστη αλλά και ειδικά εργαλεία προς το προγραμματιστή για την α-
πλούστευση του προγραμματισμού.

--- Τέλος παράθεσης ---

Σελίδα 175 Βιβλίου Καθηγητή:

--- Παράθεση ---ΔΤ2.
Α.
ΑΝ Βαθμός>ΜΟ ΤΟΤΕ
   ΓΡΑΨΕ ‘Πολύ καλά’
ΑΛΛΙΩΣ_ΑΝ Βαθμός>=(ΜΟ-2) ΤΟΤΕ
   ΓΡΑΨΕ ‘Καλά’
ΑΛΛΙΩΣ
   ΓΡΑΨΕ ‘Μέτρια’
ΤΕΛΟΣ_ΑΝ

--- Τέλος παράθεσης ---

alkisg:
Το pdf του βιβλίου μαθητή ανανεώθηκε, το έλεγξα και εμφανίζει παντού σωστά ελληνικά, και επιτρέπει αναζήτηση και αντιγραφή. Επομένως εκτός απροόπτου είναι πλέον τελική έκδοση, αν δείτε κάπου λάθος πείτε μου.

Λήψη από το αρχικό μήνυμα.

EleniK:
Άλκη μεγάλη υπόθεση αυτό που έκανες και ειδικά για νέους συναδέλφους που δεν βρίσκουν πουθενά το βιβλίο του καθηγητή. Ευχαριστουμε πολύ.

alkisg:
Να 'σαι καλά Ελένη! :)

Να 'ναι καλά κι η Python, με τη βοήθειά της μπόρεσα να διορθώσω και τα υπόλοιπα προβλήματα. Τώρα πλέον και τα 3 βιβλία είναι εντάξει, και άφησα μόνο λίγες επικεφαλίδες από το τετράδιο μαθητή και το βιβλίο καθηγητή, οι οποίες φαίνονται κι αυτές μεν εντάξει αλλά δεν αντιγράφονται σωστά με copy/paste.
Άμα κάποιος έχει τις γραμματοσειρές UB-AntiqueOlive, UB-AntiqueOliveBlack, UB-Helvetica και MgQuad, ας μου τις στείλει για να τις διορθώσω κι αυτές, δεν τις έχω και δεν μπορώ να τις κάνω embed. Δεν υπάρχει ζήτημα νομιμότητας αφού είναι ήδη ενσωματωμένες στα βιβλία, απλά έχει γίνει λάθος subsetting. Είπα να μην τις αντικαταστήσω με άλλες open source γραμματοσειρές αφού το πρόβλημα είναι μόνο σε επικεφαλίδες, οπότε προτίμησα να φαίνονται όπως στο τυπωμένο βιβλίο κι ας μην αντιγράφονται με copy/paste...

Λήψη από το αρχικό μήνυμα.

Πλοήγηση

[0] Λίστα μηνυμάτων

[#] Επόμενη σελίδα

Μετάβαση στην πλήρη έκδοση