Αποστολέας Θέμα: Εύρεση Duplicates σε Word  (Αναγνώστηκε 1213 φορές)

nikolasmer

  • Ομάδα Νέου Λυκείου
  • *
  • Μηνύματα: 548
  • There can be only one...may it be AEPP.
Εύρεση Duplicates σε Word
« στις: 01 Σεπ 2015, 10:26:49 πμ »
Έχω αντιγράψει κάποιες ασκήσεις σε Word από διάφορες πηγές μαζικά και μάλλον υπάρχουν επαναλήψεις ίδιων ασκήσεων.
Μου είναι δύσκολο να τα κοιτάω ένα ένα από την Εύρεση.
Υπάρχει η δυνατότητα να βρεθούν τα Duplicates, παράγραφοι δηλαδή που είναι εντελώς ίδιοι, με τη μια και όχι ένα προς ένα;
Απ' τα τσακάλια δεν γλυτώνεις μ'ευχές ή παρακάλια
(Κ. Βάρναλης)

Μερεντίτης Νικόλαος
Καθηγητής Πληροφορικής - Φροντιστής

bugman

  • Δεινόσαυρος
  • *****
  • Μηνύματα: 393
  • The Bug Eater
    • Πληροφορική Προγραμματισμός
Απ: Εύρεση Duplicates σε Word
« Απάντηση #1 στις: 01 Σεπ 2015, 11:54:12 πμ »
Κάνε όλο το κείμενο έναν πίνακα ανά παράγραφο, κάνε ταξινόμηση και  θα δεις όμοιες παραγράφους. Κράτα σε διαφορετικό αρχείο το πίνακα και δουλειά με το χέρι...Διαφορετικά πρέπει να κάνεις εξαγωγή σε txt και εφαρμογή προγράμματος...Ο αλγόριθμος θα βρίσκει ίδια κομμάτια, τα κομμάτια θα επιλέγονται αρχικά ανά παράγραφο και όποτε βρίσκει ίδια θα κοιτάει την επόμενη....Σε κάθε περίπτωση κρατάς μια λίστα με κάθε εγγραφή ...αρχή τέλος, και στο τέλος βρίσκεις ποια εγγραφή υπάρχει σε κάποια άλλη.....και αφαιρούμε την μικρότερη. Στο τέλος θα έχεις μόνο τα μεγαλύτερα ...ενιαία τμήματα.(ενώ μικρά όπως λέξεις δεν θα περιλαμβάνονται, δεν είναι παράγραφοι. Όπως και μικρές επαναλήψεις, που μπορεί να υπάρχουν, αλλάρα τις αφήνουμε γιατί ανήκουν σε μεγάλες ομάδες.)

nikolasmer

  • Ομάδα Νέου Λυκείου
  • *
  • Μηνύματα: 548
  • There can be only one...may it be AEPP.
Απ: Εύρεση Duplicates σε Word
« Απάντηση #2 στις: 01 Σεπ 2015, 12:23:24 μμ »
Είναι και αυτό μανίκι τώρα για μένα. Για 150 περίπου σελίδες...
Respect bugman. Πολύ καλή ιδέα.
Αναρωτιέμαι αν τοποθετήσω σε πίνακα (sic) μονοδιάστατο,κάθε εκφώνηση άσκησης σε ενα κελί, φτιάχνοντας ένα κατάλληλο προγραμματάκι σε Γλώσσα θα δουλέψει ή θα κρασάρει το (παλιό μου καβουρδιστήρι) pc μου!!
Στο τέλος το προγραμματάκι θα επιστρέφει καινούριο πίνακα με μοναδικές τιμές, δηλαδή αυτό που ζητάω! :D ;D

Απ' τα τσακάλια δεν γλυτώνεις μ'ευχές ή παρακάλια
(Κ. Βάρναλης)

Μερεντίτης Νικόλαος
Καθηγητής Πληροφορικής - Φροντιστής

dpa2006

  • Δεινόσαυρος
  • *****
  • Μηνύματα: 624
Απ: Εύρεση Duplicates σε Word
« Απάντηση #3 στις: 01 Σεπ 2015, 08:02:44 μμ »
Έχω αντιγράψει κάποιες ασκήσεις σε Word από διάφορες πηγές μαζικά και μάλλον υπάρχουν επαναλήψεις ίδιων ασκήσεων.
Μου είναι δύσκολο να τα κοιτάω ένα ένα από την Εύρεση.
Υπάρχει η δυνατότητα να βρεθούν τα Duplicates, παράγραφοι δηλαδή που είναι εντελώς ίδιοι, με τη μια και όχι ένα προς ένα;
Ρίξε μια ματιά στο:
http://www.techandlife.com/2012/06/finding-duplicate-paragraphs-in-microsoft-word/
Computer science (abbreviated CS or CompSci) is the scientific and practical approach to computation and its applications. It is the systematic study of the feasibility, structure, expression, and mechanization of the methodical processes (or algorithms) that underlie the acquisition, representation, processing, storage, communication of, and access to information, whether such information is encoded in bits and bytes in a computer memory or transcribed engines and protein structures in a human cell.source:http://en.wikipedia.org/wiki/Computer_science

nikolasmer

  • Ομάδα Νέου Λυκείου
  • *
  • Μηνύματα: 548
  • There can be only one...may it be AEPP.
Απ: Εύρεση Duplicates σε Word
« Απάντηση #4 στις: 02 Σεπ 2015, 11:09:58 πμ »
Το είχα δει και εγώ αυτό το άρθρο.
Ρίξε μια ματιά στο:
http://www.techandlife.com/2012/06/finding-duplicate-paragraphs-in-microsoft-word/

Πολύ χρονοβόρα διαδικασία για καμιά 300 παραγράφους. Αργεί πολύ και μου κολλάει τον υπολογιστή!! Βέβαια έχω έναν επεξεργαστή Intel Celeron στα 2 GHz. :P....

Ποιος τα περνάει όλα αυτά σε ένα excelάκι τώρα...
Απ' τα τσακάλια δεν γλυτώνεις μ'ευχές ή παρακάλια
(Κ. Βάρναλης)

Μερεντίτης Νικόλαος
Καθηγητής Πληροφορικής - Φροντιστής

dpa2006

  • Δεινόσαυρος
  • *****
  • Μηνύματα: 624
Απ: Εύρεση Duplicates σε Word
« Απάντηση #5 στις: 03 Σεπ 2015, 04:49:50 μμ »
Το είχα δει και εγώ αυτό το άρθρο.
Πολύ χρονοβόρα διαδικασία για καμιά 300 παραγράφους. Αργεί πολύ και μου κολλάει τον υπολογιστή!! Βέβαια έχω έναν επεξεργαστή Intel Celeron στα 2 GHz. :P....

Ποιος τα περνάει όλα αυτά σε ένα excelάκι τώρα...

Ναι είναι αργή διαδικασία ειδικά αν έχεις παλαιό μηχάνημα.
Αν το έκανες μακροεντολή (VBA) και έτρεχε "μόνο" του;
Computer science (abbreviated CS or CompSci) is the scientific and practical approach to computation and its applications. It is the systematic study of the feasibility, structure, expression, and mechanization of the methodical processes (or algorithms) that underlie the acquisition, representation, processing, storage, communication of, and access to information, whether such information is encoded in bits and bytes in a computer memory or transcribed engines and protein structures in a human cell.source:http://en.wikipedia.org/wiki/Computer_science

itt

  • Δεινόσαυρος
  • *****
  • Μηνύματα: 428
  • Real stupidity beats ΑΙ any time
Απ: Εύρεση Duplicates σε Word
« Απάντηση #6 στις: 04 Σεπ 2015, 04:02:55 μμ »
http://thingiequery.com/

Bάλτα σε excel and have fun.

nikolasmer

  • Ομάδα Νέου Λυκείου
  • *
  • Μηνύματα: 548
  • There can be only one...may it be AEPP.
Απ: Εύρεση Duplicates σε Word
« Απάντηση #7 στις: 04 Σεπ 2015, 05:31:33 μμ »
http://thingiequery.com/

Bάλτα σε excel and have fun.
Αν και φαίνεται ωραίο εργαλείο δυστυχώς η εγκατάστασή του δεν ολοκληρώνεται ποτέ. Εδώ και μια ώρα περίπου προσπαθεί να εγκατασταθεί αλλά μάταια. Επιπλέον υπάρχουν ασκήσεις με κώδικα που έχω και δε νομίζω ότι στο excel θα μπορεί να γίνει σωστή δουλειά. Θα μου τα κάνει μαντάρα.
Περίεργο...Χρειάζομαι κουμπάκι "Find Duplicates" στον επεξεργαστή κειμένου μου!!!
Απ' τα τσακάλια δεν γλυτώνεις μ'ευχές ή παρακάλια
(Κ. Βάρναλης)

Μερεντίτης Νικόλαος
Καθηγητής Πληροφορικής - Φροντιστής

dpa2006

  • Δεινόσαυρος
  • *****
  • Μηνύματα: 624
Απ: Εύρεση Duplicates σε Word
« Απάντηση #8 στις: 05 Σεπ 2015, 02:37:55 μμ »
Αν και φαίνεται ωραίο εργαλείο δυστυχώς η εγκατάστασή του δεν ολοκληρώνεται ποτέ. Εδώ και μια ώρα περίπου προσπαθεί να εγκατασταθεί αλλά μάταια. Επιπλέον υπάρχουν ασκήσεις με κώδικα που έχω και δε νομίζω ότι στο excel θα μπορεί να γίνει σωστή δουλειά. Θα μου τα κάνει μαντάρα.
Περίεργο...Χρειάζομαι κουμπάκι "Find Duplicates" στον επεξεργαστή κειμένου μου!!!
Αν το φτιάξεις σε Macro και το αντιστοιχείσεις σε κουμπί;
VBA:
https://support.microsoft.com/en-us/kb/246299
Computer science (abbreviated CS or CompSci) is the scientific and practical approach to computation and its applications. It is the systematic study of the feasibility, structure, expression, and mechanization of the methodical processes (or algorithms) that underlie the acquisition, representation, processing, storage, communication of, and access to information, whether such information is encoded in bits and bytes in a computer memory or transcribed engines and protein structures in a human cell.source:http://en.wikipedia.org/wiki/Computer_science