Εύρεση Duplicates σε Word

Ξεκίνησε από nikolasmer, 01 Σεπ 2015, 10:26:49 ΠΜ

« προηγούμενο - επόμενο »

nikolasmer

Έχω αντιγράψει κάποιες ασκήσεις σε Word από διάφορες πηγές μαζικά και μάλλον υπάρχουν επαναλήψεις ίδιων ασκήσεων.
Μου είναι δύσκολο να τα κοιτάω ένα ένα από την Εύρεση.
Υπάρχει η δυνατότητα να βρεθούν τα Duplicates, παράγραφοι δηλαδή που είναι εντελώς ίδιοι, με τη μια και όχι ένα προς ένα;
Μερεντίτης Νικόλαος
Πληροφορικός

bugman

Κάνε όλο το κείμενο έναν πίνακα ανά παράγραφο, κάνε ταξινόμηση και  θα δεις όμοιες παραγράφους. Κράτα σε διαφορετικό αρχείο το πίνακα και δουλειά με το χέρι...Διαφορετικά πρέπει να κάνεις εξαγωγή σε txt και εφαρμογή προγράμματος...Ο αλγόριθμος θα βρίσκει ίδια κομμάτια, τα κομμάτια θα επιλέγονται αρχικά ανά παράγραφο και όποτε βρίσκει ίδια θα κοιτάει την επόμενη....Σε κάθε περίπτωση κρατάς μια λίστα με κάθε εγγραφή ...αρχή τέλος, και στο τέλος βρίσκεις ποια εγγραφή υπάρχει σε κάποια άλλη.....και αφαιρούμε την μικρότερη. Στο τέλος θα έχεις μόνο τα μεγαλύτερα ...ενιαία τμήματα.(ενώ μικρά όπως λέξεις δεν θα περιλαμβάνονται, δεν είναι παράγραφοι. Όπως και μικρές επαναλήψεις, που μπορεί να υπάρχουν, αλλάρα τις αφήνουμε γιατί ανήκουν σε μεγάλες ομάδες.)

nikolasmer

Είναι και αυτό μανίκι τώρα για μένα. Για 150 περίπου σελίδες...
Respect bugman. Πολύ καλή ιδέα.
Αναρωτιέμαι αν τοποθετήσω σε πίνακα (sic) μονοδιάστατο,κάθε εκφώνηση άσκησης σε ενα κελί, φτιάχνοντας ένα κατάλληλο προγραμματάκι σε Γλώσσα θα δουλέψει ή θα κρασάρει το (παλιό μου καβουρδιστήρι) pc μου!!
Στο τέλος το προγραμματάκι θα επιστρέφει καινούριο πίνακα με μοναδικές τιμές, δηλαδή αυτό που ζητάω! :D ;D

Μερεντίτης Νικόλαος
Πληροφορικός

dpa2006

Παράθεση από: nikolasmer στις 01 Σεπ 2015, 10:26:49 ΠΜ
Έχω αντιγράψει κάποιες ασκήσεις σε Word από διάφορες πηγές μαζικά και μάλλον υπάρχουν επαναλήψεις ίδιων ασκήσεων.
Μου είναι δύσκολο να τα κοιτάω ένα ένα από την Εύρεση.
Υπάρχει η δυνατότητα να βρεθούν τα Duplicates, παράγραφοι δηλαδή που είναι εντελώς ίδιοι, με τη μια και όχι ένα προς ένα;
Ρίξε μια ματιά στο:
http://www.techandlife.com/2012/06/finding-duplicate-paragraphs-in-microsoft-word/
Computer science (abbreviated CS or CompSci) is the scientific and practical approach to computation and its applications. It is the systematic study of the feasibility, structure, expression, and mechanization of the methodical processes (or algorithms) that underlie the acquisition, representation, processing, storage, communication of, and access to information, whether such information is encoded in bits and bytes in a computer memory or transcribed engines and protein structures in a human cell.source:http://en.wikipedia.org/wiki/Computer_science

nikolasmer

Το είχα δει και εγώ αυτό το άρθρο.
Παράθεση από: dpa2006 στις 01 Σεπ 2015, 08:02:44 ΜΜ
Ρίξε μια ματιά στο:
http://www.techandlife.com/2012/06/finding-duplicate-paragraphs-in-microsoft-word/

Πολύ χρονοβόρα διαδικασία για καμιά 300 παραγράφους. Αργεί πολύ και μου κολλάει τον υπολογιστή!! Βέβαια έχω έναν επεξεργαστή Intel Celeron στα 2 GHz. :P....

Ποιος τα περνάει όλα αυτά σε ένα excelάκι τώρα...
Μερεντίτης Νικόλαος
Πληροφορικός

dpa2006

Παράθεση από: nikolasmer στις 02 Σεπ 2015, 11:09:58 ΠΜ
Το είχα δει και εγώ αυτό το άρθρο.
Πολύ χρονοβόρα διαδικασία για καμιά 300 παραγράφους. Αργεί πολύ και μου κολλάει τον υπολογιστή!! Βέβαια έχω έναν επεξεργαστή Intel Celeron στα 2 GHz. :P....

Ποιος τα περνάει όλα αυτά σε ένα excelάκι τώρα...

Ναι είναι αργή διαδικασία ειδικά αν έχεις παλαιό μηχάνημα.
Αν το έκανες μακροεντολή (VBA) και έτρεχε "μόνο" του;
Computer science (abbreviated CS or CompSci) is the scientific and practical approach to computation and its applications. It is the systematic study of the feasibility, structure, expression, and mechanization of the methodical processes (or algorithms) that underlie the acquisition, representation, processing, storage, communication of, and access to information, whether such information is encoded in bits and bytes in a computer memory or transcribed engines and protein structures in a human cell.source:http://en.wikipedia.org/wiki/Computer_science

itt


nikolasmer

Παράθεση από: itt στις 04 Σεπ 2015, 04:02:55 ΜΜ
http://thingiequery.com/

Bάλτα σε excel and have fun.
Αν και φαίνεται ωραίο εργαλείο δυστυχώς η εγκατάστασή του δεν ολοκληρώνεται ποτέ. Εδώ και μια ώρα περίπου προσπαθεί να εγκατασταθεί αλλά μάταια. Επιπλέον υπάρχουν ασκήσεις με κώδικα που έχω και δε νομίζω ότι στο excel θα μπορεί να γίνει σωστή δουλειά. Θα μου τα κάνει μαντάρα.
Περίεργο...Χρειάζομαι κουμπάκι "Find Duplicates" στον επεξεργαστή κειμένου μου!!!
Μερεντίτης Νικόλαος
Πληροφορικός

dpa2006

Παράθεση από: nikolasmer στις 04 Σεπ 2015, 05:31:33 ΜΜ
Αν και φαίνεται ωραίο εργαλείο δυστυχώς η εγκατάστασή του δεν ολοκληρώνεται ποτέ. Εδώ και μια ώρα περίπου προσπαθεί να εγκατασταθεί αλλά μάταια. Επιπλέον υπάρχουν ασκήσεις με κώδικα που έχω και δε νομίζω ότι στο excel θα μπορεί να γίνει σωστή δουλειά. Θα μου τα κάνει μαντάρα.
Περίεργο...Χρειάζομαι κουμπάκι "Find Duplicates" στον επεξεργαστή κειμένου μου!!!
Αν το φτιάξεις σε Macro και το αντιστοιχείσεις σε κουμπί;
VBA:
https://support.microsoft.com/en-us/kb/246299
Computer science (abbreviated CS or CompSci) is the scientific and practical approach to computation and its applications. It is the systematic study of the feasibility, structure, expression, and mechanization of the methodical processes (or algorithms) that underlie the acquisition, representation, processing, storage, communication of, and access to information, whether such information is encoded in bits and bytes in a computer memory or transcribed engines and protein structures in a human cell.source:http://en.wikipedia.org/wiki/Computer_science