Χρειάζεστε το κείμενο από ένα PDF αλλά δεν μπορείτε να το επιλέξετε ή να το αντιγράψετε. Ίσως το PDF είναι σαρωμένο έγγραφο, ίσως η επιλογή κειμένου είναι περιορισμένη, ή ίσως θέλετε απλώς μια καθαρή εκδοχή σε απλό κείμενο. Το εργαλείο PDF to Text εξάγει κάθε λέξη από το PDF σας σε δευτερόλεπτα.
Τι χρειάζεστε
- Ένα αρχείο PDF που περιέχει κείμενο που θέλετε να εξαγάγετε
- Ένα πρόγραμμα περιήγησης
- Δεν απαιτείται λογαριασμός ή λογισμικό
Οδηγός βήμα προς βήμα
Ανοίξτε το εργαλείο PDF to Text
Μεταβείτε στο εργαλείο PDF to Text. Εκτελείται εξ ολοκλήρου στο πρόγραμμα περιήγησής σας χωρίς καμία ρύθμιση.
Μεταφορτώστε το PDF σας
Κάντε κλικ στην περιοχή μεταφόρτωσης ή σύρετε και αποθέστε το PDF. Το εργαλείο θα επεξεργαστεί το αρχείο και θα εξαγάγει όλο το αναγνώσιμο περιεχόμενο κειμένου.
Αντιγράψτε ή κατεβάστε το εξαχθέν κείμενο
Το εξαχθέν κείμενο εμφανίζεται σε περιοχή κειμένου. Μπορείτε να επιλέξετε και να αντιγράψετε συγκεκριμένες ενότητες ή να κατεβάσετε ολόκληρο το κείμενο ως αρχείο. Το κείμενο είναι καθαρό και έτοιμο για επικόλληση σε οποιοδήποτε έγγραφο, email ή πρόγραμμα επεξεργασίας.
Καλό να ξέρετε Όλη η εξαγωγή κειμένου γίνεται τοπικά στο πρόγραμμα περιήγησής σας. Το PDF σας δεν αποστέλλεται ποτέ σε κανένα διακομιστή, οπότε τα ευαίσθητα έγγραφα παραμένουν ιδιωτικά.
Με τι είδους PDF λειτουργεί αυτό;
Ψηφιακά (native) PDF
PDF που δημιουργήθηκαν από έγγραφα Word, ιστοσελίδες ή οποιαδήποτε εφαρμογή που παράγει PDF βασισμένα σε κείμενο. Αυτά δίνουν τα καλύτερα αποτελέσματα επειδή το κείμενο αποθηκεύεται ήδη ως χαρακτήρες στο αρχείο.
Σαρωμένα PDF
PDF φτιαγμένα από σαρωμένα χάρτινα έγγραφα είναι ουσιαστικά εικόνες. Η εξαγωγή κειμένου από σαρωμένα PDF εξαρτάται από την ικανότητα OCR του εργαλείου. Τα αποτελέσματα είναι γενικά καλά για καθαρές σαρώσεις με τυπικές γραμματοσειρές, αλλά χειρόγραφα και σαρώσεις πολύ χαμηλής ποιότητας ενδέχεται να παράγουν ελλιπή αποτελέσματα.
Μεικτά PDF
Ορισμένα PDF περιέχουν μείγμα ψηφιακού κειμένου και σαρωμένων εικόνων. Το εργαλείο εξάγει οποιαδήποτε δεδομένα κειμένου είναι διαθέσιμα στη δομή του αρχείου.
Συμβουλή Για τα καλύτερα αποτελέσματα εξαγωγής από σαρωμένα έγγραφα, βεβαιωθείτε ότι η σάρωση είναι τουλάχιστον 300 DPI και το κείμενο είναι καθαρά ευανάγνωστο. Οι λοξές ή θολές σαρώσεις παράγουν χαμηλότερη ποιότητα εξόδου.
Συνηθισμένες περιπτώσεις χρήσης
- Παράθεση κειμένου σε email ή έγγραφο: Εξαγωγή ακριβούς διατύπωσης από αναφορά ή άρθρο PDF.
- Αναζήτηση περιεχομένου: Μόλις εξαχθεί, μπορείτε να χρησιμοποιήσετε τη λειτουργία αναζήτησης του προγράμματος επεξεργασίας κειμένου για εύρεση συγκεκριμένων αποσπασμάτων.
- Εισαγωγή δεδομένων: Εξαγωγή κειμένου από φόρμες PDF ή τιμολόγια σε υπολογιστικό φύλλο.
- Προσβασιμότητα: Μετατροπή περιεχομένου PDF σε απλό κείμενο για screen readers ή εργαλεία text-to-speech.
- Μετάφραση: Εξαγωγή κειμένου, επικόλληση σε εργαλείο μετάφρασης και μετάφραση του περιεχομένου.
Συμβουλές για καθαρά αποτελέσματα
Ελέγξτε για αλλαγές γραμμής: Η εξαγωγή κειμένου PDF εισάγει μερικές φορές αλλαγές γραμμής στη μέση προτάσεων επειδή το αρχικό PDF χρησιμοποιεί στήλες σταθερού πλάτους. Ενδέχεται να χρειαστεί να καθαρίσετε τις αλλαγές γραμμής στο πρόγραμμα επεξεργασίας κειμένου.
Προσέξτε κεφαλίδες και υποσέλιδα: Επαναλαμβανόμενες κεφαλίδες, υποσέλιδα και αριθμοί σελίδων από το PDF θα εμφανιστούν στο εξαχθέν κείμενο. Διαγράψτε τα χειροκίνητα αν γεμίζουν το αποτέλεσμα.
Οι πίνακες ενδέχεται να χάσουν δομή: Το κείμενο σε πίνακες PDF εξάγεται από αριστερά προς δεξιά, από πάνω προς τα κάτω. Η στοίχιση στήλης ενδέχεται να μην διατηρηθεί ως απλό κείμενο. Για δεδομένα πινάκων, ενδέχεται να χρειαστεί να τα αναδιοργανώσετε χειροκίνητα σε υπολογιστικό φύλλο.
Σημαντικό Αν το PDF είναι προστατευμένο με κωδικό και περιορίζει την αντιγραφή, το εργαλείο ενδέχεται να μη μπορεί να εξαγάγει το κείμενο. Θα χρειαστεί να αφαιρέσετε πρώτα τον περιορισμό PDF.
Συχνές ερωτήσεις
Μπορώ να εξαγάγω κείμενο μόνο από ορισμένες σελίδες; Το εργαλείο εξάγει κείμενο από ολόκληρο το έγγραφο. Αν χρειάζεστε κείμενο μόνο από συγκεκριμένες σελίδες, χρησιμοποιήστε πρώτα το εργαλείο PDF Page Delete για να απομονώσετε τις σελίδες που θέλετε, στη συνέχεια εξαγάγετε κείμενο από το κομμένο αρχείο.
Διατηρείται η μορφοποίηση; Η έξοδος είναι απλό κείμενο. Έντονη γραφή, πλάγια, χρώματα και διάταξη δεν διατηρούνται. Λαμβάνετε τις ακατέργαστες λέξεις και τις παραγράφους.
Μπορώ να εξαγάγω κείμενο από αρχείο εικόνας; Αυτό το εργαλείο λειτουργεί με αρχεία PDF. Για εξαγωγή κειμένου από αυτόνομες εικόνες (JPG, PNG), θα χρειαστείτε αποκλειστικό εργαλείο OCR.
Επόμενα βήματα
Τώρα που έχετε το κείμενο, μπορεί να θέλετε να επιστρέψετε στο αρχικό PDF και να αφαιρέσετε περιττές σελίδες, να το συμπιέσετε ή να καθαρίσετε τα μεταδεδομένα του πριν το μοιραστείτε.