Je hebt tekst uit een PDF nodig maar kunt deze niet selecteren of kopiëren. Misschien is de PDF een gescand document, misschien is de tekstselectie beperkt, of misschien wil je gewoon een schone platte-tekstversie. De PDF naar Tekst-tool extraheert elk woord uit je PDF in seconden.
Wat heb je nodig
- Een PDF-bestand met tekst die je wilt extraheren
- Een webbrowser
- Geen account of software te installeren
Stapsgewijze handleiding
Open de PDF naar Tekst-tool
Ga naar de PDF naar Tekst-tool. Deze draait volledig in je browser zonder enige configuratie.
Upload je PDF
Klik op het uploadgebied of sleep je PDF erin. De tool verwerkt het bestand en extraheert alle leesbare tekstinhoud.
Kopieer of download de geëxtraheerde tekst
De geëxtraheerde tekst verschijnt in een tekstveld. Je kunt specifieke secties selecteren en kopiëren, of de volledige tekst downloaden als bestand. De tekst is schoon en klaar om te plakken in elk document, e-mail of teksteditor.
Goed om te weten Alle tekstextractie vindt lokaal in je browser plaats. Je PDF wordt nooit naar een server gestuurd, waardoor gevoelige documenten privé blijven.
Met welk soort PDF's werkt dit?
Digitale (native) PDF's
PDF's gemaakt vanuit Word-documenten, webpagina's of elke applicatie die tekstgebaseerde PDF's genereert. Deze geven de beste resultaten omdat de tekst al als tekens in het bestand is opgeslagen.
Gescande PDF's
PDF's gemaakt van gescande papieren documenten zijn in feite afbeeldingen. Tekstextractie uit gescande PDF's hangt af van de OCR-capaciteit van de tool. Resultaten zijn over het algemeen goed voor schone scans met standaardlettertypen, maar handschrift en scans van zeer lage kwaliteit kunnen onvolledige resultaten opleveren.
Gemengde PDF's
Sommige PDF's bevatten een mix van digitale tekst en gescande afbeeldingen. De tool extraheert alle tekstdata die beschikbaar is in de bestandsstructuur.
Tip Voor de beste extractieresultaten uit gescande documenten, zorg dat de scan minimaal 300 DPI is en de tekst duidelijk leesbaar is. Scheve of onscherpe scans leveren uitvoer van lagere kwaliteit op.
Veelgebruikte toepassingen
- Tekst citeren in een e-mail of document: Extraheer de exacte bewoordingen uit een PDF-rapport of -artikel.
- Inhoud doorzoeken: Eenmaal geëxtraheerd kun je de zoekfunctie van je teksteditor gebruiken om specifieke passages te vinden.
- Gegevensinvoer: Haal tekst uit PDF-formulieren of facturen en zet deze in een spreadsheet.
- Toegankelijkheid: Converteer PDF-inhoud naar platte tekst voor schermlezers of tekst-naar-spraaktools.
- Vertaling: Extraheer tekst, plak het in een vertaaltool en vertaal de inhoud.
Tips voor schone resultaten
Controleer op regelafbrekingen: PDF-tekstextractie voegt soms regelafbrekingen in midden in zinnen omdat de originele PDF kolommen met vaste breedte gebruikt. Mogelijk moet je regelafbrekingen opschonen in je teksteditor.
Let op kop- en voetteksten: Herhaalde kop- en voetteksten en paginanummers uit de PDF verschijnen in de geëxtraheerde tekst. Verwijder ze handmatig als ze het resultaat rommelig maken.
Tabellen kunnen hun structuur verliezen: Tekst in PDF-tabellen wordt van links naar rechts, van boven naar beneden geëxtraheerd. De kolomuitlijning wordt mogelijk niet behouden als platte tekst. Voor tabelgegevens moet je deze mogelijk handmatig reorganiseren in een spreadsheet.
Belangrijk Als de PDF met een wachtwoord is beveiligd en kopiëren beperkt, kan de tool de tekst mogelijk niet extraheren. Je zou eerst de PDF-beperking moeten verwijderen.
Veelgestelde vragen
Kan ik tekst uit alleen bepaalde pagina's extraheren? De tool extraheert tekst uit het hele document. Als je alleen tekst van specifieke pagina's nodig hebt, gebruik dan eerst de PDF Pagina Verwijderen-tool om de gewenste pagina's te isoleren, en extraheer dan tekst uit het bijgesneden bestand.
Wordt de opmaak overgenomen? De uitvoer is platte tekst. Vet, cursief, kleuren en lay-out worden niet behouden. Je krijgt de ruwe woorden en alinea's.
Kan ik tekst uit een afbeeldingsbestand extraheren? Deze tool werkt met PDF-bestanden. Voor het extraheren van tekst uit losse afbeeldingen (JPG, PNG) heb je een speciale OCR-tool nodig.
Volgende stappen
Nu je de tekst hebt, wil je misschien teruggaan naar de originele PDF en onnodige pagina's verwijderen, deze comprimeren, of de metadata opschonen voor het delen.