Du behöver texten från en PDF men kan inte markera eller kopiera den. Kanske är PDF:en ett skannat dokument, kanske är textmarkering begränsad, eller kanske vill du bara ha en ren klartext-version. Verktyget PDF till text extraherar varje ord från din PDF på sekunder.
Vad du behöver
- En PDF-fil som innehåller text du vill extrahera
- En webbläsare
- Inget konto eller programvara att installera
Steg-för-steg-guide
Öppna verktyget PDF till text
Gå till PDF till text-verktyget. Det körs helt i webbläsaren utan något konfigurationsbehov.
Ladda upp din PDF
Klicka på uppladdningsområdet eller dra och släpp din PDF. Verktyget bearbetar filen och extraherar allt läsbart textinnehåll.
Kopiera eller ladda ner den extraherade texten
Den extraherade texten visas i ett textfält. Du kan markera och kopiera specifika avsnitt, eller ladda ner all text som en fil. Texten är ren och redo att klistras in i vilket dokument, e-post eller redigerare som helst.
Bra att veta All textextrahering sker lokalt i webbläsaren. Din PDF skickas aldrig till någon server, så känsliga dokument förblir privata.
Vilka typer av PDF:er fungerar med detta?
Digitala (ursprungliga) PDF:er
PDF:er skapade från Word-dokument, webbsidor eller valfri applikation som genererar textbaserade PDF:er. Dessa ger bäst resultat eftersom texten redan lagras som tecken i filen.
Skannade PDF:er
PDF:er gjorda av skannade pappersdokument är i grunden bilder. Textextrahering från skannade PDF:er beror på verktygets OCR-förmåga. Resultaten är generellt bra för rena skanningar med standardteckensnitt, men handskrift och skanningar av mycket låg kvalitet kan ge ofullständiga resultat.
Blandade PDF:er
Vissa PDF:er innehåller en blandning av digital text och skannade bilder. Verktyget extraherar den textdata som finns tillgänglig i filstrukturen.
Tips För bästa extraktionsresultat från skannade dokument, se till att skanningen är minst 300 DPI och att texten är tydligt läsbar. Lutade eller suddiga skanningar ger lägre kvalitet på utdata.
Vanliga användningsfall
- Citera text i ett e-postmeddelande eller dokument: Extrahera den exakta formuleringen från en PDF-rapport eller artikel.
- Söka i innehåll: När texten är extraherad kan du använda din textredigerares sökfunktion för att hitta specifika passager.
- Datainmatning: Hämta text från PDF-formulär eller fakturor till ett kalkylblad.
- Tillgänglighet: Konvertera PDF-innehåll till klartext för skärmläsare eller text-till-tal-verktyg.
- Översättning: Extrahera text, klistra in den i ett översättningsverktyg och översätt innehållet.
Tips för rena resultat
Kontrollera radbrytningar: PDF-textextrahering infogar ibland radbrytningar mitt i meningar eftersom original-PDF:en använder fastbreddkolumner. Du kan behöva rensa upp radbrytningar i din textredigerare.
Uppmärksamma sidhuvuden och sidfötter: Upprepade sidhuvuden, sidfötter och sidnummer från PDF:en visas i den extraherade texten. Ta bort dem manuellt om de gör resultatet rörigt.
Tabeller kan förlora strukturen: Text i PDF-tabeller extraheras från vänster till höger, uppifrån och ner. Kolumnalignering bevaras kanske inte som klartext. För tabelldata kan du behöva organisera om det manuellt i ett kalkylblad.
Viktigt Om PDF:en är lösenordsskyddad och begränsar kopiering kanske verktyget inte kan extrahera texten. Du behöver ta bort PDF-begränsningen först.
Vanliga frågor
Kan jag extrahera text från bara vissa sidor? Verktyget extraherar text från hela dokumentet. Om du bara behöver text från specifika sidor, använd verktyget PDF Sidradering först för att isolera de sidor du vill ha, och extrahera sedan text från den beskurna filen.
Bevaras formateringen? Utdata är klartext. Fet stil, kursiv, färger och layout bevaras inte. Du får de råa orden och styckena.
Kan jag extrahera text från en bildfil? Det här verktyget fungerar med PDF-filer. För att extrahera text från fristående bilder (JPG, PNG) behöver du ett dedikerat OCR-verktyg.
Nästa steg
Nu när du har texten kanske du vill gå tillbaka till original-PDF:en och ta bort onödiga sidor, komprimera den eller rensa dess metadata innan du delar.