Potřebujete text z PDF, ale nelze ho vybrat ani zkopírovat. Možná je PDF naskenovaný dokument, možná je výběr textu omezen, nebo chcete jen čistou verzi v prostém textu. Nástroj PDF na Text extrahuje každé slovo z PDF během sekund.
Co budete potřebovat
- Soubor PDF obsahující text, který chcete extrahovat
- Webový prohlížeč
- Není třeba účet ani instalace softwaru
Návod krok za krokem
Otevřete nástroj PDF na Text
Přejděte na nástroj PDF na Text. Funguje výhradně ve vašem prohlížeči bez jakéhokoli nastavení.
Nahrajte PDF
Klikněte na oblast nahrávání nebo přetáhněte PDF. Nástroj soubor zpracuje a extrahuje veškerý čitelný textový obsah.
Zkopírujte nebo stáhněte extrahovaný text
Extrahovaný text se zobrazí v textové oblasti. Můžete vybrat a zkopírovat konkrétní části nebo stáhnout celý text jako soubor. Text je čistý a připravený ke vložení do libovolného dokumentu, e-mailu nebo editoru.
Dobré vědět Veškerá extrakce textu probíhá lokálně ve vašem prohlížeči. Vaše PDF se nikdy neodesílá na žádný server, takže citlivé dokumenty zůstávají soukromé.
S jakými PDF to funguje?
Digitální (nativní) PDF
PDF vytvořené z dokumentů Word, webových stránek nebo jakékoli aplikace, která generuje textová PDF. Ty dávají nejlepší výsledky, protože text je již uložen jako znaky v souboru.
Naskenovaná PDF
PDF vytvořené z naskenovaných papírových dokumentů jsou v podstatě obrázky. Extrakce textu z naskenovaných PDF závisí na schopnosti OCR nástroje. Výsledky jsou obecně dobré pro čisté skeny se standardními fonty, ale ručně psaný text a velmi nekvalitní skeny mohou přinést neúplné výsledky.
Smíšená PDF
Některá PDF obsahují kombinaci digitálního textu a naskenovaných obrázků. Nástroj extrahuje veškerá textová data dostupná ve struktuře souboru.
Tip Pro nejlepší výsledky extrakce z naskenovaných dokumentů se ujistěte, že sken má alespoň 300 DPI a text je jasně čitelný. Zkosené nebo rozmazané skeny produkují nižší kvalitu výstupu.
Běžné způsoby použití
- Citování textu v e-mailu nebo dokumentu: Extrahujte přesné znění z PDF reportu nebo článku.
- Prohledávání obsahu: Po extrakci můžete pomocí funkce hledání v textovém editoru najít konkrétní pasáže.
- Zadávání dat: Přeneste text z PDF formulářů nebo faktur do tabulky.
- Přístupnost: Převeďte obsah PDF do prostého textu pro čtečky obrazovky nebo nástroje převodu textu na řeč.
- Překlad: Extrahujte text, vložte ho do překladačového nástroje a přeložte obsah.
Tipy pro čisté výsledky
Zkontrolujte zalomení řádků: Extrakce textu z PDF někdy vkládá zalomení řádků uprostřed vět, protože původní PDF používá sloupce s pevnou šířkou. Možná bude třeba zalomení řádků v textovém editoru vyčistit.
Dávejte pozor na záhlaví a zápatí: Opakující se záhlaví, zápatí a čísla stránek z PDF se zobrazí v extrahovaném textu. Pokud zahlcují výsledek, odstraňte je ručně.
Tabulky mohou ztratit strukturu: Text v PDF tabulkách se extrahuje zleva doprava, shora dolů. Zarovnání sloupců nemusí být zachováno jako prostý text. Pro tabulková data může být nutné ho ručně reorganizovat v tabulce.
Důležité Pokud je PDF chráněné heslem a omezuje kopírování, nástroj nemusí být schopen text extrahovat. Nejprve budete muset odstranit omezení PDF.
Časté otázky
Mohu extrahovat text jen z určitých stránek? Nástroj extrahuje text z celého dokumentu. Pokud potřebujete text jen z konkrétních stránek, nejprve použijte nástroj Mazání stránek PDF pro izolaci požadovaných stránek a pak extrahujte text z ořezaného souboru.
Zachová se formátování? Výstup je prostý text. Tučné písmo, kurzíva, barvy a rozvržení se nezachová. Dostanete surová slova a odstavce.
Mohu extrahovat text z obrazového souboru? Tento nástroj pracuje se soubory PDF. Pro extrakci textu ze samostatných obrázků (JPG, PNG) byste potřebovali speciální nástroj OCR.
Další kroky
Nyní, když máte text, možná se budete chtít vrátit k původnímu PDF a odstranit nepotřebné stránky, komprimovat ho nebo vyčistit jeho metadata před sdílením.