„Převést PDF do Wordu" je jedním z nejhledanějších dotazů na celém webu. Důvod je zřejmý: PDF jsou všude — smlouvy, zprávy, faktury, naskenované formuláře, životopisy — a v určitou chvíli potřebujete jedno změnit. Možná jste si všimli překlepu. Možná máte ve formuláři špatně jméno. Možná jste dostali šablonu, kterou je třeba vyplnit. Formát PDF byl navržen pro spolehlivé zobrazování, ne pro úpravy, takže přirozenou odpovědí je převést jej zpět na něco editovatelného.
Standardní odpovědí na otázku „jak to udělám?" byla flotila služeb typu nahrát-a-čekat: Smallpdf, iLovePDF, Adobe Acrobat Online, PDF2Doc a desítky klonů. Všechny fungují stejně: přetáhnete PDF, počkáte, až jej jejich server zpracuje, stáhnete .docx. Funguje to. Znamená to ale také, že váš dokument — ať obsahuje cokoli — leží na cizím serveru, krátce nebo i déle.
Existuje tišší alternativa, která se stala životaschopnou teprve nedávno: provést převod v prohlížeči, aniž by soubor opustil vaše zařízení. Tady je, jak to funguje a kdy to dává smysl.
Proč je PDF do Wordu těžší, než to vypadá
PDF je dokument s pevným rozložením. Každý glyf má explicitní souřadnice na stránce. V samotném souboru neexistuje pojem „odstavec" ani „nadpis" — jsou tu jen znaky na pozicích, někdy seskupené do řádků, někdy v tabulkách, někdy obtékající obrázky. Wordovský dokument je naopak dokument plynoucí: odstavce, nadpisy, seznamy, tabulky a styly, které si renderer může volně uspořádat.
Převést jedno do druhého je reverzní inženýrství. Nástroj se musí dívat na shluky znaků a hádat: je to nadpis, nebo jen tučné slovo? Je to odrážkový seznam, nebo tři řádky, které náhodou začínají tečkou? Má toto dvousloupcové rozložení význam, nebo je to jen vizuální zvláštnost? Jsou tyto zarovnané číslice tabulka, nebo jen čísla, která náhodou stojí v jedné řadě?
Kvalita převodu PDF do Wordu je kvalitou těchto odhadů. Některá PDF jsou snadná: čerstvě exportovaný wordovský dokument se vrátí do Wordu téměř dokonale. Jiná jsou těžká: naskenovaný formulář, vícesloupcové časopisové rozložení nebo dokument se složitými tabulkami otestuje jakýkoli nástroj, placený i bezplatný.
Dva druhy PDF, dva druhy převodu
Před výběrem nástroje pomáhá vědět, jaký druh PDF máte.
Textová PDF obsahují skutečný, prohledávatelný text — ten, který lze označit a zkopírovat. Většina PDF vytvořených z Wordu, Google Docs nebo webových stránek jsou textová PDF. Ta se převádějí čistě: proces čte text přímo, odvozuje strukturu a zapisuje wordovský dokument.
Naskenovaná PDF jsou v podstatě obrázky stránek. „Text", který vidíte, jsou jen pixely. Označte slovo a vyberete oblast obrazu, ne znaky. Tato vyžadují další krok zvaný OCR (Optical Character Recognition) k přečtení textu z pixelů, než může jakýkoli převod proběhnout. OCR přidá čas zpracování a občas zavede chyby — zaběhnuté „I" se může změnit v „1", „rn" se může změnit v „m".
Některé nástroje zvládnou oba případy transparentně. Jiné na naskenovaném případu selžou. Pokud váš převod vypadá špatně, zkontrolujte, zda můžete v původním PDF označovat text; pokud ne, potřebujete nástroj s OCR.
Co „Převést PDF do Wordu ve vašem prohlížeči" ve skutečnosti znamená
Konvertor PDF do Wordu zaměřený na soukromí spouští celý proces lokálně:
- Přetáhnete PDF. Prohlížeč přečte soubor jako bajty.
- Parser PDF extrahuje text + pozice. Knihovny jako pdf.js, běžící zcela v JavaScriptu a WebAssembly, dokážou parsovat PDF stránku po stránce a obnovit každý úsek textu s jeho fontem, velikostí a souřadnicemi.
- Heuristika rozložení rekonstruuje odstavce. Řádky, které sdílejí font, velikost a sloupcovou pozici, jsou seskupeny. Velký text se stává nadpisem; konzistentní odsazení se stává seznamem; zarovnané buňky se stávají tabulkou.
- Wordovský writer sestaví .docx. Knihovny jako docx.js generují platný wordovský soubor z rekonstruované struktury. Výstupem je skutečné .docx, které se otevře ve Wordu, LibreOffice, Google Docs nebo Pages.
To vše se děje ve vašem prohlížeči. Soubor nikdy neopustí vaše zařízení. Pro typické 10stránkové PDF zabere celý proces jednu až tři sekundy.
Srovnání, čeho se vzdáváte
Tady je upřímné srovnání tří běžných cest.
V prohlížeči, bez uploadu. Vaše soukromí je zachováno. Převod je rychlý na rozumném notebooku. Kvalita je konkurenceschopná u textových PDF a slušná u jednoduchých naskenovaných. Občas budete muset ručně doupravit tabulky nebo neobvyklá rozložení. Bez vodoznaků, bez denního limitu, bez čekání.
Bezplatné služby založené na uploadu. Kvalita je podobná. Váš dokument je vystaven na serveru třetí strany. Bezplatné úrovně obvykle omezují velikost souboru, denní počet, nebo obojí. Mnoho z nich přidá vodoznak nebo zápatí „powered by", pokud nezaplatíte. Doba čekání je především síťový round-trip, ne zpracování — vaše PDF je malé pro nahrání, ale vracející se .docx prochází frontou.
Samotný Microsoft Word. Word má zabudovanou funkci „Otevřít PDF", která převádí PDF na editovatelné wordovské dokumenty ve velmi dobré kvalitě. Vyžaduje licenci za 70-100 € nebo předplatné Microsoft 365. Převod probíhá na vašem zařízení. Pro lidi, kteří už Word vlastní, je to opravdu dobrá volba; příběh soukromí je tentýž jako u cesty přes prohlížeč.
Kdy záleží na otázce uploadu
U programu schůze nebo veřejné zprávy nezáleží na tom, kde převod probíhá. Dokument je už veřejný; nahrát ho do konvertoru na tom nic nemění.
U těchto dokumentů je otázka uploadu reálná:
- Smlouvy a právní dokumenty — podmínky, které jste ještě nepodepsali, NDA, dohody o narovnání
- Lékařské záznamy — výsledky vyšetření, recepty, lékařské poznámky
- Finanční dokumenty — daňová přiznání, výplatní pásky, bankovní výpisy
- HR dokumenty — pracovní smlouvy, hodnocení výkonu, nabídky odstupného
- Osobní životopisy a motivační dopisy s domácími adresami a telefonními čísly
- Interní firemní materiály — strategická memoranda, finanční prognózy, seznamy klientů
Pro každý z nich není konvertor v prohlížeči jen příjemným bonusem. Odstraňuje skutečné riziko: že váš soubor skončí v zalogovaném HTTP požadavku, v záloze, v trénovací datové sadě nebo v budoucím úniku dat ze služby, kterou si stěží pamatujete, že jste použili.
Tipy pro lepší převody
Ať už používáte jakýkoli nástroj, několik návyků zlepšuje výsledky:
Začněte textovým PDF, kdykoli můžete. Pokud máte původní wordovský dokument, zdrojové PDF nebo webovou stránku, vygenerujte PDF znovu — převést čisté textové PDF je vždy lepší než převádět sken.
Ořízněte rozsáhlý bílý prostor. Některé konvertory matou obrovské okraje nebo text v zápatí. Ořez stránky před převodem může pomoci s detekcí rozložení.
Nejdřív zkontrolujte tabulky. Tabulky jsou nejčastějším zdrojem chyb převodu. Pokud vaše PDF obsahuje kritické tabulky, vložte je po převodu do tabulkového procesoru, abyste ověřili, že se data zarovnala správně.
Spusťte OCR explicitně, když je třeba. Pokud je vaše PDF sken, vyberte nástroj, který říká, že umí OCR, nebo nejdřív spusťte krok OCR pro vytvoření textového PDF a pak převádějte.
Ukládejte jako kopii. Vždy převádějte do nového souboru, nikdy nepřepisujte originál. PDF jsou neměnná z nějakého důvodu; možná se budete chtít vrátit ke zdroji, pokud převod ztratil něco důležitého.
Závěr
Převod PDF do Wordu nevyžaduje účet, kreditní kartu ani upload. Tatáž technologie, která pohání placené služby, nyní běží v jakémkoli moderním prohlížeči, dostatečně rychle pro každodenní dokumenty a dostatečně soukromě pro ty citlivé. Až příště sáhnete po Smallpdf nebo iLovePDF, zkuste nejdřív lokální nástroj. Soubor, který převedete, je soubor, který si necháte — ne kopie na cizím serveru.
