Obdržíte PDF s nesprávným datem. Nebo smlouvu, kde je třeba přeformulovat klauzuli. Nebo zprávu s čísly, která se od napsání změnila. Oprava by zabrala deset sekund v textovém editoru. Ale PDF se zdá být zamčený — nehybný, neměnný, frustrujícně konečný.
Toto není chyba. Je to základní povaha formátu. Pochopení proč jsou PDF těžko upravitelné vám pomůže zvolit správný přístup, když potřebujete něco změnit.
Architektura PDF
Wordový dokument a PDF vypadají na obrazovce podobně, ale jejich vnitřní struktury jsou zásadně odlišné.
Wordový dokument ukládá obsah jako tok strukturovaných prvků: odstavce, nadpisy, tabulky, seznamy. Software rozhoduje, jak je vykreslit na základě okrajů, velikostí písma a rozměrů stránky.
PDF ukládá obsah jako sadu přesných kreslicích instrukcí. Každý znak je umístěn na přesných souřadnicích x-y na stránce s pevnými rozměry.
- Word je jako recept: „Umísti nadpis nahoře, pak první odstavec, pak obrázek."
- PDF je jako fotografie hotového jídla: každý prvek je pevně na svém místě. Není žádný recept k úpravě — jen konečný výsledek.
Záměrné konstrukční rozhodnutí PDF znamená Portable Document Format. Adobe ho vytvořilo v roce 1993 specificky k vyřešení problému, že dokumenty vypadají na různých systémech odlišně. Upravitelnost byla záměrně obětována ve prospěch věrnosti.
Anotace vs. skutečné úpravy
Anotace (přidávání na vrch)
Znamená umisťování nového obsahu na existující dokument: přidávání textu do prázdných míst, umisťování podpisu, vkládání obrázků nebo zaškrtnutí.
Skutečné úpravy (změna obsahu)
Znamená úpravu skutečného obsahu PDF: změnu existujícího textu, přepisování odstavců, restrukturalizaci tabulek. Kvůli architektuře PDF s pevným rozložením je to ze své podstaty obtížné.
Skutečné úpravy obecně vyžadují nejprve převod do upravitelného formátu (obvykle Word), provedení změn tam a export zpět do PDF.
Převod PDF do Wordu: co se děje pod kapotou
Převod PDF do Wordového dokumentu je mistrovský kousek reverzního inženýrství. Převodník musí rekonstruovat strukturovaný obsah z plochého rozložení stránky:
- Seskupování znaků: jednotlivé znaky umístěné na souřadnicích jsou seskupeny do slov, pak do řádků, pak do odstavců
- Detekce rozložení: algoritmus identifikuje sloupce, tabulky, záhlaví, zápatí a postranní panely
- Mapování písem: písma vložená v PDF jsou identifikována a přiřazena k dostupným systémovým písmům
- Extrakce obrázků: grafika je extrahována s pozicemi a rozměry
- Rekonstrukce struktury: všechny prvky jsou sestaveny do souboru
.docx
Kdy převod funguje dobře — a kdy ne
| Typ dokumentu | Kvalita převodu |
|---|---|
| Jednoduché dopisy, zprávy, eseje | Vynikající — téměř identické s originálem |
| Dokumenty se základními tabulkami | Velmi dobrá — mohou být potřeba drobné úpravy zarovnání |
| Vícesloupcová rozložení (zpravodaje, časopisy) | Dobrá — sloupce se mohou sloučit nebo přeuspořádat |
| Výrazně designované dokumenty (brožury, plakáty) | Průměrná — pravděpodobně bude potřeba značné ruční čištění |
| Naskenované dokumenty (PDF založené na obrázcích) | Špatná — bez textu k extrakci bez OCR |
Problém naskenovaného PDF Pokud je vaše PDF sken fyzického dokumentu, neobsahuje vůbec žádný text — jen obrázek každé stránky. Převod do Wordu vytvoří dokument s obrázky, ne upravitelný text. Nejprve potřebujete OCR.
Volba správného přístupu
Použijte anotaci když: vyplňujete formulářová pole, přidáváte podpis, opravujete jedno slovo, přidáváte komentáře.
Použijte převod PDF do Wordu když: přepisujete odstavce, restrukturalizujete tabulku, měníte rozložení, aktualizujete více sekcí dokumentu.
Použijte původní zdrojový soubor když: máte přístup k původnímu Wordovému nebo InDesignovému dokumentu. Toto je vždy nejlepší volba, pokud je dostupná.
Problém kvality při převodu tam a zpět
Každý převod mezi formáty zavádí drobné změny. Praktické pravidlo: převeďte jednou, upravte důkladně, exportujte jednou. Nepřeskakujte mezi formáty tam a zpět.
Další informace
PDF nebyly navrženy k úpravám, a to je vlastně vlastnost. Ale když potřebujete provést změny, pochopení architektury formátu vám pomůže zvolit správný přístup.
Prozkoumejte PDF nástroje a tutoriály dostupné na těchto stránkách pro úpravy založené na anotacích i převod formátů. Každý nástroj běží ve vašem prohlížeči a zpracovává soubory lokálně na vašem zařízení.
