Text aus gescannten PDFs und Bildern extrahieren mit OCR (optische Zeichenerkennung)
PDF-OCR nutzt Tesseract.js, das in Ihrem Browser läuft, um Text in gescannten oder bildbasierten PDFs zu erkennen. Sie können einfachen Text extrahieren, ein durchsuchbares PDF erstellen, bei dem der erkannte Text hinter dem Originalbild liegt, oder ein DOCX-Dokument exportieren. Alles läuft lokal — es werden keine Dokumente irgendwohin hochgeladen.