Wyodrębniaj tekst ze skanów PDF i obrazów za pomocą OCR (optyczne rozpoznawanie znaków)
PDF OCR używa Tesseract.js działającego w przeglądarce do rozpoznawania tekstu wewnątrz skanowanych lub opartych na obrazie plików PDF. Możesz wyodrębnić zwykły tekst, utworzyć przeszukiwalny PDF, w którym rozpoznany tekst jest umieszczony za oryginalnym obrazem, lub wyeksportować dokument DOCX. Wszystko działa lokalnie — żadne dokumenty nie są nigdzie przesyłane.