Извлекайте текст из сканов PDF и изображений с помощью OCR (оптического распознавания символов)
PDF OCR использует Tesseract.js, работающий в вашем браузере, для распознавания текста внутри отсканированных или основанных на изображениях PDF. Вы можете извлечь обычный текст, создать PDF с возможностью поиска, где распознанный текст накладывается за оригинальное изображение, или экспортировать DOCX. Всё работает локально — никакие документы не загружаются.