使用 OCR(光学字符识别)从扫描的 PDF 和图像中提取文字
PDF OCR 使用在您的浏览器中运行的 Tesseract.js 来识别扫描或基于图像的 PDF 中的文本。您可以提取纯文本,生成可搜索的 PDF(识别的文本叠加在原始图像后面),或导出为 DOCX 文档。所有操作都在本地运行 — 不会上传任何文档。