PDF🔒 在浏览器中运行

文字提取 (OCR)

使用 OCR（光学字符识别）从扫描的 PDF 和图像中提取文字

📝

拖放 PDF 到此处或点击浏览

.pdf, .png, .jpg, .jpeg, .webp, .tiff, .bmp

使用案例

PDF OCR 使用在您的浏览器中运行的 Tesseract.js 来识别扫描或基于图像的 PDF 中的文本。您可以提取纯文本，生成可搜索的 PDF（识别的文本叠加在原始图像后面），或导出为 DOCX 文档。所有操作都在本地运行 — 不会上传任何文档。

支持哪些语言？

通过 Tesseract.js 支持超过 100 种语言，包括英语、法语、西班牙语、德语、中文、日语、阿拉伯语等。您还可以同时选择多种语言进行多语言 OCR。

我的 PDF 会上传到服务器吗？

不会。文字识别完全通过 WebAssembly 在您的浏览器中进行。您的文件不会离开您的设备。

有哪些可用的输出格式？

识别出的文字以纯文本 (.txt) 形式提供。OCR 完成后即可复制或下载。

OCR 是什么意思？

OCR 是 Optical Character Recognition（光学字符识别）的缩写。这项技术可识别图像或扫描文档中字母的形状，并将它们转换成可真正编辑和搜索的数字文本。没有 OCR，扫描的页面只是一张图片；有了 OCR，您可以复制、搜索、翻译和编辑其中的内容。

为什么 OCR 比预期慢？

Tesseract.js 在首次使用时会加载 4–10 MB 的语言模型，并在浏览器主线程中对每一页执行计算机视觉处理。在现代笔记本上每页约需 3–8 秒，手机或大文档会更慢。进度条会实时更新，方便你做安排。后续页面更快，因为模型已驻留在内存中。

使用案例

把一摞旧纸质发票数字化，便于会计搜索与留存。

让扫描的教科书可全文搜索，便于学习。

从扫描合同中提取文本，把条款复制粘贴到草稿。

在翻译扫描文档之前先提取其中的文字。

把收据扫描件转为文字字段，再粘贴进报销表格。

关于文字提取 (OCR)

常见问题