使用 OCR(光學字元辨識)從掃描的 PDF 與圖片中提取文字
PDF OCR 使用在您的瀏覽器中執行的 Tesseract.js 來辨識掃描或基於影像的 PDF 中的文字。您可以擷取純文字,產生可搜尋的 PDF(辨識的文字疊加在原始影像後方),或匯出為 DOCX 文件。所有作業都在本機執行 — 不會上傳任何文件。