PDF🔒 在瀏覽器中運行

文字提取 (OCR)

使用 OCR（光學字元辨識）從掃描的 PDF 與圖片中提取文字

📝

拖放 PDF 到此處或點擊瀏覽

.pdf, .png, .jpg, .jpeg, .webp, .tiff, .bmp

使用案例

PDF OCR 使用在您的瀏覽器中執行的 Tesseract.js 來辨識掃描或基於影像的 PDF 中的文字。您可以擷取純文字，產生可搜尋的 PDF（辨識的文字疊加在原始影像後方），或匯出為 DOCX 文件。所有作業都在本機執行 — 不會上傳任何文件。

支援哪些語言？

透過 Tesseract.js 支援超過 100 種語言，包括英語、法語、西班牙語、德語、中文、日語、阿拉伯語等。您還可以同時選擇多種語言進行多語言 OCR。

我的 PDF 會上傳到伺服器嗎？

不會。文字辨識完全透過 WebAssembly 在您的瀏覽器中進行。您的檔案不會離開您的裝置。

有哪些可用的輸出格式？

辨識出的文字以純文字 (.txt) 形式提供。OCR 完成後即可複製或下載。

OCR 是什麼意思？

OCR 是 Optical Character Recognition（光學字元辨識）的縮寫。這項技術可辨識圖片或掃描文件中字母的形狀，並將它們轉換為真正可編輯與可搜尋的數位文字。沒有 OCR，掃描頁只是一張圖片；有了 OCR，您便可以複製、搜尋、翻譯與編輯其中的內容。

為什麼 OCR 比預期慢？

Tesseract.js 首次使用時會載入 4–10 MB 的語言模型，並在瀏覽器主執行緒對每一頁執行電腦視覺處理。在現代筆電上每頁約 3–8 秒，手機或大型文件會更久。進度條即時更新，便於規劃時間。後續頁面會更快，因為模型已在記憶體中。

使用案例

把一疊舊紙本發票數位化，便於會計檢索與留存。

讓掃描的教科書全文可搜尋，方便讀書。

從掃描合約擷取文字，把條款複製貼上至草稿。

在翻譯前先擷取掃描文件的文字，作為翻譯素材。

把收據掃描檔轉為文字欄位，再貼進費用追蹤試算表。

關於文字提取 (OCR)

常見問題