OCR (光学文字認識) でスキャンしたPDFや画像からテキストを抽出
PDF OCRはTesseract.jsをブラウザ内で動かし、スキャンや画像ベースのPDF内のテキストを認識します。プレーンテキストを抽出したり、認識テキストを元画像の背面にレイヤーとして配置した検索可能PDFを作成したり、DOCX文書として書き出すことができます。すべてローカルで動作し、ドキュメントはどこにもアップロードされません。