Anda memerlukan teks dari PDF tetapi tidak bisa memilih atau menyalinnya. Mungkin PDF adalah dokumen yang dipindai, mungkin pemilihan teks dibatasi, atau mungkin Anda hanya ingin versi teks biasa yang bersih. Alat PDF to Text mengekstrak setiap kata dari PDF Anda dalam hitungan detik.
Yang Anda butuhkan
- File PDF berisi teks yang ingin Anda ekstrak
- Browser web
- Tidak perlu akun atau software yang perlu dipasang
Panduan langkah demi langkah
Buka alat PDF to Text
Buka alat PDF to Text. Berjalan sepenuhnya di browser Anda tanpa perlu pengaturan apa pun.
Unggah PDF Anda
Klik area unggah atau seret dan lepas PDF Anda. Alat akan memproses file dan mengekstrak semua konten teks yang dapat dibaca.
Salin atau unduh teks yang diekstrak
Teks yang diekstrak muncul dalam area teks. Anda dapat memilih dan menyalin bagian tertentu, atau mengunduh seluruh teks sebagai file. Teksnya bersih dan siap ditempel ke dokumen, email, atau editor apa pun.
Perlu diketahui Semua ekstraksi teks terjadi secara lokal di browser Anda. PDF Anda tidak pernah dikirim ke server mana pun, sehingga dokumen sensitif tetap privat.
Jenis PDF apa yang didukung?
PDF digital (native)
PDF yang dibuat dari dokumen Word, halaman web, atau aplikasi apa pun yang menghasilkan PDF berbasis teks. Ini memberikan hasil terbaik karena teks sudah tersimpan sebagai karakter dalam file.
PDF yang dipindai
PDF yang dibuat dari dokumen kertas yang dipindai pada dasarnya adalah gambar. Ekstraksi teks dari PDF yang dipindai bergantung pada kemampuan OCR alat. Hasilnya umumnya baik untuk pindaian yang bersih dengan font standar, tetapi tulisan tangan dan pindaian berkualitas sangat rendah mungkin menghasilkan hasil yang tidak lengkap.
PDF campuran
Beberapa PDF berisi campuran teks digital dan gambar yang dipindai. Alat mengekstrak data teks apa pun yang tersedia dalam struktur file.
Tips Untuk hasil ekstraksi terbaik dari dokumen yang dipindai, pastikan pindaian minimal 300 DPI dan teks dapat terbaca dengan jelas. Pindaian yang miring atau buram menghasilkan output berkualitas lebih rendah.
Kasus penggunaan umum
- Mengutip teks dalam email atau dokumen: Ekstrak kata-kata tepat dari laporan atau artikel PDF.
- Mencari konten: Setelah diekstrak, Anda dapat menggunakan fungsi pencarian editor teks untuk menemukan bagian tertentu.
- Entri data: Tarik teks dari formulir PDF atau faktur ke dalam spreadsheet.
- Aksesibilitas: Konversi konten PDF ke teks biasa untuk pembaca layar atau alat text-to-speech.
- Penerjemahan: Ekstrak teks, tempel ke alat terjemahan, dan terjemahkan kontennya.
Tips untuk hasil yang bersih
Periksa jeda baris: Ekstraksi teks PDF terkadang menyisipkan jeda baris di tengah kalimat karena PDF asli menggunakan kolom lebar tetap. Anda mungkin perlu membersihkan jeda baris di editor teks.
Perhatikan header dan footer: Header, footer, dan nomor halaman yang berulang dari PDF akan muncul dalam teks yang diekstrak. Hapus secara manual jika mengacaukan hasil.
Tabel mungkin kehilangan struktur: Teks dalam tabel PDF diekstrak dari kiri ke kanan, atas ke bawah. Penyelarasan kolom mungkin tidak dipertahankan sebagai teks biasa. Untuk data tabel, Anda mungkin perlu mengatur ulang secara manual dalam spreadsheet.
Penting Jika PDF dilindungi kata sandi dan membatasi penyalinan, alat mungkin tidak dapat mengekstrak teks. Anda perlu menghapus pembatasan PDF terlebih dahulu.
Pertanyaan yang sering diajukan
Bisakah saya mengekstrak teks hanya dari halaman tertentu? Alat mengekstrak teks dari seluruh dokumen. Jika Anda hanya memerlukan teks dari halaman tertentu, gunakan alat PDF Page Delete terlebih dahulu untuk mengisolasi halaman yang Anda inginkan, lalu ekstrak teks dari file yang sudah dipangkas.
Apakah formatnya terbawa? Outputnya adalah teks biasa. Tebal, miring, warna, dan tata letak tidak dipertahankan. Anda mendapatkan kata-kata dan paragraf mentah.
Bisakah saya mengekstrak teks dari file gambar? Alat ini bekerja dengan file PDF. Untuk mengekstrak teks dari gambar mandiri (JPG, PNG), Anda memerlukan alat OCR yang khusus.
Langkah selanjutnya
Sekarang Anda sudah memiliki teksnya, Anda mungkin ingin kembali ke PDF asli dan menghapus halaman yang tidak diperlukan, mengompresnya, atau membersihkan metadatanya sebelum berbagi.