আপনার PDF থেকে টেক্সট দরকার কিন্তু সিলেক্ট বা কপি করতে পারছেন না। হয়তো PDF স্ক্যান করা ডকুমেন্ট, টেক্সট সিলেকশন সীমাবদ্ধ বা আপনি শুধু পরিচ্ছন্ন প্লেইন-টেক্সট সংস্করণ চান। PDF to Text টুল সেকেন্ডে আপনার PDF থেকে প্রতিটি শব্দ বের করে।
যা প্রয়োজন
- টেক্সট বের করতে চান এমন একটি PDF ফাইল
- একটি ওয়েব ব্রাউজার
- কোনো অ্যাকাউন্ট বা সফটওয়্যার ইনস্টল লাগবে না
ধাপে ধাপে গাইড
PDF to Text টুল খুলুন
PDF to Text টুলে যান। কোনো সেটআপ ছাড়াই সম্পূর্ণরূপে আপনার ব্রাউজারে চলে।
আপনার PDF আপলোড করুন
আপলোড এরিয়ায় ক্লিক করুন বা PDF ড্র্যাগ অ্যান্ড ড্রপ করুন। টুলটি ফাইল প্রসেস করে সমস্ত পাঠযোগ্য টেক্সট কন্টেন্ট বের করবে।
বের করা টেক্সট কপি বা ডাউনলোড করুন
বের করা টেক্সট একটি টেক্সট এরিয়ায় দেখা যায়। নির্দিষ্ট অংশ সিলেক্ট ও কপি করতে, বা ফাইল হিসেবে পুরো টেক্সট ডাউনলোড করতে পারেন। টেক্সট পরিচ্ছন্ন এবং যেকোনো ডকুমেন্ট, ইমেইল বা এডিটরে পেস্ট করার জন্য প্রস্তুত।
জেনে রাখুন সমস্ত টেক্সট এক্সট্রাকশন আপনার ব্রাউজারে স্থানীয়ভাবে ঘটে। আপনার PDF কখনো কোনো সার্ভারে পাঠানো হয় না, তাই সংবেদনশীল ডকুমেন্ট গোপনীয় থাকে।
কোন ধরনের PDF-এ এটি কাজ করে?
ডিজিটাল (নেটিভ) PDF
Word ডকুমেন্ট, ওয়েব পৃষ্ঠা বা টেক্সট-ভিত্তিক PDF তৈরি করে এমন অ্যাপ্লিকেশন থেকে তৈরি PDF। এগুলো সেরা ফলাফল দেয় কারণ টেক্সট ইতিমধ্যে ফাইলে অক্ষর হিসেবে সংরক্ষিত।
স্ক্যান করা PDF
স্ক্যান করা কাগজের ডকুমেন্ট থেকে তৈরি PDF মূলত ছবি। স্ক্যান করা PDF থেকে টেক্সট এক্সট্রাকশন টুলের OCR ক্ষমতার উপর নির্ভর করে। মানক ফন্টসহ পরিচ্ছন্ন স্ক্যানে ফলাফল সাধারণত ভালো, তবে হাতের লেখা ও খুব কম-মানের স্ক্যানে অসম্পূর্ণ ফলাফল হতে পারে।
মিশ্র PDF
কিছু PDF-এ ডিজিটাল টেক্সট ও স্ক্যান করা ছবির মিশ্রণ থাকে। টুলটি ফাইল কাঠামোতে উপলব্ধ যেকোনো টেক্সট ডেটা বের করে।
পরামর্শ স্ক্যান করা ডকুমেন্ট থেকে সেরা এক্সট্রাকশন ফলাফলের জন্য, স্ক্যান কমপক্ষে 300 DPI এবং টেক্সট স্পষ্টভাবে পাঠযোগ্য নিশ্চিত করুন। তির্যক বা ঝাপসা স্ক্যানে নিম্নমানের আউটপুট হয়।
সাধারণ ব্যবহার
- ইমেইল বা ডকুমেন্টে টেক্সট উদ্ধৃত করা: PDF রিপোর্ট বা আর্টিকেল থেকে সঠিক শব্দ বের করুন।
- কন্টেন্ট সার্চ: বের করার পর, নির্দিষ্ট প্যাসেজ খুঁজতে টেক্সট এডিটরের সার্চ ফাংশন ব্যবহার করুন।
- ডেটা এন্ট্রি: PDF ফর্ম বা ইনভয়েস থেকে স্প্রেডশিটে টেক্সট নিন।
- অ্যাক্সেসিবিলিটি: স্ক্রিন রিডার বা টেক্সট-টু-স্পিচ টুলের জন্য PDF কন্টেন্ট প্লেইন টেক্সটে রূপান্তর করুন।
- অনুবাদ: টেক্সট বের করুন, অনুবাদ টুলে পেস্ট করুন এবং কন্টেন্ট অনুবাদ করুন।
পরিচ্ছন্ন ফলাফলের টিপস
লাইন ব্রেক পরীক্ষা করুন: PDF টেক্সট এক্সট্রাকশন কখনো বাক্যের মাঝে লাইন ব্রেক যোগ করে কারণ মূল PDF নির্দিষ্ট-প্রস্থ কলাম ব্যবহার করে। টেক্সট এডিটরে লাইন ব্রেক পরিষ্কার করতে হতে পারে।
হেডার ও ফুটার দেখুন: PDF থেকে পুনরাবৃত্ত হেডার, ফুটার ও পৃষ্ঠা নম্বর বের করা টেক্সটে দেখা যাবে। ফলাফলে বিশৃঙ্খলা সৃষ্টি করলে ম্যানুয়ালি মুছুন।
টেবিল কাঠামো হারাতে পারে: PDF টেবিলের টেক্সট বাম থেকে ডানে, উপর থেকে নিচে বের হয়। কলাম সারিবদ্ধতা প্লেইন টেক্সট হিসেবে সংরক্ষিত নাও হতে পারে। টেবিল ডেটার জন্য, স্প্রেডশিটে ম্যানুয়ালি পুনঃসংগঠন লাগতে পারে।
গুরুত্বপূর্ণ PDF পাসওয়ার্ড-সুরক্ষিত হয়ে কপি সীমাবদ্ধ করলে, টুল টেক্সট বের করতে নাও পারে। প্রথমে PDF সীমাবদ্ধতা সরাতে হবে।
প্রায়শই জিজ্ঞাসিত প্রশ্ন
শুধু নির্দিষ্ট পৃষ্ঠা থেকে কি টেক্সট বের করা যায়? টুলটি পুরো ডকুমেন্ট থেকে টেক্সট বের করে। শুধু নির্দিষ্ট পৃষ্ঠা থেকে টেক্সট প্রয়োজন হলে, প্রথমে PDF পৃষ্ঠা মুছুন টুল ব্যবহার করে চান এমন পৃষ্ঠা আলাদা করুন, তারপর ছাঁটা ফাইল থেকে টেক্সট বের করুন।
ফরম্যাটিং কি বজায় থাকে? আউটপুট প্লেইন টেক্সট। বোল্ড, ইটালিক, রঙ ও লেআউট সংরক্ষিত হয় না। আপনি কাঁচা শব্দ ও অনুচ্ছেদ পান।
ইমেজ ফাইল থেকে কি টেক্সট বের করা যায়? এই টুল PDF ফাইলে কাজ করে। স্বতন্ত্র ছবি (JPG, PNG) থেকে টেক্সট বের করতে, ডেডিকেটেড OCR টুল লাগবে।
পরবর্তী ধাপ
টেক্সট পাওয়ার পর, মূল PDF-এ ফিরে গিয়ে অপ্রয়োজনীয় পৃষ্ঠা সরাতে, কম্প্রেস করতে, বা শেয়ারের আগে মেটাডেটা পরিষ্কার করতে পারেন।