जब कॉपी-पेस्ट काम न करे तो PDF से टेक्स्ट निकालना
आप एक PDF खोलते हैं, कुछ टेक्स्ट चुनने की कोशिश करते हैं, और कुछ नहीं होता। कर्सर कुछ भी हाइलाइट नहीं करता। या इससे भी बुरा, आप टेक्स्ट चुनने और कॉपी करने में कामयाब होते हैं, इसे किसी दस्तावेज़ में पेस्ट करते हैं, और यादृच्छिक वर्णों और टूटी फ़ॉर्मेटिंग की गड़बड़ी मिलती है।
यह सबसे आम PDF निराशाओं में से एक है, और यह आपकी सोच से अधिक बार होती है। अच्छी खबर यह है कि लगभग हमेशा एक समाधान होता है।
PDF में कॉपी-पेस्ट क्यों विफल होता है
सभी PDF समान नहीं बनाई जातीं। आप टेक्स्ट कॉपी क्यों नहीं कर सकते यह इस बात पर निर्भर करता है कि PDF कैसे बनाई गई थी।
कारण 1: PDF एक स्कैन की गई छवि है
यह सबसे आम कारण है। जब आप कागज़ी दस्तावेज़ स्कैन करते हैं, तो स्कैनर प्रत्येक पृष्ठ की तस्वीर लेता है। परिणामी PDF में छवियां होती हैं, टेक्स्ट नहीं।
कारण 2: PDF सुरक्षित है
PDF लेखक अनुमतियां सेट कर सकते हैं जो प्रतिबंधित करती हैं कि उपयोगकर्ता दस्तावेज़ के साथ क्या कर सकते हैं। एक सामान्य प्रतिबंध टेक्स्ट चयन और कॉपी को अक्षम करना है।
कारण 3: टेक्स्ट एन्कोडिंग टूटी हुई है
कुछ PDF कस्टम फ़ॉन्ट एन्कोडिंग का उपयोग करती हैं जो मानक वर्णों में मैप नहीं होतीं। टेक्स्ट तकनीकी रूप से वहां है, लेकिन जब आप इसे पेस्ट करते हैं, तो विकृत आउटपुट मिलता है।
यदि टेक्स्ट नहीं चुना जाता या गलत तरीके से पेस्ट होता है, तो आपको टेक्स्ट निष्कर्षण टूल की आवश्यकता है।
जब कॉपी-पेस्ट विफल हो तो टेक्स्ट कैसे निकालें
स्कैन किए गए PDF के लिए: OCR
Optical Character Recognition (OCR) वह तकनीक है जो छवियों से टेक्स्ट पढ़ती है। आधुनिक OCR इंजन उल्लेखनीय रूप से सटीक हैं, विशेष रूप से साफ़ मुद्रित दस्तावेज़ों पर।
चेतावनी OCR सही नहीं है। यह हस्तलेखन, असामान्य फ़ॉन्ट, कम गुणवत्ता वाले स्कैन, या जटिल लेआउट वाले दस्तावेज़ों के साथ संघर्ष कर सकता है। महत्वपूर्ण दस्तावेज़ों में उपयोग करने से पहले हमेशा OCR आउटपुट की प्रूफ़रीडिंग करें।
निकाले गए टेक्स्ट के साथ आप क्या कर सकते हैं
- वर्ड प्रोसेसर में सामग्री संपादित करें
- पृष्ठों के माध्यम से स्क्रॉल किए बिना विशिष्ट जानकारी खोजें
- टेक्स्ट को दूसरी भाषा में अनुवाद करें
- किसी अन्य दस्तावेज़ या प्रस्तुति के लिए सामग्री पुनर्स्वरूपित करें
- टेबल और फ़ॉर्म से डेटा विश्लेषण करें
- स्क्रीन रीडर के लिए दस्तावेज़ों के सुलभ संस्करण बनाएं
अभी PDF से टेक्स्ट निकालना है? हमारी चरण-दर-चरण गाइड का पालन करें: PDF टेक्स्ट कैसे निकालें। यह टेक्स्ट-आधारित और स्कैन किए गए दोनों PDF पर काम करता है, सीधे आपके browser में।