OCR Full Form Hindi
OCR का फुलफॉर्म Optical Character Recognition और हिंदी में ओसीआर का मतलब ऑप्टिकल कैरेक्टर पहचान है। ऑप्टिकल कैरेक्टर रिकॉग्निशन (OCR) या ऑप्टिकल कैरेक्टर रीडर (OCR), एक ऐसी तकनीक है, जो एक ऑप्टिकल स्कैनर या कंप्यूटर सॉफ्टवेयर का उपयोग हस्तलिखित, टाइप या मुद्रित टेक्स्ट को टेक्स्ट में बदलने के लिए करती है, जिसे फिर टेक्स्ट एडिटर का उपयोग करके संपादित किया जा सकता है।
ओसीआर क्या है? What is OCR in Hindi
OCR का मतलब ऑप्टिकल कैरेक्टर रिकग्निशन है। इसे एक ऑप्टिकल कैरेक्टर रीडर (OCR) या टेक्स्ट रिकग्निशन के रूप में भी जाना जाता है। इसे स्कैन किए गए कागज दस्तावेजों, या डिजिटल कैमरा द्वारा कैप्चर किए गए दस्तावेजों की छवियों को पठनीय, संपादन योग्य और खोज योग्य डेटा में परिवर्तित करने के लिए डिज़ाइन किया गया है। भौतिक दस्तावेज़ के स्कैन किए गए पृष्ठ को स्क्रीन पर प्रदर्शित किया जा सकता है और पढ़ा जा सकता है, लेकिन कंप्यूटर के लिए, यह काले और सफेद डॉट्स की एक श्रृंखला है, जिसे वह पहचान नहीं सकता है। कंप्यूटर को स्कैन किए गए दस्तावेज़ को पढ़ने और एक सॉफ्ट कॉपी बनाने में सक्षम करने के लिए, ओसीआर विकसित किया गया था। ओसीआर एक स्कैन किए गए दस्तावेज़ के पाठ की जांच करता है और पात्रों को कोड में अनुवाद करता है जो पाठ मशीन को पठनीय बनाता है ताकि इसे एक इलेक्ट्रॉनिक प्रारूप या सॉफ्ट कॉपी में परिवर्तित किया जा सके, जैसे एक वर्ड प्रोसेसर के साथ बनाया गया दस्तावेज़, जिसे उपयोगकर्ता संपादित कर सकते हैं, प्रारूप कर सकते हैं। खोज और पढ़ें।
OCR कैसे काम करता है:
-
स्कैनर दस्तावेज़ के भौतिक रूप को संसाधित करता है।
-
एक बार दस्तावेज़ को स्कैन करने के बाद, सॉफ्टवेयर इसकी संरचना का विश्लेषण करता है और इसे एक रंगीन (काले और सफेद) संस्करण में परिवर्तित करता है।
-
स्कैन किए गए दस्तावेज़ की जांच प्रकाश और अंधेरे क्षेत्रों के लिए की जाती है।
-
अंधेरे क्षेत्रों को पात्रों के रूप में पहचाना जाता है, और प्रकाश क्षेत्रों को पृष्ठभूमि के रूप में पहचाना जाता है। पत्र या न्यूमेरिक अंकों की पहचान करने के लिए अंधेरे क्षेत्रों का विश्लेषण किया जाता है। लाइनों को शब्दों और शब्दों में वर्णों में विभाजित किया गया है। ओसीआर यह निर्धारित करने का प्रयास करता है कि क्या अंधेरे क्षेत्र एक विशेष पत्र या संख्या का प्रतिनिधित्व करते हैं। एक बार पात्रों को बाहर निकाल दिया जाता है और पहचानने के बाद, उन्हें एक ASCII कोड में परिवर्तित कर दिया जाता है, जिसका उपयोग कंप्यूटर सिस्टम द्वारा आगे की जोड़तोड़ को संभालने के लिए किया जा सकता है और इस प्रकार आपको मान्यता प्राप्त पाठ प्रस्तुत करता है। ओसीआर सॉफ्टवेयर उनकी तकनीकों में भिन्न हो सकते हैं, लेकिन आम तौर पर एक समय में एक वर्ण, शब्द या पाठ के ब्लॉक का विश्लेषण करते हैं और फिर निम्नलिखित दो एल्गोरिदम में से एक का उपयोग करके वर्णों की पहचान करते हैं।
-
Pattern Recognition: ओसीआर सॉफ्टवेयर को विभिन्न फोंट और प्रारूपों के साथ पाठ के उदाहरणों को खिलाकर विकसित किया जाता है, इसलिए वे पात्रों के आकार या पैटर्न को समझते हैं और तदनुसार उन्हें सही ढंग से पहचानते हैं।
-
Feature Detection: इस तकनीक में, OCR प्रोग्राम किसी वर्ण या संख्या की विशेषता पर निर्भर करते हैं। सुविधाओं में एक पंक्ति में कोण रेखाओं, पार की गई रेखाओं या घटता की संख्या शामिल हो सकती है। उदाहरण के लिए, 'A' अक्षर को बीच में एक क्षैतिज रेखा से जुड़ी दो रेखाओं के रूप में संग्रहीत किया जा सकता है और एक छोर पर एक साथ जुड़ भी सकता है।