OCR Full Form in Hindi




OCR Full Form in Hindi - OCR की पूरी जानकारी?

OCR Full Form in Hindi, What is OCR in Hindi, OCR Full Form, OCR Kya Hai, OCR का Full Form क्या हैं, OCR का फुल फॉर्म क्या है, Full Form of OCR in Hindi, What is OCR, OCR किसे कहते है, OCR का फुल फॉर्म इन हिंदी, OCR का पूरा नाम और हिंदी में क्या अर्थ होता है, OCR की शुरुआत कैसे हुई, दोस्तों क्या आपको पता है, OCR की फुल फॉर्म क्या है, अगर आपका उत्तर नहीं है, तो आपको उदास होने की कोई जरुरत नहीं है, क्योंकि आज हम इस पोस्ट में आपको OCR की पूरी जानकारी हिंदी भाषा में देने जा रहे है. तो फ्रेंड्स OCR फुल फॉर्म इन हिंदी में और इसका पूरा इतिहास जानने के लिए आप इस पोस्ट को लास्ट तक पढ़े।

OCR Full Form in Hindi

OCR की फुल फॉर्म “Optical Character Recognition” होती है, OCR की फुल फॉर्म का हिंदी में अर्थ “ऑप्टिकल कैरेक्टर पहचान” है. कंप्यूटर्स को सबसे ज्यादा तब काम करना पड़ता है, जब अधिक Human type की इनफॉर्मेशन को प्रोसेस करना पड़ता है, जैसे फाउंटन पेन या पुराने फ़ैशन प्रिंटेड बुक्‍स, यह वह जगह है जहां Optical Character Recognition हमारे बचाव में आता है. यह उपयोगी Technique प्रिंटेड या Handwriting text को Analyze करती है और उसे एक ऐसे फॉर्म में बदलती है जिसे कंप्यूटर समझता है. यह Article इस बारे में और जानकारी देता है कि यह Technique कैसे काम करती है और यह बहुत उपयोगी क्यों है. चलिए अब आगे बढ़ते है और आपको इसके बारे में थोडा और विस्तार से जानकारी उपलब्ध करवाते है।

OCR का मतलब ऑप्टिकल कैरेक्टर रिकग्निशन है, इसे एक ऑप्टिकल कैरेक्टर रीडर (OCR) या टेक्स्ट रिकग्निशन के रूप में भी जाना जाता है. इसे स्कैन किए गए कागज दस्तावेजों, या डिजिटल कैमरा द्वारा कैप्चर किए गए दस्तावेजों की छवियों को पठनीय, संपादन योग्य और खोज योग्य डेटा में परिवर्तित करने के लिए डिज़ाइन किया गया है।

OCR का पूरा नाम Optical Character Recognition, एक तकनीक है, जो आपको विभिन्न प्रकार के डयॉक्‍युमेंटस् को कन्‍वर्ट करना एनेबल करती है. यहाँ पर हम आपकी जानकारी के लिए बता दे कि इस टेक्‍नोलॉजी से स्कैन किए गए पेपर डयॉक्‍युमेंटस्, पीडीएफ फाइलें या एक डिजिटल कैमरे से लिए गए इमेजेस को एडिट और सर्च करने योग्य डेटा में कन्‍वर्ट किया जा सकता हैं, तकनीकी रूप से, OCR, Handwriting, प्रिंटेड या टाइप किए गए टेक्‍स्‍ट कि इमेजेस के इलेक्ट्रॉनिक या Mechanical version को मशीन-एन्कोडेड टेक्स्ट में कन्‍वर्ट करते हैं।

What is OCR in Hindi

दोस्तों अगर आपने भी किसी Book के किसी पेज को Scan कर उसे Text में कन्वर्ट करने की कोशिश की है, तो आपको भी OCR की जरूरत पड़ेगी, OCR यानी “ऑप्टिकल कैरेक्टर रीडर” जो ऑप्टिकल कैरेक्टर रिकॉग्निशन तकनीक पर काम करता है. असल में यह Software कुछ-कुछ कृत्रिम होशियारी यानी कृत्रिम बुद्धिमत्ता पर आधारित होता है. इस सिस्टम का उपयोग आज के समय में बहुत ही तेजी से होता है, आज हर जगह पर इसका इस्तेमाल करके काम को बहुत सरल कर दिया जाता है. यह ऐसा सिस्टम होता है जो आप की Handwriting को भी पहचान कर उसे भी Text में बदल देते हैं साथ ही साथ आपकी स्पेलिंग को Check कर लेते हैं. अक्सर संक्षिप्त ओसीआर, ऑप्टिकल चरित्र मान्यता, यह एक प्रकार की तकनीक होती है, जिसके जरिये आज बहुत सारे काम आसानी से किये जाते है। यह एक प्रकार की कोड को पड़ने की तकनीक होती है, यानि पेज को स्‍कैन कर टैक्‍स्‍ट में कन्‍वर्ट करना इसका काम होता है।

एक भौतिक दस्तावेज़ के स्कैन किए गए पृष्ठ को स्क्रीन पर प्रदर्शित किया जा सकता है और पढ़ा जा सकता है. लेकिन कंप्यूटर के लिए, यह काले और सफेद डॉट्स की एक श्रृंखला है. जिसे यह पहचान नहीं सकता है. कंप्यूटर को स्कैन किए गए दस्तावेज़ को पढ़ने और सॉफ्ट कॉपी बनाने में सक्षम करने के लिए, ओसीआर विकसित किया गया था. ओसीआर एक स्कैन किए गए दस्तावेज़ के पाठ की जांच करता है और पात्रों को कोड में अनुवाद करता है जो पाठ मशीन को पठनीय बनाता है ताकि इसे एक इलेक्ट्रॉनिक प्रारूप या सॉफ्ट कॉपी में परिवर्तित किया जा सके, जैसे एक वर्ड प्रोसेसर के साथ बनाया गया दस्तावेज़, जिसे उपयोगकर्ता संपादित कर सकते हैं, प्रारूप कर सकते हैं, खोज और पढ़ें।

इस प्रकार, यह कंप्यूटर को स्कैन किए गए पृष्ठ पर शब्दों और पात्रों को पहचानने में मदद करता है और स्कैन किए गए पृष्ठ या दस्तावेज़ पर मुद्रित शब्दों और वर्णों के ऑप्टिकल गुणों का उपयोग करके भौतिक मुद्रित या हस्तलिखित दस्तावेजों की डिजिटल छवियां।

एक ओसीआर डिवाइस हार्डवेयर और सॉफ्टवेयर संयोजन से बना होता है, जिसे भौतिक दस्तावेजों को मशीन-पठनीय पाठ में बदलने के लिए डिज़ाइन किया गया है. ओसीआर (ऑप्टिकल स्कैनर या एक सर्किट बोर्ड) का हार्डवेयर पाठ की प्रतिलिपि बनाता है और पढ़ता है, जबकि सॉफ्टवेयर उन्नत प्रसंस्करण से संबंधित है. सॉफ्टवेयर बुद्धिमान चरित्र पहचान (ICR) के उन्नत तरीकों का उपयोग करने के लिए कृत्रिम बुद्धि का उपयोग भी कर सकता है, जैसे कि भाषा या शैली की लिखावट की पहचान करने की क्षमता।

OCR यानी "ऑप्टिकल कैरेक्टर रीडर" जो Optical character recognition technology पर काम करता है जिससे हाथ से लिखे या टाइप कर प्रिंट किये या किसी न्‍यूजपेपर या बुक के किसी भी पेज को स्‍कैन कर टैक्‍स्‍ट में कन्‍वर्ट किया जा सकता है, जिससे उसे दोबारा ऑडिट किया जा सके, असल में यह Software कुछ-कुछ Artificial intelligence यानी Artificial Intelligence पर आधारित हैं, जब आप स्‍कैनर से कोई भी पेज Scan करते हो तो, OCR प्रकाश द्वारा छपे हुए अक्षरों की बनावट से उनकी पहचान करता है और उसे Text में बदल देता है, अब तो कुछ Software यहॉ तक सक्षम हैं कि आपकी Handwriting को भी पहचान कर उसे भी Text में बदल देते हैं साथ ही साथ आपकी Spelling को चैक कर लेते हैं।

OCR कैसे काम करता है

  • स्कैनर दस्तावेज़ के भौतिक रूप को संसाधित करता है।

  • स्कैन किए गए दस्तावेज़ की जांच प्रकाश और अंधेरे क्षेत्रों के लिए की जाती है।

  • एक बार दस्तावेज़ को स्कैन करने के बाद, सॉफ्टवेयर इसकी संरचना का विश्लेषण करता है और इसे एक रंगीन (काले और सफेद) संस्करण में परिवर्तित करता है।

  • अंधेरे क्षेत्रों को पात्रों के रूप में पहचाना जाता है, और प्रकाश क्षेत्रों को पृष्ठभूमि के रूप में पहचाना जाता है।

  • एक बार पात्रों को बाहर निकाल दिया जाता है और पहचानने के बाद, उन्हें एक ASCII कोड में बदल दिया जाता है, जिसका उपयोग कंप्यूटर सिस्टम द्वारा आगे की जोड़तोड़ को संभालने के लिए किया जा सकता है और इस प्रकार आपको मान्यता प्राप्त पाठ प्रस्तुत करता है।

  • वर्ण या संख्यात्मक अंक की पहचान करने के लिए अंधेरे क्षेत्रों का विश्लेषण किया जाता है. लाइनों को शब्दों और शब्दों में वर्णों में विभाजित किया गया है, OCR यह निर्धारित करने का प्रयास करता है कि क्या अंधेरे क्षेत्र एक विशेष पत्र या संख्या का प्रतिनिधित्व करते हैं।

OCR सॉफ्टवेयर उनकी तकनीकों में भिन्न हो सकते हैं, लेकिन आम तौर पर एक बार में एक वर्ण, शब्द या पाठ के ब्लॉक का विश्लेषण करते हैं, और फिर निम्नलिखित दो एल्गोरिदम में से एक का उपयोग करके वर्णों की पहचान करते हैं।

यदि आपका काम डाटा एंट्री का है अर्थात आपको पुस्तकों में लिखा हुआ डाटा Computer में या अपने मोबाइल में बार-बार टाइप करना पड़ता है और आप इस बेकार की मेहनत से थक चुके हैं तो OCR तकनीक आपके लिए रामबाण साबित हो सकती है. Computer से जुड़े अधिकतर लोग इस तकनीक के बारे में जानते हैं लेकिन कुछ यूज़र्स ऐसे हैं जो अभी भी इस तकनीक से अनजान है तो आज आप जिस तकनीक के बारे में जानने जा रहे हैं तो आइये शरू करते है, OCR एक ऐसी टेक्नोलॉजी है जिसके द्वारा इमेज या पीडीऍफ़ डॉक्यूमेंट को स्कैन करके एडिट किया जाता है. OCR ने हमारे कई मुश्किल कामो को आसान कर दिया है, दरअसल OCR किसी भी Printed text को या handwritting टेक्स्ट को पढ़ सकता है और उस फाइल को convert कर सकता है जिससे उस टेक्स्ट को edit किया जा सके, OCR किसी भी टेक्स्ट इमेज को जोकि Jpeg image format में होता है उसे टेक्स्ट फाइल में convert कर देता है जिससे उस टेक्स्ट इमेज को एडिट किया जा सके।

OCR कैसे काम करता है इसको जानने के लिए आइये कुछ उदहारणों को देखते है. सबसे पहले हम आपको बता दे कि इसके काम करने के दो तरीके है जिसमे सबसे पहला है. मान लीजिये कोई स्कूल या कॉलेज है जहाँ एडमिशन शुरू हो गए है, और वहाँ हजारो छात्र आकर एडमिशन form भरते है. जैसा कि आप सभी जानते है, अब उन छात्रों की डिटेल को स्कूल को अपने कंप्यूटर में सेव करनी है। अब ऐसे में अगर OCR न हो तो स्कूल वालो को खूब सारा स्टाफ चाहिए होगा जो की सभी छात्रों की details एक एक करके कंप्यूटर में एंट्री करते जाए, ऐसा करने से बहुत समय लगेगा साथ ही स्कूल का खर्चा भी बढ़ेगा. लेकिन OCR से क्या होता है उस फार्म को स्कैन करके कंप्यूटर में फीड किया जा सकता है. इससे सारे फार्म कंप्यूटर में बड़ी जल्दी और बिना अतिरिक्त पैसे खर्च किए हो जाएगा।

अब आइये हम इसके दूसरे तरीके के बारे में बात करते है जो काफी आसान है, मान लीजिये सरकार लोगो की feedback के लिए एक survey करती है और शहर के सभी लोगो को फार्म देती है की लोग उसे भर के उन्हें अपनी वापस करे, आमतौर इसके बाद सरकार के पास हजारो या लाखो फॉर्म आ गए है. दोस्तों की आप जानते है उसके बाद सरकार उन फार्म का डाटा कंप्यूटर में फीड करना चाहती है. अब इसके लिए उन्हें काफी सारा स्टाफ रखना पड़ेगा, जो की सारे डाटा को कंप्यूटर में फीड कर सके, इसके लिए पैसा भी खर्च होगा और काफी समय में भी लगेगा, लेकिन अगर सरकार OCR का इस्तेमाल करती तो वह इस काम को आसानी से बड़ी जल्दी कर देगी, इसी काम के लिए OCR का इस्तेमाल होता है. OCR से आप उस फॉर्म को स्कैन करके कंप्यूटर में सेव कर सकते है और अगर किसी फार्म में कोई गलती हो तो उसे edit भी किया जा सकता है।

OCR का अर्थ ऑप्टिकल कैरेक्टर रिकग्निशन होता है, जिसका अर्थ है कि सॉफ्टवेयर स्कैन किए गए पेज पर शब्दों और अक्षरों को पहचानने के लिए टेक्स्ट कैरेक्टर के ऑप्टिकल गुणों का उपयोग करता है. ओसीआर सॉफ्टवेयर दस्तावेजों के माध्यम से जाने और सामग्री को मशीन-पठनीय बनाने में सक्षम है, ताकि उन्हें इलेक्ट्रॉनिक प्रारूप में काम किया जा सके, इसका उपयोग कई अलग-अलग दस्तावेजों के लिए किया जा सकता है, और कई कार्यों को स्वचालित करने की अनुमति देता है।

प्रसंस्करण रूपों के लिए ओसीआर सॉफ्टवेयर में कुछ महत्वपूर्ण अतिरिक्त विशेषताएं शामिल हैं जो इसे वास्तव में सामग्री निकालने और इलेक्ट्रॉनिक स्प्रेडशीट में इनपुट करने में सक्षम बनाती हैं. दस्तावेज़ों को केवल पाठ-खोज योग्य बनाने के अलावा, प्रपत्रों के लिए OCR पृष्ठ के विशिष्ट भागों से जानकारी निकालने और इसे दस्तावेज़ प्रकार के आधार पर वर्गीकृत करने के लिए डेटा फ़ील्ड का उपयोग करता है. यह स्वचालित रूप से प्रपत्रों को संसाधित करने के लिए दस्तावेज़ स्वचालन सॉफ़्टवेयर को सक्षम करता है।

अक्सर संक्षिप्त रूप में ओसीआर, ऑप्टिकल चरित्र मान्यता कंप्यूटर विज्ञान की शाखा को संदर्भित करती है जिसमें कागज से पाठ पढ़ना और चित्रों को इस रूप में अनुवाद करना शामिल होता है कि कंप्यूटर हेरफेर कर सकता है (उदाहरण के लिए, एएससीआईआई कोड में)। एक OCR प्रणाली आपको एक पुस्तक या एक पत्रिका लेख लेने में सक्षम बनाती है, इसे सीधे इलेक्ट्रॉनिक कंप्यूटर फ़ाइल में फीड करती है, और फिर वर्ड प्रोसेसर का उपयोग करके फ़ाइल को संपादित करती है।

सभी ओसीआर प्रणालियों में पाठ पढ़ने के लिए एक ऑप्टिकल स्कैनर, और छवियों के विश्लेषण के लिए परिष्कृत सॉफ़्टवेयर शामिल हैं. अधिकांश ओसीआर सिस्टम, पात्रों को पहचानने के लिए हार्डवेयर (विशेष सर्किट बोर्ड) और सॉफ्टवेयर के संयोजन का उपयोग करते हैं, हालांकि कुछ सस्ती प्रणाली पूरी तरह से सॉफ्टवेयर के माध्यम से करते हैं. उन्नत ओसीआर सिस्टम बड़े प्रकार के फोंट में पाठ पढ़ सकते हैं, लेकिन उन्हें अभी भी हस्तलिखित पाठ के साथ कठिनाई है. ओसीआर सिस्टम की क्षमता बहुत अधिक है क्योंकि वे उपयोगकर्ताओं को मुद्रित दस्तावेजों तक पहुंचने के लिए कंप्यूटर की शक्ति का उपयोग करने में सक्षम बनाते हैं, ओसीआर पहले से ही व्यापक रूप से कानूनी पेशे में उपयोग किया जा रहा है, जहां यह पता चलता है कि एक बार आवश्यक घंटों या दिनों को अब कुछ सेकंड में पूरा किया जा सकता है।

ऑप्टिकल कैरेक्टर रेकोग्निशन अथवा ओ.सी.आर. एक ऐसी तकनीक है. जिसका प्रयोग किसी विशेष प्रकार के चिन्ह, अक्षर, या नंबर को पढ़ने के लिये किया जाता है इन Character को प्रकाश स्त्रोत के द्वारा पढ़ा जा सकता हैं. OCR उपकरण टाइपराइटर से छपे हुए कैरेक्टर्स, कैश रजिस्टर के कैरक्टर और क्रेडिट कार्ड के Character को पढ़ लेता हैं. OCR के फॉण्ट कंप्यूटर में संग्रहित रहते है. जिन्हें OCR स्टैंडर्ड कहते हैं. OCR एक स्कैनर है जो पेजों को स्कैन करता है. OCR का सॉफ्टवेयर टेक्स्ट को सुधारने योग्य टेक्स्ट फॉर्मेट (ASCII) में परिवर्तित करता है, जिसे हम वर्ड प्रोसेसिंग एप्लीकेशन में भी उपयोग कर सकते हैं और परिवर्तन लागू कर सकते हैं. यह ग्रिड डॉट्स को निकालने और डॉट्स के इन एरे को समतुल्य ASCII टेक्स्ट में परिवर्तित करके काम करता है जिसे कंप्यूटर अक्षरों, संख्याओं या विशेष प्रतीकों के रूप में प्रस्तुत कर सकता है।

Advantages of OCR in Hindi

OCR सबसे व्यापक रूप से कार्यान्वित प्रकार के डेटा एंट्री तरीकों में से एक है. OCR में डिजीटल स्कैनिंग और लिखित या मुद्रित पाठ की मान्यता शामिल है. यहाँ पाठ को पहले फोटोस्कैन किया जाता है, विश्लेषण किया जाता है और अंत में वर्ण कोड में अनुवादित किया जाता है. इस मशीन-एन्कोडेड पाठ को आसानी से इलेक्ट्रॉनिक रूप से खोजा और संपादित किया जा सकता है।

ओसीआर ने डेटा प्रविष्टि की प्रक्रिया में बहुत सुधार किया है, यह सॉफ्टवेयर टूल खोजे गए दस्तावेजों के त्वरित रूपांतरण को खोज योग्य पाठ फ़ाइलों में सक्षम बनाता है, आज, दस्तावेजों को स्कैन करने की आवश्यकता निरंतर बढ़ रही है, क्योंकि यह इन दस्तावेजों को आवश्यकता पड़ने पर आसानी से देखा जा सकता है. स्कैन किए गए दस्तावेजों को इलेक्ट्रॉनिक माध्यम से भी आसानी से साझा किया जा सकता है।

यद्यपि ओसीआर के कई फायदे हैं, यह मुख्य रूप से काम की प्रभावशीलता और दक्षता बढ़ाने में व्यवसायों की मदद करता है, भारी सामग्री के माध्यम से जल्दी से खोज करने की इसकी क्षमता अत्यंत मददगार है, विशेष रूप से कार्यालय सेटिंग्स में, जो उच्च दस्तावेज़ इनफ्लो और उच्च मात्रा स्कैनिंग से निपटते हैं। OCR डेटा प्रविष्टि के कुछ प्रमुख लाभ निम्नलिखित हैं -

ब्लाइंड और दृष्टिहीन कि सहायता

स्क्रीन रीडर मशीन-रिडेबल टेक्‍स्‍ट को डीकोड कर सकते हैं और नेत्रहीन लोगों को समझने के लिए स्क्रीन पर दिए गए शब्द पढ़ सकते हैं।

उच्चतर उत्पादकता

ओसीआर सॉफ्टवेयर व्यवसायों को आवश्यकता पड़ने पर त्वरित डेटा पुनर्प्राप्ति की सुविधा प्रदान करके उच्च उत्पादकता प्राप्त करने में मदद करता है. प्रासंगिक डेटा निकालने के लिए कर्मचारियों को जो समय और प्रयास की आवश्यकता थी, उसे अब कोर गतिविधियों पर ध्यान केंद्रित करने के लिए चैनलाइज़ किया जा सकता है. इसके अलावा, कर्मचारियों को आवश्यक दस्तावेजों तक पहुंचने के लिए केंद्रीय रिकॉर्ड रूम में कई यात्राएं करने की आवश्यकता नहीं है, क्योंकि वे अपने डेस्क से उठे बिना उन्हें एक्सेस कर सकते हैं।

डेटा को सर्च करना और मनिप्‍युलेट करना

स्कैन किए गए डयॉक्‍युमेंट का टेक्‍स्‍ट वर्जन बनाने कि OCR की क्षमता से टेक्‍स्‍ट को सर्च करना और डयॉक्‍युमेंट में वर्ड के किसी सेट को लोकेट करना संभव बन गया हैं. यह आपको वर्ड प्रोसेसर के माध्यम से डयॉक्‍युमेंट को एडिट करने की सुविधा भी देता है।

लागत में कमी

ओसीआर के लिए ऑप्ट करने से व्यवसायों को डेटा निष्कर्षण करने के लिए पेशेवरों को काम पर रखने में कटौती करने में मदद मिलेगी, जो ओसीआर डेटा प्रविष्टि विधियों के सबसे महत्वपूर्ण लाभों में से एक है. यह उपकरण विभिन्न अन्य लागतों, जैसे कि प्रतिलिपि बनाने, मुद्रण, शिपिंग, आदि को ट्रिम करने में भी मदद करता है. इसलिए, ओसीआर गलत या खोए हुए दस्तावेजों की लागत को समाप्त करता है और पुनः प्राप्त कार्यालय स्थान के रूप में उच्च बचत प्रदान करता है, जो अन्यथा भंडारण के लिए उपयोग किया जाएगा। कागज के दस्तावेज।

उच्च सटिकता

डेटा प्रविष्टि की प्रमुख चुनौतियों में से एक अशुद्धि है, स्वचालित डेटा प्रविष्टि उपकरण जैसे OCR डेटा प्रविष्टि कम त्रुटियों और अशुद्धियों के परिणामस्वरूप होती है, जिसके परिणामस्वरूप कुशल डेटा प्रविष्टि होती है. इसके अलावा, ओसीआर डेटा प्रविष्टि से डेटा हानि जैसी समस्याओं से भी सफलतापूर्वक निपटा जा सकता है. जैसा कि कोई जनशक्ति शामिल नहीं है, गलती से सूचना में कुंजीयन या अन्यथा जैसे मुद्दों को समाप्त किया जा सकता है।

आपदा बहाली

डेटा रिकवरी के लिए OCR का उपयोग करने से आपदा वसूली एक प्रमुख लाभ है. जब डेटा को सुरक्षित सर्वर और वितरित सिस्टम में इलेक्ट्रॉनिक रूप से संग्रहीत किया जाता है, तो यह आपातकालीन स्थितियों में भी सुरक्षित रहता है. जब अचानक आग ब्रेकआउट या प्राकृतिक आपदा होती है, तो व्यापार निरंतरता सुनिश्चित करने के लिए डिजिटाइज्ड डेटा को जल्दी से पुनर्प्राप्त किया जा सकता है।