ओसीआर को संभालना

परिचय

इस ट्यूटोरियल में, हम ऑप्टिकल कैरेक्टर रिकॉग्निशन (OCR) कार्यों को कुशलतापूर्वक संभालने के लिए .NET के लिए GroupDocs.Parser का उपयोग करने का तरीका जानेंगे। यह लाइब्रेरी दस्तावेज़ों से टेक्स्ट निकालने के लिए शक्तिशाली उपकरण प्रदान करती है, और OCR के साथ, आप छवियों या स्कैन किए गए दस्तावेज़ों से भी टेक्स्ट निकाल सकते हैं। आइए इस प्रक्रिया को चरण दर चरण समझें।

आवश्यक शर्तें

शुरू करने से पहले, सुनिश्चित करें कि आपके पास निम्नलिखित सेटअप है:

.NET लाइब्रेरी के लिए GroupDocs.Parser: लाइब्रेरी को यहाँ से डाउनलोड करेंयहाँ.
आपकी नमूना फ़ाइल: एक नमूना फ़ाइल (दस्तावेज़ या छवि) तैयार करें जिससे आप पाठ निकालना चाहते हैं।
C# और .NET वातावरण का बुनियादी ज्ञान।

नामस्थान आयात करें

सबसे पहले, आपको अपने .NET अनुप्रयोग में GroupDocs.Parser कार्यात्मकताओं का उपयोग करने के लिए आवश्यक नामस्थान आयात करने की आवश्यकता है।

using System;
using System.Collections.Generic;
using System.Drawing;
using System.IO;
using System.Linq;
using System.Text;
using Aspose.OCR;
using GroupDocs.Parser.Data;
using GroupDocs.Parser.Options;

चरण 1: OCR कनेक्टर के साथ पार्सर सेटिंग्स बनाएँ

आरंभ करेंParserSettings OCR कनेक्टर के साथ क्लास। उदाहरण के लिए, Aspose OCR ऑन-प्रिमाइसेस का उपयोग करना।

ParserSettings settings = new ParserSettings(new AsposeOcrOnPremise());

चरण 2: OCR विकल्प कॉन्फ़िगर करें

एक सेट अप करेंOcrEventHandler ओसीआर प्रसंस्करण के दौरान चेतावनियों को संभालने के लिए।

OcrEventHandler handler = new OcrEventHandler();
OcrOptions ocrOptions = new OcrOptions(handler);

चरण 3: टेक्स्ट निष्कर्षण विकल्प कॉन्फ़िगर करें

बनाएंTextOptions ओसीआर-आधारित पाठ निष्कर्षण को सक्षम करने के लिए।

TextOptions options = new TextOptions(false, true, ocrOptions);

चरण 4: OCR का उपयोग करके टेक्स्ट निकालें

उदाहरण प्रस्तुत करेंParser सेटिंग्स के साथ क्लास और ओसीआर का उपयोग कर पाठ निकालें।

using (Parser parser = new Parser("YourSampleFile.pdf", settings))
{
    using (TextReader reader = parser.GetText(options))
    {
        if (reader == null)
        {
            Console.WriteLine("Text extraction isn't supported.");
        }
        else
        {
            Console.WriteLine(reader.ReadToEnd());
        }
    }
    if (handler.HasWarnings)
    {
        Console.WriteLine("The following warnings occurred during text recognition:");
        foreach (string w in handler.Warnings)
        {
            Console.WriteLine("\t* " + w);
        }
    }
    else
    {
        Console.WriteLine("Text recognition was performed without any warnings.");
    }
}

निष्कर्ष

इन चरणों का पालन करके, आप अपने अनुप्रयोगों के भीतर OCR कार्यों को प्रभावी ढंग से संभालने के लिए GroupDocs.Parser for .NET का लाभ उठा सकते हैं। इस लाइब्रेरी द्वारा दी जाने वाली शक्तिशाली क्षमताओं के साथ छवियों या स्कैन किए गए दस्तावेज़ों से पाठ निकालना सहज हो जाता है।

अक्सर पूछे जाने वाले प्रश्न

क्या GroupDocs.Parser for .NET विभिन्न फ़ाइल स्वरूपों के साथ संगत है?

हां, GroupDocs.Parser पीडीएफ, DOCX, PPTX, XLSX, चित्र (JPEG, PNG, TIFF) और अधिक सहित फ़ाइल स्वरूपों की एक विस्तृत श्रृंखला का समर्थन करता है।

क्या मैं अपनी व्यावसायिक परियोजनाओं में .NET के लिए GroupDocs.Parser का उपयोग कर सकता हूं?

हां, आप लाइसेंस खरीदने के बाद GroupDocs.Parser for .NET को अपने व्यावसायिक अनुप्रयोगों में एकीकृत कर सकते हैं।

क्या GroupDocs.Parser एन्क्रिप्टेड या पासवर्ड-संरक्षित फ़ाइलों को संभालता है?

GroupDocs.Parser पासवर्ड-संरक्षित PDF दस्तावेज़ों से पाठ को पार्स और निकाल सकता है।

क्या .NET के लिए GroupDocs.Parser का कोई परीक्षण संस्करण उपलब्ध है?

हां, आप यहां से निःशुल्क परीक्षण संस्करण डाउनलोड कर सकते हैंयहाँ.

मैं .NET के लिए GroupDocs.Parser से संबंधित समर्थन कहां पा सकता हूं या प्रश्न पूछ सकता हूं?

आप यहां जा सकते हैंGroupDocs.Parser मंच किसी भी सहायता संबंधी प्रश्न या चर्चा के लिए.

पाठ पहचानना