पाठ पहचानना

परिचय

.NET विकास के क्षेत्र में, विभिन्न दस्तावेज़ स्वरूपों से कुशल पाठ निष्कर्षण सर्वोपरि है। .NET के लिए GroupDocs.Parser पाठ को सहजता से निकालने के लिए एक मजबूत समाधान प्रदान करता है। इस ट्यूटोरियल में, हम दस्तावेज़ों से पाठ को पहचानने और निकालने के लिए GroupDocs.Parser का चरण-दर-चरण उपयोग करने पर गहराई से विचार करेंगे।

आवश्यक शर्तें

इससे पहले कि हम GroupDocs.Parser का उपयोग करना शुरू करें, सुनिश्चित करें कि आपके पास निम्नलिखित पूर्वापेक्षाएँ हैं:

  • C# प्रोग्रामिंग की बुनियादी समझ
  • आपकी मशीन पर Visual Studio स्थापित है
  • पैकेज डाउनलोड और दस्तावेज़ संदर्भ के लिए इंटरनेट तक पहुंच

नामस्थान आयात करें

GroupDocs.Parser कार्यक्षमताओं का लाभ उठाने के लिए आवश्यक नामस्थानों को आयात करके आरंभ करें:

using System;
using System.Collections.Generic;
using System.Drawing;
using System.IO;
using System.Linq;
using System.Text;
using Aspose.OCR;
using GroupDocs.Parser.Data;
using GroupDocs.Parser.Options;

चरण 1: GroupDocs.Parser स्थापित करें

सबसे पहले, GroupDocs.Parser लाइब्रेरी डाउनलोड और इंस्टॉल करें। आप इसे यहाँ से प्राप्त कर सकते हैंलिंक को डाउनलोड करें.

चरण 2: अस्थायी लाइसेंस प्राप्त करें

GroupDocs.Parser का उपयोग करने के लिए, यहाँ से एक अस्थायी लाइसेंस प्राप्त करेंयहाँ.

चरण 3: ParserSettings आरंभ करना

इसका एक उदाहरण बनाएंParserSettingsयदि आवश्यक हो तो ओसीआर कनेक्टर सहित पाठ निष्कर्षण सेटिंग्स को कॉन्फ़िगर करने के लिए क्लास।

ParserSettings settings = new ParserSettings(new AsposeOcrOnPremise());

चरण 4: पाठ निकालने के लिए पार्सर का उपयोग करना

अब, इसका एक उदाहरण बनाएंParser कॉन्फ़िगर की गई सेटिंग्स के साथ क्लास।

using (Parser parser = new Parser("YourSampleFile.docx", settings))
{
    // OCR उपयोग के लिए TextOptions कॉन्फ़िगर करें
    TextOptions options = new TextOptions(false, true);
    // OCR का उपयोग करके पाठ निकालें
    using (TextReader reader = parser.GetText(options))
    {
        // निकाला गया पाठ या 'समर्थित नहीं' संदेश प्रदर्शित करें
        Console.WriteLine(reader == null ? "Text extraction isn't supported" : reader.ReadToEnd());
    }
}

इस स्निपेट में:

  • प्रतिस्थापित करें"YourSampleFile.docx" अपने लक्ष्य दस्तावेज़ के पथ के साथ.
  • TextOptions OCR को सक्षम करने और पाठ निष्कर्षण को अनुकूलित करने के लिए कॉन्फ़िगर किया गया है।

निष्कर्ष

बधाई हो! आपने सीखा है कि कैसे कुशलतापूर्वक पाठ निकालने के लिए अपने प्रोजेक्ट में GroupDocs.Parser for .NET को एकीकृत किया जाए।प्रलेखन उन्नत सुविधाओं और अनुकूलन के लिए.

अक्सर पूछे जाने वाले प्रश्न

क्या GroupDocs.Parser पीडीएफ फाइलों से पाठ निकालने के लिए उपयुक्त है?

हां, GroupDocs.Parser पीडीएफ सहित विभिन्न प्रारूपों से पाठ निष्कर्षण का समर्थन करता है।

क्या मैं अपने ASP.NET अनुप्रयोग में GroupDocs.Parser को एकीकृत कर सकता हूँ?

निश्चित रूप से, GroupDocs.Parser को ASP.NET अनुप्रयोगों में सहजता से एकीकृत किया जा सकता है।

क्या GroupDocs.Parser को व्यावसायिक उपयोग के लिए लाइसेंस की आवश्यकता है?

हां, व्यावसायिक उपयोग के लिए लाइसेंस की आवश्यकता होती है। अस्थायी लाइसेंस प्राप्त करेंयहाँ.

GroupDocs.Parser द्वारा कौन से दस्तावेज़ प्रारूप समर्थित हैं?

GroupDocs.Parser कई प्रकार के प्रारूपों का समर्थन करता है, जिसमें DOCX, PDF, XLSX आदि शामिल हैं।

मैं GroupDocs.Parser से संबंधित सहायता कैसे प्राप्त कर सकता हूं या प्रश्न पूछ सकता हूं?

दौरा करनाGroupDocs.Parser मंचसमर्थन और चर्चा के लिए।