विशिष्ट फ़ाइल प्रारूप लोड करना

परिचय

.NET डेवलपमेंट की दुनिया में, विभिन्न फ़ाइल स्वरूपों से टेक्स्ट को पार्स करना और निकालना एक सामान्य आवश्यकता है। .NET के लिए GroupDocs.Parser इस कार्य को सरल बनाने के लिए शक्तिशाली उपकरण प्रदान करता है। यह ट्यूटोरियल आपको GroupDocs.Parser का उपयोग करके विशिष्ट फ़ाइल स्वरूपों से टेक्स्ट को चरण दर चरण लोड करने और निकालने के बारे में मार्गदर्शन करेगा।

आवश्यक शर्तें

इस ट्यूटोरियल में आगे बढ़ने से पहले, सुनिश्चित करें कि आपके पास निम्नलिखित हैं:

  • C# और .NET विकास का बुनियादी ज्ञान।
  • .NET विकास के लिए Visual Studio या कोई अन्य IDE स्थापित होना चाहिए।
  • .NET लाइब्रेरी के लिए GroupDocs.Parser. आप इसे यहाँ से डाउनलोड कर सकते हैंयहाँ.
  • समर्थित प्रारूपों में से किसी एक में नमूना फ़ाइल (जैसे, Word, PDF, Markdown).

नामस्थान आयात करें

अपनी C# फ़ाइल में आवश्यक नामस्थान जोड़कर आरंभ करें:

using System;
using System.Collections.Generic;
using System.IO;
using System.Text;
using GroupDocs.Parser.Options;

किसी विशिष्ट फ़ाइल प्रारूप से पाठ लोड करने और निकालने के लिए इन चरणों का पालन करें:

चरण 1: फ़ाइल स्ट्रीम खोलें

सबसे पहले, अपनी नमूना फ़ाइल के लिए एक स्ट्रीम खोलें:

using (Stream stream = File.OpenRead("YourSampleFile.docx"))
{
    // अगले चरण पर आगे बढ़ें
}

प्रतिस्थापित करें"YourSampleFile.docx" अपनी नमूना फ़ाइल के पथ के साथ.

चरण 2: पार्सर इंस्टेंस बनाएं

उदाहरण प्रस्तुत करेंParser क्लास में खुली स्ट्रीम को जोड़ें और फ़ाइल प्रारूप निर्दिष्ट करें:

using (Parser parser = new Parser(stream, new LoadOptions(FileFormat.Docx)))
{
    // अगले चरण पर आगे बढ़ें
}

प्रतिस्थापित करेंFileFormat.Docx आपकी नमूना फ़ाइल के आधार पर उपयुक्त फ़ाइल प्रारूप गणना के साथ (उदाहरण के लिए,FileFormat.Pdf, FileFormat.Markup मार्कडाउन के लिए).

चरण 3: टेक्स्ट निष्कर्षण समर्थन की जाँच करें

सत्यापित करें कि लोड की गई फ़ाइल प्रारूप के लिए पाठ निष्कर्षण समर्थित है या नहीं:

if (!parser.Features.Text)
{
    Console.WriteLine("Text extraction isn't supported.");
    return;
}

चरण 4: दस्तावेज़ से पाठ निकालें

उपयोगparser.GetText() प्राप्त करने के लिएTextReader उदाहरण और निकाले गए पाठ को पढ़ें:

using (TextReader reader = parser.GetText())
{
    string extractedText = reader.ReadToEnd();
    Console.WriteLine(extractedText);
}

निष्कर्ष

GroupDocs.Parser for .NET विभिन्न फ़ाइल स्वरूपों से टेक्स्ट निष्कर्षण को सरल बनाता है, जिससे C# अनुप्रयोगों में कुशल दस्तावेज़ प्रसंस्करण सक्षम होता है। इस ट्यूटोरियल का अनुसरण करके, आपने सीखा है कि GroupDocs.Parser का उपयोग करके विशिष्ट फ़ाइल स्वरूपों को कैसे लोड किया जाए और टेक्स्ट कैसे निकाला जाए।

अक्सर पूछे जाने वाले प्रश्न

क्या GroupDocs.Parser for .NET उपयोग करने के लिए स्वतंत्र है?

GroupDocs.Parser for .NET निःशुल्क और सशुल्क लाइसेंसिंग विकल्प दोनों प्रदान करता है। आप उन्हें एक्सप्लोर कर सकते हैंयहाँ.

.NET के लिए GroupDocs.Parser द्वारा कौन से फ़ाइल स्वरूप समर्थित हैं?

GroupDocs.Parser कई तरह के फ़ाइल फ़ॉर्मेट को सपोर्ट करता है, जिसमें Word, PDF, Excel, PowerPoint, Markdown और बहुत कुछ शामिल है। दस्तावेज़ देखेंयहाँ पूरी सूची के लिए यहां क्लिक करें.

क्या मैं खरीदने से पहले .NET के लिए GroupDocs.Parser आज़मा सकता हूं?

हां, आप निःशुल्क परीक्षण संस्करण का उपयोग कर सकते हैंयहाँ.

मैं GroupDocs.Parser for .NET के बारे में समर्थन कहां पा सकता हूं या प्रश्न पूछ सकता हूं?

GroupDocs.Parser फ़ोरम पर जाएँयहाँ किसी भी प्रश्न या सहायता की आवश्यकता के लिए.

मैं .NET के लिए GroupDocs.Parser हेतु अस्थायी लाइसेंस कैसे प्राप्त कर सकता हूं?

आप अस्थायी लाइसेंस प्राप्त कर सकते हैंयहाँ.