स्ट्रीम से दस्तावेज़ लोड करें

परिचय

.NET अनुप्रयोगों में दस्तावेज़ प्रसंस्करण के क्षेत्र में, विभिन्न फ़ाइल स्वरूपों से पाठ निकालना एक सामान्य आवश्यकता है। .NET के लिए GroupDocs.Parser दस्तावेज़ों की एक विविध श्रेणी से पाठ को सहजता से पार्स करने और निकालने के लिए एक शक्तिशाली समाधान प्रदान करता है। यह ट्यूटोरियल आपको दस्तावेज़ों से पाठ निकालने के लिए GroupDocs.Parser का उपयोग करने की प्रक्रिया के माध्यम से कदम दर कदम मार्गदर्शन करेगा।

आवश्यक शर्तें

.NET के लिए GroupDocs.Parser का उपयोग करने से पहले, सुनिश्चित करें कि आपके पास निम्नलिखित सेटअप है:

  • विकास वातावरण: विजुअल स्टूडियो या कोई अन्य .NET विकास वातावरण।
  • .NET पैकेज के लिए GroupDocs.Parser: .NET लाइब्रेरी के लिए GroupDocs.Parser डाउनलोड और इंस्टॉल करेंयहाँ.
  • दस्तावेज़ नमूने: पाठ निष्कर्षण के लिए नमूना दस्तावेज़ तैयार रखें।

नामस्थान आयात करना

GroupDocs.Parser कार्यात्मकताओं तक पहुँचने के लिए अपने .NET प्रोजेक्ट में आवश्यक नामस्थानों को आयात करके प्रारंभ करें।

using System;
using System.Collections.Generic;
using System.IO;
using System.Linq;
using System.Text;

निम्न चरण प्रदर्शित करते हैं कि किसी स्ट्रीम से GroupDocs.Parser का उपयोग करके दस्तावेज़ से पाठ कैसे निकाला जाए।

चरण 1: स्ट्रीम से दस्तावेज़ लोड करें

// स्ट्रीम बनाएं
using (Stream stream = File.OpenRead("YourSampleFile.docx"))
{
    // स्ट्रीम के साथ Parser क्लास का एक उदाहरण बनाएँ
    using (Parser parser = new Parser(stream))
    {
        // रीडर में पाठ निकालें
        using (TextReader reader = parser.GetText())
        {
            // दस्तावेज़ से पाठ प्रिंट करें
            // यदि पाठ निष्कर्षण समर्थित नहीं है, तो रीडर शून्य होगा
            Console.WriteLine(reader == null ? "Text extraction isn't supported" : reader.ReadToEnd());
        }
    }
}

इस उदाहरण में:

  • हम दस्तावेज़ फ़ाइल के लिए एक फ़ाइल स्ट्रीम खोलते हैं (YourSampleFile.docx).
  • आरंभ करेंParser धारा के साथ उदाहरण.
  • उपयोगparser.GetText() पुनः प्राप्त करने के लिएTextReader जिसमें निकाला गया पाठ शामिल है।
  • यदि दस्तावेज़ प्रारूप के लिए पाठ निष्कर्षण समर्थित नहीं है, तो निकाले गए पाठ या संदेश का प्रिंट आउट लें।

निष्कर्ष

.NET के लिए GroupDocs.Parser विभिन्न दस्तावेज़ स्वरूपों से पाठ निष्कर्षण को सरल बनाता है, जिससे डेवलपर्स को अपने अनुप्रयोगों के भीतर पाठ्य सामग्री को कुशलतापूर्वक संसाधित और उपयोग करने में सक्षम बनाता है। इस ट्यूटोरियल में बताए गए चरणों का पालन करके, आप अपने .NET प्रोजेक्ट में दस्तावेज़ पाठ निष्कर्षण क्षमताओं को सहजता से एकीकृत कर सकते हैं।

अक्सर पूछे जाने वाले प्रश्न

.NET के लिए GroupDocs.Parser द्वारा कौन से दस्तावेज़ प्रारूप समर्थित हैं?

GroupDocs.Parser DOCX, PDF, XLSX, PPTX, EPUB, आदि सहित दस्तावेज़ प्रारूपों की एक विस्तृत श्रृंखला का समर्थन करता है।

क्या GroupDocs.Parser दस्तावेज़ों से छवियाँ या मेटाडेटा निकाल सकता है?

हां, GroupDocs.Parser विभिन्न दस्तावेज़ प्रकारों से चित्र, मेटाडेटा और पाठ निकाल सकता है।

क्या GroupDocs.Parser .NET कोर अनुप्रयोगों के साथ संगत है?

हां, GroupDocs.Parser .NET फ्रेमवर्क और .NET कोर अनुप्रयोगों दोनों के साथ संगत है।

मैं GroupDocs.Parser के लिए अस्थायी लाइसेंस कैसे प्राप्त कर सकता हूं?

आप यहां से अस्थायी लाइसेंस प्राप्त कर सकते हैंयहाँ.

मैं GroupDocs.Parser के लिए अधिक समर्थन या दस्तावेज़ कहां पा सकता हूं?

अतिरिक्त सहायता के लिए, यहां जाएंGroupDocs.Parser फ़ोरम या देखेंप्रलेखन.