स्थानीय डिस्क से दस्तावेज़ लोड करें
परिचय
इस ट्यूटोरियल में, हम यह पता लगाएंगे कि दस्तावेज़ों से टेक्स्ट निकालने के लिए .NET के लिए GroupDocs.Parser का उपयोग कैसे करें। GroupDocs.Parser एक शक्तिशाली लाइब्रेरी है जो डेवलपर्स को विभिन्न दस्तावेज़ प्रारूपों को पार्स करने और प्रोग्रामेटिक रूप से टेक्स्ट सामग्री निकालने की अनुमति देती है। हम इस लाइब्रेरी का उपयोग करके टेक्स्ट निष्कर्षण के साथ आरंभ करने के लिए आवश्यक चरणों को कवर करेंगे।
आवश्यक शर्तें
शुरू करने से पहले, सुनिश्चित करें कि आपके पास निम्नलिखित पूर्वापेक्षाएँ स्थापित हैं:
- आपके सिस्टम पर Visual Studio स्थापित है.
- C# प्रोग्रामिंग भाषा का बुनियादी ज्ञान।
- .NET लाइब्रेरी के लिए GroupDocs.Parser स्थापित (डाउनलोडयहाँ).
नामस्थान आयात करें
सबसे पहले, आपको अपने C# प्रोजेक्ट में आवश्यक नेमस्पेस आयात करने होंगे:
using System;
using System.Collections.Generic;
using System.IO;
using System.Linq;
using System.Text;
चरण 1: स्थानीय डिस्क से दस्तावेज़ लोड करें
अपने स्थानीय डिस्क से एक दस्तावेज़ लोड करके शुरू करें।"Your Sample File"
अपने लक्ष्य दस्तावेज़ के पथ के साथ.
// फ़ाइलपथ सेट करें
string filePath = "Your Sample File";
// फ़ाइलपथ के साथ पार्सर क्लास का एक उदाहरण बनाएँ
using (Parser parser = new Parser(filePath))
{
// रीडर में पाठ निकालें
using (TextReader reader = parser.GetText())
{
//दस्तावेज़ से निकाले गए पाठ को प्रिंट करें
// यदि पाठ निष्कर्षण समर्थित नहीं है, तो रीडर शून्य होगा
Console.WriteLine(reader == null ? "Text extraction isn't supported" : reader.ReadToEnd());
}
}
चरणों का स्पष्टीकरण
- फ़ाइल पथ सेट करना: उस दस्तावेज़ का पथ निर्दिष्ट करके शुरू करें जिससे आप पाठ निकालना चाहते हैं (
filePath
चर)। - पार्सर इंस्टेंस बनाना: इंस्टेंसिएट करना
Parser
कक्षा उत्तीर्ण करकेfilePath
. - पाठ निकालना: का उपयोग करें
GetText()
की विधिParser
उदाहरण प्राप्त करने के लिएTextReader
दस्तावेज़ से निकाला गया पाठ युक्त ऑब्जेक्ट. - निकाले गए पाठ को पढ़ना: उपयोग करें
ReadToEnd()
की विधिTextReader
दस्तावेज़ से निकाली गई संपूर्ण पाठ सामग्री को पुनः प्राप्त करने के लिए। - असमर्थित प्रारूपों को संभालना: यदि दस्तावेज़ प्रारूप पाठ निष्कर्षण का समर्थन नहीं करता है, तो
reader
वस्तु होगीnull
, और आप इस परिदृश्य को तदनुसार संभाल सकते हैं।
निष्कर्ष
इस ट्यूटोरियल में, हमने .NET के लिए GroupDocs.Parser का उपयोग करके दस्तावेज़ से टेक्स्ट निकालने के शुरुआती चरणों को कवर किया है। यह लाइब्रेरी दस्तावेज़ पार्सिंग के लिए व्यापक सुविधाएँ प्रदान करती है, जिससे डेवलपर्स अपने अनुप्रयोगों के भीतर विभिन्न फ़ाइल स्वरूपों के साथ कुशलतापूर्वक काम कर सकते हैं।
अक्सर पूछे जाने वाले प्रश्न
क्या GroupDocs.Parser सभी दस्तावेज़ प्रारूपों के साथ संगत है?
GroupDocs.Parser पीडीएफ, माइक्रोसॉफ्ट ऑफिस दस्तावेज़ (वर्ड, एक्सेल, पावरपॉइंट), और अधिक सहित प्रारूपों की एक विस्तृत श्रृंखला का समर्थन करता है।
क्या मैं GroupDocs.Parser का उपयोग करके पाठ के साथ मेटाडेटा निकाल सकता हूँ?
हां, GroupDocs.Parser समर्थित दस्तावेज़ प्रारूपों से पाठ सामग्री और मेटाडेटा दोनों को निकालने की अनुमति देता है।
मैं GroupDocs.Parser के लिए अधिक संसाधन और समर्थन कहां पा सकता हूं?
दौरा करनाGroupDocs.Parser दस्तावेज़ीकरण विस्तृत API संदर्भ के लिए और अन्वेषण करेंग्रुपडॉक्स फोरम सामुदायिक समर्थन के लिए.
मैं GroupDocs.Parser के लिए अस्थायी लाइसेंस कैसे प्राप्त कर सकता हूं?
आप अनुरोध कर सकते हैंअस्थायी लाइसेंस मूल्यांकन और परीक्षण प्रयोजनों के लिए।
क्या GroupDocs.Parser के लिए कोई निःशुल्क परीक्षण उपलब्ध है?
हां, आप डाउनलोड कर सकते हैंमुफ्त परीक्षण GroupDocs.Parser का संस्करण.