टेम्पलेट्स में लिंक किए गए स्थानों पर फ़ील्ड के साथ कार्य करना
परिचय
.NET के लिए GroupDocs.Parser एक मजबूत लाइब्रेरी है जिसे दस्तावेज़ पार्सिंग और डेटा निष्कर्षण कार्यों को सुविधाजनक बनाने के लिए डिज़ाइन किया गया है। यह PDF, DOCX, XLSX और अन्य सहित फ़ाइल स्वरूपों की एक विस्तृत श्रृंखला का समर्थन करता है। इसकी प्रमुख विशेषताओं में से एक टेम्पलेट-आधारित डेटा निष्कर्षण है, जो आपको दस्तावेज़ के भीतर फ़ील्ड परिभाषित करने और इन पूर्वनिर्धारित टेम्पलेट्स के आधार पर विशिष्ट डेटा निकालने की अनुमति देता है।
आवश्यक शर्तें
शुरू करने से पहले, सुनिश्चित करें कि आपके पास निम्नलिखित हैं:
- C# प्रोग्रामिंग की बुनियादी समझ
- आपके सिस्टम पर Visual Studio स्थापित है
- .NET लाइब्रेरी के लिए GroupDocs.Parser (डाउनलोड करेंयहाँ)
- काम करने के लिए नमूना दस्तावेज़ फ़ाइलें
नामस्थान आयात करना
अपने C# प्रोजेक्ट में आवश्यक नामस्थानों को शामिल करके आरंभ करें:
using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using GroupDocs.Parser.Data;
using GroupDocs.Parser.Templates;
चरण 1: टेम्पलेट फ़ील्ड परिभाषित करें
सबसे पहले, नियमित अभिव्यक्तियों और लिंक किए गए पदों का उपयोग करके टेम्पलेट फ़ील्ड को परिभाषित करें:
// नियमित अभिव्यक्ति के साथ फ़ील्ड परिभाषित करें
TemplateField field = new TemplateField(
new TemplateRegexPosition("Tax"),
"Tax");
// विशिष्ट स्थिति सेटिंग के साथ लिंक किए गए फ़ील्ड को परिभाषित करें
TemplateField linkedField = new TemplateField(
new TemplateLinkedPosition(
"Tax",
new Size(100, 20),
new TemplateLinkedPositionEdges(false, false, true, false)),
"TaxValue");
चरण 2: एक टेम्पलेट बनाएँ
इसके बाद, परिभाषित फ़ील्ड वाला एक टेम्पलेट बनाएं:
// परिभाषित फ़ील्ड के साथ एक टेम्पलेट बनाएँ
Template template = new Template(new TemplateItem[] { field, linkedField });
चरण 3: टेम्पलेट के साथ दस्तावेज़ पार्स करें
अब, आरंभ करेंParser
क्लास में जाकर टेम्पलेट का उपयोग करके दस्तावेज़ को पार्स करें:
using (Parser parser = new Parser("YourSampleFile.pdf"))
{
// टेम्पलेट द्वारा दस्तावेज़ को पार्स करें
DocumentData data = parser.ParseByTemplate(template);
// निकाले गए डेटा को पुनरावृत्त करें और परिणाम प्रिंट करें
for (int i = 0; i < data.Count; i++)
{
Console.Write(data[i].Name + ": ");
PageTextArea area = data[i].PageArea as PageTextArea;
Console.WriteLine(area == null ? "Not a template field" : area.Text);
}
}
निष्कर्ष
.NET के लिए GroupDocs.Parser टेम्प्लेट का उपयोग करके दस्तावेज़ों से संरचित डेटा निकालने की प्रक्रिया को सरल बनाता है। फ़ील्ड परिभाषित करके और टेम्प्लेट लागू करके, आप दस्तावेज़ प्रसंस्करण कार्यों में स्वचालन और उत्पादकता को बढ़ाते हुए, कुशलतापूर्वक प्रासंगिक जानकारी निकाल सकते हैं।
अक्सर पूछे जाने वाले प्रश्न
क्या GroupDocs.Parser एन्क्रिप्टेड PDF फ़ाइलों से डेटा निकाल सकता है?
हां, GroupDocs.Parser पार्सिंग के दौरान पासवर्ड प्रदान करके एन्क्रिप्टेड PDF फ़ाइलों को पार्स करने का समर्थन करता है।
टेम्पलेट-आधारित निष्कर्षण के लिए कौन से फ़ाइल प्रारूप समर्थित हैं?
GroupDocs.Parser पीडीएफ, DOCX, XLSX, PPTX, TXT, आदि सहित फ़ाइल स्वरूपों की एक विस्तृत श्रृंखला का समर्थन करता है।
क्या GroupDocs.Parser के लिए कोई परीक्षण संस्करण उपलब्ध है?
हां, आप यहां से निःशुल्क परीक्षण संस्करण डाउनलोड कर सकते हैंयहाँ.
क्या मैं दस्तावेजों के बैच प्रसंस्करण के लिए GroupDocs.Parser का उपयोग कर सकता हूं?
हां, GroupDocs.Parser बैच प्रोसेसिंग को एक साथ कई दस्तावेजों को पार्स करने की अनुमति देता है।
मुझे GroupDocs.Parser के लिए तकनीकी सहायता कहां मिल सकती है?
आप तकनीकी सहायता प्राप्त कर सकते हैं और समुदाय के साथ जुड़ सकते हैंग्रुपडॉक्स फ़ोरम.