निकाले गए डेटा में तालिकाओं के साथ कार्य करना

परिचय

इस ट्यूटोरियल में, हम यह पता लगाएंगे कि दस्तावेज़ों में तालिकाओं से डेटा निकालने के लिए .NET के लिए GroupDocs.Parser का उपयोग कैसे करें। GroupDocs.Parser एक शक्तिशाली उपकरण है जो डेवलपर्स को PDF, DOCX, XLSX, और अधिक जैसे विभिन्न फ़ाइल स्वरूपों से पाठ, मेटाडेटा और संरचित सामग्री को पार्स और निकालने में सक्षम बनाता है। विशेष रूप से, हम पूर्वनिर्धारित टेम्पलेट्स का उपयोग करके कुशलतापूर्वक तालिका डेटा निकालने पर ध्यान केंद्रित करेंगे।

आवश्यक शर्तें

आरंभ करने से पहले, सुनिश्चित करें कि आपके पास निम्नलिखित चीज़ें मौजूद हैं:

  • आपके मशीन पर Visual Studio स्थापित है.
  • C# और .NET फ्रेमवर्क की बुनियादी समझ।
  • GroupDocs.Parser लाइब्रेरी NuGet पैकेज मैनेजर के माध्यम से स्थापित की गई।

नामस्थान आयात करें

GroupDocs.Parser और संबंधित कार्यात्मकताओं के साथ कार्य करने के लिए आवश्यक नामस्थानों को आयात करके प्रारंभ करें।

using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using GroupDocs.Parser.Data;
using GroupDocs.Parser.Templates;

चरण 1: एक टेबल टेम्पलेट बनाएँ

तालिकाओं से डेटा निकालने के लिए, सबसे पहले, एक टेम्पलेट परिभाषित करें जो उस तालिका की संरचना का प्रतिनिधित्व करता है जिसे आप निकालना चाहते हैं। दस्तावेज़ के भीतर तालिका का स्थान और आयाम निर्दिष्ट करें।

// तालिका पैरामीटर (स्थान और आकार) परिभाषित करें
TemplateTableParameters parameters = new TemplateTableParameters(new Rectangle(new Point(35, 320), new Size(530, 55)), null);
// पैरामीटर्स के साथ एक टेबल टेम्पलेट बनाएँ
TemplateTable table = new TemplateTable(parameters, "Details", null);

चरण 2: टेम्पलेट परिभाषित करें

एक ऐसा टेम्पलेट बनाएँ जिसमें आपके द्वारा परिभाषित टेबल टेम्पलेट शामिल हो। यह टेम्पलेट पार्सर को यह बताएगा कि टेबल डेटा निकालते समय क्या देखना है।

// तालिका के साथ एक टेम्पलेट बनाएँ
Template template = new Template(new TemplateItem[] { table });

चरण 3: दस्तावेज़ पार्स करें और तालिका डेटा निकालें

आपके द्वारा परिभाषित टेम्पलेट का उपयोग करके किसी विशिष्ट दस्तावेज़ को पार्स करने के लिए GroupDocs.Parser से Parser वर्ग का उपयोग करें।

// अपनी नमूना फ़ाइल का पथ निर्दिष्ट करें
string filePath = "YourSampleFile.pdf";
// पार्सर क्लास का एक उदाहरण बनाएँ
using (Parser parser = new Parser(filePath))
{
    // टेम्पलेट द्वारा दस्तावेज़ को पार्स करें
    DocumentData data = parser.ParseByTemplate(template);
    // सभी निकाले गए डेटा पर पुनरावृत्ति करें
    for (int i = 0; i < data.Count; i++)
    {
        Console.Write(data[i].Name + ": ");
        // जाँचें कि निकाला गया फ़ील्ड एक तालिका है या नहीं
        PageTableArea area = data[i].PageArea as PageTableArea;
        if (area == null)
        {
            continue;
        }
        // तालिका पंक्तियों पर पुनरावृति करें
        for (int row = 0; row < area.RowCount; row++)
        {
            // तालिका स्तंभों पर पुनरावृति करें
            for (int column = 0; column < area.ColumnCount; column++)
            {
                // सेल मान प्राप्त करें
                PageTextArea cellValue = area[row, column].PageArea as PageTextArea;
                // सेल मान प्रिंट करें (या शून्य होने पर रिक्त स्ट्रिंग)
                Console.Write(cellValue == null ? "" : cellValue.Text);
                // स्तंभों के बीच टैब स्पेस प्रिंट करें
                if (column > 0)
                {
                    Console.Write("\t");
                }
            }
            // प्रत्येक पंक्ति को प्रिंट करने के बाद अगली पंक्ति पर जाएँ
            Console.WriteLine();
        }
    }
}

निष्कर्ष

इस ट्यूटोरियल में, हमने यह पता लगाया है कि दस्तावेज़ों से टेबल डेटा निकालने के लिए .NET के लिए GroupDocs.Parser का उपयोग कैसे करें। टेम्प्लेट परिभाषित करके और पार्सिंग विधियों का उपयोग करके, डेवलपर्स विभिन्न फ़ाइल स्वरूपों से तालिकाओं जैसे संरचित डेटा को कुशलतापूर्वक निकाल सकते हैं।

अक्सर पूछे जाने वाले प्रश्न

क्या GroupDocs.Parser सभी दस्तावेज़ प्रारूपों के साथ संगत है?

हां, GroupDocs.Parser पीडीएफ, DOCX, XLSX, PPTX और अधिक सहित फ़ाइल स्वरूपों की एक विस्तृत श्रृंखला का समर्थन करता है।

क्या मैं किसी दस्तावेज़ के विशिष्ट क्षेत्रों से डेटा निकाल सकता हूँ?

बिल्कुल, आप ऐसे टेम्पलेट्स परिभाषित कर सकते हैं जो निष्कर्षण के लिए दस्तावेज़ के भीतर विशिष्ट क्षेत्रों (जैसे तालिकाओं) को लक्षित करते हैं।

क्या GroupDocs.Parser बड़े दस्तावेज़ों के लिए उपयुक्त है?

हां, GroupDocs.Parser बड़े दस्तावेज़ों को कुशलतापूर्वक संभालने के लिए अनुकूलित है, जिससे डेवलपर्स को डेटा को सहजता से निकालने की सुविधा मिलती है।

क्या GroupDocs.Parser संरचित डेटा के साथ-साथ पाठ निष्कर्षण का समर्थन करता है?

हां, संरचित डेटा निष्कर्षण (जैसे तालिकाओं) के अलावा, GroupDocs.Parser दस्तावेज़ों से सादा पाठ और मेटाडेटा निकाल सकता है।

मैं GroupDocs.Parser एकीकरण के साथ समर्थन या सहायता कैसे प्राप्त कर सकता हूं?

सहायता और चर्चा के लिए, GroupDocs समुदाय फ़ोरम पर जाएँयहाँ.