Εξαγωγή πινάκων από το έγγραφο

Εισαγωγή

Το Groupdocs.Parser για .NET είναι μια ολοκληρωμένη βιβλιοθήκη που διευκολύνει την ανάλυση εγγράφων, επιτρέποντάς σας να εξάγετε πολύτιμες πληροφορίες όπως πίνακες, κείμενο, μεταδεδομένα και άλλα από έγγραφα. Σε αυτό το σεμινάριο, εστιάζουμε ειδικά στην εξαγωγή πινάκων από έγγραφα χρησιμοποιώντας το Groupdocs.Parser API.

Προαπαιτούμενα

Πριν ξεκινήσουμε, βεβαιωθείτε ότι έχετε τα εξής:

  • Το Visual Studio είναι εγκατεστημένο στο σύστημά σας.
  • Εγκατεστημένο .NET Framework ή .NET Core.
  • Βασικές γνώσεις προγραμματισμού C#.

Εισαγωγή χώρων ονομάτων

Αρχικά, πρέπει να εισαγάγετε τους απαραίτητους χώρους ονομάτων για πρόσβαση στις κλάσεις και τις μεθόδους Groupdocs.Parser.

using System;
using System.Collections.Generic;
using System.IO;
using System.Text;
using GroupDocs.Parser.Data;
using GroupDocs.Parser.Options;
using GroupDocs.Parser.Templates;

Βήμα 1: Δημιουργήστε μια παρουσία κλάσης Parser

Αρχικοποιήστε μια νέα παρουσία τουParser τάξη παρέχοντας τη διαδρομή προς το δείγμα εγγράφου σας.

using (Parser parser = new Parser("YourSampleFile.docx"))
{
    // Ο κωδικός σας πηγαίνει εδώ
}

Βήμα 2: Ελέγξτε την Υποστήριξη εξαγωγής πίνακα

Επαληθεύστε εάν το έγγραφο υποστηρίζει την εξαγωγή πίνακα χρησιμοποιώντας τοFeatures ιδιοκτησία τουParser τάξη.

if (!parser.Features.Tables)
{
    Console.WriteLine("Document doesn't support table extraction.");
    return;
}

Βήμα 3: Ορισμός διάταξης πίνακα

Καθορίστε τη διάταξη των πινάκων που θέλετε να εξαγάγετε χρησιμοποιώνταςTemplateTableLayout. Καθορίστε πλάτη στηλών και ύψη σειρών με βάση τη δομή του εγγράφου σας.

TemplateTableLayout layout = new TemplateTableLayout(
    new double[] { 50, 95, 275, 415, 485, 545 },
    new double[] { 325, 340, 365, 395 });

Βήμα 4: Ορισμός επιλογών εξαγωγής πίνακα

ΔημιουργώPageTableAreaOptions με την καθορισμένη διάταξη για να καθορίσετε τον τρόπο εξαγωγής των πινάκων.

PageTableAreaOptions options = new PageTableAreaOptions(layout);

Βήμα 5: Εξαγωγή πινάκων

Χρησιμοποιήστε τοGetTables μέθοδος τουParser κλάση για εξαγωγή πινάκων από το έγγραφο με βάση τις καθορισμένες επιλογές.

IEnumerable<PageTableArea> tables = parser.GetTables(options);

Βήμα 6: Επανάληψη και πρόσβαση σε δεδομένα πίνακα

Επαναλάβετε τους πίνακες που έχουν εξαχθεί και τις αντίστοιχες γραμμές και στήλες τους για να αποκτήσετε πρόσβαση στα δεδομένα κελιών.

foreach (PageTableArea table in tables)
{
    for (int row = 0; row < table.RowCount; row++)
    {
        for (int column = 0; column < table.ColumnCount; column++)
        {
            PageTableAreaCell cell = table[row, column];
            if (cell != null)
            {
                Console.Write(cell.Text);
                Console.Write(" | ");
            }
        }
        Console.WriteLine();
    }
    Console.WriteLine();
}

συμπέρασμα

Σε αυτό το σεμινάριο, έχουμε καλύψει τον τρόπο χρήσης του Groupdocs.Parser για .NET για την αποτελεσματική εξαγωγή πινάκων από έγγραφα. Αξιοποιώντας τις δυνατότητες αυτής της βιβλιοθήκης, μπορείτε να ενσωματώσετε την εξαγωγή πινάκων στις εφαρμογές σας .NET απρόσκοπτα.

Συχνές ερωτήσεις

Μπορεί το Groupdocs.Parser να χειριστεί διαφορετικές μορφές εγγράφων;

Ναι, το Groupdocs.Parser υποστηρίζει ένα ευρύ φάσμα μορφών εγγράφων, συμπεριλαμβανομένων των DOCX, PDF, XLSX και άλλων.

Υπάρχει διαθέσιμη δοκιμαστική έκδοση για το Groupdocs.Parser για .NET;

Ναι, μπορείτε να κάνετε λήψη μιας δωρεάν δοκιμής απόεδώ.

Πώς μπορώ να λάβω υποστήριξη για ερωτήματα που σχετίζονται με το Groupdocs.Parser;

Μπορείτε να επισκεφθείτε τοGroupdocs.Parser φόρουμ για βοήθεια.

Πού μπορώ να αγοράσω άδεια χρήσης για το Groupdocs.Parser;

Μπορείτε να αγοράσετε άδεια απόεδώ.

Πώς μπορώ να αποκτήσω προσωρινή άδεια για λόγους αξιολόγησης;

Μπορείτε να αποκτήσετε μια προσωρινή άδειαεδώ.