Praca z układem tabeli w szablonach

Wstęp

W tym samouczku omówimy, jak pracować z układem tabeli w szablonach przy użyciu programu GroupDocs.Parser dla platformy .NET. GroupDocs.Parser to potężny interfejs API do analizowania dokumentów, który umożliwia programistom wyodrębnianie tekstu i metadanych z różnych formatów dokumentów, w tym PDF, pakietu Microsoft Office i innych.

Warunki wstępne

Zanim zaczniemy, upewnij się, że masz następujące wymagania wstępne:

  • Podstawowa znajomość programowania w C# i .NET.
  • Program Visual Studio zainstalowany na Twoim komputerze.
  • Zainstalowano GroupDocs.Parser dla .NET. Możesz go pobraćTutaj.

Importuj przestrzenie nazw

Najpierw zaimportuj niezbędne przestrzenie nazw do swojego projektu:

using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using GroupDocs.Parser.Data;
using GroupDocs.Parser.Templates;

Krok 1: Utwórz szablon tabeli z układem

Aby pracować z układami tabel w szablonach, należy zdefiniować strukturę tabeli za pomocąTemplateTableLayout. Układ ten określa szerokość kolumn i wysokość wierszy.

TemplateTableLayout layout = new TemplateTableLayout(
    new double[] { 30, 100, 320, 400, 480, 550 },   // Szerokości kolumn
    new double[] { 320, 345, 375 }                  // Wysokości rzędów
);
// Utwórz tabelę szablonów
TemplateTable table = new TemplateTable(layout, "Details", null);

Krok 2: Utwórz szablon

Teraz utwórz szablon, korzystając ze zdefiniowanej tabeli.

Template template = new Template(new TemplateItem[] { table });

Krok 3: Przeanalizuj dokument przy użyciu szablonu

Następnie utwórz instancjęParser class i analizuj dokument przy użyciu utworzonego szablonu.

using (Parser parser = new Parser("YourSampleFile.pdf"))
{
    // Przeanalizuj dokument według szablonu
    DocumentData data = parser.ParseByTemplate(template);
    // Iteruj po wyodrębnionych danych
    for (int i = 0; i < data.Count; i++)
    {
        Console.Write(data[i].Name + ": ");
        // Sprawdź, czy pole jest tabelą
        PageTableArea area = data[i].PageArea as PageTableArea;
        if (area == null)
        {
            continue;
        }
        // Iteruj po wierszach tabeli
        for (int row = 0; row < area.RowCount; row++)
        {
            // Iteruj po kolumnach tabeli
            for (int column = 0; column < area.ColumnCount; column++)
            {
                // Uzyskaj wartość komórki
                PageTextArea cellValue = area[row, column].PageArea as PageTextArea;
                // Wydrukuj wartość komórki
                Console.Write(cellValue == null ? "" : cellValue.Text);
                // Wydrukuj odstęp między kolumnami
                Console.Write("\t");
            }
            // Po każdym rzędzie przejdź do następnego wiersza
            Console.WriteLine();
        }
    }
}

Wniosek

W tym samouczku nauczyliśmy się, jak używać GroupDocs.Parser dla .NET do pracy z układami tabel w szablonach dokumentów. Postępując zgodnie z opisanymi krokami, możesz efektywnie analizować i wyodrębniać uporządkowane dane z dokumentów, ułatwiając różne zadania przetwarzania danych w swoich aplikacjach.

Często zadawane pytania

Czy mogę analizować tabele z dokumentów PDF za pomocą GroupDocs.Parser dla .NET?

Tak, GroupDocs.Parser obsługuje analizowanie tabel z dokumentów PDF i innych popularnych formatów.

Czy GroupDocs.Parser nadaje się do wyodrębniania określonych pól danych z dokumentów?

Absolutnie GroupDocs.Parser oferuje solidne funkcje wyodrębniania docelowych pól danych w oparciu o predefiniowane szablony.

Jak obsługiwać różne układy tabel w dokumencie?

GroupDocs.Parser umożliwia definiowanie niestandardowych szablonów w celu wydajnej obsługi różnorodnych układów tabel.

Czy GroupDocs.Parser obsługuje przetwarzanie dużych dokumentów?

Tak, GroupDocs.Parser jest zoptymalizowany do obsługi dokumentów o różnych rozmiarach, zapewniając wydajność i niezawodność.

Czy mogę zintegrować GroupDocs.Parser z innymi bibliotekami .NET?

Z pewnością GroupDocs.Parser bezproblemowo integruje się z innymi bibliotekami .NET, umożliwiając kompleksowe przetwarzanie dokumentów.