Praca z układem tabeli w szablonach
Wstęp
W tym samouczku omówimy, jak pracować z układem tabeli w szablonach przy użyciu programu GroupDocs.Parser dla platformy .NET. GroupDocs.Parser to potężny interfejs API do analizowania dokumentów, który umożliwia programistom wyodrębnianie tekstu i metadanych z różnych formatów dokumentów, w tym PDF, pakietu Microsoft Office i innych.
Warunki wstępne
Zanim zaczniemy, upewnij się, że masz następujące wymagania wstępne:
- Podstawowa znajomość programowania w C# i .NET.
- Program Visual Studio zainstalowany na Twoim komputerze.
- Zainstalowano GroupDocs.Parser dla .NET. Możesz go pobraćTutaj.
Importuj przestrzenie nazw
Najpierw zaimportuj niezbędne przestrzenie nazw do swojego projektu:
using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using GroupDocs.Parser.Data;
using GroupDocs.Parser.Templates;
Krok 1: Utwórz szablon tabeli z układem
Aby pracować z układami tabel w szablonach, należy zdefiniować strukturę tabeli za pomocąTemplateTableLayout
. Układ ten określa szerokość kolumn i wysokość wierszy.
TemplateTableLayout layout = new TemplateTableLayout(
new double[] { 30, 100, 320, 400, 480, 550 }, // Szerokości kolumn
new double[] { 320, 345, 375 } // Wysokości rzędów
);
// Utwórz tabelę szablonów
TemplateTable table = new TemplateTable(layout, "Details", null);
Krok 2: Utwórz szablon
Teraz utwórz szablon, korzystając ze zdefiniowanej tabeli.
Template template = new Template(new TemplateItem[] { table });
Krok 3: Przeanalizuj dokument przy użyciu szablonu
Następnie utwórz instancjęParser
class i analizuj dokument przy użyciu utworzonego szablonu.
using (Parser parser = new Parser("YourSampleFile.pdf"))
{
// Przeanalizuj dokument według szablonu
DocumentData data = parser.ParseByTemplate(template);
// Iteruj po wyodrębnionych danych
for (int i = 0; i < data.Count; i++)
{
Console.Write(data[i].Name + ": ");
// Sprawdź, czy pole jest tabelą
PageTableArea area = data[i].PageArea as PageTableArea;
if (area == null)
{
continue;
}
// Iteruj po wierszach tabeli
for (int row = 0; row < area.RowCount; row++)
{
// Iteruj po kolumnach tabeli
for (int column = 0; column < area.ColumnCount; column++)
{
// Uzyskaj wartość komórki
PageTextArea cellValue = area[row, column].PageArea as PageTextArea;
// Wydrukuj wartość komórki
Console.Write(cellValue == null ? "" : cellValue.Text);
// Wydrukuj odstęp między kolumnami
Console.Write("\t");
}
// Po każdym rzędzie przejdź do następnego wiersza
Console.WriteLine();
}
}
}
Wniosek
W tym samouczku nauczyliśmy się, jak używać GroupDocs.Parser dla .NET do pracy z układami tabel w szablonach dokumentów. Postępując zgodnie z opisanymi krokami, możesz efektywnie analizować i wyodrębniać uporządkowane dane z dokumentów, ułatwiając różne zadania przetwarzania danych w swoich aplikacjach.
Często zadawane pytania
Czy mogę analizować tabele z dokumentów PDF za pomocą GroupDocs.Parser dla .NET?
Tak, GroupDocs.Parser obsługuje analizowanie tabel z dokumentów PDF i innych popularnych formatów.
Czy GroupDocs.Parser nadaje się do wyodrębniania określonych pól danych z dokumentów?
Absolutnie GroupDocs.Parser oferuje solidne funkcje wyodrębniania docelowych pól danych w oparciu o predefiniowane szablony.
Jak obsługiwać różne układy tabel w dokumencie?
GroupDocs.Parser umożliwia definiowanie niestandardowych szablonów w celu wydajnej obsługi różnorodnych układów tabel.
Czy GroupDocs.Parser obsługuje przetwarzanie dużych dokumentów?
Tak, GroupDocs.Parser jest zoptymalizowany do obsługi dokumentów o różnych rozmiarach, zapewniając wydajność i niezawodność.
Czy mogę zintegrować GroupDocs.Parser z innymi bibliotekami .NET?
Z pewnością GroupDocs.Parser bezproblemowo integruje się z innymi bibliotekami .NET, umożliwiając kompleksowe przetwarzanie dokumentów.