Praca z polami w ustalonych pozycjach w szablonach

Wstęp

W tym samouczku omówimy, jak pracować z polami w ustalonych pozycjach w szablonach przy użyciu GroupDocs.Parser dla .NET. GroupDocs.Parser to potężna biblioteka do analizowania dokumentów, która umożliwia programistom wyodrębnianie danych z różnych formatów dokumentów, takich jak PDF, Word, Excel i innych. W szczególności skupimy się na definiowaniu i wykorzystywaniu pól szablonów w celu wyodrębnienia ukierunkowanych informacji na podstawie ich stałych pozycji.

Warunki wstępne

Zanim zaczniemy, upewnij się, że masz następujące elementy:

  • Podstawowa znajomość programowania w C# i .NET.
  • Program Visual Studio zainstalowany w systemie.
  • Zainstalowana biblioteka GroupDocs.Parser for .NET. Można go pobrać zTutaj.
  • Przykładowe pliki dokumentów do testów.

Importuj przestrzenie nazw

Zacznij od uwzględnienia niezbędnych przestrzeni nazw w projekcie C#:

using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using GroupDocs.Parser.Data;
using GroupDocs.Parser.Templates;

Krok 1: Zdefiniuj pole szablonu

Najpierw zdefiniuj pole ze stałą pozycją w szablonie. To pole reprezentuje obszar, z którego zostaną wyodrębnione dane.

TemplateField field = new TemplateField(
    new TemplateFixedPosition(new Rectangle(new Point(35, 135), new Size(100, 10))),
    "FromCompany");

Tutaj:

  • Rectangle określa położenie i wielkość pola.
  • Point(35, 135) reprezentuje współrzędne lewego górnego rogu.
  • Size(100, 10) określa szerokość i wysokość pola.
  • "FromCompany" to nazwa przypisana do tego pola.

Krok 2: Utwórz szablon

Skonstruuj szablon, korzystając ze zdefiniowanego pola.

Template template = new Template(new TemplateItem[] { field });

TheTemplate obiekt przechowuje zdefiniowane pola.

Krok 3: Przeanalizuj dokument przy użyciu szablonu

Utwórz instancjęParser class z docelową ścieżką dokumentu, a następnie przeanalizuj dokument przy użyciu utworzonego szablonu.

using (Parser parser = new Parser("YourSampleFile.pdf"))
{
    DocumentData data = parser.ParseByTemplate(template);
    // Iteruj po wyodrębnionych danych
    for (int i = 0; i < data.Count; i++)
    {
        Console.Write(data[i].Name + ": ");
        PageTextArea area = data[i].PageArea as PageTextArea;
        Console.WriteLine(area == null ? "Not a template field" : area.Text);
    }
}

Tutaj:

  • Parser jest inicjowany przy użyciu ścieżki przykładowego pliku dokumentu.
  • ParseByTemplate metoda służy do wyodrębniania danych na podstawie dostarczonego szablonu.
  • Dostęp do wyodrębnionych danych uzyskuje się za pomocąDocumentDatagdzie każdy element odpowiada zdefiniowanemu polu.

Wniosek

W tym samouczku omówiliśmy proces pracy z polami w ustalonych pozycjach w szablonach przy użyciu GroupDocs.Parser dla .NET. Definiując szablony z określonymi pozycjami pól, programiści mogą dokładnie wyodrębniać docelowe dane z różnych formatów dokumentów.

Często zadawane pytania

Czy GroupDocs.Parser jest kompatybilny ze wszystkimi formatami dokumentów?

GroupDocs.Parser obsługuje szeroką gamę formatów plików, w tym PDF, Microsoft Word, Excel, PowerPoint i inne. Patrzdokumentacja aby uzyskać szczegółową listę.

Jak mogę uzyskać tymczasową licencję na GroupDocs.Parser?

Licencję tymczasową do celów testowych można uzyskać odTutaj.

Gdzie mogę znaleźć pomoc dotyczącą GroupDocs.Parser?

Aby uzyskać pomoc techniczną i dyskusje, odwiedź stronęForum GroupDocs.Parser.

Czy mogę wypróbować GroupDocs.Parser przed zakupem?

Tak, możesz przeglądać bibliotekę w ramach bezpłatnego okresu próbnegoTutaj.

Jak kupić licencję na GroupDocs.Parser?

Aby kupić licencję, odwiedź stronęstrona zakupu.