Praca z polami w ustalonych pozycjach w szablonach

Wstęp

W tym samouczku omówimy, jak pracować z polami w ustalonych pozycjach w szablonach przy użyciu GroupDocs.Parser dla .NET. GroupDocs.Parser to potężna biblioteka do analizowania dokumentów, która umożliwia programistom wyodrębnianie danych z różnych formatów dokumentów, takich jak PDF, Word, Excel i innych. W szczególności skupimy się na definiowaniu i wykorzystywaniu pól szablonów w celu wyodrębnienia ukierunkowanych informacji na podstawie ich stałych pozycji.

Warunki wstępne

Zanim zaczniemy, upewnij się, że masz następujące elementy:

Podstawowa znajomość programowania w C# i .NET.
Program Visual Studio zainstalowany w systemie.
Zainstalowana biblioteka GroupDocs.Parser for .NET. Można go pobrać zTutaj.
Przykładowe pliki dokumentów do testów.

Importuj przestrzenie nazw

Zacznij od uwzględnienia niezbędnych przestrzeni nazw w projekcie C#:

using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using GroupDocs.Parser.Data;
using GroupDocs.Parser.Templates;

Krok 1: Zdefiniuj pole szablonu

Najpierw zdefiniuj pole ze stałą pozycją w szablonie. To pole reprezentuje obszar, z którego zostaną wyodrębnione dane.

TemplateField field = new TemplateField(
    new TemplateFixedPosition(new Rectangle(new Point(35, 135), new Size(100, 10))),
    "FromCompany");

Tutaj:

Rectangle określa położenie i wielkość pola.
Point(35, 135) reprezentuje współrzędne lewego górnego rogu.
Size(100, 10) określa szerokość i wysokość pola.
"FromCompany" to nazwa przypisana do tego pola.

Krok 2: Utwórz szablon

Skonstruuj szablon, korzystając ze zdefiniowanego pola.

Template template = new Template(new TemplateItem[] { field });

TheTemplate obiekt przechowuje zdefiniowane pola.

Krok 3: Przeanalizuj dokument przy użyciu szablonu

Utwórz instancjęParser class z docelową ścieżką dokumentu, a następnie przeanalizuj dokument przy użyciu utworzonego szablonu.

using (Parser parser = new Parser("YourSampleFile.pdf"))
{
    DocumentData data = parser.ParseByTemplate(template);
    // Iteruj po wyodrębnionych danych
    for (int i = 0; i < data.Count; i++)
    {
        Console.Write(data[i].Name + ": ");
        PageTextArea area = data[i].PageArea as PageTextArea;
        Console.WriteLine(area == null ? "Not a template field" : area.Text);
    }
}

Tutaj:

Parser jest inicjowany przy użyciu ścieżki przykładowego pliku dokumentu.
ParseByTemplate metoda służy do wyodrębniania danych na podstawie dostarczonego szablonu.
Dostęp do wyodrębnionych danych uzyskuje się za pomocąDocumentDatagdzie każdy element odpowiada zdefiniowanemu polu.

Wniosek

W tym samouczku omówiliśmy proces pracy z polami w ustalonych pozycjach w szablonach przy użyciu GroupDocs.Parser dla .NET. Definiując szablony z określonymi pozycjami pól, programiści mogą dokładnie wyodrębniać docelowe dane z różnych formatów dokumentów.

Często zadawane pytania

Czy GroupDocs.Parser jest kompatybilny ze wszystkimi formatami dokumentów?

GroupDocs.Parser obsługuje szeroką gamę formatów plików, w tym PDF, Microsoft Word, Excel, PowerPoint i inne. Patrzdokumentacja aby uzyskać szczegółową listę.

Jak mogę uzyskać tymczasową licencję na GroupDocs.Parser?

Licencję tymczasową do celów testowych można uzyskać odTutaj.

Gdzie mogę znaleźć pomoc dotyczącą GroupDocs.Parser?

Aby uzyskać pomoc techniczną i dyskusje, odwiedź stronęForum GroupDocs.Parser.

Czy mogę wypróbować GroupDocs.Parser przed zakupem?

Tak, możesz przeglądać bibliotekę w ramach bezpłatnego okresu próbnegoTutaj.

Jak kupić licencję na GroupDocs.Parser?

Aby kupić licencję, odwiedź stronęstrona zakupu.

Praca z kodami kreskowymi w szablonach Praca z polami w połączonych pozycjach w szablonach