Praca z polami w połączonych pozycjach w szablonach

Wstęp

GroupDocs.Parser dla .NET to solidna biblioteka zaprojektowana w celu ułatwienia zadań analizowania dokumentów i ekstrakcji danych. Obsługuje szeroką gamę formatów plików, w tym PDF, DOCX, XLSX i inne. Jedną z jego kluczowych funkcji jest ekstrakcja danych w oparciu o szablony, która umożliwia definiowanie pól w dokumencie i wyodrębnianie określonych danych na podstawie tych predefiniowanych szablonów.

Warunki wstępne

Zanim zaczniemy, upewnij się, że masz następujące elementy:

  • Podstawowa znajomość programowania w języku C#
  • Program Visual Studio zainstalowany w systemie
  • Biblioteka GroupDocs.Parser dla .NET (pobierz zTutaj)
  • Przykładowe pliki dokumentów do pracy

Importowanie przestrzeni nazw

Zacznij od uwzględnienia niezbędnych przestrzeni nazw w projekcie C#:

using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using GroupDocs.Parser.Data;
using GroupDocs.Parser.Templates;

Krok 1: Zdefiniuj pola szablonu

Najpierw zdefiniuj pola szablonu za pomocą wyrażeń regularnych i połączonych pozycji:

// Zdefiniuj pole z wyrażeniem regularnym
TemplateField field = new TemplateField(
    new TemplateRegexPosition("Tax"),
    "Tax");
// Zdefiniuj połączone pole z określonymi ustawieniami pozycji
TemplateField linkedField = new TemplateField(
    new TemplateLinkedPosition(
        "Tax",
        new Size(100, 20),
        new TemplateLinkedPositionEdges(false, false, true, false)),
    "TaxValue");

Krok 2: Utwórz szablon

Następnie utwórz szablon zawierający zdefiniowane pola:

// Utwórz szablon ze zdefiniowanymi polami
Template template = new Template(new TemplateItem[] { field, linkedField });

Krok 3: Przeanalizuj dokument za pomocą szablonu

Teraz zainicjujParser class i przeanalizuj dokument, korzystając z szablonu:

using (Parser parser = new Parser("YourSampleFile.pdf"))
{
    // Przeanalizuj dokument według szablonu
    DocumentData data = parser.ParseByTemplate(template);
    // Iteruj po wyodrębnionych danych i drukuj wyniki
    for (int i = 0; i < data.Count; i++)
    {
        Console.Write(data[i].Name + ": ");
        PageTextArea area = data[i].PageArea as PageTextArea;
        Console.WriteLine(area == null ? "Not a template field" : area.Text);
    }
}

Wniosek

GroupDocs.Parser dla .NET upraszcza proces wyodrębniania danych strukturalnych z dokumentów przy użyciu szablonów. Definiując pola i stosując szablony, możesz efektywnie wyodrębniać istotne informacje, zwiększając automatyzację i produktywność w zadaniach związanych z przetwarzaniem dokumentów.

Często zadawane pytania

Czy GroupDocs.Parser może wyodrębnić dane z zaszyfrowanych plików PDF?

Tak, GroupDocs.Parser obsługuje analizowanie zaszyfrowanych plików PDF, podając hasło podczas analizowania.

Jakie formaty plików są obsługiwane w przypadku wyodrębniania na podstawie szablonów?

GroupDocs.Parser obsługuje szeroką gamę formatów plików, w tym PDF, DOCX, XLSX, PPTX, TXT i inne.

Czy dostępna jest wersja próbna programu GroupDocs.Parser?

Tak, możesz pobrać bezpłatną wersję próbną ze stronyTutaj.

Czy mogę używać GroupDocs.Parser do wsadowego przetwarzania dokumentów?

Tak, GroupDocs.Parser umożliwia przetwarzanie wsadowe w celu jednoczesnego analizowania wielu dokumentów.

Gdzie mogę uzyskać pomoc techniczną dotyczącą GroupDocs.Parser?

Możesz uzyskać pomoc techniczną i nawiązać kontakt ze społecznością pod adresemForum GroupDocs.