Praca z polami w połączonych pozycjach w szablonach
Wstęp
GroupDocs.Parser dla .NET to solidna biblioteka zaprojektowana w celu ułatwienia zadań analizowania dokumentów i ekstrakcji danych. Obsługuje szeroką gamę formatów plików, w tym PDF, DOCX, XLSX i inne. Jedną z jego kluczowych funkcji jest ekstrakcja danych w oparciu o szablony, która umożliwia definiowanie pól w dokumencie i wyodrębnianie określonych danych na podstawie tych predefiniowanych szablonów.
Warunki wstępne
Zanim zaczniemy, upewnij się, że masz następujące elementy:
- Podstawowa znajomość programowania w języku C#
- Program Visual Studio zainstalowany w systemie
- Biblioteka GroupDocs.Parser dla .NET (pobierz zTutaj)
- Przykładowe pliki dokumentów do pracy
Importowanie przestrzeni nazw
Zacznij od uwzględnienia niezbędnych przestrzeni nazw w projekcie C#:
using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using GroupDocs.Parser.Data;
using GroupDocs.Parser.Templates;
Krok 1: Zdefiniuj pola szablonu
Najpierw zdefiniuj pola szablonu za pomocą wyrażeń regularnych i połączonych pozycji:
// Zdefiniuj pole z wyrażeniem regularnym
TemplateField field = new TemplateField(
new TemplateRegexPosition("Tax"),
"Tax");
// Zdefiniuj połączone pole z określonymi ustawieniami pozycji
TemplateField linkedField = new TemplateField(
new TemplateLinkedPosition(
"Tax",
new Size(100, 20),
new TemplateLinkedPositionEdges(false, false, true, false)),
"TaxValue");
Krok 2: Utwórz szablon
Następnie utwórz szablon zawierający zdefiniowane pola:
// Utwórz szablon ze zdefiniowanymi polami
Template template = new Template(new TemplateItem[] { field, linkedField });
Krok 3: Przeanalizuj dokument za pomocą szablonu
Teraz zainicjujParser
class i przeanalizuj dokument, korzystając z szablonu:
using (Parser parser = new Parser("YourSampleFile.pdf"))
{
// Przeanalizuj dokument według szablonu
DocumentData data = parser.ParseByTemplate(template);
// Iteruj po wyodrębnionych danych i drukuj wyniki
for (int i = 0; i < data.Count; i++)
{
Console.Write(data[i].Name + ": ");
PageTextArea area = data[i].PageArea as PageTextArea;
Console.WriteLine(area == null ? "Not a template field" : area.Text);
}
}
Wniosek
GroupDocs.Parser dla .NET upraszcza proces wyodrębniania danych strukturalnych z dokumentów przy użyciu szablonów. Definiując pola i stosując szablony, możesz efektywnie wyodrębniać istotne informacje, zwiększając automatyzację i produktywność w zadaniach związanych z przetwarzaniem dokumentów.
Często zadawane pytania
Czy GroupDocs.Parser może wyodrębnić dane z zaszyfrowanych plików PDF?
Tak, GroupDocs.Parser obsługuje analizowanie zaszyfrowanych plików PDF, podając hasło podczas analizowania.
Jakie formaty plików są obsługiwane w przypadku wyodrębniania na podstawie szablonów?
GroupDocs.Parser obsługuje szeroką gamę formatów plików, w tym PDF, DOCX, XLSX, PPTX, TXT i inne.
Czy dostępna jest wersja próbna programu GroupDocs.Parser?
Tak, możesz pobrać bezpłatną wersję próbną ze stronyTutaj.
Czy mogę używać GroupDocs.Parser do wsadowego przetwarzania dokumentów?
Tak, GroupDocs.Parser umożliwia przetwarzanie wsadowe w celu jednoczesnego analizowania wielu dokumentów.
Gdzie mogę uzyskać pomoc techniczną dotyczącą GroupDocs.Parser?
Możesz uzyskać pomoc techniczną i nawiązać kontakt ze społecznością pod adresemForum GroupDocs.