Arbeiten mit Feldern an verknüpften Positionen in Vorlagen

Einführung

GroupDocs.Parser für .NET ist eine robuste Bibliothek, die das Parsen von Dokumenten und die Datenextraktion erleichtert. Sie unterstützt eine Vielzahl von Dateiformaten, darunter PDF, DOCX, XLSX und mehr. Eines ihrer wichtigsten Features ist die vorlagenbasierte Datenextraktion, mit der Sie Felder in einem Dokument definieren und bestimmte Daten basierend auf diesen vordefinierten Vorlagen extrahieren können.

Voraussetzungen

Bevor wir beginnen, stellen Sie sicher, dass Sie über Folgendes verfügen:

  • Grundlegende Kenntnisse der C#-Programmierung
  • Visual Studio auf Ihrem System installiert
  • GroupDocs.Parser für .NET-Bibliothek (Download vonHier)
  • Beispieldokumentdateien zum Arbeiten

Namespaces importieren

Beginnen Sie, indem Sie die erforderlichen Namespaces in Ihr C#-Projekt einbinden:

using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using GroupDocs.Parser.Data;
using GroupDocs.Parser.Templates;

Schritt 1: Vorlagenfelder definieren

Definieren Sie zunächst die Vorlagenfelder mit regulären Ausdrücken und verknüpften Positionen:

// Definieren Sie ein Feld mit einem regulären Ausdruck
TemplateField field = new TemplateField(
    new TemplateRegexPosition("Tax"),
    "Tax");
// Definieren Sie ein verknüpftes Feld mit bestimmten Positionseinstellungen
TemplateField linkedField = new TemplateField(
    new TemplateLinkedPosition(
        "Tax",
        new Size(100, 20),
        new TemplateLinkedPositionEdges(false, false, true, false)),
    "TaxValue");

Schritt 2: Erstellen Sie eine Vorlage

Erstellen Sie als Nächstes eine Vorlage mit den definierten Feldern:

// Erstellen Sie eine Vorlage mit den definierten Feldern
Template template = new Template(new TemplateItem[] { field, linkedField });

Schritt 3: Dokument mit Vorlage analysieren

Initialisieren Sie nun denParser Klasse und analysieren Sie das Dokument mithilfe der Vorlage:

using (Parser parser = new Parser("YourSampleFile.pdf"))
{
    // Analysieren Sie das Dokument anhand der Vorlage
    DocumentData data = parser.ParseByTemplate(template);
    // Durch extrahierte Daten iterieren und Ergebnisse drucken
    for (int i = 0; i < data.Count; i++)
    {
        Console.Write(data[i].Name + ": ");
        PageTextArea area = data[i].PageArea as PageTextArea;
        Console.WriteLine(area == null ? "Not a template field" : area.Text);
    }
}

Abschluss

GroupDocs.Parser für .NET vereinfacht das Extrahieren strukturierter Daten aus Dokumenten mithilfe von Vorlagen. Durch das Definieren von Feldern und Anwenden von Vorlagen können Sie relevante Informationen effizient extrahieren und so die Automatisierung und Produktivität bei der Dokumentenverarbeitung verbessern.

Häufig gestellte Fragen

Kann GroupDocs.Parser Daten aus verschlüsselten PDF-Dateien extrahieren?

Ja, GroupDocs.Parser unterstützt das Parsen verschlüsselter PDF-Dateien, indem während des Parsens das Kennwort angegeben wird.

Welche Dateiformate werden für die vorlagenbasierte Extraktion unterstützt?

GroupDocs.Parser unterstützt eine Vielzahl von Dateiformaten, darunter PDF, DOCX, XLSX, PPTX, TXT und mehr.

Gibt es eine Testversion für GroupDocs.Parser?

Ja, Sie können eine kostenlose Testversion herunterladen vonHier.

Kann ich GroupDocs.Parser zur Stapelverarbeitung von Dokumenten verwenden?

Ja, GroupDocs.Parser ermöglicht die Stapelverarbeitung, um mehrere Dokumente gleichzeitig zu analysieren.

Wo erhalte ich technischen Support für GroupDocs.Parser?

Technischen Support und die Möglichkeit, sich mit der Community auszutauschen finden Sie unterGroupDocs-Forum.