Werken met velden op vaste posities in sjablonen

Invoering

In deze zelfstudie onderzoeken we hoe u met velden op vaste posities binnen sjablonen kunt werken met behulp van GroupDocs.Parser voor .NET. GroupDocs.Parser is een krachtige bibliotheek voor het parseren van documenten waarmee ontwikkelaars gegevens kunnen extraheren uit verschillende documentformaten zoals PDF, Word, Excel en meer. We zullen ons specifiek concentreren op het definiëren en gebruiken van sjabloonvelden om gerichte informatie te extraheren op basis van hun vaste posities.

Vereisten

Voordat we beginnen, zorg ervoor dat u over het volgende beschikt:

  • Basiskennis van C# en .NET-ontwikkeling.
  • Visual Studio is op uw systeem geïnstalleerd.
  • GroupDocs.Parser voor .NET-bibliotheek geïnstalleerd. Je kunt het downloaden vanhier.
  • Voorbeelddocumentbestanden voor testen.

Naamruimten importeren

Begin met het opnemen van de benodigde naamruimten in uw C#-project:

using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using GroupDocs.Parser.Data;
using GroupDocs.Parser.Templates;

Stap 1: Definieer een sjabloonveld

Definieer eerst een veld met een vaste positie binnen een sjabloon. Dit veld vertegenwoordigt het gebied waaruit gegevens worden geëxtraheerd.

TemplateField field = new TemplateField(
    new TemplateFixedPosition(new Rectangle(new Point(35, 135), new Size(100, 10))),
    "FromCompany");

Hier:

  • Rectangle specificeert de positie en grootte van het veld.
  • Point(35, 135) vertegenwoordigt de coördinaten in de linkerbovenhoek.
  • Size(100, 10) definieert de breedte en hoogte van het veld.
  • "FromCompany" is de naam die aan dit veld is toegewezen.

Stap 2: Maak een sjabloon

Construeer een sjabloon met behulp van het gedefinieerde veld.

Template template = new Template(new TemplateItem[] { field });

DeTemplate object bevat de gedefinieerde velden.

Stap 3: Document parseren met behulp van de sjabloon

Instantieer deParser class met het doeldocumentpad en parseer vervolgens het document met behulp van de gemaakte sjabloon.

using (Parser parser = new Parser("YourSampleFile.pdf"))
{
    DocumentData data = parser.ParseByTemplate(template);
    // Herhaal de geëxtraheerde gegevens
    for (int i = 0; i < data.Count; i++)
    {
        Console.Write(data[i].Name + ": ");
        PageTextArea area = data[i].PageArea as PageTextArea;
        Console.WriteLine(area == null ? "Not a template field" : area.Text);
    }
}

Hier:

  • Parser wordt geïnitialiseerd met het voorbeelddocumentbestandspad.
  • ParseByTemplate methode wordt gebruikt om gegevens te extraheren op basis van de meegeleverde sjabloon.
  • Geëxtraheerde gegevens zijn toegankelijk viaDocumentDatawaarbij elk item overeenkomt met een gedefinieerd veld.

Conclusie

In deze zelfstudie hebben we het proces besproken van het werken met velden op vaste posities in sjablonen met behulp van GroupDocs.Parser voor .NET. Door sjablonen met specifieke veldposities te definiëren, kunnen ontwikkelaars nauwkeurig gerichte gegevens uit verschillende documentformaten extraheren.

Veelgestelde vragen

Is GroupDocs.Parser compatibel met alle documentformaten?

GroupDocs.Parser ondersteunt een breed scala aan bestandsindelingen, waaronder PDF, Microsoft Word, Excel, PowerPoint en meer. Verwijs naar dedocumentatie voor een gedetailleerde lijst.

Hoe kan ik een tijdelijke licentie voor GroupDocs.Parser verkrijgen?

U kunt een tijdelijke licentie voor testdoeleinden verkrijgen bijhier.

Waar kan ik ondersteuning vinden voor GroupDocs.Parser?

Voor technische assistentie en discussies kunt u terecht op deGroupDocs.Parser-forum.

Kan ik GroupDocs.Parser uitproberen voordat ik een aankoop doe?

Ja, u kunt de bibliotheek verkennen met een gratis proefversiehier.

Hoe koop ik een licentie voor GroupDocs.Parser?

Om een licentie te kopen, gaat u naar deaankooppagina.