Werken met velden op vaste posities in sjablonen
Invoering
In deze zelfstudie onderzoeken we hoe u met velden op vaste posities binnen sjablonen kunt werken met behulp van GroupDocs.Parser voor .NET. GroupDocs.Parser is een krachtige bibliotheek voor het parseren van documenten waarmee ontwikkelaars gegevens kunnen extraheren uit verschillende documentformaten zoals PDF, Word, Excel en meer. We zullen ons specifiek concentreren op het definiëren en gebruiken van sjabloonvelden om gerichte informatie te extraheren op basis van hun vaste posities.
Vereisten
Voordat we beginnen, zorg ervoor dat u over het volgende beschikt:
- Basiskennis van C# en .NET-ontwikkeling.
- Visual Studio is op uw systeem geïnstalleerd.
- GroupDocs.Parser voor .NET-bibliotheek geïnstalleerd. Je kunt het downloaden vanhier.
- Voorbeelddocumentbestanden voor testen.
Naamruimten importeren
Begin met het opnemen van de benodigde naamruimten in uw C#-project:
using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using GroupDocs.Parser.Data;
using GroupDocs.Parser.Templates;
Stap 1: Definieer een sjabloonveld
Definieer eerst een veld met een vaste positie binnen een sjabloon. Dit veld vertegenwoordigt het gebied waaruit gegevens worden geëxtraheerd.
TemplateField field = new TemplateField(
new TemplateFixedPosition(new Rectangle(new Point(35, 135), new Size(100, 10))),
"FromCompany");
Hier:
Rectangle
specificeert de positie en grootte van het veld.Point(35, 135)
vertegenwoordigt de coördinaten in de linkerbovenhoek.Size(100, 10)
definieert de breedte en hoogte van het veld."FromCompany"
is de naam die aan dit veld is toegewezen.
Stap 2: Maak een sjabloon
Construeer een sjabloon met behulp van het gedefinieerde veld.
Template template = new Template(new TemplateItem[] { field });
DeTemplate
object bevat de gedefinieerde velden.
Stap 3: Document parseren met behulp van de sjabloon
Instantieer deParser
class met het doeldocumentpad en parseer vervolgens het document met behulp van de gemaakte sjabloon.
using (Parser parser = new Parser("YourSampleFile.pdf"))
{
DocumentData data = parser.ParseByTemplate(template);
// Herhaal de geëxtraheerde gegevens
for (int i = 0; i < data.Count; i++)
{
Console.Write(data[i].Name + ": ");
PageTextArea area = data[i].PageArea as PageTextArea;
Console.WriteLine(area == null ? "Not a template field" : area.Text);
}
}
Hier:
Parser
wordt geïnitialiseerd met het voorbeelddocumentbestandspad.ParseByTemplate
methode wordt gebruikt om gegevens te extraheren op basis van de meegeleverde sjabloon.- Geëxtraheerde gegevens zijn toegankelijk via
DocumentData
waarbij elk item overeenkomt met een gedefinieerd veld.
Conclusie
In deze zelfstudie hebben we het proces besproken van het werken met velden op vaste posities in sjablonen met behulp van GroupDocs.Parser voor .NET. Door sjablonen met specifieke veldposities te definiëren, kunnen ontwikkelaars nauwkeurig gerichte gegevens uit verschillende documentformaten extraheren.
Veelgestelde vragen
Is GroupDocs.Parser compatibel met alle documentformaten?
GroupDocs.Parser ondersteunt een breed scala aan bestandsindelingen, waaronder PDF, Microsoft Word, Excel, PowerPoint en meer. Verwijs naar dedocumentatie voor een gedetailleerde lijst.
Hoe kan ik een tijdelijke licentie voor GroupDocs.Parser verkrijgen?
U kunt een tijdelijke licentie voor testdoeleinden verkrijgen bijhier.
Waar kan ik ondersteuning vinden voor GroupDocs.Parser?
Voor technische assistentie en discussies kunt u terecht op deGroupDocs.Parser-forum.
Kan ik GroupDocs.Parser uitproberen voordat ik een aankoop doe?
Ja, u kunt de bibliotheek verkennen met een gratis proefversiehier.
Hoe koop ik een licentie voor GroupDocs.Parser?
Om een licentie te kopen, gaat u naar deaankooppagina.