Arbeta med fält på fasta positioner i mallar

Introduktion

I den här handledningen kommer vi att utforska hur man arbetar med fält på fasta positioner inom mallar med hjälp av GroupDocs.Parser för .NET. GroupDocs.Parser är ett kraftfullt dokumentanalysbibliotek som gör det möjligt för utvecklare att extrahera data från olika dokumentformat som PDF, Word, Excel och mer. Specifikt kommer vi att fokusera på att definiera och använda mallfält för att extrahera riktad information baserat på deras fasta positioner.

Förutsättningar

Innan vi börjar, se till att du har följande:

  • Grundläggande förståelse för C# och .NET utveckling.
  • Visual Studio installerat på ditt system.
  • GroupDocs.Parser för .NET-biblioteket installerat. Du kan ladda ner den frånhär.
  • Exempel på dokumentfiler för testning.

Importera namnområden

Börja med att inkludera de nödvändiga namnrymden i ditt C#-projekt:

using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using GroupDocs.Parser.Data;
using GroupDocs.Parser.Templates;

Steg 1: Definiera ett mallfält

Definiera först ett fält med en fast position i en mall. Detta fält representerar området från vilket data kommer att extraheras.

TemplateField field = new TemplateField(
    new TemplateFixedPosition(new Rectangle(new Point(35, 135), new Size(100, 10))),
    "FromCompany");

Här:

  • Rectangle anger fältets position och storlek.
  • Point(35, 135) representerar koordinaterna i det övre vänstra hörnet.
  • Size(100, 10) definierar fältets bredd och höjd.
  • "FromCompany" är namnet som tilldelats detta fält.

Steg 2: Skapa en mall

Konstruera en mall med det definierade fältet.

Template template = new Template(new TemplateItem[] { field });

DeTemplate objektet innehåller de definierade fälten.

Steg 3: Analysera dokument med hjälp av mallen

InstantieraParser klass med måldokumentets sökväg och analysera sedan dokumentet med den skapade mallen.

using (Parser parser = new Parser("YourSampleFile.pdf"))
{
    DocumentData data = parser.ParseByTemplate(template);
    // Iterera genom extraherade data
    for (int i = 0; i < data.Count; i++)
    {
        Console.Write(data[i].Name + ": ");
        PageTextArea area = data[i].PageArea as PageTextArea;
        Console.WriteLine(area == null ? "Not a template field" : area.Text);
    }
}

Här:

  • Parser initieras med sökvägen till exempeldokumentfilen.
  • ParseByTemplate metod används för att extrahera data baserat på den tillhandahållna mallen.
  • Extraherade data nås med hjälp avDocumentDatadär varje objekt motsvarar ett definierat fält.

Slutsats

I den här handledningen täckte vi processen att arbeta med fält på fasta positioner i mallar med hjälp av GroupDocs.Parser för .NET. Genom att definiera mallar med specifika fältpositioner kan utvecklare extrahera riktad data exakt från olika dokumentformat.

FAQ’s

Är GroupDocs.Parser kompatibel med alla dokumentformat?

GroupDocs.Parser stöder ett brett utbud av filformat, inklusive PDF, Microsoft Word, Excel, PowerPoint och mer. Referera tilldokumentation för en detaljerad lista.

Hur kan jag få en tillfällig licens för GroupDocs.Parser?

Du kan få en tillfällig licens för teständamål frånhär.

Var kan jag hitta support för GroupDocs.Parser?

För teknisk hjälp och diskussioner, besökGroupDocs.Parser-forum.

Kan jag prova GroupDocs.Parser innan jag köper?

Ja, du kan utforska biblioteket med en gratis provperiod tillgänglighär.

Hur köper jag en licens för GroupDocs.Parser?

För att köpa en licens, besökköpsidan.