Práce s poli na pevných pozicích v šablonách

Úvod

V tomto tutoriálu prozkoumáme, jak pracovat s poli na pevných pozicích v šablonách pomocí GroupDocs.Parser for .NET. GroupDocs.Parser je výkonná knihovna pro analýzu dokumentů, která umožňuje vývojářům extrahovat data z různých formátů dokumentů, jako jsou PDF, Word, Excel a další. Konkrétně se zaměříme na definování a využití polí šablony k extrahování cílených informací na základě jejich pevných pozic.

Předpoklady

Než začneme, ujistěte se, že máte následující:

  • Základní znalost vývoje C# a .NET.
  • Visual Studio nainstalované ve vašem systému.
  • Nainstalovaná knihovna GroupDocs.Parser for .NET. Můžete si jej stáhnout ztady.
  • Ukázkové soubory dokumentů pro testování.

Import jmenných prostorů

Začněte tím, že do svého projektu C# zahrnete potřebné jmenné prostory:

using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using GroupDocs.Parser.Data;
using GroupDocs.Parser.Templates;

Krok 1: Definujte pole šablony

Nejprve definujte pole s pevnou pozicí v šabloně. Toto pole představuje oblast, ze které budou data extrahována.

TemplateField field = new TemplateField(
    new TemplateFixedPosition(new Rectangle(new Point(35, 135), new Size(100, 10))),
    "FromCompany");

Tady:

  • Rectangle určuje polohu a velikost pole.
  • Point(35, 135) představuje souřadnice levého horního rohu.
  • Size(100, 10) definuje šířku a výšku pole.
  • "FromCompany" je název přiřazený tomuto poli.

Krok 2: Vytvořte šablonu

Vytvořte šablonu pomocí definovaného pole.

Template template = new Template(new TemplateItem[] { field });

TheTemplate objekt obsahuje definovaná pole.

Krok 3: Analyzujte dokument pomocí šablony

Vytvořte instanciParser třídy s cestou cílového dokumentu a poté dokument analyzujte pomocí vytvořené šablony.

using (Parser parser = new Parser("YourSampleFile.pdf"))
{
    DocumentData data = parser.ParseByTemplate(template);
    // Iterujte extrahovaná data
    for (int i = 0; i < data.Count; i++)
    {
        Console.Write(data[i].Name + ": ");
        PageTextArea area = data[i].PageArea as PageTextArea;
        Console.WriteLine(area == null ? "Not a template field" : area.Text);
    }
}

Tady:

  • Parser je inicializována pomocí cesty k souboru vzorového dokumentu.
  • ParseByTemplate metoda se používá k extrahování dat na základě poskytnuté šablony.
  • K extrahovaným datům se přistupuje pomocíDocumentDatakde každá položka odpovídá definovanému poli.

Závěr

V tomto tutoriálu jsme se zabývali procesem práce s poli na pevných pozicích v šablonách pomocí GroupDocs.Parser pro .NET. Definováním šablon se specifickými pozicemi v poli mohou vývojáři přesně extrahovat cílená data z různých formátů dokumentů.

FAQ

Je GroupDocs.Parser kompatibilní se všemi formáty dokumentů?

GroupDocs.Parser podporuje širokou škálu formátů souborů, včetně PDF, Microsoft Word, Excel, PowerPoint a dalších. Odkazovat nadokumentace pro podrobný seznam.

Jak mohu získat dočasnou licenci pro GroupDocs.Parser?

Dočasnou licenci pro testovací účely můžete získat odtady.

Kde najdu podporu pro GroupDocs.Parser?

Pro technickou pomoc a diskuse navštivte stránkuFórum GroupDocs.Parser.

Mohu GroupDocs.Parser před nákupem vyzkoušet?

Ano, knihovnu můžete prozkoumat pomocí bezplatné zkušební verzetady.

Jak si koupím licenci pro GroupDocs.Parser?

Chcete-li zakoupit licenci, navštivte stránkunákupní stránku.