Lavorare con il layout della tabella nei modelli

introduzione

In questo tutorial esploreremo come lavorare con il layout delle tabelle nei modelli utilizzando GroupDocs.Parser per .NET. GroupDocs.Parser è una potente API per l’analisi dei documenti che consente agli sviluppatori di estrarre testo e metadati da vari formati di documenti, tra cui PDF, Microsoft Office e altri.

Prerequisiti

Prima di iniziare, assicurati di possedere i seguenti prerequisiti:

Conoscenza base dello sviluppo C# e .NET.
Visual Studio installato sul tuo computer.
GroupDocs.Parser per .NET installato. Puoi scaricarloQui.

Importa spazi dei nomi

Innanzitutto, assicurati di importare gli spazi dei nomi necessari nel tuo progetto:

using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using GroupDocs.Parser.Data;
using GroupDocs.Parser.Templates;

Passaggio 1: crea un modello di tabella con layout

Per lavorare con i layout di tabella nei modelli, è necessario definire la struttura della tabella utilizzandoTemplateTableLayout. Questo layout specifica la larghezza delle colonne e l’altezza delle righe.

TemplateTableLayout layout = new TemplateTableLayout(
    new double[] { 30, 100, 320, 400, 480, 550 },   // Larghezze delle colonne
    new double[] { 320, 345, 375 }                  // Altezze delle file
);
// Crea una tabella modello
TemplateTable table = new TemplateTable(layout, "Details", null);

Passaggio 2: crea un modello

Ora crea un modello utilizzando la tabella definita.

Template template = new Template(new TemplateItem[] { table });

Passaggio 3: analizzare un documento utilizzando il modello

Successivamente, istanziare il fileParser class e analizzare un documento utilizzando il modello creato.

using (Parser parser = new Parser("YourSampleFile.pdf"))
{
    // Analizzare il documento in base al modello
    DocumentData data = parser.ParseByTemplate(template);
    // Iterare sui dati estratti
    for (int i = 0; i < data.Count; i++)
    {
        Console.Write(data[i].Name + ": ");
        // Controlla se il campo è una tabella
        PageTableArea area = data[i].PageArea as PageTableArea;
        if (area == null)
        {
            continue;
        }
        // Scorrere le righe della tabella
        for (int row = 0; row < area.RowCount; row++)
        {
            // Scorri le colonne della tabella
            for (int column = 0; column < area.ColumnCount; column++)
            {
                // Ottieni il valore della cella
                PageTextArea cellValue = area[row, column].PageArea as PageTextArea;
                // Stampa il valore della cella
                Console.Write(cellValue == null ? "" : cellValue.Text);
                // Stampa lo spazio tra le colonne
                Console.Write("\t");
            }
            // Passa alla riga successiva dopo ogni riga
            Console.WriteLine();
        }
    }
}

Conclusione

In questo tutorial abbiamo imparato come utilizzare GroupDocs.Parser per .NET per lavorare con i layout di tabella nei modelli di documento. Seguendo i passaggi descritti, puoi analizzare ed estrarre in modo efficiente i dati strutturati dai documenti, facilitando varie attività di elaborazione dei dati nelle tue applicazioni.

Domande frequenti

Posso analizzare tabelle da documenti PDF utilizzando GroupDocs.Parser per .NET?

Sì, GroupDocs.Parser supporta l’analisi delle tabelle da documenti PDF insieme ad altri formati popolari.

GroupDocs.Parser è adatto per estrarre campi dati specifici dai documenti?

Assolutamente sì, GroupDocs.Parser offre funzionalità affidabili per l’estrazione di campi dati mirati in base a modelli predefiniti.

Come posso gestire diversi layout di tabella all’interno di un documento?

GroupDocs.Parser consente di definire modelli personalizzati per gestire in modo efficiente diversi layout di tabella.

GroupDocs.Parser supporta l’elaborazione di documenti di grandi dimensioni?

Sì, GroupDocs.Parser è ottimizzato per la gestione di documenti di varie dimensioni, garantendo prestazioni e affidabilità.

Posso integrare GroupDocs.Parser con altre librerie .NET?

Certamente GroupDocs.Parser si integra perfettamente con altre librerie .NET, consentendo flussi di lavoro completi di elaborazione dei documenti.