Estrai tabelle dal documento

introduzione

Groupdocs.Parser per .NET è una libreria completa che facilita l’analisi dei documenti, consentendoti di estrarre informazioni preziose come tabelle, testo, metadati e altro dai documenti. In questo tutorial, ci concentreremo specificamente sull’estrazione di tabelle dai documenti utilizzando l’API Groupdocs.Parser.

Prerequisiti

Prima di iniziare, assicurati di avere quanto segue:

  • Visual Studio installato nel sistema.
  • .NET Framework o .NET Core installato.
  • Conoscenza base della programmazione C#.

Importa spazi dei nomi

Innanzitutto, è necessario importare gli spazi dei nomi necessari per accedere alle classi e ai metodi Groupdocs.Parser.

using System;
using System.Collections.Generic;
using System.IO;
using System.Text;
using GroupDocs.Parser.Data;
using GroupDocs.Parser.Options;
using GroupDocs.Parser.Templates;

Passaggio 1: creare un’istanza della classe parser

Inizializza una nuova istanza diParser class fornendo il percorso del documento di esempio.

using (Parser parser = new Parser("YourSampleFile.docx"))
{
    // Il tuo codice va qui
}

Passaggio 2: verificare il supporto per l’estrazione della tabella

Verifica se il documento supporta l’estrazione della tabella utilizzando il fileFeatures proprietà delParser classe.

if (!parser.Features.Tables)
{
    Console.WriteLine("Document doesn't support table extraction.");
    return;
}

Passaggio 3: definire il layout della tabella

Definisci il layout delle tabelle che desideri estrarre utilizzandoTemplateTableLayout. Specifica la larghezza delle colonne e l’altezza delle righe in base alla struttura del documento.

TemplateTableLayout layout = new TemplateTableLayout(
    new double[] { 50, 95, 275, 415, 485, 545 },
    new double[] { 325, 340, 365, 395 });

Passaggio 4: imposta le opzioni di estrazione della tabella

CrearePageTableAreaOptions con il layout definito per specificare come devono essere estratte le tabelle.

PageTableAreaOptions options = new PageTableAreaOptions(layout);

Passaggio 5: estrazione delle tabelle

Utilizza ilGetTables metodo delParser classe per estrarre le tabelle dal documento in base alle opzioni specificate.

IEnumerable<PageTableArea> tables = parser.GetTables(options);

Passaggio 6: iterazione e accesso ai dati della tabella

Scorri le tabelle estratte e le rispettive righe e colonne per accedere ai dati della cella.

foreach (PageTableArea table in tables)
{
    for (int row = 0; row < table.RowCount; row++)
    {
        for (int column = 0; column < table.ColumnCount; column++)
        {
            PageTableAreaCell cell = table[row, column];
            if (cell != null)
            {
                Console.Write(cell.Text);
                Console.Write(" | ");
            }
        }
        Console.WriteLine();
    }
    Console.WriteLine();
}

Conclusione

In questo tutorial abbiamo spiegato come utilizzare Groupdocs.Parser per .NET per estrarre tabelle dai documenti in modo efficiente. Sfruttando le funzionalità di questa libreria, puoi integrare perfettamente l’estrazione delle tabelle nelle tue applicazioni .NET.

Domande frequenti

Groupdocs.Parser può gestire diversi formati di documenti?

Sì, Groupdocs.Parser supporta un’ampia gamma di formati di documenti tra cui DOCX, PDF, XLSX e altri.

È disponibile una versione di prova per Groupdocs.Parser per .NET?

Sì, puoi scaricare una versione di prova gratuita daQui.

Come posso ottenere supporto per le query relative a Groupdocs.Parser?

Puoi visitare ilForum Groupdocs.Parser per assistenza.

Dove posso acquistare una licenza per Groupdocs.Parser?

Puoi acquistare una licenza daQui.

Come posso ottenere una licenza temporanea a scopo di valutazione?

È possibile ottenere una licenza temporaneaQui.