Travailler avec la disposition des tableaux dans les modèles

Introduction

Dans ce didacticiel, nous verrons comment utiliser la disposition des tableaux dans les modèles à l’aide de GroupDocs.Parser pour .NET. GroupDocs.Parser est une puissante API d’analyse de documents qui permet aux développeurs d’extraire du texte et des métadonnées de divers formats de documents, notamment PDF, Microsoft Office, etc.

Conditions préalables

Avant de commencer, assurez-vous de disposer des prérequis suivants :

Connaissance de base du développement C# et .NET.
Visual Studio installé sur votre ordinateur.
GroupDocs.Parser pour .NET installé. Vous pouvez le téléchargerici.

Importer des espaces de noms

Tout d’abord, assurez-vous d’importer les espaces de noms nécessaires dans votre projet :

using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using GroupDocs.Parser.Data;
using GroupDocs.Parser.Templates;

Étape 1 : Créer un modèle de tableau avec mise en page

Pour travailler avec des présentations de tableau dans des modèles, vous devez définir la structure du tableau à l’aide deTemplateTableLayout. Cette disposition spécifie les largeurs des colonnes et les hauteurs des lignes.

TemplateTableLayout layout = new TemplateTableLayout(
    new double[] { 30, 100, 320, 400, 480, 550 },   // Largeurs de colonnes
    new double[] { 320, 345, 375 }                  // Hauteurs de rangée
);
// Créer un modèle de table
TemplateTable table = new TemplateTable(layout, "Details", null);

Étape 2 : créer un modèle

Maintenant, créez un modèle en utilisant le tableau défini.

Template template = new Template(new TemplateItem[] { table });

Étape 3 : analyser un document à l’aide du modèle

Ensuite, instanciez leParser classe et analysez un document à l’aide du modèle créé.

using (Parser parser = new Parser("YourSampleFile.pdf"))
{
    // Analyser le document par le modèle
    DocumentData data = parser.ParseByTemplate(template);
    // Itérer sur les données extraites
    for (int i = 0; i < data.Count; i++)
    {
        Console.Write(data[i].Name + ": ");
        // Vérifiez si le champ est une table
        PageTableArea area = data[i].PageArea as PageTableArea;
        if (area == null)
        {
            continue;
        }
        // Parcourir les lignes du tableau
        for (int row = 0; row < area.RowCount; row++)
        {
            // Parcourir les colonnes du tableau
            for (int column = 0; column < area.ColumnCount; column++)
            {
                // Obtenez la valeur de la cellule
                PageTextArea cellValue = area[row, column].PageArea as PageTextArea;
                // Imprimer la valeur de la cellule
                Console.Write(cellValue == null ? "" : cellValue.Text);
                // Imprimer l'espace entre les colonnes
                Console.Write("\t");
            }
            // Passer à la ligne suivante après chaque ligne
            Console.WriteLine();
        }
    }
}

Conclusion

Dans ce didacticiel, nous avons appris à utiliser GroupDocs.Parser pour .NET pour travailler avec des présentations de tableaux dans des modèles de documents. En suivant les étapes décrites, vous pouvez analyser et extraire efficacement des données structurées à partir de documents, facilitant ainsi diverses tâches de traitement de données dans vos applications.

FAQ

Puis-je analyser des tableaux à partir de documents PDF à l’aide de GroupDocs.Parser pour .NET ?

Oui, GroupDocs.Parser prend en charge l’analyse des tableaux à partir de documents PDF ainsi que d’autres formats populaires.

GroupDocs.Parser est-il adapté à l’extraction de champs de données spécifiques à partir de documents ?

Absolument, GroupDocs.Parser offre des fonctionnalités robustes pour extraire des champs de données ciblés basés sur des modèles prédéfinis.

Comment puis-je gérer différentes dispositions de tableau dans un document ?

GroupDocs.Parser permet de définir des modèles personnalisés pour gérer efficacement diverses mises en page de tableaux.

GroupDocs.Parser prend-il en charge le traitement de documents volumineux ?

Oui, GroupDocs.Parser est optimisé pour gérer des documents de différentes tailles, garantissant performances et fiabilité.

Puis-je intégrer GroupDocs.Parser à d’autres bibliothèques .NET ?

Certes, GroupDocs.Parser s’intègre de manière transparente à d’autres bibliothèques .NET, permettant des flux de travail complets de traitement de documents.

Travailler avec des champs aux positions Regex dans les modèles Utilisation des paramètres de table dans les modèles