Travailler avec la disposition des tableaux dans les modèles
Introduction
Dans ce didacticiel, nous verrons comment utiliser la disposition des tableaux dans les modèles à l’aide de GroupDocs.Parser pour .NET. GroupDocs.Parser est une puissante API d’analyse de documents qui permet aux développeurs d’extraire du texte et des métadonnées de divers formats de documents, notamment PDF, Microsoft Office, etc.
Conditions préalables
Avant de commencer, assurez-vous de disposer des prérequis suivants :
- Connaissance de base du développement C# et .NET.
- Visual Studio installé sur votre ordinateur.
- GroupDocs.Parser pour .NET installé. Vous pouvez le téléchargerici.
Importer des espaces de noms
Tout d’abord, assurez-vous d’importer les espaces de noms nécessaires dans votre projet :
using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using GroupDocs.Parser.Data;
using GroupDocs.Parser.Templates;
Étape 1 : Créer un modèle de tableau avec mise en page
Pour travailler avec des présentations de tableau dans des modèles, vous devez définir la structure du tableau à l’aide deTemplateTableLayout
. Cette disposition spécifie les largeurs des colonnes et les hauteurs des lignes.
TemplateTableLayout layout = new TemplateTableLayout(
new double[] { 30, 100, 320, 400, 480, 550 }, // Largeurs de colonnes
new double[] { 320, 345, 375 } // Hauteurs de rangée
);
// Créer un modèle de table
TemplateTable table = new TemplateTable(layout, "Details", null);
Étape 2 : créer un modèle
Maintenant, créez un modèle en utilisant le tableau défini.
Template template = new Template(new TemplateItem[] { table });
Étape 3 : analyser un document à l’aide du modèle
Ensuite, instanciez leParser
classe et analysez un document à l’aide du modèle créé.
using (Parser parser = new Parser("YourSampleFile.pdf"))
{
// Analyser le document par le modèle
DocumentData data = parser.ParseByTemplate(template);
// Itérer sur les données extraites
for (int i = 0; i < data.Count; i++)
{
Console.Write(data[i].Name + ": ");
// Vérifiez si le champ est une table
PageTableArea area = data[i].PageArea as PageTableArea;
if (area == null)
{
continue;
}
// Parcourir les lignes du tableau
for (int row = 0; row < area.RowCount; row++)
{
// Parcourir les colonnes du tableau
for (int column = 0; column < area.ColumnCount; column++)
{
// Obtenez la valeur de la cellule
PageTextArea cellValue = area[row, column].PageArea as PageTextArea;
// Imprimer la valeur de la cellule
Console.Write(cellValue == null ? "" : cellValue.Text);
// Imprimer l'espace entre les colonnes
Console.Write("\t");
}
// Passer à la ligne suivante après chaque ligne
Console.WriteLine();
}
}
}
Conclusion
Dans ce didacticiel, nous avons appris à utiliser GroupDocs.Parser pour .NET pour travailler avec des présentations de tableaux dans des modèles de documents. En suivant les étapes décrites, vous pouvez analyser et extraire efficacement des données structurées à partir de documents, facilitant ainsi diverses tâches de traitement de données dans vos applications.
FAQ
Puis-je analyser des tableaux à partir de documents PDF à l’aide de GroupDocs.Parser pour .NET ?
Oui, GroupDocs.Parser prend en charge l’analyse des tableaux à partir de documents PDF ainsi que d’autres formats populaires.
GroupDocs.Parser est-il adapté à l’extraction de champs de données spécifiques à partir de documents ?
Absolument, GroupDocs.Parser offre des fonctionnalités robustes pour extraire des champs de données ciblés basés sur des modèles prédéfinis.
Comment puis-je gérer différentes dispositions de tableau dans un document ?
GroupDocs.Parser permet de définir des modèles personnalisés pour gérer efficacement diverses mises en page de tableaux.
GroupDocs.Parser prend-il en charge le traitement de documents volumineux ?
Oui, GroupDocs.Parser est optimisé pour gérer des documents de différentes tailles, garantissant performances et fiabilité.
Puis-je intégrer GroupDocs.Parser à d’autres bibliothèques .NET ?
Certes, GroupDocs.Parser s’intègre de manière transparente à d’autres bibliothèques .NET, permettant des flux de travail complets de traitement de documents.