Extraire le texte d'une feuille Excel en mode brut
Introduction
Dans ce didacticiel, nous allons explorer comment extraire du texte de feuilles Excel à l’aide de GroupDocs.Parser pour .NET en mode brut. GroupDocs.Parser est une API puissante qui permet aux développeurs de travailler avec différents formats de documents, y compris des fichiers Excel, pour l’extraction et l’analyse de texte. Nous passerons en revue les conditions préalables, importerons les espaces de noms et détaillerons chaque étape pour démontrer le processus d’extraction de texte à partir de feuilles Excel.
Conditions préalables
Avant de commencer, assurez-vous d’avoir configuré les conditions préalables suivantes :
- Visual Studio : installez Visual Studio IDE sur votre ordinateur.
- GroupDocs.Parser pour .NET : téléchargez et installez GroupDocs.Parser à partir dupage de téléchargement.
- Exemple de fichier Excel : préparez un exemple de fichier Excel que vous utiliserez pour l’extraction de texte.
Importer des espaces de noms
Commencez par importer les espaces de noms nécessaires dans votre projet C# pour accéder aux fonctionnalités de GroupDocs.Parser :
using System;
using System.Collections.Generic;
using System.IO;
using System.Text;
using GroupDocs.Parser.Data;
using GroupDocs.Parser.Options;
Étape 1 : Créer une instance de la classe Parser
Tout d’abord, créez une instance deParser
classe en fournissant le chemin d’accès à votre exemple de fichier Excel :
using (Parser parser = new Parser("YourSampleFile.xlsx"))
{
// Votre code pour l'extraction de texte ira ici
}
Étape 2 : obtenir des informations sur le document
Récupérer les informations du document à l’aide de l’outilGetDocumentInfo()
méthode:
IDocumentInfo documentInfo = parser.GetDocumentInfo();
Étape 3 : Itérer sur les feuilles
Parcourez chaque feuille du fichier Excel :
for (int p = 0; p < documentInfo.RawPageCount; p++)
{
Console.WriteLine(string.Format("Page {0}/{1}", p + 1, documentInfo.RawPageCount));
//Votre code pour l'extraction de texte de chaque feuille ira ici
}
Étape 4 : Extraire le texte de chaque feuille
Extraire le texte de chaque feuille à l’aide d’unTextReader
:
using (TextReader reader = parser.GetText(p, new TextOptions(true)))
{
Console.WriteLine(reader.ReadToEnd());
}
Conclusion
Dans ce didacticiel, nous avons expliqué comment extraire du texte de feuilles Excel à l’aide de GroupDocs.Parser pour .NET. En suivant les étapes décrites ci-dessus, vous pouvez récupérer efficacement des données texte à partir de fichiers Excel pour un traitement ou une analyse ultérieure dans vos applications .NET.
FAQ
GroupDocs.Parser peut-il extraire du texte à partir d’autres formats de document ?
Oui, GroupDocs.Parser prend en charge un large éventail de formats de documents, notamment Word, PDF, PowerPoint, etc.
GroupDocs.Parser est-il adapté au traitement de gros fichiers Excel ?
Oui, GroupDocs.Parser est conçu pour gérer efficacement des documents volumineux.
Où puis-je trouver plus de documentation sur GroupDocs.Parser ?
Vous pouvez vous référer auDocumentation pour des informations détaillées et des exemples.
Comment puis-je obtenir une licence temporaire pour GroupDocs.Parser ?
Visitece lien pour demander une licence temporaire.
GroupDocs.Parser offre-t-il un support client ?
Oui, vous pouvez demander de l’aide ou poser des questions sur leForum GroupDocs.