Extraire le texte d'une feuille Excel en mode brut

Introduction

Dans ce didacticiel, nous allons explorer comment extraire du texte de feuilles Excel à l’aide de GroupDocs.Parser pour .NET en mode brut. GroupDocs.Parser est une API puissante qui permet aux développeurs de travailler avec différents formats de documents, y compris des fichiers Excel, pour l’extraction et l’analyse de texte. Nous passerons en revue les conditions préalables, importerons les espaces de noms et détaillerons chaque étape pour démontrer le processus d’extraction de texte à partir de feuilles Excel.

Conditions préalables

Avant de commencer, assurez-vous d’avoir configuré les conditions préalables suivantes :

  • Visual Studio : installez Visual Studio IDE sur votre ordinateur.
  • GroupDocs.Parser pour .NET : téléchargez et installez GroupDocs.Parser à partir dupage de téléchargement.
  • Exemple de fichier Excel : préparez un exemple de fichier Excel que vous utiliserez pour l’extraction de texte.

Importer des espaces de noms

Commencez par importer les espaces de noms nécessaires dans votre projet C# pour accéder aux fonctionnalités de GroupDocs.Parser :

using System;
using System.Collections.Generic;
using System.IO;
using System.Text;
using GroupDocs.Parser.Data;
using GroupDocs.Parser.Options;

Étape 1 : Créer une instance de la classe Parser

Tout d’abord, créez une instance deParser classe en fournissant le chemin d’accès à votre exemple de fichier Excel :

using (Parser parser = new Parser("YourSampleFile.xlsx"))
{
    // Votre code pour l'extraction de texte ira ici
}

Étape 2 : obtenir des informations sur le document

Récupérer les informations du document à l’aide de l’outilGetDocumentInfo() méthode:

IDocumentInfo documentInfo = parser.GetDocumentInfo();

Étape 3 : Itérer sur les feuilles

Parcourez chaque feuille du fichier Excel :

for (int p = 0; p < documentInfo.RawPageCount; p++)
{
    Console.WriteLine(string.Format("Page {0}/{1}", p + 1, documentInfo.RawPageCount));
    
    //Votre code pour l'extraction de texte de chaque feuille ira ici
}

Étape 4 : Extraire le texte de chaque feuille

Extraire le texte de chaque feuille à l’aide d’unTextReader:

using (TextReader reader = parser.GetText(p, new TextOptions(true)))
{
    Console.WriteLine(reader.ReadToEnd());
}

Conclusion

Dans ce didacticiel, nous avons expliqué comment extraire du texte de feuilles Excel à l’aide de GroupDocs.Parser pour .NET. En suivant les étapes décrites ci-dessus, vous pouvez récupérer efficacement des données texte à partir de fichiers Excel pour un traitement ou une analyse ultérieure dans vos applications .NET.

FAQ

GroupDocs.Parser peut-il extraire du texte à partir d’autres formats de document ?

Oui, GroupDocs.Parser prend en charge un large éventail de formats de documents, notamment Word, PDF, PowerPoint, etc.

GroupDocs.Parser est-il adapté au traitement de gros fichiers Excel ?

Oui, GroupDocs.Parser est conçu pour gérer efficacement des documents volumineux.

Où puis-je trouver plus de documentation sur GroupDocs.Parser ?

Vous pouvez vous référer auDocumentation pour des informations détaillées et des exemples.

Comment puis-je obtenir une licence temporaire pour GroupDocs.Parser ?

Visitece lien pour demander une licence temporaire.

GroupDocs.Parser offre-t-il un support client ?

Oui, vous pouvez demander de l’aide ou poser des questions sur leForum GroupDocs.