Estrai testo da un foglio Excel in modalità Raw

introduzione

In questo tutorial esploreremo come estrarre testo da fogli Excel utilizzando GroupDocs.Parser per .NET in modalità raw. GroupDocs.Parser è una potente API che consente agli sviluppatori di lavorare con vari formati di documenti, inclusi file Excel, per l’estrazione e l’analisi del testo. Esamineremo i prerequisiti, importeremo gli spazi dei nomi e analizzeremo ogni passaggio per dimostrare il processo di estrazione del testo dai fogli Excel.

Prerequisiti

Prima di iniziare, assicurati di aver configurato i seguenti prerequisiti:

  • Visual Studio: installa l’IDE di Visual Studio sul tuo computer.
  • GroupDocs.Parser per .NET: scarica e installa GroupDocs.Parser dal filepagina di download.
  • File Excel di esempio: prepara un file Excel di esempio che utilizzerai per l’estrazione del testo.

Importa spazi dei nomi

Inizia importando gli spazi dei nomi necessari nel tuo progetto C# per accedere alle funzionalità di GroupDocs.Parser:

using System;
using System.Collections.Generic;
using System.IO;
using System.Text;
using GroupDocs.Parser.Data;
using GroupDocs.Parser.Options;

Passaggio 1: creare un’istanza della classe parser

Innanzitutto, crea un’istanza diParser class fornendo il percorso del file Excel di esempio:

using (Parser parser = new Parser("YourSampleFile.xlsx"))
{
    // Il tuo codice per l'estrazione del testo andrà qui
}

Passaggio 2: ottieni informazioni sul documento

Recuperare le informazioni sul documento utilizzando il fileGetDocumentInfo() metodo:

IDocumentInfo documentInfo = parser.GetDocumentInfo();

Passaggio 3: ripetere i fogli

Scorrere ogni foglio nel file Excel:

for (int p = 0; p < documentInfo.RawPageCount; p++)
{
    Console.WriteLine(string.Format("Page {0}/{1}", p + 1, documentInfo.RawPageCount));
    
    //Il tuo codice per l'estrazione del testo da ogni foglio andrà qui
}

Passaggio 4: estrai il testo da ciascun foglio

Estrai il testo da ciascun foglio utilizzando aTextReader:

using (TextReader reader = parser.GetText(p, new TextOptions(true)))
{
    Console.WriteLine(reader.ReadToEnd());
}

Conclusione

In questo tutorial, abbiamo spiegato come estrarre testo da fogli Excel utilizzando GroupDocs.Parser per .NET. Seguendo i passaggi sopra descritti, puoi recuperare in modo efficiente dati di testo da file Excel per ulteriori elaborazioni o analisi nelle tue applicazioni .NET.

Domande frequenti

GroupDocs.Parser può estrarre testo da altri formati di documento?

Sì, GroupDocs.Parser supporta un’ampia gamma di formati di documenti tra cui Word, PDF, PowerPoint e altri.

GroupDocs.Parser è adatto per l’elaborazione di file Excel di grandi dimensioni?

Sì, GroupDocs.Parser è progettato per gestire documenti di grandi dimensioni in modo efficiente.

Dove posso trovare ulteriore documentazione su GroupDocs.Parser?

Puoi fare riferimento adocumentazione per informazioni dettagliate ed esempi.

Come posso ottenere una licenza temporanea per GroupDocs.Parser?

Visitaquesto link per richiedere una licenza temporanea.

GroupDocs.Parser offre assistenza clienti?

Sì, puoi chiedere assistenza o porre domande suForum di GroupDocs.