Estrai testo da un documento Excel come HTML

introduzione

In questo tutorial esploreremo come utilizzare GroupDocs.Parser per .NET per estrarre testo da un documento Excel e convertirlo in formato HTML. GroupDocs.Parser è una potente libreria che consente agli sviluppatori di lavorare con vari formati di documenti, estraendo testo e metadati in modo efficiente.

Prerequisiti

Prima di iniziare, assicurati di avere la seguente configurazione:

  • Visual Studio installato nel sistema.
  • Conoscenza di base della programmazione C#.
  • Libreria GroupDocs.Parser per .NET. Puoi scaricarlo daQui.

Importa spazi dei nomi

Inizia includendo gli spazi dei nomi necessari nel tuo progetto C# per accedere alle funzionalità GroupDocs.Parser.

using System;
using System.Collections.Generic;
using System.IO;
using System.Text;
using GroupDocs.Parser.Data;
using GroupDocs.Parser.Options;

Passaggio 1: creare un’istanza della classe parser

Innanzitutto, istanziare il fileParser classe fornendo il percorso del documento Excel.

using (Parser parser = new Parser("YourSampleFile.xlsx"))
{
    // Ulteriore codice andrà qui
}

Sostituire"YourSampleFile.xlsx" con il percorso del file Excel.

Passaggio 2: estrai il testo come HTML

All’interno delusing blocco delParser ad esempio, utilizzare il fileGetFormattedText metodo per estrarre testo formattato in modalità HTML.

using (Parser parser = new Parser("YourSampleFile.xlsx"))
{
    using (TextReader reader = parser.GetFormattedText(new FormattedTextOptions(FormattedTextMode.Html)))
    {
        // Ulteriore codice andrà qui
    }
}

Passaggio 3: leggere e stampare il testo HTML estratto

Successivamente, leggi il testo HTML estratto dal fileTextReader e stamparlo sulla console.

using (Parser parser = new Parser("YourSampleFile.xlsx"))
{
    using (TextReader reader = parser.GetFormattedText(new FormattedTextOptions(FormattedTextMode.Html)))
    {
        Console.WriteLine(reader.ReadToEnd());
    }
}

Una volta eseguito, questo codice estrarrà il testo dal documento Excel e lo visualizzerà in formato HTML nella console.

Conclusione

In questo tutorial, abbiamo imparato come utilizzare GroupDocs.Parser per .NET per estrarre testo da un documento Excel e convertirlo in formato HTML. Questa libreria fornisce un modo semplice per lavorare con vari formati di documenti, consentendo agli sviluppatori di gestire in modo efficiente le attività di estrazione del testo nelle loro applicazioni.

Domande frequenti

GroupDocs.Parser può gestire altri formati di documenti oltre a Excel?

Sì, GroupDocs.Parser supporta un’ampia gamma di formati di file tra cui PDF, Word, PowerPoint e altri.

GroupDocs.Parser è compatibile con .NET Core?

Sì, GroupDocs.Parser è compatibile sia con .NET Framework che con .NET Core.

GroupDocs.Parser preserva la formattazione durante l’estrazione del testo?

Sì, GroupDocs.Parser può preservare la formattazione come caratteri, stili e layout durante l’estrazione del testo.

Posso estrarre metadati dai documenti utilizzando GroupDocs.Parser?

Sì, GroupDocs.Parser consente di estrarre metadati come autore, data di creazione e altro dai tipi di documenti supportati.

È disponibile una prova gratuita per GroupDocs.Parser?

Sì, puoi scaricare una versione di prova gratuita daQui.