Extrahujte text z listu aplikace Excel v režimu Raw

Úvod

tomto tutoriálu prozkoumáme, jak extrahovat text z listů aplikace Excel pomocí GroupDocs.Parser for .NET v nezpracovaném režimu. GroupDocs.Parser je výkonné API, které umožňuje vývojářům pracovat s různými formáty dokumentů, včetně souborů Excel, pro extrakci a analýzu textu. Projdeme si předpoklady, importujeme jmenné prostory a rozebereme každý krok, abychom předvedli proces extrahování textu z listů aplikace Excel.

Předpoklady

Než začnete, ujistěte se, že máte nastaveny následující předpoklady:

  • Visual Studio: Nainstalujte Visual Studio IDE na váš počítač.
  • GroupDocs.Parser pro .NET: Stáhněte a nainstalujte GroupDocs.Parser zstránka ke stažení.
  • Ukázkový soubor aplikace Excel: Připravte si ukázkový soubor aplikace Excel, který použijete pro extrakci textu.

Import jmenných prostorů

Začněte importem potřebných jmenných prostorů do vašeho projektu C#, abyste získali přístup k funkcím GroupDocs.Parser:

using System;
using System.Collections.Generic;
using System.IO;
using System.Text;
using GroupDocs.Parser.Data;
using GroupDocs.Parser.Options;

Krok 1: Vytvořte instanci třídy analyzátoru

Nejprve vytvořte instanci souboruParser třídy poskytnutím cesty k vašemu ukázkovému souboru Excel:

using (Parser parser = new Parser("YourSampleFile.xlsx"))
{
    // Sem bude umístěn váš kód pro extrakci textu
}

Krok 2: Získejte informace o dokumentu

Získejte informace o dokumentu pomocíGetDocumentInfo() metoda:

IDocumentInfo documentInfo = parser.GetDocumentInfo();

Krok 3: Iterujte přes listy

Projděte každý list v souboru aplikace Excel:

for (int p = 0; p < documentInfo.RawPageCount; p++)
{
    Console.WriteLine(string.Format("Page {0}/{1}", p + 1, documentInfo.RawPageCount));
    
    //Zde bude váš kód pro extrakci textu z každého listu
}

Krok 4: Extrahujte text z každého listu

Extrahujte text z každého listu pomocí aTextReader:

using (TextReader reader = parser.GetText(p, new TextOptions(true)))
{
    Console.WriteLine(reader.ReadToEnd());
}

Závěr

V tomto tutoriálu jsme se zabývali tím, jak extrahovat text z listů aplikace Excel pomocí GroupDocs.Parser pro .NET. Podle výše uvedených kroků můžete efektivně načíst textová data ze souborů aplikace Excel pro další zpracování nebo analýzu ve vašich aplikacích .NET.

FAQ

Může GroupDocs.Parser extrahovat text z jiných formátů dokumentů?

Ano, GroupDocs.Parser podporuje širokou škálu formátů dokumentů včetně Wordu, PDF, PowerPointu a dalších.

Je GroupDocs.Parser vhodný pro zpracování velkých souborů Excel?

Ano, GroupDocs.Parser je navržen tak, aby efektivně zpracovával velké dokumenty.

Kde najdu další dokumentaci o GroupDocs.Parser?

Můžete odkazovat nadokumentace pro podrobné informace a příklady.

Jak mohu získat dočasnou licenci pro GroupDocs.Parser?

Návštěvatento odkaz požádat o dočasnou licenci.

Nabízí GroupDocs.Parser zákaznickou podporu?

Ano, můžete vyhledat pomoc nebo klást otázky nafórum GroupDocs.