Szöveg kibontása az Excel munkalapról nyers módban

Bevezetés

Ebben az oktatóanyagban megvizsgáljuk, hogyan lehet szöveget kivonni Excel-lapokból a GroupDocs.Parser for .NET használatával nyers módban. A GroupDocs.Parser egy hatékony API, amely lehetővé teszi a fejlesztők számára, hogy különféle dokumentumformátumokkal dolgozzanak, beleértve az Excel fájlokat is, szövegkivonat és -elemzés céljából. Végignézzük az előfeltételeket, importálunk névtereket, és lebontjuk az egyes lépéseket, hogy bemutassuk a szöveg Excel-lapokból való kivonatolási folyamatát.

Előfeltételek

Mielőtt elkezdené, győződjön meg arról, hogy beállította a következő előfeltételeket:

  • Visual Studio: Telepítse a Visual Studio IDE-t a gépére.
  • GroupDocs.Parser for .NET: Töltse le és telepítse a GroupDocs.Parser programot aletöltési oldal.
  • Minta Excel-fájl: Készítsen egy minta Excel-fájlt, amelyet szövegkivonathoz fog használni.

Névterek importálása

Kezdje azzal, hogy importálja a szükséges névtereket a C# projektbe a GroupDocs.Parser funkcióinak eléréséhez:

using System;
using System.Collections.Generic;
using System.IO;
using System.Text;
using GroupDocs.Parser.Data;
using GroupDocs.Parser.Options;

1. lépés: Hozzon létre egy példányt az elemző osztályból

Először hozzon létre egy példányt aParser osztályban, megadva a minta Excel-fájl elérési útját:

using (Parser parser = new Parser("YourSampleFile.xlsx"))
{
    // A szövegkivonat kódja ide kerül
}

2. lépés: Dokumentuminformációk lekérése

A dokumentum információinak lekérése aGetDocumentInfo() módszer:

IDocumentInfo documentInfo = parser.GetDocumentInfo();

3. lépés: Ismétlés a lapokon

Lapozzon át az Excel fájl egyes lapjain:

for (int p = 0; p < documentInfo.RawPageCount; p++)
{
    Console.WriteLine(string.Format("Page {0}/{1}", p + 1, documentInfo.RawPageCount));
    
    //Az egyes lapokról a szövegkivonat kódja ide kerül
}

4. lépés: Szöveg kibontása minden lapról

Szöveg kibontása minden lapból a a segítségévelTextReader:

using (TextReader reader = parser.GetText(p, new TextOptions(true)))
{
    Console.WriteLine(reader.ReadToEnd());
}

Következtetés

Ebben az oktatóanyagban bemutattuk, hogyan lehet szöveget kivonni Excel-lapokból a GroupDocs.Parser for .NET használatával. A fent vázolt lépések követésével hatékonyan kérheti le a szöveges adatokat az Excel-fájlokból további feldolgozás vagy elemzés céljából .NET-alkalmazásaiban.

GYIK

A GroupDocs.Parser ki tudja bontani a szöveget más dokumentumformátumokból?

Igen, a GroupDocs.Parser a dokumentumformátumok széles skáláját támogatja, beleértve a Word, PDF, PowerPoint és egyebeket.

A GroupDocs.Parser alkalmas nagyméretű Excel fájlok feldolgozására?

Igen, a GroupDocs.Parser célja a nagyméretű dokumentumok hatékony kezelése.

Hol találok további dokumentációt a GroupDocs.Parserről?

Hivatkozhat adokumentáció részletes információkért és példákért.

Hogyan szerezhetek ideiglenes licencet a GroupDocs.Parser számára?

Látogatásez a link ideiglenes engedélyt kérni.

A GroupDocs.Parser kínál ügyfélszolgálatot?

Igen, kérhet segítséget vagy kérdéseket tehet fel aGroupDocs fórum.