Szöveg kibontása az Excel-dokumentumból HTML-ként

Bevezetés

Ebben az oktatóanyagban megvizsgáljuk, hogyan használható a GroupDocs.Parser for .NET szöveg Excel-dokumentumból való kinyerésére és HTML formátumba konvertálására. A GroupDocs.Parser egy hatékony könyvtár, amely lehetővé teszi a fejlesztők számára, hogy különféle dokumentumformátumokkal dolgozzanak, hatékonyan kivonva a szöveget és a metaadatokat.

Előfeltételek

Mielőtt elkezdené, győződjön meg arról, hogy az alábbiakat beállította:

  • A Visual Studio telepítve van a rendszerére.
  • A C# programozás alapjai.
  • GroupDocs.Parser könyvtár .NET-hez. Letöltheti innenitt.

Névterek importálása

Kezdje a szükséges névterek felvételével a C# projektbe a GroupDocs.Parser funkciók eléréséhez.

using System;
using System.Collections.Generic;
using System.IO;
using System.Text;
using GroupDocs.Parser.Data;
using GroupDocs.Parser.Options;

1. lépés: Hozzon létre egy példányt az elemző osztályból

Először példányosítsa aParser osztályt az Excel-dokumentum elérési útjának megadásával.

using (Parser parser = new Parser("YourSampleFile.xlsx"))
{
    // A további kód ide kerül
}

Cserélje ki"YourSampleFile.xlsx" az Excel-fájl elérési útjával.

2. lépés: A szöveg kibontása HTML-ként

Belülusing blokkja aParser például használja aGetFormattedText módszer a formázott szöveg HTML módban történő kinyerésére.

using (Parser parser = new Parser("YourSampleFile.xlsx"))
{
    using (TextReader reader = parser.GetFormattedText(new FormattedTextOptions(FormattedTextMode.Html)))
    {
        // A további kód ide kerül
    }
}

3. lépés: Olvassa el és nyomtassa ki a kivont HTML szöveget

Ezután olvassa el a kivont HTML-szöveget aTextReader és nyomtassa ki a konzolra.

using (Parser parser = new Parser("YourSampleFile.xlsx"))
{
    using (TextReader reader = parser.GetFormattedText(new FormattedTextOptions(FormattedTextMode.Html)))
    {
        Console.WriteLine(reader.ReadToEnd());
    }
}

A végrehajtás után ez a kód kivonja a szöveget az Excel dokumentumból, és HTML formátumban jeleníti meg a konzolon.

Következtetés

Ebben az oktatóanyagban megtanultuk, hogyan lehet a GroupDocs.Parser for .NET használatával szöveget kivonni Excel-dokumentumból, és HTML formátumba konvertálni. Ez a könyvtár egyszerű módot biztosít a különféle dokumentumformátumokkal való munkavégzéshez, lehetővé téve a fejlesztők számára, hogy hatékonyan kezeljék a szövegkivonási feladatokat alkalmazásaikban.

GYIK

A GroupDocs.Parser kezelhet más dokumentumformátumokat az Excelen kívül?

Igen, a GroupDocs.Parser a fájlformátumok széles skáláját támogatja, beleértve a PDF, Word, PowerPoint és egyebeket.

A GroupDocs.Parser kompatibilis a .NET Core-al?

Igen, a GroupDocs.Parser kompatibilis a .NET-keretrendszerrel és a .NET Core-val is.

GroupDocs.Parser megőrzi a formázást a szövegkivonás során?

Igen, a GroupDocs.Parser meg tudja őrizni a formázást, például a betűtípusokat, stílusokat és elrendezést a szövegkivonás során.

Kivonhatok-e metaadatokat dokumentumokból a GroupDocs.Parser segítségével?

Igen, a GroupDocs.Parser lehetővé teszi metaadatok, például szerző, létrehozási dátum és egyebek kinyerését a támogatott dokumentumtípusokból.

Van ingyenes próbaverzió a GroupDocs.Parser számára?

Igen, letölthet egy ingyenes próbaverziót a webhelyrőlitt.