Szöveg kibontása az Excel-dokumentumból HTML-ként
Bevezetés
Ebben az oktatóanyagban megvizsgáljuk, hogyan használható a GroupDocs.Parser for .NET szöveg Excel-dokumentumból való kinyerésére és HTML formátumba konvertálására. A GroupDocs.Parser egy hatékony könyvtár, amely lehetővé teszi a fejlesztők számára, hogy különféle dokumentumformátumokkal dolgozzanak, hatékonyan kivonva a szöveget és a metaadatokat.
Előfeltételek
Mielőtt elkezdené, győződjön meg arról, hogy az alábbiakat beállította:
- A Visual Studio telepítve van a rendszerére.
- A C# programozás alapjai.
- GroupDocs.Parser könyvtár .NET-hez. Letöltheti innenitt.
Névterek importálása
Kezdje a szükséges névterek felvételével a C# projektbe a GroupDocs.Parser funkciók eléréséhez.
using System;
using System.Collections.Generic;
using System.IO;
using System.Text;
using GroupDocs.Parser.Data;
using GroupDocs.Parser.Options;
1. lépés: Hozzon létre egy példányt az elemző osztályból
Először példányosítsa aParser
osztályt az Excel-dokumentum elérési útjának megadásával.
using (Parser parser = new Parser("YourSampleFile.xlsx"))
{
// A további kód ide kerül
}
Cserélje ki"YourSampleFile.xlsx"
az Excel-fájl elérési útjával.
2. lépés: A szöveg kibontása HTML-ként
Belülusing
blokkja aParser
például használja aGetFormattedText
módszer a formázott szöveg HTML módban történő kinyerésére.
using (Parser parser = new Parser("YourSampleFile.xlsx"))
{
using (TextReader reader = parser.GetFormattedText(new FormattedTextOptions(FormattedTextMode.Html)))
{
// A további kód ide kerül
}
}
3. lépés: Olvassa el és nyomtassa ki a kivont HTML szöveget
Ezután olvassa el a kivont HTML-szöveget aTextReader
és nyomtassa ki a konzolra.
using (Parser parser = new Parser("YourSampleFile.xlsx"))
{
using (TextReader reader = parser.GetFormattedText(new FormattedTextOptions(FormattedTextMode.Html)))
{
Console.WriteLine(reader.ReadToEnd());
}
}
A végrehajtás után ez a kód kivonja a szöveget az Excel dokumentumból, és HTML formátumban jeleníti meg a konzolon.
Következtetés
Ebben az oktatóanyagban megtanultuk, hogyan lehet a GroupDocs.Parser for .NET használatával szöveget kivonni Excel-dokumentumból, és HTML formátumba konvertálni. Ez a könyvtár egyszerű módot biztosít a különféle dokumentumformátumokkal való munkavégzéshez, lehetővé téve a fejlesztők számára, hogy hatékonyan kezeljék a szövegkivonási feladatokat alkalmazásaikban.
GYIK
A GroupDocs.Parser kezelhet más dokumentumformátumokat az Excelen kívül?
Igen, a GroupDocs.Parser a fájlformátumok széles skáláját támogatja, beleértve a PDF, Word, PowerPoint és egyebeket.
A GroupDocs.Parser kompatibilis a .NET Core-al?
Igen, a GroupDocs.Parser kompatibilis a .NET-keretrendszerrel és a .NET Core-val is.
GroupDocs.Parser megőrzi a formázást a szövegkivonás során?
Igen, a GroupDocs.Parser meg tudja őrizni a formázást, például a betűtípusokat, stílusokat és elrendezést a szövegkivonás során.
Kivonhatok-e metaadatokat dokumentumokból a GroupDocs.Parser segítségével?
Igen, a GroupDocs.Parser lehetővé teszi metaadatok, például szerző, létrehozási dátum és egyebek kinyerését a támogatott dokumentumtípusokból.
Van ingyenes próbaverzió a GroupDocs.Parser számára?
Igen, letölthet egy ingyenes próbaverziót a webhelyrőlitt.