Táblázatok kibontása a dokumentumból
Bevezetés
A Groupdocs.Parser for .NET egy átfogó könyvtár, amely megkönnyíti a dokumentumok elemzését, lehetővé téve olyan értékes információk kinyerését a dokumentumokból, mint például táblázatok, szövegek, metaadatok és egyebek. Ebben az oktatóanyagban kifejezetten a táblázatok kinyerésére összpontosítunk a dokumentumokból a Groupdocs.Parser API használatával.
Előfeltételek
Mielőtt elkezdené, győződjön meg arról, hogy rendelkezik az alábbiakkal:
- A Visual Studio telepítve van a rendszerére.
- .NET Framework vagy .NET Core telepítve.
- C# programozási alapismeretek.
Névterek importálása
Először is importálnia kell a szükséges névtereket a Groupdocs.Parser osztályok és metódusok eléréséhez.
using System;
using System.Collections.Generic;
using System.IO;
using System.Text;
using GroupDocs.Parser.Data;
using GroupDocs.Parser.Options;
using GroupDocs.Parser.Templates;
1. lépés: Hozzon létre egy példányt az elemző osztályból
Inicializálja aParser
osztályba, megadva a mintadokumentum elérési útját.
using (Parser parser = new Parser("YourSampleFile.docx"))
{
// A kódod ide kerül
}
2. lépés: Ellenőrizze a Táblázat kivonási támogatást
Ellenőrizze, hogy a dokumentum támogatja-e a táblázat kibontását aFeatures
tulajdona aParser
osztály.
if (!parser.Features.Tables)
{
Console.WriteLine("Document doesn't support table extraction.");
return;
}
3. lépés: Határozza meg a táblázat elrendezését
Határozza meg a kivonatolni kívánt táblák elrendezésétTemplateTableLayout
. Határozza meg az oszlopszélességet és a sormagasságot a dokumentum szerkezete alapján.
TemplateTableLayout layout = new TemplateTableLayout(
new double[] { 50, 95, 275, 415, 485, 545 },
new double[] { 325, 340, 365, 395 });
4. lépés: Állítsa be a táblázat kibontási beállításait
TeremtPageTableAreaOptions
a meghatározott elrendezéssel a táblák kibontásának módjának megadásához.
PageTableAreaOptions options = new PageTableAreaOptions(layout);
5. lépés: Táblázatok kibontása
Használja ki aGetTables
módszere aParser
osztályban táblákat kinyerhet a dokumentumból a megadott beállítások alapján.
IEnumerable<PageTableArea> tables = parser.GetTables(options);
6. lépés: Iteráció és táblaadatok elérése
A cellaadatok eléréséhez ismételje meg a kibontott táblázatokat és a hozzájuk tartozó sorokat és oszlopokat.
foreach (PageTableArea table in tables)
{
for (int row = 0; row < table.RowCount; row++)
{
for (int column = 0; column < table.ColumnCount; column++)
{
PageTableAreaCell cell = table[row, column];
if (cell != null)
{
Console.Write(cell.Text);
Console.Write(" | ");
}
}
Console.WriteLine();
}
Console.WriteLine();
}
Következtetés
Ebben az oktatóanyagban bemutattuk, hogyan használható a Groupdocs.Parser for .NET a táblák hatékony kinyerésére a dokumentumokból. Ennek a könyvtárnak a képességeit kihasználva zökkenőmentesen integrálhatja a táblakivonást .NET-alkalmazásaiba.
GYIK
A Groupdocs.Parser képes kezelni a különböző dokumentumformátumokat?
Igen, a Groupdocs.Parser a dokumentumformátumok széles skáláját támogatja, beleértve a DOCX, PDF, XLSX és egyebeket.
Elérhető a Groupdocs.Parser for .NET próbaverziója?
Igen, letölthet egy ingyenes próbaverziót a webhelyrőlitt.
Hogyan kaphatok támogatást a Groupdocs.Parserrel kapcsolatos lekérdezésekhez?
Meglátogathatja aGroupdocs.Parser fórum segítségért.
Hol vásárolhatok licencet a Groupdocs.Parser számára?
Engedélyt vásárolhat innenitt.
Hogyan szerezhetek ideiglenes engedélyt értékelési célból?
Kaphat ideiglenes engedélytitt.