Táblázatok kibontása a dokumentumból

Bevezetés

A Groupdocs.Parser for .NET egy átfogó könyvtár, amely megkönnyíti a dokumentumok elemzését, lehetővé téve olyan értékes információk kinyerését a dokumentumokból, mint például táblázatok, szövegek, metaadatok és egyebek. Ebben az oktatóanyagban kifejezetten a táblázatok kinyerésére összpontosítunk a dokumentumokból a Groupdocs.Parser API használatával.

Előfeltételek

Mielőtt elkezdené, győződjön meg arról, hogy rendelkezik az alábbiakkal:

  • A Visual Studio telepítve van a rendszerére.
  • .NET Framework vagy .NET Core telepítve.
  • C# programozási alapismeretek.

Névterek importálása

Először is importálnia kell a szükséges névtereket a Groupdocs.Parser osztályok és metódusok eléréséhez.

using System;
using System.Collections.Generic;
using System.IO;
using System.Text;
using GroupDocs.Parser.Data;
using GroupDocs.Parser.Options;
using GroupDocs.Parser.Templates;

1. lépés: Hozzon létre egy példányt az elemző osztályból

Inicializálja aParser osztályba, megadva a mintadokumentum elérési útját.

using (Parser parser = new Parser("YourSampleFile.docx"))
{
    // A kódod ide kerül
}

2. lépés: Ellenőrizze a Táblázat kivonási támogatást

Ellenőrizze, hogy a dokumentum támogatja-e a táblázat kibontását aFeatures tulajdona aParser osztály.

if (!parser.Features.Tables)
{
    Console.WriteLine("Document doesn't support table extraction.");
    return;
}

3. lépés: Határozza meg a táblázat elrendezését

Határozza meg a kivonatolni kívánt táblák elrendezésétTemplateTableLayout. Határozza meg az oszlopszélességet és a sormagasságot a dokumentum szerkezete alapján.

TemplateTableLayout layout = new TemplateTableLayout(
    new double[] { 50, 95, 275, 415, 485, 545 },
    new double[] { 325, 340, 365, 395 });

4. lépés: Állítsa be a táblázat kibontási beállításait

TeremtPageTableAreaOptions a meghatározott elrendezéssel a táblák kibontásának módjának megadásához.

PageTableAreaOptions options = new PageTableAreaOptions(layout);

5. lépés: Táblázatok kibontása

Használja ki aGetTables módszere aParser osztályban táblákat kinyerhet a dokumentumból a megadott beállítások alapján.

IEnumerable<PageTableArea> tables = parser.GetTables(options);

6. lépés: Iteráció és táblaadatok elérése

A cellaadatok eléréséhez ismételje meg a kibontott táblázatokat és a hozzájuk tartozó sorokat és oszlopokat.

foreach (PageTableArea table in tables)
{
    for (int row = 0; row < table.RowCount; row++)
    {
        for (int column = 0; column < table.ColumnCount; column++)
        {
            PageTableAreaCell cell = table[row, column];
            if (cell != null)
            {
                Console.Write(cell.Text);
                Console.Write(" | ");
            }
        }
        Console.WriteLine();
    }
    Console.WriteLine();
}

Következtetés

Ebben az oktatóanyagban bemutattuk, hogyan használható a Groupdocs.Parser for .NET a táblák hatékony kinyerésére a dokumentumokból. Ennek a könyvtárnak a képességeit kihasználva zökkenőmentesen integrálhatja a táblakivonást .NET-alkalmazásaiba.

GYIK

A Groupdocs.Parser képes kezelni a különböző dokumentumformátumokat?

Igen, a Groupdocs.Parser a dokumentumformátumok széles skáláját támogatja, beleértve a DOCX, PDF, XLSX és egyebeket.

Elérhető a Groupdocs.Parser for .NET próbaverziója?

Igen, letölthet egy ingyenes próbaverziót a webhelyrőlitt.

Hogyan kaphatok támogatást a Groupdocs.Parserrel kapcsolatos lekérdezésekhez?

Meglátogathatja aGroupdocs.Parser fórum segítségért.

Hol vásárolhatok licencet a Groupdocs.Parser számára?

Engedélyt vásárolhat innenitt.

Hogyan szerezhetek ideiglenes engedélyt értékelési célból?

Kaphat ideiglenes engedélytitt.