Képek kibontása a dokumentumból

Bevezetés

Ebben az oktatóanyagban megvizsgáljuk, hogyan lehet képeket kinyerni a dokumentumokból a GroupDocs.Parser for .NET segítségével. A GroupDocs.Parser egy hatékony könyvtár, amely lehetővé teszi a fejlesztők számára, hogy szöveget, metaadatokat, képeket és egyebeket kinyerjenek különféle dokumentumformátumokból.

Előfeltételek

Mielőtt elkezdené, győződjön meg arról, hogy beállította a következő előfeltételeket:

  • Visual Studio: Telepítse a Visual Studio-t a gépére.
  • GroupDocs.Parser for .NET: Töltse le és telepítse a GroupDocs.Parser programot aletöltési oldal.
  • Mintadokumentum: Készítsen mintadokumentumot (PDF, DOCX stb.), amelyből képeket szeretne kinyerni.

Névterek importálása

Kezdje a szükséges névterek importálásával a C# projektben:

using System;
using System.Collections.Generic;
using System.Text;
using GroupDocs.Parser.Data;

1. lépés: Hozzon létre egy példányt az elemző osztályból

Először hozzon létre egy példányt aParser osztályba, megadva a mintadokumentum elérési útját.

using (Parser parser = new Parser("YourSampleFile.pdf"))
{
    // A kódod ide kerül
}

Cserélje ki"YourSampleFile.pdf" a dokumentumfájl elérési útjával.

2. lépés: Kivonja a képeket a dokumentumból

Ezután bontsa ki a képeket a dokumentumból aGetImages() módszer.

IEnumerable<PageImageArea> images = parser.GetImages();

AGetImages() metódus egy gyűjteményt ad visszaPageImageArea a dokumentumban található képeket ábrázoló objektumok.

3. lépés: Ellenőrizze a képkivonási támogatást

Mielőtt ismételné a képeket, ellenőrizze, hogy a dokumentum támogatja-e a képkivonást.

if (images == null)
{
    Console.WriteLine("Images extraction isn't supported");
    return;
}

Ez a lépés biztosítja, hogy a dokumentum kivonható képeket tartalmazzon.

4. lépés: Ismételje meg a kicsomagolt képeket

Most ismételje meg a kibontott képeket, hogy részletes információkat kapjon az egyes képekről, például oldalindexet, téglalap koordinátákat és képtípust.

foreach (PageImageArea image in images)
{
    Console.WriteLine($"Page: {image.Page.Index}, Rectangle: {image.Rectangle}, Type: {image.FileType}");
}

Ez a hurok információkat nyomtat minden egyes kivont képről, beleértve a helyét és típusát.

Következtetés

Ebben az oktatóanyagban megtanultuk, hogyan használhatja a GroupDocs.Parser for .NET-et a képek programozott kinyerésére a dokumentumokból. Az alábbi lépések követésével zökkenőmentesen integrálhatja a dokumentumkép-kinyerési funkciót .NET-alkalmazásaiba.

GYIK

GroupDocs.Parser ki tudja bontani a képeket minden dokumentumformátumból?

A GroupDocs.Parser támogatja a képek kinyerését különféle formátumokból, beleértve a PDF, DOCX, XLSX és egyebeket.

Van ingyenes próbaverzió a GroupDocs.Parser számára?

Igen, elérheti a GroupDocs.Parser ingyenes próbaverzióját a webhelyrőlweboldal.

Hol találom a GroupDocs.Parser dokumentációját?

A GroupDocs.Parser részletes dokumentációja megtalálhatóitt.

Hogyan szerezhetek ideiglenes licencet a GroupDocs.Parser számára?

Ideiglenes engedélyt szerezhet aideiglenes licenc oldal.

Hol kaphatok támogatást a GroupDocs.Parser számára?

Technikai támogatásért és segítségért látogassa meg aGroupDocs.Parser fórum.