ドキュメントから画像を抽出する

導入

このチュートリアルでは、GroupDocs.Parser for .NET を使用してドキュメントから画像を抽出する方法について説明します。GroupDocs.Parser は、開発者がさまざまなドキュメント形式からテキスト、メタデータ、画像などを抽出できるようにする強力なライブラリです。

始める前に、次の前提条件が設定されていることを確認してください。

まず、C# プロジェクトに必要な名前空間をインポートします。

using System;
using System.Collections.Generic;
using System.Text;
using GroupDocs.Parser.Data;

まず、Parserサンプルドキュメントへのパスを指定してクラスを作成します。

using (Parser parser = new Parser("YourSampleFile.pdf"))
{
    //ここにコードを入力してください
}

交換する"YourSampleFile.pdf"ドキュメントファイルへのパスを入力します。

次に、GetImages()方法。

IEnumerable<PageImageArea> images = parser.GetImages();

のGetImages()メソッドはコレクションを返しますPageImageAreaドキュメント内で見つかった画像を表すオブジェクト。

画像を反復処理する前に、ドキュメントで画像抽出がサポートされているかどうかを確認します。

if (images == null)
{
    Console.WriteLine("Images extraction isn't supported");
    return;
}

この手順により、ドキュメントに抽出可能な画像が含まれていることが保証されます。

次に、抽出された画像を反復処理して、ページインデックス、四角形の座標、画像の種類など、各画像の詳細情報にアクセスします。

foreach (PageImageArea image in images)
{
    Console.WriteLine($"Page: {image.Page.Index}, Rectangle: {image.Rectangle}, Type: {image.FileType}");
}

このループは、抽出された各画像の場所や種類などの情報を出力します。

このチュートリアルでは、GroupDocs.Parser for .NET を使用してプログラムでドキュメントから画像を抽出する方法を学習しました。これらの手順に従うことで、ドキュメント画像抽出機能を .NET アプリケーションにシームレスに統合できます。

GroupDocs.Parser は、PDF、DOCX、XLSX など、さまざまな形式から画像を抽出できます。

はい、GroupDocs.Parserの無料トライアルは以下からご利用いただけます。Webサイト.

GroupDocs.Parserの詳細なドキュメントは以下にあります。ここ.

技術サポートと支援については、GroupDocs.Parser フォーラム.