PDFフォームからデータを抽出する

導入

このチュートリアルでは、GroupDocs.Parser for .NET を使用して PDF フォームからデータを抽出する方法について説明します。GroupDocs.Parser は、開発者が PDF、DOCX、XLSX などのさまざまなドキュメント形式を効率的に操作できるようにする強力なライブラリです。PDF フォームから特定のフィールドを抽出し、抽出したデータを処理するために必要な手順を説明します。

前提条件

始める前に、次の前提条件を満たしていることを確認してください。

C# プログラミングの基礎知識。
Visual Studio がシステムにインストールされています。
GroupDocs.Parser for .NETライブラリがインストールされています。ダウンロードはこちらからここ.

名前空間のインポート

開始するには、C# プロジェクトに必要な名前空間をインポートする必要があります。

using System;
using System.Linq;
using GroupDocs.Parser.Data;

ステップ1: パーサーを初期化する

まず、Parserサンプル PDF ファイルへのパスを指定してクラスを作成します。

using (Parser parser = new Parser("YourSampleFile.pdf"))
{
    //データ抽出用のコードはここに記載します
}

ステップ2: PDF文書からデータを抽出する

次に、usingブロック、呼び出しParseFormPDF ドキュメントからデータを抽出する方法:

DocumentData data = parser.ParseForm();
if (data == null)
{
    Console.WriteLine("Form extraction isn't supported.");
    return;
}

ステップ3: 特定のフィールドデータにアクセスする

さて、メソッドを定義するGetFieldText抽出されたデータ内の特定のフィールドからテキストを取得するには:

private static string GetFieldText(DocumentData data, string fieldName)
{
    FieldData fieldData = data.GetFieldsByName(fieldName).FirstOrDefault();
    return fieldData != null && fieldData.PageArea is PageTextArea
        ? (fieldData.PageArea as PageTextArea).Text
        : null;
}

ステップ4: 予備レコードオブジェクトを作成する

定義した後、GetFieldTextメソッドを使用して、PreliminaryRecord抽出されたデータを含むオブジェクト:

PreliminaryRecord rec = new PreliminaryRecord();
rec.Name = GetFieldText(data, "Name");
rec.Model = GetFieldText(data, "Model");
rec.Time = GetFieldText(data, "Time");
rec.Description = GetFieldText(data, "Description");

ステップ5: 抽出したデータを活用する

最後に、抽出したデータを必要に応じて使用できます。データベースに保存したり、Web 応答として送信したり、表示したりできます。

Console.WriteLine("Preliminary record");
Console.WriteLine("Name: {0}", rec.Name);
Console.WriteLine("Model: {0}", rec.Model);
Console.WriteLine("Time: {0}", rec.Time);
Console.WriteLine("Description: {0}", rec.Description);

結論

このチュートリアルでは、GroupDocs.Parser for .NET を使用して PDF フォームからデータを抽出する基本について説明しました。これらの手順に従うことで、C# アプリケーション内で PDF ドキュメントから特定の情報を効率的に取得できます。

よくある質問

GroupDocs.Parser は PDF 以外のドキュメント形式と互換性がありますか?

はい、GroupDocs.Parser は DOCX、XLSX、PPTX など、さまざまな形式をサポートしています。

GroupDocs.Parser を使用して画像とメタデータを抽出できますか?

はい、GroupDocs.Parser を使用すると、ドキュメントから画像、メタデータ、テキストを抽出できます。

GroupDocs.Parser の追加サポートやドキュメントはどこで入手できますか?

訪問することができますGroupDocs.Parser ドキュメント詳細な情報と例については、こちらをご覧ください。

GroupDocs.Parser の無料トライアルはありますか?

はい、アクセスできますGroupDocs.Parserの無料トライアルその特徴を探ります。

GroupDocs.Parser の一時ライセンスを取得するにはどうすればよいですか?

あなたは取得することができますGroupDocs.Parser の一時ライセンスプロジェクトにおけるその機能を評価します。

PDFポートフォリオから添付ファイルを抽出する PDFから画像を抽出する