テンプレートでのテーブルレイアウトの操作

導入

このチュートリアルでは、GroupDocs.Parser for .NET を使用してテンプレートのテーブルレイアウトを操作する方法について説明します。GroupDocs.Parser は、開発者が PDF、Microsoft Office などのさまざまなドキュメント形式からテキストとメタデータを抽出できるようにする強力なドキュメント解析 API です。

前提条件

始める前に、次の前提条件を満たしていることを確認してください。

C# および .NET 開発に関する基本的な知識。
マシンに Visual Studio がインストールされています。
GroupDocs.Parser for .NETがインストールされています。ダウンロードできます。ここ.

名前空間のインポート

まず、必要な名前空間をプロジェクトにインポートしてください。

using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using GroupDocs.Parser.Data;
using GroupDocs.Parser.Templates;

ステップ1: レイアウト付きのテーブルテンプレートを作成する

テンプレート内のテーブルレイアウトを操作するには、テーブルの構造を定義する必要があります。TemplateTableLayoutこのレイアウトは、列の幅と行の高さを指定します。

TemplateTableLayout layout = new TemplateTableLayout(
    new double[] { 30, 100, 320, 400, 480, 550 },   //列幅
    new double[] { 320, 345, 375 }                  //行の高さ
);
//テンプレートテーブルを作成する
TemplateTable table = new TemplateTable(layout, "Details", null);

ステップ2: テンプレートを作成する

次に、定義したテーブルを使用してテンプレートを作成します。

Template template = new Template(new TemplateItem[] { table });

ステップ3: テンプレートを使用してドキュメントを解析する

次に、Parserクラスを作成し、作成されたテンプレートを使用してドキュメントを解析します。

using (Parser parser = new Parser("YourSampleFile.pdf"))
{
    //テンプレートに従ってドキュメントを解析する
    DocumentData data = parser.ParseByTemplate(template);
    //抽出されたデータを反復処理する
    for (int i = 0; i < data.Count; i++)
    {
        Console.Write(data[i].Name + ": ");
        //フィールドがテーブルであるかどうかを確認する
        PageTableArea area = data[i].PageArea as PageTableArea;
        if (area == null)
        {
            continue;
        }
        //テーブル行を反復処理する
        for (int row = 0; row < area.RowCount; row++)
        {
            //テーブル列を反復処理する
            for (int column = 0; column < area.ColumnCount; column++)
            {
                //セルの値を取得する
                PageTextArea cellValue = area[row, column].PageArea as PageTextArea;
                //セルの値を印刷する
                Console.Write(cellValue == null ? "" : cellValue.Text);
                //列間のスペースを印刷する
                Console.Write("\t");
            }
            //各行の後に次の行に移動する
            Console.WriteLine();
        }
    }
}

結論

このチュートリアルでは、GroupDocs.Parser for .NET を使用してドキュメントテンプレートのテーブルレイアウトを操作する方法を学習しました。概要の手順に従うことで、ドキュメントから構造化データを効率的に解析および抽出し、アプリケーションでのさまざまなデータ処理タスクを容易に実行できるようになります。

よくある質問

GroupDocs.Parser for .NET を使用して PDF ドキュメントからテーブルを解析できますか?

はい、GroupDocs.Parser は、PDF ドキュメントやその他の一般的な形式からのテーブルの解析をサポートしています。

GroupDocs.Parser はドキュメントから特定のデータフィールドを抽出するのに適していますか?

はい、GroupDocs.Parser は、事前定義されたテンプレートに基づいて対象のデータフィールドを抽出するための強力な機能を提供します。

ドキュメント内で異なるテーブルレイアウトを処理するにはどうすればよいですか?

GroupDocs.Parser を使用すると、さまざまなテーブルレイアウトを効率的に処理するためのカスタムテンプレートを定義できます。

GroupDocs.Parser は大きなドキュメントの処理をサポートしていますか?

はい、GroupDocs.Parser はさまざまなサイズのドキュメントを処理するように最適化されており、パフォーマンスと信頼性を保証します。

GroupDocs.Parser を他の .NET ライブラリと統合できますか?

確かに、GroupDocs.Parser は他の .NET ライブラリとシームレスに統合され、包括的なドキュメント処理ワークフローを実現します。

テンプレート内の正規表現位置でのフィールドの操作テンプレート内のテーブルパラメータの操作