テンプレートを使用してページを解析する
コンテンツ
[
隠れる
]導入
このチュートリアルでは、GroupDocs.Parser for .NET を使用してドキュメントからデータを効率的に抽出する方法について詳しく説明します。GroupDocs.Parser は、PDF、DOCX、PPTX などのさまざまなドキュメント形式を解析できる強力なライブラリです。バーコードなどの特定のコンテンツを正確に抽出できるテンプレートを使用したページの解析に焦点を当てます。
前提条件
始める前に、次の設定がされていることを確認してください。
- GroupDocs.Parser for .NETライブラリ: ダウンロードできますここ.
- 開発環境: Visual Studio または任意の .NET 互換 IDE。
- サンプル ドキュメント: 解析するコンテンツを含むドキュメントを用意します。
名前空間のインポート
まず、C# プロジェクトに必要な名前空間を含めます。
using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using GroupDocs.Parser.Data;
using GroupDocs.Parser.Templates;
ステップ1: バーコードフィールドを定義する
バーコードを抽出するには、TemplateBarcode
オブジェクト。場所を指定します(Rectangle
) とバーコードの種類を指定します。
TemplateBarcode barcode = new TemplateBarcode(
new Rectangle(new Point(405, 55), new Size(100, 50)),
"QR");
ステップ2: テンプレートを作成する
バーコード(または他のフィールド)をTemplate
物体。
Template template = new Template(new TemplateItem[] { barcode });
ステップ3: パーサーをインスタンス化する
インスタンスを作成するParser
解析するドキュメント パスを指定します。
using (Parser parser = new Parser("YourSampleFile.docx"))
{
//テンプレートを使用してドキュメントページを反復処理する
foreach (DocumentPageData data in parser.ParsePagesByTemplate(template))
{
//ページインデックスを印刷する
Console.WriteLine("Page: " + data.PageIndex);
//抽出したデータを印刷する
for (int i = 0; i < data.Count; i++)
{
Console.Write(data[i].Name + ": ");
PageBarcodeArea area = data[i].PageArea as PageBarcodeArea;
Console.WriteLine(area == null ? "Not a template barcode field" : area.Value);
}
}
}
結論
GroupDocs.Parser for .NET を使用すると、ドキュメントをシームレスに解析し、テンプレートを使用してバーコードなどの特定のコンテンツを抽出できます。このチュートリアルでは、.NET アプリケーションでドキュメント解析を開始するための基本的な手順について説明しました。
よくある質問
GroupDocs.Parser はさまざまなドキュメント形式を処理できますか?
はい、GroupDocs.Parser は PDF、DOCX、XLSX などさまざまな形式をサポートしています。
GroupDocs.Parser はバーコードなどの特定のデータを抽出するのに適していますか?
もちろんです! GroupDocs.Parser は、対象を絞ったコンテンツの抽出に正確な抽出機能を提供します。
GroupDocs.Parser の詳細なドキュメントはどこで見つかりますか?
訪問ドキュメンテーション包括的なガイダンスを提供します。
GroupDocs.Parser の一時ライセンスを取得するにはどうすればよいですか?
取得する一時ライセンス評価または開発の目的で。
GroupDocs はトラブルシューティングのサポートを提供していますか?
はい、サポートを受けることができますGroupDocs フォーラムご質問や問題がございましたら、