從 PDF 表單中提取數據
內容
[
隱藏
]介紹
在本教學中,我們將探討如何利用 GroupDocs.Parser for .NET 從 PDF 表單中擷取資料。 GroupDocs.Parser 是一個功能強大的程式庫,可讓開發人員有效地處理各種文件格式,包括 PDF、DOCX、XLSX 等。我們將逐步完成從 PDF 表單中提取特定欄位並處理提取的資料的必要步驟。
先決條件
在我們開始之前,請確保您具備以下先決條件:
- C# 程式設計基礎知識。
- Visual Studio 安裝在您的系統上。
- 安裝了 .NET 函式庫的 GroupDocs.Parser。您可以從以下位置下載:這裡.
導入命名空間
首先,您需要在 C# 專案中匯入所需的命名空間:
using System;
using System.Linq;
using GroupDocs.Parser.Data;
第 1 步:初始化解析器
首先,建立一個實例Parser
透過指定範例 PDF 檔案的路徑來建立類別:
using (Parser parser = new Parser("YourSampleFile.pdf"))
{
//資料提取的程式碼將會放在這裡
}
第 2 步:從 PDF 文件中提取數據
接下來,在using
塊,調用ParseForm
從PDF文件中提取資料的方法:
DocumentData data = parser.ParseForm();
if (data == null)
{
Console.WriteLine("Form extraction isn't supported.");
return;
}
第 3 步:存取特定欄位數據
現在,定義一個方法GetFieldText
從提取的資料中的特定欄位檢索文字:
private static string GetFieldText(DocumentData data, string fieldName)
{
FieldData fieldData = data.GetFieldsByName(fieldName).FirstOrDefault();
return fieldData != null && fieldData.PageArea is PageTextArea
? (fieldData.PageArea as PageTextArea).Text
: null;
}
第四步:建立初步記錄對象
定義後GetFieldText
方法,用它來填充PreliminaryRecord
具有提取資料的對象:
PreliminaryRecord rec = new PreliminaryRecord();
rec.Name = GetFieldText(data, "Name");
rec.Model = GetFieldText(data, "Model");
rec.Time = GetFieldText(data, "Time");
rec.Description = GetFieldText(data, "Description");
第 5 步:利用擷取的數據
最後,您可以根據需要使用提取的資料 - 無論是儲存到資料庫、作為 Web 回應發送還是顯示它:
Console.WriteLine("Preliminary record");
Console.WriteLine("Name: {0}", rec.Name);
Console.WriteLine("Model: {0}", rec.Model);
Console.WriteLine("Time: {0}", rec.Time);
Console.WriteLine("Description: {0}", rec.Description);
結論
在本教程中,我們介紹了使用 GroupDocs.Parser for .NET 從 PDF 表單中提取資料的基礎知識。透過執行這些步驟,您可以在 C# 應用程式中有效地從 PDF 文件中檢索特定資訊。
常見問題解答
GroupDocs.Parser 是否與 PDF 以外的其他文件格式相容?
是的,GroupDocs.Parser 支援各種格式,包括 DOCX、XLSX、PPTX 等。
我可以使用 GroupDocs.Parser 提取圖像和元資料嗎?
是的,GroupDocs.Parser 允許從文件中提取圖像、元資料和文字。
在哪裡可以找到 GroupDocs.Parser 的其他支援或文件?
您可以訪問GroupDocs.Parser 文檔取得詳細資訊和範例。
GroupDocs.Parser 是否有免費試用版?
是的,您可以訪問免費試用 GroupDocs.Parser來探索它的特點。
如何獲得 GroupDocs.Parser 的臨時許可證?
您可以獲得一個GroupDocs.Parser 的臨時許可證評估其在您的項目中的能力。