使用範本中的表格佈局
內容
[
隱藏
]介紹
在本教學中,我們將探索如何使用 GroupDocs.Parser for .NET 在範本中處理表格版面配置。 GroupDocs.Parser 是一個功能強大的文件解析 API,可讓開發人員從各種文件格式(包括 PDF、Microsoft Office 等)中提取文字和元資料。
先決條件
在我們開始之前,請確保您符合以下先決條件:
- C# 和 .NET 開發的基礎知識。
- Visual Studio 安裝在您的電腦上。
- 安裝了適用於 .NET 的 GroupDocs.Parser。你可以下載它這裡.
導入命名空間
首先,確保將必要的命名空間匯入到您的專案中:
using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using GroupDocs.Parser.Data;
using GroupDocs.Parser.Templates;
第 1 步:建立帶有佈局的表格模板
要在範本中使用表格佈局,您需要使用以下命令定義表格的結構TemplateTableLayout
。此佈局指定列的寬度和行的高度。
TemplateTableLayout layout = new TemplateTableLayout(
new double[] { 30, 100, 320, 400, 480, 550 }, //列寬
new double[] { 320, 345, 375 } //行高
);
//建立模板表
TemplateTable table = new TemplateTable(layout, "Details", null);
第 2 步:建立模板
現在,使用定義的表格建立一個範本。
Template template = new Template(new TemplateItem[] { table });
步驟 3:使用範本解析文檔
接下來,實例化Parser
類別並使用建立的模板解析文件。
using (Parser parser = new Parser("YourSampleFile.pdf"))
{
//透過模板解析文檔
DocumentData data = parser.ParseByTemplate(template);
//迭代提取的數據
for (int i = 0; i < data.Count; i++)
{
Console.Write(data[i].Name + ": ");
//檢查欄位是否為表
PageTableArea area = data[i].PageArea as PageTableArea;
if (area == null)
{
continue;
}
//遍歷表行
for (int row = 0; row < area.RowCount; row++)
{
//遍歷表列
for (int column = 0; column < area.ColumnCount; column++)
{
//取得儲存格值
PageTextArea cellValue = area[row, column].PageArea as PageTextArea;
//列印儲存格值
Console.Write(cellValue == null ? "" : cellValue.Text);
//列印列之間的空間
Console.Write("\t");
}
//每行後移動到下一行
Console.WriteLine();
}
}
}
結論
在本教學中,我們學習如何利用 GroupDocs.Parser for .NET 來處理文件範本中的表格佈局。透過遵循概述的步驟,您可以有效地從文件中解析和提取結構化數據,從而促進應用程式中的各種數據處理任務。
常見問題解答
我可以使用 GroupDocs.Parser for .NET 解析 PDF 文件中的表格嗎?
是的,GroupDocs.Parser 支援從 PDF 文件以及其他流行格式解析表格。
GroupDocs.Parser適合從文件中提取特定資料欄位嗎?
當然,GroupDocs.Parser 提供了基於預定義模板提取目標資料欄位的強大功能。
如何處理文件中的不同表格佈局?
GroupDocs.Parser 允許定義自訂範本以有效處理不同的表格佈局。
GroupDocs.Parser是否支援處理大文件?
是的,GroupDocs.Parser 針對處理不同大小的文件進行了最佳化,確保了效能和可靠性。
我可以將 GroupDocs.Parser 與其他 .NET 程式庫整合嗎?
當然,GroupDocs.Parser 與其他 .NET 程式庫無縫集成,實現全面的文件處理工作流程。