แยกตารางออกจากเอกสาร
การแนะนำ
Groupdocs.Parser สำหรับ .NET เป็นไลบรารีแบบครอบคลุมที่อำนวยความสะดวกในการแยกวิเคราะห์เอกสาร ทำให้คุณสามารถดึงข้อมูลอันมีค่า เช่น ตาราง ข้อความ เมตาดาต้า และอื่นๆ จากเอกสารได้ ในบทช่วยสอนนี้ เรามุ่งเน้นที่การแยกตารางออกจากเอกสารโดยใช้ Groupdocs.Parser API โดยเฉพาะ
ข้อกำหนดเบื้องต้น
ก่อนที่เราจะเริ่ม ตรวจสอบให้แน่ใจว่าคุณมีสิ่งต่อไปนี้:
- ติดตั้ง Visual Studio บนระบบของคุณแล้ว
- ติดตั้ง .NET Framework หรือ .NET Core แล้ว
- ความรู้พื้นฐานเกี่ยวกับการเขียนโปรแกรม C#
นำเข้าเนมสเปซ
ขั้นแรก คุณต้องนำเข้าเนมสเปซที่จำเป็นเพื่อเข้าถึงคลาสและวิธีการของ Groupdocs.Parser
using System;
using System.Collections.Generic;
using System.IO;
using System.Text;
using GroupDocs.Parser.Data;
using GroupDocs.Parser.Options;
using GroupDocs.Parser.Templates;
ขั้นตอนที่ 1: สร้างอินสแตนซ์ของ Parser Class
เริ่มต้นอินสแตนซ์ใหม่ของParser
คลาสโดยระบุเส้นทางไปยังเอกสารตัวอย่างของคุณ
using (Parser parser = new Parser("YourSampleFile.docx"))
{
// รหัสของคุณอยู่ที่นี่
}
ขั้นตอนที่ 2: ตรวจสอบการสนับสนุนการแยกตาราง
ตรวจสอบว่าเอกสารรองรับการแยกตารางโดยใช้Features
ทรัพย์สินของParser
ระดับ.
if (!parser.Features.Tables)
{
Console.WriteLine("Document doesn't support table extraction.");
return;
}
ขั้นตอนที่ 3: กำหนดเค้าโครงตาราง
กำหนดเค้าโครงของตารางที่คุณต้องการแยกใช้TemplateTableLayout
- ระบุความกว้างของคอลัมน์และความสูงของแถวตามโครงสร้างของเอกสารของคุณ
TemplateTableLayout layout = new TemplateTableLayout(
new double[] { 50, 95, 275, 415, 485, 545 },
new double[] { 325, 340, 365, 395 });
ขั้นตอนที่ 4: ตั้งค่าตัวเลือกการแยกตาราง
สร้างPageTableAreaOptions
ด้วยโครงร่างที่กำหนดไว้เพื่อระบุวิธีแยกตาราง
PageTableAreaOptions options = new PageTableAreaOptions(layout);
ขั้นตอนที่ 5: แยกตาราง
ใช้GetTables
วิธีการของParser
คลาสเพื่อแยกตารางออกจากเอกสารตามตัวเลือกที่ระบุ
IEnumerable<PageTableArea> tables = parser.GetTables(options);
ขั้นตอนที่ 6: วนซ้ำและเข้าถึงข้อมูลตาราง
วนซ้ำตารางที่แยกออกมา รวมถึงแถวและคอลัมน์ตามลำดับเพื่อเข้าถึงข้อมูลเซลล์
foreach (PageTableArea table in tables)
{
for (int row = 0; row < table.RowCount; row++)
{
for (int column = 0; column < table.ColumnCount; column++)
{
PageTableAreaCell cell = table[row, column];
if (cell != null)
{
Console.Write(cell.Text);
Console.Write(" | ");
}
}
Console.WriteLine();
}
Console.WriteLine();
}
บทสรุป
ในบทช่วยสอนนี้ เราได้กล่าวถึงวิธีใช้ Groupdocs.Parser สำหรับ .NET เพื่อแยกตารางออกจากเอกสารอย่างมีประสิทธิภาพ ด้วยการใช้ประโยชน์จากความสามารถของไลบรารีนี้ คุณสามารถรวมการแยกตารางเข้ากับแอปพลิเคชัน .NET ของคุณได้อย่างราบรื่น
คำถามที่พบบ่อย
Groupdocs.Parser สามารถจัดการรูปแบบเอกสารที่แตกต่างกันได้หรือไม่
ใช่ Groupdocs.Parser รองรับรูปแบบเอกสารที่หลากหลาย รวมถึง DOCX, PDF, XLSX และอื่นๆ
มีรุ่นทดลองใช้สำหรับ Groupdocs.Parser สำหรับ .NET หรือไม่
ใช่ คุณสามารถดาวน์โหลดรุ่นทดลองใช้ฟรีได้จากที่นี่.
ฉันจะรับการสนับสนุนสำหรับข้อความค้นหาที่เกี่ยวข้องกับ Groupdocs.Parser ได้อย่างไร
ท่านสามารถเยี่ยมชมได้ที่ฟอรัม Groupdocs.Parser สำหรับความช่วยเหลือ.
ฉันจะซื้อใบอนุญาตสำหรับ Groupdocs.Parser ได้ที่ไหน
คุณสามารถซื้อใบอนุญาตได้จากที่นี่.
ฉันจะขอรับใบอนุญาตชั่วคราวเพื่อวัตถุประสงค์ในการประเมินได้อย่างไร
คุณสามารถขอรับใบอนุญาตชั่วคราวได้ที่นี่.