แยกตารางออกจากเอกสาร

การแนะนำ

Groupdocs.Parser สำหรับ .NET เป็นไลบรารีแบบครอบคลุมที่อำนวยความสะดวกในการแยกวิเคราะห์เอกสาร ทำให้คุณสามารถดึงข้อมูลอันมีค่า เช่น ตาราง ข้อความ เมตาดาต้า และอื่นๆ จากเอกสารได้ ในบทช่วยสอนนี้ เรามุ่งเน้นที่การแยกตารางออกจากเอกสารโดยใช้ Groupdocs.Parser API โดยเฉพาะ

ข้อกำหนดเบื้องต้น

ก่อนที่เราจะเริ่ม ตรวจสอบให้แน่ใจว่าคุณมีสิ่งต่อไปนี้:

  • ติดตั้ง Visual Studio บนระบบของคุณแล้ว
  • ติดตั้ง .NET Framework หรือ .NET Core แล้ว
  • ความรู้พื้นฐานเกี่ยวกับการเขียนโปรแกรม C#

นำเข้าเนมสเปซ

ขั้นแรก คุณต้องนำเข้าเนมสเปซที่จำเป็นเพื่อเข้าถึงคลาสและวิธีการของ Groupdocs.Parser

using System;
using System.Collections.Generic;
using System.IO;
using System.Text;
using GroupDocs.Parser.Data;
using GroupDocs.Parser.Options;
using GroupDocs.Parser.Templates;

ขั้นตอนที่ 1: สร้างอินสแตนซ์ของ Parser Class

เริ่มต้นอินสแตนซ์ใหม่ของParser คลาสโดยระบุเส้นทางไปยังเอกสารตัวอย่างของคุณ

using (Parser parser = new Parser("YourSampleFile.docx"))
{
    // รหัสของคุณอยู่ที่นี่
}

ขั้นตอนที่ 2: ตรวจสอบการสนับสนุนการแยกตาราง

ตรวจสอบว่าเอกสารรองรับการแยกตารางโดยใช้Features ทรัพย์สินของParser ระดับ.

if (!parser.Features.Tables)
{
    Console.WriteLine("Document doesn't support table extraction.");
    return;
}

ขั้นตอนที่ 3: กำหนดเค้าโครงตาราง

กำหนดเค้าโครงของตารางที่คุณต้องการแยกใช้TemplateTableLayout- ระบุความกว้างของคอลัมน์และความสูงของแถวตามโครงสร้างของเอกสารของคุณ

TemplateTableLayout layout = new TemplateTableLayout(
    new double[] { 50, 95, 275, 415, 485, 545 },
    new double[] { 325, 340, 365, 395 });

ขั้นตอนที่ 4: ตั้งค่าตัวเลือกการแยกตาราง

สร้างPageTableAreaOptions ด้วยโครงร่างที่กำหนดไว้เพื่อระบุวิธีแยกตาราง

PageTableAreaOptions options = new PageTableAreaOptions(layout);

ขั้นตอนที่ 5: แยกตาราง

ใช้GetTables วิธีการของParser คลาสเพื่อแยกตารางออกจากเอกสารตามตัวเลือกที่ระบุ

IEnumerable<PageTableArea> tables = parser.GetTables(options);

ขั้นตอนที่ 6: วนซ้ำและเข้าถึงข้อมูลตาราง

วนซ้ำตารางที่แยกออกมา รวมถึงแถวและคอลัมน์ตามลำดับเพื่อเข้าถึงข้อมูลเซลล์

foreach (PageTableArea table in tables)
{
    for (int row = 0; row < table.RowCount; row++)
    {
        for (int column = 0; column < table.ColumnCount; column++)
        {
            PageTableAreaCell cell = table[row, column];
            if (cell != null)
            {
                Console.Write(cell.Text);
                Console.Write(" | ");
            }
        }
        Console.WriteLine();
    }
    Console.WriteLine();
}

บทสรุป

ในบทช่วยสอนนี้ เราได้กล่าวถึงวิธีใช้ Groupdocs.Parser สำหรับ .NET เพื่อแยกตารางออกจากเอกสารอย่างมีประสิทธิภาพ ด้วยการใช้ประโยชน์จากความสามารถของไลบรารีนี้ คุณสามารถรวมการแยกตารางเข้ากับแอปพลิเคชัน .NET ของคุณได้อย่างราบรื่น

คำถามที่พบบ่อย

Groupdocs.Parser สามารถจัดการรูปแบบเอกสารที่แตกต่างกันได้หรือไม่

ใช่ Groupdocs.Parser รองรับรูปแบบเอกสารที่หลากหลาย รวมถึง DOCX, PDF, XLSX และอื่นๆ

มีรุ่นทดลองใช้สำหรับ Groupdocs.Parser สำหรับ .NET หรือไม่

ใช่ คุณสามารถดาวน์โหลดรุ่นทดลองใช้ฟรีได้จากที่นี่.

ฉันจะรับการสนับสนุนสำหรับข้อความค้นหาที่เกี่ยวข้องกับ Groupdocs.Parser ได้อย่างไร

ท่านสามารถเยี่ยมชมได้ที่ฟอรัม Groupdocs.Parser สำหรับความช่วยเหลือ.

ฉันจะซื้อใบอนุญาตสำหรับ Groupdocs.Parser ได้ที่ไหน

คุณสามารถซื้อใบอนุญาตได้จากที่นี่.

ฉันจะขอรับใบอนุญาตชั่วคราวเพื่อวัตถุประสงค์ในการประเมินได้อย่างไร

คุณสามารถขอรับใบอนุญาตชั่วคราวได้ที่นี่.