Ekstrak Tabel dari Dokumen

Perkenalan

Groupdocs.Parser untuk .NET adalah perpustakaan komprehensif yang memfasilitasi penguraian dokumen, memungkinkan Anda mengekstrak informasi berharga seperti tabel, teks, metadata, dan lainnya dari dokumen. Dalam tutorial ini, kami fokus secara khusus pada mengekstraksi tabel dari dokumen menggunakan Groupdocs.Parser API.

Prasyarat

Sebelum kita mulai, pastikan Anda memiliki hal berikut:

  • Visual Studio diinstal pada sistem Anda.
  • .NET Framework atau .NET Core diinstal.
  • Pengetahuan dasar tentang pemrograman C#.

Impor Namespace

Pertama, Anda perlu mengimpor namespace yang diperlukan untuk mengakses kelas dan metode Groupdocs.Parser.

using System;
using System.Collections.Generic;
using System.IO;
using System.Text;
using GroupDocs.Parser.Data;
using GroupDocs.Parser.Options;
using GroupDocs.Parser.Templates;

Langkah 1: Buat Instance Kelas Parser

Inisialisasi instance baru dariParser kelas dengan menyediakan jalur ke dokumen sampel Anda.

using (Parser parser = new Parser("YourSampleFile.docx"))
{
    // Kode Anda ada di sini
}

Langkah 2: Periksa Dukungan Ekstraksi Tabel

Verifikasi apakah dokumen mendukung ekstraksi tabel menggunakanFeatures properti dariParser kelas.

if (!parser.Features.Tables)
{
    Console.WriteLine("Document doesn't support table extraction.");
    return;
}

Langkah 3: Tentukan Tata Letak Tabel

Tentukan tata letak tabel yang ingin Anda ekstrak menggunakanTemplateTableLayout. Tentukan lebar kolom dan tinggi baris berdasarkan struktur dokumen Anda.

TemplateTableLayout layout = new TemplateTableLayout(
    new double[] { 50, 95, 275, 415, 485, 545 },
    new double[] { 325, 340, 365, 395 });

Langkah 4: Tetapkan Opsi Ekstraksi Tabel

MembuatPageTableAreaOptions dengan tata letak yang ditentukan untuk menentukan bagaimana tabel harus diekstraksi.

PageTableAreaOptions options = new PageTableAreaOptions(layout);

Langkah 5: Ekstrak Tabel

MemanfaatkanGetTables metodeParser kelas untuk mengekstrak tabel dari dokumen berdasarkan opsi yang ditentukan.

IEnumerable<PageTableArea> tables = parser.GetTables(options);

Langkah 6: Iterasi dan Akses Data Tabel

Ulangi tabel yang diekstraksi serta baris dan kolomnya masing-masing untuk mengakses data sel.

foreach (PageTableArea table in tables)
{
    for (int row = 0; row < table.RowCount; row++)
    {
        for (int column = 0; column < table.ColumnCount; column++)
        {
            PageTableAreaCell cell = table[row, column];
            if (cell != null)
            {
                Console.Write(cell.Text);
                Console.Write(" | ");
            }
        }
        Console.WriteLine();
    }
    Console.WriteLine();
}

Kesimpulan

Dalam tutorial ini, kami telah membahas cara menggunakan Groupdocs.Parser untuk .NET untuk mengekstrak tabel dari dokumen secara efisien. Memanfaatkan kemampuan perpustakaan ini, Anda dapat mengintegrasikan ekstraksi tabel ke dalam aplikasi .NET Anda dengan lancar.

FAQ

Bisakah Groupdocs.Parser menangani format dokumen yang berbeda?

Ya, Groupdocs.Parser mendukung berbagai format dokumen termasuk DOCX, PDF, XLSX, dan banyak lagi.

Apakah ada versi uji coba yang tersedia untuk Groupdocs.Parser untuk .NET?

Ya, Anda dapat mengunduh uji coba gratis dariDi Sini.

Bagaimana saya bisa mendapatkan dukungan untuk pertanyaan terkait Groupdocs.Parser?

Anda dapat mengunjungiForum Groupdocs.Parser untuk bantuan.

Di mana saya dapat membeli lisensi untuk Groupdocs.Parser?

Anda dapat membeli lisensi dariDi Sini.

Bagaimana saya bisa mendapatkan izin sementara untuk tujuan evaluasi?

Anda bisa mendapatkan lisensi sementaraDi Sini.