Bekerja dengan Tata Letak Tabel di Templat

Perkenalan

Dalam tutorial ini, kita akan mempelajari cara bekerja dengan tata letak tabel di templat menggunakan GroupDocs.Parser untuk .NET. GroupDocs.Parser adalah API penguraian dokumen canggih yang memungkinkan pengembang mengekstrak teks dan metadata dari berbagai format dokumen, termasuk PDF, Microsoft Office, dan banyak lagi.

Prasyarat

Sebelum kita mulai, pastikan Anda memiliki prasyarat berikut:

Pengetahuan dasar tentang pengembangan C# dan .NET.
Visual Studio diinstal pada mesin Anda.
GroupDocs.Parser untuk .NET diinstal. Anda dapat mengunduhnyaDi Sini.

Impor Namespace

Pertama, pastikan untuk mengimpor namespace yang diperlukan ke dalam proyek Anda:

using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using GroupDocs.Parser.Data;
using GroupDocs.Parser.Templates;

Langkah 1: Buat Templat Tabel dengan Layout

Untuk bekerja dengan tata letak tabel di templat, Anda perlu menentukan struktur tabel menggunakanTemplateTableLayout. Tata letak ini menentukan lebar kolom dan tinggi baris.

TemplateTableLayout layout = new TemplateTableLayout(
    new double[] { 30, 100, 320, 400, 480, 550 },   // Lebar kolom
    new double[] { 320, 345, 375 }                  // Ketinggian baris
);
// Buat Tabel Templat
TemplateTable table = new TemplateTable(layout, "Details", null);

Langkah 2: Buat Templat

Sekarang, buat templat menggunakan tabel yang ditentukan.

Template template = new Template(new TemplateItem[] { table });

Langkah 3: Parsing Dokumen Menggunakan Templat

Selanjutnya, buat instanceParser kelas dan parsing dokumen menggunakan templat yang dibuat.

using (Parser parser = new Parser("YourSampleFile.pdf"))
{
    // Parsing dokumen berdasarkan templat
    DocumentData data = parser.ParseByTemplate(template);
    // Ulangi data yang diekstraksi
    for (int i = 0; i < data.Count; i++)
    {
        Console.Write(data[i].Name + ": ");
        // Periksa apakah bidang tersebut berupa tabel
        PageTableArea area = data[i].PageArea as PageTableArea;
        if (area == null)
        {
            continue;
        }
        // Iterasi melalui baris tabel
        for (int row = 0; row < area.RowCount; row++)
        {
            // Iterasi melalui kolom tabel
            for (int column = 0; column < area.ColumnCount; column++)
            {
                // Dapatkan nilai sel
                PageTextArea cellValue = area[row, column].PageArea as PageTextArea;
                // Cetak nilai sel
                Console.Write(cellValue == null ? "" : cellValue.Text);
                // Cetak ruang antar kolom
                Console.Write("\t");
            }
            // Pindah ke baris berikutnya setelah setiap baris
            Console.WriteLine();
        }
    }
}

Kesimpulan

Dalam tutorial ini, kita telah mempelajari cara memanfaatkan GroupDocs.Parser untuk .NET untuk bekerja dengan tata letak tabel di templat dokumen. Dengan mengikuti langkah-langkah yang diuraikan, Anda dapat mengurai dan mengekstrak data terstruktur dari dokumen secara efisien, sehingga memfasilitasi berbagai tugas pemrosesan data di aplikasi Anda.

FAQ

Bisakah saya mengurai tabel dari dokumen PDF menggunakan GroupDocs.Parser untuk .NET?

Ya, GroupDocs.Parser mendukung penguraian tabel dari dokumen PDF bersama dengan format populer lainnya.

Apakah GroupDocs.Parser cocok untuk mengekstraksi bidang data tertentu dari dokumen?

Tentu saja, GroupDocs.Parser menawarkan fitur canggih untuk mengekstraksi bidang data yang ditargetkan berdasarkan templat yang telah ditentukan sebelumnya.

Bagaimana cara menangani tata letak tabel yang berbeda dalam dokumen?

GroupDocs.Parser memungkinkan penentuan templat khusus untuk menangani beragam tata letak tabel secara efisien.

Apakah GroupDocs.Parser mendukung pemrosesan dokumen besar?

Ya, GroupDocs.Parser dioptimalkan untuk menangani dokumen dengan berbagai ukuran, memastikan kinerja dan keandalan.

Bisakah saya mengintegrasikan GroupDocs.Parser dengan perpustakaan .NET lainnya?

Tentu saja, GroupDocs.Parser terintegrasi secara mulus dengan perpustakaan .NET lainnya, memungkinkan alur kerja pemrosesan dokumen yang komprehensif.

Bekerja dengan Bidang di Posisi Regex di Templat Bekerja dengan Parameter Tabel di Templat