Bekerja dengan Bidang pada Posisi Tetap di Templat

Perkenalan

Dalam tutorial ini, kita akan mempelajari cara bekerja dengan bidang pada posisi tetap dalam templat menggunakan GroupDocs.Parser untuk .NET. GroupDocs.Parser adalah pustaka penguraian dokumen canggih yang memungkinkan pengembang mengekstrak data dari berbagai format dokumen seperti PDF, Word, Excel, dan banyak lagi. Secara khusus, kami akan fokus pada pendefinisian dan pemanfaatan bidang templat untuk mengekstrak informasi yang ditargetkan berdasarkan posisi tetapnya.

Prasyarat

Sebelum kita mulai, pastikan Anda memiliki hal berikut:

  • Pemahaman dasar tentang pengembangan C# dan .NET.
  • Visual Studio diinstal pada sistem Anda.
  • GroupDocs.Parser untuk perpustakaan .NET diinstal. Anda dapat mengunduhnya dariDi Sini.
  • Contoh file dokumen untuk pengujian.

Impor Namespace

Mulailah dengan memasukkan namespace yang diperlukan dalam proyek C# Anda:

using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using GroupDocs.Parser.Data;
using GroupDocs.Parser.Templates;

Langkah 1: Tentukan Bidang Templat

Pertama, tentukan bidang dengan posisi tetap dalam templat. Bidang ini mewakili area dari mana data akan diambil.

TemplateField field = new TemplateField(
    new TemplateFixedPosition(new Rectangle(new Point(35, 135), new Size(100, 10))),
    "FromCompany");

Di Sini:

  • Rectangle menentukan posisi dan ukuran lapangan.
  • Point(35, 135) mewakili koordinat sudut kiri atas.
  • Size(100, 10) mendefinisikan lebar dan tinggi lapangan.
  • "FromCompany" adalah nama yang diberikan untuk bidang ini.

Langkah 2: Buat Templat

Buat templat menggunakan bidang yang ditentukan.

Template template = new Template(new TemplateItem[] { field });

ItuTemplate objek memegang bidang yang ditentukan.

Langkah 3: Parsing Dokumen Menggunakan Templat

Buat instanceParser kelas dengan jalur dokumen target dan kemudian parsing dokumen menggunakan templat yang dibuat.

using (Parser parser = new Parser("YourSampleFile.pdf"))
{
    DocumentData data = parser.ParseByTemplate(template);
    // Iterasi melalui data yang diekstraksi
    for (int i = 0; i < data.Count; i++)
    {
        Console.Write(data[i].Name + ": ");
        PageTextArea area = data[i].PageArea as PageTextArea;
        Console.WriteLine(area == null ? "Not a template field" : area.Text);
    }
}

Di Sini:

  • Parser diinisialisasi dengan jalur file dokumen sampel.
  • ParseByTemplate Metode ini digunakan untuk mengekstrak data berdasarkan template yang disediakan.
  • Data yang diekstraksi diakses menggunakanDocumentDatadi mana setiap item berhubungan dengan bidang yang ditentukan.

Kesimpulan

Dalam tutorial ini, kami membahas proses bekerja dengan bidang pada posisi tetap di templat menggunakan GroupDocs.Parser untuk .NET. Dengan menentukan templat dengan posisi bidang tertentu, pengembang dapat secara akurat mengekstrak data yang ditargetkan dari berbagai format dokumen.

FAQ

Apakah GroupDocs.Parser kompatibel dengan semua format dokumen?

GroupDocs.Parser mendukung berbagai format file, termasuk PDF, Microsoft Word, Excel, PowerPoint, dan banyak lagi. Mengacu kepadadokumentasi untuk daftar rinci.

Bagaimana saya bisa mendapatkan lisensi sementara untuk GroupDocs.Parser?

Anda bisa mendapatkan lisensi sementara untuk tujuan pengujian dariDi Sini.

Di mana saya dapat menemukan dukungan untuk GroupDocs.Parser?

Untuk bantuan teknis dan diskusi, kunjungiForum GroupDocs.Parser.

Bisakah saya mencoba GroupDocs.Parser sebelum membeli?

Ya, Anda dapat menjelajahi perpustakaan dengan tersedia uji coba gratisDi Sini.

Bagaimana cara membeli lisensi untuk GroupDocs.Parser?

Untuk membeli lisensi, kunjungihalaman pembelian.