Parsing Halaman Menggunakan Templat

Perkenalan

Dalam tutorial ini, kita akan mempelajari penggunaan GroupDocs.Parser untuk .NET untuk mengekstrak data dari dokumen secara efisien. GroupDocs.Parser adalah perpustakaan canggih yang memungkinkan penguraian berbagai format dokumen seperti PDF, DOCX, PPTX, dan banyak lagi. Kami akan fokus pada penguraian halaman menggunakan templat, yang memungkinkan ekstraksi konten tertentu secara tepat seperti kode batang.

Prasyarat

Sebelum kita mulai, pastikan Anda telah menyiapkan yang berikut:

  • GroupDocs.Parser untuk Perpustakaan .NET: Anda dapat mengunduhnyaDi Sini.
  • Lingkungan Pengembangan: Visual Studio atau IDE apa pun yang kompatibel dengan .NET.
  • Contoh Dokumen: Miliki dokumen dengan konten yang ingin Anda urai.

Impor Namespace

Mulailah dengan memasukkan namespace yang diperlukan dalam proyek C# Anda:

using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using GroupDocs.Parser.Data;
using GroupDocs.Parser.Templates;

Langkah 1: Tentukan Bidang Barcode

Untuk mengekstrak kode batang, tentukan aTemplateBarcode obyek. Tentukan lokasinya (Rectangle) dan jenis kode batang.

TemplateBarcode barcode = new TemplateBarcode(
    new Rectangle(new Point(405, 55), new Size(100, 50)),
    "QR");

Langkah 2: Buat Templat

Gabungkan kode batang (atau bidang lainnya) menjadi aTemplate obyek.

Template template = new Template(new TemplateItem[] { barcode });

Langkah 3: Buat instance Parser

Buat sebuah contoh dariParser dan tentukan jalur dokumen yang ingin Anda parsing.

using (Parser parser = new Parser("YourSampleFile.docx"))
{
    // Ulangi halaman dokumen menggunakan templat
    foreach (DocumentPageData data in parser.ParsePagesByTemplate(template))
    {
        // Cetak indeks halaman
        Console.WriteLine("Page: " + data.PageIndex);
        // Cetak data yang diekstraksi
        for (int i = 0; i < data.Count; i++)
        {
            Console.Write(data[i].Name + ": ");
            PageBarcodeArea area = data[i].PageArea as PageBarcodeArea;
            Console.WriteLine(area == null ? "Not a template barcode field" : area.Value);
        }
    }
}

Kesimpulan

Menggunakan GroupDocs.Parser untuk .NET, Anda dapat dengan mudah mengurai dokumen dan mengekstrak konten tertentu seperti kode batang menggunakan templat. Tutorial ini membahas langkah-langkah mendasar untuk membantu Anda memulai penguraian dokumen di aplikasi .NET Anda.

FAQ

Bisakah GroupDocs.Parser menangani format dokumen yang berbeda?

Ya, GroupDocs.Parser mendukung berbagai format termasuk PDF, DOCX, XLSX, dan banyak lagi.

Apakah GroupDocs.Parser cocok untuk mengekstraksi data tertentu seperti kode batang?

Sangat! GroupDocs.Parser menawarkan kemampuan ekstraksi yang tepat untuk ekstraksi konten yang ditargetkan.

Di mana saya dapat menemukan dokumentasi terperinci untuk GroupDocs.Parser?

Mengunjungidokumentasi untuk panduan komprehensif.

Bagaimana saya bisa mendapatkan lisensi sementara untuk GroupDocs.Parser?

Memperoleh aizin sementara untuk tujuan evaluasi atau pengembangan.

Apakah GroupDocs menyediakan dukungan untuk pemecahan masalah?

Ya, Anda dapat mencari bantuan diForum Grup Dokumen untuk pertanyaan atau masalah apa pun.