Parsing Halaman Menggunakan Templat
Perkenalan
Dalam tutorial ini, kita akan mempelajari penggunaan GroupDocs.Parser untuk .NET untuk mengekstrak data dari dokumen secara efisien. GroupDocs.Parser adalah perpustakaan canggih yang memungkinkan penguraian berbagai format dokumen seperti PDF, DOCX, PPTX, dan banyak lagi. Kami akan fokus pada penguraian halaman menggunakan templat, yang memungkinkan ekstraksi konten tertentu secara tepat seperti kode batang.
Prasyarat
Sebelum kita mulai, pastikan Anda telah menyiapkan yang berikut:
- GroupDocs.Parser untuk Perpustakaan .NET: Anda dapat mengunduhnyaDi Sini.
- Lingkungan Pengembangan: Visual Studio atau IDE apa pun yang kompatibel dengan .NET.
- Contoh Dokumen: Miliki dokumen dengan konten yang ingin Anda urai.
Impor Namespace
Mulailah dengan memasukkan namespace yang diperlukan dalam proyek C# Anda:
using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using GroupDocs.Parser.Data;
using GroupDocs.Parser.Templates;
Langkah 1: Tentukan Bidang Barcode
Untuk mengekstrak kode batang, tentukan aTemplateBarcode
obyek. Tentukan lokasinya (Rectangle
) dan jenis kode batang.
TemplateBarcode barcode = new TemplateBarcode(
new Rectangle(new Point(405, 55), new Size(100, 50)),
"QR");
Langkah 2: Buat Templat
Gabungkan kode batang (atau bidang lainnya) menjadi aTemplate
obyek.
Template template = new Template(new TemplateItem[] { barcode });
Langkah 3: Buat instance Parser
Buat sebuah contoh dariParser
dan tentukan jalur dokumen yang ingin Anda parsing.
using (Parser parser = new Parser("YourSampleFile.docx"))
{
// Ulangi halaman dokumen menggunakan templat
foreach (DocumentPageData data in parser.ParsePagesByTemplate(template))
{
// Cetak indeks halaman
Console.WriteLine("Page: " + data.PageIndex);
// Cetak data yang diekstraksi
for (int i = 0; i < data.Count; i++)
{
Console.Write(data[i].Name + ": ");
PageBarcodeArea area = data[i].PageArea as PageBarcodeArea;
Console.WriteLine(area == null ? "Not a template barcode field" : area.Value);
}
}
}
Kesimpulan
Menggunakan GroupDocs.Parser untuk .NET, Anda dapat dengan mudah mengurai dokumen dan mengekstrak konten tertentu seperti kode batang menggunakan templat. Tutorial ini membahas langkah-langkah mendasar untuk membantu Anda memulai penguraian dokumen di aplikasi .NET Anda.
FAQ
Bisakah GroupDocs.Parser menangani format dokumen yang berbeda?
Ya, GroupDocs.Parser mendukung berbagai format termasuk PDF, DOCX, XLSX, dan banyak lagi.
Apakah GroupDocs.Parser cocok untuk mengekstraksi data tertentu seperti kode batang?
Sangat! GroupDocs.Parser menawarkan kemampuan ekstraksi yang tepat untuk ekstraksi konten yang ditargetkan.
Di mana saya dapat menemukan dokumentasi terperinci untuk GroupDocs.Parser?
Mengunjungidokumentasi untuk panduan komprehensif.
Bagaimana saya bisa mendapatkan lisensi sementara untuk GroupDocs.Parser?
Memperoleh aizin sementara untuk tujuan evaluasi atau pengembangan.
Apakah GroupDocs menyediakan dukungan untuk pemecahan masalah?
Ya, Anda dapat mencari bantuan diForum Grup Dokumen untuk pertanyaan atau masalah apa pun.