Alanı Ada Göre Al

giriiş

Bu eğitimde, fiyatlar ve e-postalar gibi belirli veri alanlarını belgelerden çıkarmak için GroupDocs.Parser for .NET’ten nasıl yararlanılacağını keşfedeceğiz. Bu güçlü kitaplık, belge ayrıştırma görevlerini basitleştirerek onu çeşitli veri çıkarma ihtiyaçları için ideal hale getirir.

Önkoşullar

Eğiticiye dalmadan önce aşağıdaki önkoşullara sahip olduğunuzdan emin olun:

  • Sisteminizde Visual Studio yüklü.
  • Temel C# programlama bilgisi.
  • GroupDocs.Parser for .NET’i şu adresten indirip yükleyin:bu bağlantı.

Ad Alanlarını İçe Aktar

Gerekli ad alanlarını C# projenize aktararak başlayın:

using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using GroupDocs.Parser.Data;
using GroupDocs.Parser.Templates;

1. Adım: Şablon Alanlarını Tanımlayın

İlk olarak veri çıkarmak için şablon alanlarını tanımlayacağız. Bu örnekte fiyatları ve e-postaları yakalamak için alanlar oluşturacağız.

// Bir "fiyat" alanı tanımlayın
TemplateField priceField = new TemplateField(
    new TemplateRegexPosition("\\$\\d+(.\\d+)?"),
    "Price");
// Bir "e-posta" alanı tanımlayın
TemplateField emailField = new TemplateField(
    new TemplateRegexPosition("[a-z]+\\@[a-z]+\\.[a-z]+"),
    "Email");
// Şablon oluştur
Template template = new Template(new TemplateItem[] { priceField, emailField });

Adım 2: Şablonu Kullanarak Belgeyi Ayrıştırma

Daha sonra, tanımlanan şablonu kullanarak bir belgeyi ayrıştıracağız.

using (Parser parser = new Parser("YourSampleFile.pdf"))
{
    // Belgeyi şablona göre ayrıştırın
    DocumentData data = parser.ParseByTemplate(template);
    // Fiyatları yazdır
    Console.WriteLine("Prices:");
    foreach (FieldData field in data.GetFieldsByName("Price"))
    {
        PageTextArea area = field.PageArea as PageTextArea;
        Console.WriteLine(area == null ? "Not a template field" : area.Text);
    }
    // E-postaları yazdır
    Console.WriteLine("Emails:");
    foreach (FieldData field in data.GetFieldsByName("Email"))
    {
        PageTextArea area = field.PageArea as PageTextArea;
        Console.WriteLine(area == null ? "Not a template field" : area.Text);
    }
}

Çözüm

Bu öğreticide, belgelerden belirli veri alanlarını ayıklamak için GroupDocs.Parser for .NET’in nasıl kullanılacağını öğrendik. Geliştiriciler, şablonları tanımlayarak ve kitaplığın ayrıştırma yeteneklerini kullanarak, çeşitli belge formatlarından fiyatlar ve e-postalar gibi yapılandırılmış verileri verimli bir şekilde alabilir.

SSS’ler

GroupDocs.Parser for .NET ile farklı türdeki belgeleri ayrıştırabilir miyim?

Evet, GroupDocs.Parser, PDF, DOCX, PPTX ve daha fazlası gibi çeşitli belge formatlarının ayrıştırılmasını destekler.

GroupDocs.Parser büyük ölçekli belge işlemeye uygun mu?

GroupDocs.Parser kesinlikle performans için optimize edilmiştir ve büyük hacimli belgeleri verimli bir şekilde işleyebilir.

GroupDocs.Parser’ı .NET uygulamama nasıl entegre edebilirim?

GroupDocs.Parser’ı, Visual Studio projenizdeki kitaplığa başvurarak ve gerekli ad alanlarını içe aktararak kolayca entegre edebilirsiniz.

GroupDocs.Parser, görüntülerin veya meta verilerin çıkarılmasına yönelik destek sağlıyor mu?

Evet, GroupDocs.Parser belgelerden resim, metin ve meta veri çıkarmak için API’ler sunar.

GroupDocs.Parser kullanıcıları için bir topluluk forumu var mı?

Evet, GroupDocs.Parser forumunda yardım arayabilir ve diğer kullanıcılarla iletişim kurabilirsiniz.Burada.