Belgeyi Akıştan Yükle

giriiş

.NET uygulamalarında belge işleme alanında, çeşitli dosya biçimlerinden metin çıkarmak yaygın bir gereksinimdir. GroupDocs.Parser for .NET, çok çeşitli belgelerden metni sorunsuz bir şekilde ayrıştırmak ve çıkarmak için güçlü bir çözüm sunar. Bu eğitim, belgelerden adım adım metin çıkarmak için GroupDocs.Parser’ı kullanma sürecinde size rehberlik edecektir.

Önkoşullar

.NET için GroupDocs.Parser’ı kullanmaya başlamadan önce aşağıdaki ayarlara sahip olduğunuzdan emin olun:

  • Geliştirme Ortamı: Visual Studio veya başka herhangi bir .NET geliştirme ortamı.
  • GroupDocs.Parser for .NET Paketi: GroupDocs.Parser for .NET kitaplığını şuradan indirip yükleyin:Burada.
  • Belge Örnekleri: Metin çıkarma için örnek belgeleri hazır bulundurun.

Ad Alanlarını İçe Aktarma

GroupDocs.Parser işlevlerine erişmek için gerekli ad alanlarını .NET projenize aktararak başlayın.

using System;
using System.Collections.Generic;
using System.IO;
using System.Linq;
using System.Text;

Aşağıdaki adımlarda, GroupDocs.Parser kullanılarak bir akıştan belgeden nasıl metin çıkarılacağı gösterilmektedir.

1. Adım: Belgeyi Akıştan Yükleyin

// Akışı oluştur
using (Stream stream = File.OpenRead("YourSampleFile.docx"))
{
    // Akışla birlikte Ayrıştırıcı sınıfının bir örneğini oluşturun
    using (Parser parser = new Parser(stream))
    {
        // Metni okuyucuya çıkarın
        using (TextReader reader = parser.GetText())
        {
            // Belgeden metin yazdırma
            // Metin çıkarma desteklenmiyorsa okuyucu boş olacaktır
            Console.WriteLine(reader == null ? "Text extraction isn't supported" : reader.ReadToEnd());
        }
    }
}

Bu örnekte:

  • Belge dosyası için bir dosya akışı açıyoruz (YourSampleFile.docx).
  • Bir başlatParser akışla örnek.
  • Kullanmakparser.GetText() bir şeyi geri almak içinTextReader çıkarılan metni içerir.
  • Belge formatında metin çıkarma desteklenmiyorsa, çıkarılan metni veya mesajı yazdırın.

Çözüm

GroupDocs.Parser for .NET, çeşitli belge formatlarından metin çıkarmayı basitleştirerek geliştiricilerin uygulamalarında metin içeriğini verimli bir şekilde işlemesine ve kullanmasına olanak tanır. Bu öğreticide özetlenen adımları izleyerek, belge metni çıkarma yeteneklerini .NET projelerinize sorunsuz bir şekilde entegre edebilirsiniz.

SSS’ler

GroupDocs.Parser for .NET tarafından hangi belge biçimleri desteklenir?

GroupDocs.Parser, DOCX, PDF, XLSX, PPTX, EPUB ve daha fazlasını içeren çok çeşitli belge formatlarını destekler.

GroupDocs.Parser belgelerden görüntü veya meta veri çıkarabilir mi?

Evet, GroupDocs.Parser çeşitli belge türlerinden görüntüleri, meta verileri ve metni çıkarabilir.

GroupDocs.Parser .NET Core uygulamalarıyla uyumlu mu?

Evet, GroupDocs.Parser hem .NET Framework hem de .NET Core uygulamalarıyla uyumludur.

GroupDocs.Parser için nasıl geçici lisans alabilirim?

adresinden geçici lisans alabilirsiniz.Burada.

GroupDocs.Parser için daha fazla desteği veya belgeyi nerede bulabilirim?

Ek destek için şu adresi ziyaret edin:GroupDocs.Parser Forumu veya şuraya bakın:dokümantasyon.