Načíst dokument ze streamu

Úvod

V oblasti zpracování dokumentů v aplikacích .NET je extrahování textu z různých formátů souborů běžným požadavkem. GroupDocs.Parser for .NET nabízí výkonné řešení pro bezproblémovou analýzu a extrahování textu z nejrůznějších dokumentů. Tento tutoriál vás provede procesem využití GroupDocs.Parser k extrahování textu z dokumentů krok za krokem.

Předpoklady

Než se pustíte do používání GroupDocs.Parser pro .NET, ujistěte se, že máte následující nastavení:

  • Vývojové prostředí: Visual Studio nebo jakékoli jiné vývojové prostředí .NET.
  • Balíček GroupDocs.Parser for .NET: Stáhněte a nainstalujte knihovnu GroupDocs.Parser for .NET ztady.
  • Ukázky dokumentů: Připravte si vzorové dokumenty pro extrakci textu.

Import jmenných prostorů

Začněte importováním potřebných jmenných prostorů do vašeho projektu .NET, abyste získali přístup k funkcím GroupDocs.Parser.

using System;
using System.Collections.Generic;
using System.IO;
using System.Linq;
using System.Text;

Následující kroky ukazují, jak extrahovat text z dokumentu pomocí GroupDocs.Parser z datového proudu.

Krok 1: Načtěte dokument ze streamu

// Vytvořte stream
using (Stream stream = File.OpenRead("YourSampleFile.docx"))
{
    // Vytvořte instanci třídy Parser se streamem
    using (Parser parser = new Parser(stream))
    {
        // Extrahujte text do čtečky
        using (TextReader reader = parser.GetText())
        {
            // Vytiskněte text z dokumentu
            // Pokud extrakce textu není podporována, bude čtečka null
            Console.WriteLine(reader == null ? "Text extraction isn't supported" : reader.ReadToEnd());
        }
    }
}

V tomto příkladu:

  • Otevřeme proud souboru pro soubor dokumentu (YourSampleFile.docx).
  • Inicializovat aParser například s proudem.
  • Použitíparser.GetText() získat aTextReader obsahující extrahovaný text.
  • Vytiskněte extrahovaný text nebo zprávu, pokud extrakce textu není pro formát dokumentu podporována.

Závěr

GroupDocs.Parser for .NET zjednodušuje extrakci textu z různých formátů dokumentů a umožňuje vývojářům efektivně zpracovávat a využívat textový obsah ve svých aplikacích. Podle kroků uvedených v tomto kurzu můžete bez problémů integrovat možnosti extrakce textu dokumentu do svých projektů .NET.

FAQ

Jaké formáty dokumentů podporuje GroupDocs.Parser pro .NET?

GroupDocs.Parser podporuje širokou škálu formátů dokumentů včetně DOCX, PDF, XLSX, PPTX, EPUB a dalších.

Může GroupDocs.Parser extrahovat obrázky nebo metadata z dokumentů?

Ano, GroupDocs.Parser dokáže extrahovat obrázky, metadata a text z různých typů dokumentů.

Je GroupDocs.Parser kompatibilní s aplikacemi .NET Core?

Ano, GroupDocs.Parser je kompatibilní s aplikacemi .NET Framework i .NET Core.

Jak mohu získat dočasnou licenci pro GroupDocs.Parser?

Dočasnou licenci můžete získat odtady.

Kde najdu další podporu nebo dokumentaci pro GroupDocs.Parser?

Další podporu získáte na adreseFórum GroupDocs.Parser nebo odkazovat nadokumentace.