Dokumentum betöltése a Streamből

Bevezetés

A .NET-alkalmazások dokumentumfeldolgozásának területén általános követelmény a szövegek kinyerése a különböző fájlformátumokból. A GroupDocs.Parser for .NET hatékony megoldást kínál a dokumentumok zökkenőmentes elemzésére és szövegek kinyerésére. Ez az oktatóanyag végigvezeti Önt a GroupDocs.Parser használatával a dokumentumokból szövegek kinyeréséhez lépésről lépésre.

Előfeltételek

Mielőtt belemerülne a GroupDocs.Parser for .NET használatába, győződjön meg arról, hogy a következő beállításokkal rendelkezik:

  • Fejlesztői környezet: Visual Studio vagy bármely más .NET fejlesztői környezet.
  • GroupDocs.Parser for .NET Package: Töltse le és telepítse a GroupDocs.Parser for .NET könyvtárat innenitt.
  • Dokumentumminták: Készítsen mintadokumentumokat szövegkivonathoz.

Névterek importálása

Kezdje a szükséges névterek importálásával a .NET-projektbe a GroupDocs.Parser funkciók eléréséhez.

using System;
using System.Collections.Generic;
using System.IO;
using System.Linq;
using System.Text;

következő lépések bemutatják, hogyan lehet szöveget kivonni egy dokumentumból a GroupDocs.Parser segítségével egy adatfolyamból.

1. lépés: Töltse be a dokumentumot a Streamből

// Hozd létre a streamet
using (Stream stream = File.OpenRead("YourSampleFile.docx"))
{
    // Hozzon létre egy Parser osztály példányt az adatfolyammal
    using (Parser parser = new Parser(stream))
    {
        // Szöveg kibontása az olvasóba
        using (TextReader reader = parser.GetText())
        {
            // Szöveg nyomtatása a dokumentumból
            // Ha a szövegkivonás nem támogatott, az olvasó null lesz
            Console.WriteLine(reader == null ? "Text extraction isn't supported" : reader.ReadToEnd());
        }
    }
}

Ebben a példában:

  • Megnyitunk egy fájlfolyamot a dokumentumfájlhoz (YourSampleFile.docx).
  • Inicializálás aParser például a patammal.
  • Használatparser.GetText() visszaszerezni aTextReader tartalmazza a kivont szöveget.
  • Nyomtassa ki a kivonatolt szöveget vagy üzenetet, ha a szövegkivonás nem támogatott a dokumentumformátumban.

Következtetés

A GroupDocs.Parser for .NET leegyszerűsíti a szövegek kinyerését a különböző dokumentumformátumokból, lehetővé téve a fejlesztők számára a szöveges tartalom hatékony feldolgozását és felhasználását alkalmazásaikban. Az oktatóanyagban ismertetett lépések követésével zökkenőmentesen integrálhatja a dokumentumszöveg-kivonatolási lehetőségeket .NET-projektjeibe.

GYIK

Milyen dokumentumformátumokat támogat a GroupDocs.Parser for .NET?

GroupDocs.Parser a dokumentumformátumok széles skáláját támogatja, beleértve a DOCX, PDF, XLSX, PPTX, EPUB stb.

A GroupDocs.Parser kinyerhet képeket vagy metaadatokat a dokumentumokból?

Igen, a GroupDocs.Parser képes képeket, metaadatokat és szövegeket kinyerni különféle dokumentumtípusokból.

A GroupDocs.Parser kompatibilis a .NET Core alkalmazásokkal?

Igen, a GroupDocs.Parser a .NET Framework és a .NET Core alkalmazásokkal is kompatibilis.

Hogyan szerezhetek ideiglenes licencet a GroupDocs.Parser számára?

Ideiglenes jogosítványt szerezhet beitt.

Hol találok további támogatást vagy dokumentációt a GroupDocs.Parser számára?

További támogatásért keresse fel aGroupDocs.Parser fórum vagy hivatkozzon adokumentáció.