Szöveg felismerése

Bevezetés

A .NET fejlesztés területén a különböző dokumentumformátumok hatékony szövegkinyerése a legfontosabb. A GroupDocs.Parser for .NET robusztus megoldást kínál a szöveg zökkenőmentes kibontására. Ebben az oktatóanyagban részletesen bemutatjuk a GroupDocs.Parser használatát a dokumentumok szövegének felismerésére és kivonására.

Előfeltételek

Mielőtt belevágnánk a GroupDocs.Parser használatába, győződjön meg arról, hogy rendelkezik a következő előfeltételekkel:

  • A C# programozás alapjai
  • A Visual Studio telepítve van a gépedre
  • Hozzáférés az internethez csomagletöltésekhez és dokumentációs hivatkozásokhoz

Névterek importálása

Kezdje a szükséges névterek importálásával a GroupDocs.Parser funkcióinak kihasználása érdekében:

using System;
using System.Collections.Generic;
using System.Drawing;
using System.IO;
using System.Linq;
using System.Text;
using Aspose.OCR;
using GroupDocs.Parser.Data;
using GroupDocs.Parser.Options;

1. lépés: Telepítse a GroupDocs.Parser programot

Először töltse le és telepítse a GroupDocs.Parser könyvtárat. Beszerezheti aletöltési link.

2. lépés: Szerezzen ideiglenes engedélyt

A GroupDocs.Parser használatához szerezzen be egy ideiglenes licencet a következőtőlitt.

3. lépés: A ParserSettings inicializálása

Hozzon létre egy példányt aParserSettingsosztályt a szövegkivonási beállítások konfigurálásához, beleértve az OCR-csatlakozókat is, ha szükséges.

ParserSettings settings = new ParserSettings(new AsposeOcrOnPremise());

4. lépés: Az elemző használata a szöveg kibontásához

Most hozzon létre egy példánytParser osztály a konfigurált beállításokkal.

using (Parser parser = new Parser("YourSampleFile.docx", settings))
{
    // A TextOptions konfigurálása az OCR használatához
    TextOptions options = new TextOptions(false, true);
    // Szöveg kibontása az OCR segítségével
    using (TextReader reader = parser.GetText(options))
    {
        // Kivont szöveg vagy „nem támogatott” üzenet megjelenítése
        Console.WriteLine(reader == null ? "Text extraction isn't supported" : reader.ReadToEnd());
    }
}

Ebben a részletben:

  • Cserélje ki"YourSampleFile.docx" a céldokumentum elérési útjával.
  • TextOptions úgy van beállítva, hogy engedélyezze az OCR-t és optimalizálja a szövegkivonást.

Következtetés

Gratulálunk! Megtanulta, hogyan integrálhatja a GroupDocs.Parser for .NET-et projektjeibe a hatékony szövegkivonat érdekében. Fedezze fel a kiterjedtdokumentáció fejlett funkciókhoz és optimalizálásokhoz.

GYIK

Alkalmas-e a GroupDocs.Parser szöveg kinyerésére PDF-fájlokból?

Igen, a GroupDocs.Parser támogatja a szövegek kinyerését különböző formátumokból, beleértve a PDF-et is.

Integrálhatom a GroupDocs.Parser-t az ASP.NET-alkalmazásomba?

Természetesen a GroupDocs.Parser zökkenőmentesen integrálható az ASP.NET alkalmazásokba.

A GroupDocs.Parser licencet igényel kereskedelmi használatra?

Igen, a kereskedelmi felhasználáshoz engedély szükséges. Szerezzen ideiglenes engedélytitt.

Milyen dokumentumformátumokat támogat a GroupDocs.Parser?

A GroupDocs.Parser a formátumok széles skáláját támogatja, beleértve a DOCX, PDF, XLSX és sok más formátumot.

Hogyan kérhetek támogatást vagy tehetek fel kérdéseket a GroupDocs.Parser-rel kapcsolatban?

Meglátogatni aGroupDocs.Parser fórumtámogatásért és megbeszélésekért.