OCR kezelése

Bevezetés

Ebben az oktatóanyagban megvizsgáljuk, hogyan használható a GroupDocs.Parser for .NET az optikai karakterfelismerési (OCR) feladatok hatékony kezelésére. Ez a könyvtár hatékony eszközöket kínál szövegek kinyerésére a dokumentumokból, az OCR segítségével pedig még képekből vagy beolvasott dokumentumokból is kivonhat szöveget. Lépésről lépésre merüljünk el a folyamatban.

Előfeltételek

Mielőtt elkezdené, győződjön meg arról, hogy beállította a következőket:

  • GroupDocs.Parser for .NET Library: Töltse le a könyvtárat innenitt.
  • Az Ön mintafájlja: Készítsen egy mintafájlt (dokumentumot vagy képet), amelyből szöveget szeretne kinyerni.
  • C# és .NET környezet alapismeretei.

Névterek importálása

Először is importálnia kell a szükséges névtereket a GroupDocs.Parser funkciók használatához a .NET-alkalmazásban.

using System;
using System.Collections.Generic;
using System.Drawing;
using System.IO;
using System.Linq;
using System.Text;
using Aspose.OCR;
using GroupDocs.Parser.Data;
using GroupDocs.Parser.Options;

1. lépés: Hozzon létre elemző beállításokat az OCR csatlakozóval

Inicializálja aParserSettings osztály az OCR csatlakozóval. Például az Aspose OCR helyszíni használatával.

ParserSettings settings = new ParserSettings(new AsposeOcrOnPremise());

2. lépés: Állítsa be az OCR-beállításokat

Állítson be egyOcrEventHandler a figyelmeztetések kezelésére az OCR-feldolgozás során.

OcrEventHandler handler = new OcrEventHandler();
OcrOptions ocrOptions = new OcrOptions(handler);

3. lépés: Konfigurálja a szövegkivonási beállításokat

TeremtTextOptions hogy engedélyezze az OCR alapú szövegkivonást.

TextOptions options = new TextOptions(false, true, ocrOptions);

4. lépés: Szöveg kibontása az OCR segítségével

Példányosítsa aParser osztályt a beállításokkal, és kivonja a szöveget az OCR segítségével.

using (Parser parser = new Parser("YourSampleFile.pdf", settings))
{
    using (TextReader reader = parser.GetText(options))
    {
        if (reader == null)
        {
            Console.WriteLine("Text extraction isn't supported.");
        }
        else
        {
            Console.WriteLine(reader.ReadToEnd());
        }
    }
    if (handler.HasWarnings)
    {
        Console.WriteLine("The following warnings occurred during text recognition:");
        foreach (string w in handler.Warnings)
        {
            Console.WriteLine("\t* " + w);
        }
    }
    else
    {
        Console.WriteLine("Text recognition was performed without any warnings.");
    }
}

Következtetés

Az alábbi lépések követésével kihasználhatja a GroupDocs.Parser for .NET alkalmazást az OCR-feladatok hatékony kezelésére az alkalmazásokon belül. A szövegek kinyerése képekből vagy beolvasott dokumentumokból zökkenőmentessé válik a könyvtár által kínált hatékony képességekkel.

GYIK

A GroupDocs.Parser for .NET kompatibilis a különböző fájlformátumokkal?

Igen, a GroupDocs.Parser a fájlformátumok széles skáláját támogatja, beleértve a PDF, DOCX, PPTX, XLSX, képeket (JPEG, PNG, TIFF) és még sok mást.

Használhatom a GroupDocs.Parser for .NET-et kereskedelmi projektjeimben?

Igen, licenc megvásárlása után integrálhatja a GroupDocs.Parser for .NET-et kereskedelmi alkalmazásaiba.

A GroupDocs.Parser kezeli a titkosított vagy jelszóval védett fájlokat?

A GroupDocs.Parser képes elemezni és kibontani a jelszóval védett PDF dokumentumok szövegét.

Elérhető a GroupDocs.Parser for .NET próbaverziója?

Igen, letölthet egy ingyenes próbaverziót a webhelyrőlitt.

Hol találhatok támogatást, vagy hol tehetek fel kérdéseket a GroupDocs.Parser for .NET-hez kapcsolódóan?

Meglátogathatja aGroupDocs.Parser fórum bármilyen támogatási kérdés vagy megbeszélés esetén.