OCR kezelése
Bevezetés
Ebben az oktatóanyagban megvizsgáljuk, hogyan használható a GroupDocs.Parser for .NET az optikai karakterfelismerési (OCR) feladatok hatékony kezelésére. Ez a könyvtár hatékony eszközöket kínál szövegek kinyerésére a dokumentumokból, az OCR segítségével pedig még képekből vagy beolvasott dokumentumokból is kivonhat szöveget. Lépésről lépésre merüljünk el a folyamatban.
Előfeltételek
Mielőtt elkezdené, győződjön meg arról, hogy beállította a következőket:
- GroupDocs.Parser for .NET Library: Töltse le a könyvtárat innenitt.
- Az Ön mintafájlja: Készítsen egy mintafájlt (dokumentumot vagy képet), amelyből szöveget szeretne kinyerni.
- C# és .NET környezet alapismeretei.
Névterek importálása
Először is importálnia kell a szükséges névtereket a GroupDocs.Parser funkciók használatához a .NET-alkalmazásban.
using System;
using System.Collections.Generic;
using System.Drawing;
using System.IO;
using System.Linq;
using System.Text;
using Aspose.OCR;
using GroupDocs.Parser.Data;
using GroupDocs.Parser.Options;
1. lépés: Hozzon létre elemző beállításokat az OCR csatlakozóval
Inicializálja aParserSettings
osztály az OCR csatlakozóval. Például az Aspose OCR helyszíni használatával.
ParserSettings settings = new ParserSettings(new AsposeOcrOnPremise());
2. lépés: Állítsa be az OCR-beállításokat
Állítson be egyOcrEventHandler
a figyelmeztetések kezelésére az OCR-feldolgozás során.
OcrEventHandler handler = new OcrEventHandler();
OcrOptions ocrOptions = new OcrOptions(handler);
3. lépés: Konfigurálja a szövegkivonási beállításokat
TeremtTextOptions
hogy engedélyezze az OCR alapú szövegkivonást.
TextOptions options = new TextOptions(false, true, ocrOptions);
4. lépés: Szöveg kibontása az OCR segítségével
Példányosítsa aParser
osztályt a beállításokkal, és kivonja a szöveget az OCR segítségével.
using (Parser parser = new Parser("YourSampleFile.pdf", settings))
{
using (TextReader reader = parser.GetText(options))
{
if (reader == null)
{
Console.WriteLine("Text extraction isn't supported.");
}
else
{
Console.WriteLine(reader.ReadToEnd());
}
}
if (handler.HasWarnings)
{
Console.WriteLine("The following warnings occurred during text recognition:");
foreach (string w in handler.Warnings)
{
Console.WriteLine("\t* " + w);
}
}
else
{
Console.WriteLine("Text recognition was performed without any warnings.");
}
}
Következtetés
Az alábbi lépések követésével kihasználhatja a GroupDocs.Parser for .NET alkalmazást az OCR-feladatok hatékony kezelésére az alkalmazásokon belül. A szövegek kinyerése képekből vagy beolvasott dokumentumokból zökkenőmentessé válik a könyvtár által kínált hatékony képességekkel.
GYIK
A GroupDocs.Parser for .NET kompatibilis a különböző fájlformátumokkal?
Igen, a GroupDocs.Parser a fájlformátumok széles skáláját támogatja, beleértve a PDF, DOCX, PPTX, XLSX, képeket (JPEG, PNG, TIFF) és még sok mást.
Használhatom a GroupDocs.Parser for .NET-et kereskedelmi projektjeimben?
Igen, licenc megvásárlása után integrálhatja a GroupDocs.Parser for .NET-et kereskedelmi alkalmazásaiba.
A GroupDocs.Parser kezeli a titkosított vagy jelszóval védett fájlokat?
A GroupDocs.Parser képes elemezni és kibontani a jelszóval védett PDF dokumentumok szövegét.
Elérhető a GroupDocs.Parser for .NET próbaverziója?
Igen, letölthet egy ingyenes próbaverziót a webhelyrőlitt.
Hol találhatok támogatást, vagy hol tehetek fel kérdéseket a GroupDocs.Parser for .NET-hez kapcsolódóan?
Meglátogathatja aGroupDocs.Parser fórum bármilyen támogatási kérdés vagy megbeszélés esetén.