Szöveg felismerése
Bevezetés
A .NET fejlesztés területén a különböző dokumentumformátumok hatékony szövegkinyerése a legfontosabb. A GroupDocs.Parser for .NET robusztus megoldást kínál a szöveg zökkenőmentes kibontására. Ebben az oktatóanyagban részletesen bemutatjuk a GroupDocs.Parser használatát a dokumentumok szövegének felismerésére és kivonására.
Előfeltételek
Mielőtt belevágnánk a GroupDocs.Parser használatába, győződjön meg arról, hogy rendelkezik a következő előfeltételekkel:
- A C# programozás alapjai
- A Visual Studio telepítve van a gépedre
- Hozzáférés az internethez csomagletöltésekhez és dokumentációs hivatkozásokhoz
Névterek importálása
Kezdje a szükséges névterek importálásával a GroupDocs.Parser funkcióinak kihasználása érdekében:
using System;
using System.Collections.Generic;
using System.Drawing;
using System.IO;
using System.Linq;
using System.Text;
using Aspose.OCR;
using GroupDocs.Parser.Data;
using GroupDocs.Parser.Options;
1. lépés: Telepítse a GroupDocs.Parser programot
Először töltse le és telepítse a GroupDocs.Parser könyvtárat. Beszerezheti aletöltési link.
2. lépés: Szerezzen ideiglenes engedélyt
A GroupDocs.Parser használatához szerezzen be egy ideiglenes licencet a következőtőlitt.
3. lépés: A ParserSettings inicializálása
Hozzon létre egy példányt aParserSettings
osztályt a szövegkivonási beállítások konfigurálásához, beleértve az OCR-csatlakozókat is, ha szükséges.
ParserSettings settings = new ParserSettings(new AsposeOcrOnPremise());
4. lépés: Az elemző használata a szöveg kibontásához
Most hozzon létre egy példánytParser
osztály a konfigurált beállításokkal.
using (Parser parser = new Parser("YourSampleFile.docx", settings))
{
// A TextOptions konfigurálása az OCR használatához
TextOptions options = new TextOptions(false, true);
// Szöveg kibontása az OCR segítségével
using (TextReader reader = parser.GetText(options))
{
// Kivont szöveg vagy „nem támogatott” üzenet megjelenítése
Console.WriteLine(reader == null ? "Text extraction isn't supported" : reader.ReadToEnd());
}
}
Ebben a részletben:
- Cserélje ki
"YourSampleFile.docx"
a céldokumentum elérési útjával. TextOptions
úgy van beállítva, hogy engedélyezze az OCR-t és optimalizálja a szövegkivonást.
Következtetés
Gratulálunk! Megtanulta, hogyan integrálhatja a GroupDocs.Parser for .NET-et projektjeibe a hatékony szövegkivonat érdekében. Fedezze fel a kiterjedtdokumentáció fejlett funkciókhoz és optimalizálásokhoz.
GYIK
Alkalmas-e a GroupDocs.Parser szöveg kinyerésére PDF-fájlokból?
Igen, a GroupDocs.Parser támogatja a szövegek kinyerését különböző formátumokból, beleértve a PDF-et is.
Integrálhatom a GroupDocs.Parser-t az ASP.NET-alkalmazásomba?
Természetesen a GroupDocs.Parser zökkenőmentesen integrálható az ASP.NET alkalmazásokba.
A GroupDocs.Parser licencet igényel kereskedelmi használatra?
Igen, a kereskedelmi felhasználáshoz engedély szükséges. Szerezzen ideiglenes engedélytitt.
Milyen dokumentumformátumokat támogat a GroupDocs.Parser?
A GroupDocs.Parser a formátumok széles skáláját támogatja, beleértve a DOCX, PDF, XLSX és sok más formátumot.
Hogyan kérhetek támogatást vagy tehetek fel kérdéseket a GroupDocs.Parser-rel kapcsolatban?
Meglátogatni aGroupDocs.Parser fórumtámogatásért és megbeszélésekért.