Χειρισμός OCR
Εισαγωγή
Σε αυτό το σεμινάριο, θα διερευνήσουμε πώς να χρησιμοποιήσετε το GroupDocs.Parser για .NET για να χειριστείτε αποτελεσματικά τις εργασίες Optical Character Recognition (OCR). Αυτή η βιβλιοθήκη παρέχει ισχυρά εργαλεία για την εξαγωγή κειμένου από έγγραφα και με το OCR, μπορείτε να εξαγάγετε κείμενο ακόμα και από εικόνες ή σαρωμένα έγγραφα. Ας βουτήξουμε στη διαδικασία βήμα προς βήμα.
Προαπαιτούμενα
Πριν ξεκινήσουμε, βεβαιωθείτε ότι έχετε ρυθμίσει τις ακόλουθες ρυθμίσεις:
- GroupDocs.Parser για .NET Library: Κάντε λήψη της βιβλιοθήκης απόεδώ.
- Το δείγμα αρχείου σας: Προετοιμάστε ένα δείγμα αρχείου (έγγραφο ή εικόνα) από το οποίο θέλετε να εξαγάγετε κείμενο.
- Βασικές γνώσεις C# και περιβάλλοντος .NET.
Εισαγωγή χώρων ονομάτων
Αρχικά, πρέπει να εισαγάγετε τους απαραίτητους χώρους ονομάτων για να χρησιμοποιήσετε τις λειτουργίες GroupDocs.Parser στην εφαρμογή σας .NET.
using System;
using System.Collections.Generic;
using System.Drawing;
using System.IO;
using System.Linq;
using System.Text;
using Aspose.OCR;
using GroupDocs.Parser.Data;
using GroupDocs.Parser.Options;
Βήμα 1: Δημιουργήστε ρυθμίσεις ανάλυσης με το OCR Connector
Αρχικοποιήστε τοParserSettings
κατηγορίας με την υποδοχή OCR. Για παράδειγμα, χρησιμοποιώντας το Aspose OCR on-premise.
ParserSettings settings = new ParserSettings(new AsposeOcrOnPremise());
Βήμα 2: Διαμόρφωση επιλογών OCR
Ρύθμιση ενόςOcrEventHandler
για χειρισμό προειδοποιήσεων κατά την επεξεργασία OCR.
OcrEventHandler handler = new OcrEventHandler();
OcrOptions ocrOptions = new OcrOptions(handler);
Βήμα 3: Διαμόρφωση επιλογών εξαγωγής κειμένου
ΔημιουργώTextOptions
για να ενεργοποιήσετε την εξαγωγή κειμένου βάσει OCR.
TextOptions options = new TextOptions(false, true, ocrOptions);
Βήμα 4: Εξαγωγή κειμένου χρησιμοποιώντας OCR
Στιγμιότυπο τοParser
τάξη με τις ρυθμίσεις και εξαγωγή κειμένου χρησιμοποιώντας OCR.
using (Parser parser = new Parser("YourSampleFile.pdf", settings))
{
using (TextReader reader = parser.GetText(options))
{
if (reader == null)
{
Console.WriteLine("Text extraction isn't supported.");
}
else
{
Console.WriteLine(reader.ReadToEnd());
}
}
if (handler.HasWarnings)
{
Console.WriteLine("The following warnings occurred during text recognition:");
foreach (string w in handler.Warnings)
{
Console.WriteLine("\t* " + w);
}
}
else
{
Console.WriteLine("Text recognition was performed without any warnings.");
}
}
συμπέρασμα
Ακολουθώντας αυτά τα βήματα, μπορείτε να αξιοποιήσετε το GroupDocs.Parser για .NET για να χειριστείτε αποτελεσματικά τις εργασίες OCR στις εφαρμογές σας. Η εξαγωγή κειμένου από εικόνες ή σαρωμένα έγγραφα γίνεται απρόσκοπτη με τις ισχυρές δυνατότητες που προσφέρει αυτή η βιβλιοθήκη.
Συχνές ερωτήσεις
Είναι το GroupDocs.Parser για .NET συμβατό με διαφορετικές μορφές αρχείων;
Ναι, το GroupDocs.Parser υποστηρίζει ένα ευρύ φάσμα μορφών αρχείων, όπως PDF, DOCX, PPTX, XLSX, εικόνες (JPEG, PNG, TIFF) και άλλα.
Μπορώ να χρησιμοποιήσω το GroupDocs.Parser για .NET στα εμπορικά έργα μου;
Ναι, μπορείτε να ενσωματώσετε το GroupDocs.Parser για .NET στις εμπορικές εφαρμογές σας μετά την αγορά μιας άδειας χρήσης.
Το GroupDocs.Parser χειρίζεται κρυπτογραφημένα αρχεία ή αρχεία που προστατεύονται με κωδικό πρόσβασης;
Το GroupDocs.Parser μπορεί να αναλύει και να εξάγει κείμενο από έγγραφα PDF που προστατεύονται με κωδικό πρόσβασης.
Υπάρχει διαθέσιμη δοκιμαστική έκδοση για το GroupDocs.Parser για .NET;
Ναι, μπορείτε να κάνετε λήψη μιας δωρεάν δοκιμαστικής έκδοσης απόεδώ.
Πού μπορώ να βρω υποστήριξη ή να κάνω ερωτήσεις σχετικά με το GroupDocs.Parser για .NET;
Μπορείτε να επισκεφθείτε τοGroupDocs.Parser φόρουμ για οποιεσδήποτε ερωτήσεις ή συζητήσεις υποστήριξης.