Χειρισμός OCR

Εισαγωγή

Σε αυτό το σεμινάριο, θα διερευνήσουμε πώς να χρησιμοποιήσετε το GroupDocs.Parser για .NET για να χειριστείτε αποτελεσματικά τις εργασίες Optical Character Recognition (OCR). Αυτή η βιβλιοθήκη παρέχει ισχυρά εργαλεία για την εξαγωγή κειμένου από έγγραφα και με το OCR, μπορείτε να εξαγάγετε κείμενο ακόμα και από εικόνες ή σαρωμένα έγγραφα. Ας βουτήξουμε στη διαδικασία βήμα προς βήμα.

Προαπαιτούμενα

Πριν ξεκινήσουμε, βεβαιωθείτε ότι έχετε ρυθμίσει τις ακόλουθες ρυθμίσεις:

  • GroupDocs.Parser για .NET Library: Κάντε λήψη της βιβλιοθήκης απόεδώ.
  • Το δείγμα αρχείου σας: Προετοιμάστε ένα δείγμα αρχείου (έγγραφο ή εικόνα) από το οποίο θέλετε να εξαγάγετε κείμενο.
  • Βασικές γνώσεις C# και περιβάλλοντος .NET.

Εισαγωγή χώρων ονομάτων

Αρχικά, πρέπει να εισαγάγετε τους απαραίτητους χώρους ονομάτων για να χρησιμοποιήσετε τις λειτουργίες GroupDocs.Parser στην εφαρμογή σας .NET.

using System;
using System.Collections.Generic;
using System.Drawing;
using System.IO;
using System.Linq;
using System.Text;
using Aspose.OCR;
using GroupDocs.Parser.Data;
using GroupDocs.Parser.Options;

Βήμα 1: Δημιουργήστε ρυθμίσεις ανάλυσης με το OCR Connector

Αρχικοποιήστε τοParserSettings κατηγορίας με την υποδοχή OCR. Για παράδειγμα, χρησιμοποιώντας το Aspose OCR on-premise.

ParserSettings settings = new ParserSettings(new AsposeOcrOnPremise());

Βήμα 2: Διαμόρφωση επιλογών OCR

Ρύθμιση ενόςOcrEventHandler για χειρισμό προειδοποιήσεων κατά την επεξεργασία OCR.

OcrEventHandler handler = new OcrEventHandler();
OcrOptions ocrOptions = new OcrOptions(handler);

Βήμα 3: Διαμόρφωση επιλογών εξαγωγής κειμένου

ΔημιουργώTextOptions για να ενεργοποιήσετε την εξαγωγή κειμένου βάσει OCR.

TextOptions options = new TextOptions(false, true, ocrOptions);

Βήμα 4: Εξαγωγή κειμένου χρησιμοποιώντας OCR

Στιγμιότυπο τοParser τάξη με τις ρυθμίσεις και εξαγωγή κειμένου χρησιμοποιώντας OCR.

using (Parser parser = new Parser("YourSampleFile.pdf", settings))
{
    using (TextReader reader = parser.GetText(options))
    {
        if (reader == null)
        {
            Console.WriteLine("Text extraction isn't supported.");
        }
        else
        {
            Console.WriteLine(reader.ReadToEnd());
        }
    }
    if (handler.HasWarnings)
    {
        Console.WriteLine("The following warnings occurred during text recognition:");
        foreach (string w in handler.Warnings)
        {
            Console.WriteLine("\t* " + w);
        }
    }
    else
    {
        Console.WriteLine("Text recognition was performed without any warnings.");
    }
}

συμπέρασμα

Ακολουθώντας αυτά τα βήματα, μπορείτε να αξιοποιήσετε το GroupDocs.Parser για .NET για να χειριστείτε αποτελεσματικά τις εργασίες OCR στις εφαρμογές σας. Η εξαγωγή κειμένου από εικόνες ή σαρωμένα έγγραφα γίνεται απρόσκοπτη με τις ισχυρές δυνατότητες που προσφέρει αυτή η βιβλιοθήκη.

Συχνές ερωτήσεις

Είναι το GroupDocs.Parser για .NET συμβατό με διαφορετικές μορφές αρχείων;

Ναι, το GroupDocs.Parser υποστηρίζει ένα ευρύ φάσμα μορφών αρχείων, όπως PDF, DOCX, PPTX, XLSX, εικόνες (JPEG, PNG, TIFF) και άλλα.

Μπορώ να χρησιμοποιήσω το GroupDocs.Parser για .NET στα εμπορικά έργα μου;

Ναι, μπορείτε να ενσωματώσετε το GroupDocs.Parser για .NET στις εμπορικές εφαρμογές σας μετά την αγορά μιας άδειας χρήσης.

Το GroupDocs.Parser χειρίζεται κρυπτογραφημένα αρχεία ή αρχεία που προστατεύονται με κωδικό πρόσβασης;

Το GroupDocs.Parser μπορεί να αναλύει και να εξάγει κείμενο από έγγραφα PDF που προστατεύονται με κωδικό πρόσβασης.

Υπάρχει διαθέσιμη δοκιμαστική έκδοση για το GroupDocs.Parser για .NET;

Ναι, μπορείτε να κάνετε λήψη μιας δωρεάν δοκιμαστικής έκδοσης απόεδώ.

Πού μπορώ να βρω υποστήριξη ή να κάνω ερωτήσεις σχετικά με το GroupDocs.Parser για .NET;

Μπορείτε να επισκεφθείτε τοGroupDocs.Parser φόρουμ για οποιεσδήποτε ερωτήσεις ή συζητήσεις υποστήριξης.