Αναγνώριση κειμένου

Εισαγωγή

Στον τομέα της ανάπτυξης .NET, η αποτελεσματική εξαγωγή κειμένου από διάφορες μορφές εγγράφων είναι πρωταρχικής σημασίας. Το GroupDocs.Parser για .NET παρέχει μια ισχυρή λύση για την απρόσκοπτη εξαγωγή κειμένου. Σε αυτό το σεμινάριο, θα εμβαθύνουμε στη χρήση του GroupDocs.Parser βήμα προς βήμα για την αναγνώριση και εξαγωγή κειμένου από έγγραφα.

Προαπαιτούμενα

Πριν ξεκινήσουμε τη χρήση του GroupDocs.Parser, βεβαιωθείτε ότι έχετε τις ακόλουθες προϋποθέσεις:

  • Βασική κατανόηση προγραμματισμού C#
  • Το Visual Studio είναι εγκατεστημένο στον υπολογιστή σας
  • Πρόσβαση στο διαδίκτυο για λήψεις πακέτων και αναφορές τεκμηρίωσης

Εισαγωγή χώρων ονομάτων

Ξεκινήστε εισάγοντας τους απαραίτητους χώρους ονομάτων για να αξιοποιήσετε τις λειτουργίες GroupDocs.Parser:

using System;
using System.Collections.Generic;
using System.Drawing;
using System.IO;
using System.Linq;
using System.Text;
using Aspose.OCR;
using GroupDocs.Parser.Data;
using GroupDocs.Parser.Options;

Βήμα 1: Εγκαταστήστε το GroupDocs.Parser

Αρχικά, πραγματοποιήστε λήψη και εγκατάσταση της βιβλιοθήκης GroupDocs.Parser. Μπορείτε να το αποκτήσετε από τοσύνδεσμος λήψης.

Βήμα 2: Λάβετε μια προσωρινή άδεια

Για να χρησιμοποιήσετε το GroupDocs.Parser, αποκτήστε μια προσωρινή άδεια απόεδώ.

Βήμα 3: Εκκίνηση των ρυθμίσεων Parser

Δημιουργήστε ένα παράδειγμα τουParserSettingsκλάση για να διαμορφώσετε τις ρυθμίσεις εξαγωγής κειμένου, συμπεριλαμβανομένων των υποδοχών OCR εάν χρειάζεται.

ParserSettings settings = new ParserSettings(new AsposeOcrOnPremise());

Βήμα 4: Χρήση Parser για εξαγωγή κειμένου

Τώρα, δημιουργήστε ένα παράδειγμα τουParser τάξη με τις διαμορφωμένες ρυθμίσεις.

using (Parser parser = new Parser("YourSampleFile.docx", settings))
{
    // Διαμόρφωση Επιλογών κειμένου για χρήση OCR
    TextOptions options = new TextOptions(false, true);
    // Εξαγωγή κειμένου χρησιμοποιώντας OCR
    using (TextReader reader = parser.GetText(options))
    {
        // Εμφάνιση κειμένου που έχει εξαχθεί ή μηνύματος "δεν υποστηρίζεται".
        Console.WriteLine(reader == null ? "Text extraction isn't supported" : reader.ReadToEnd());
    }
}

Σε αυτό το απόσπασμα:

  • Αντικαθιστώ"YourSampleFile.docx" με τη διαδρομή προς το έγγραφο-στόχο σας.
  • TextOptions έχει ρυθμιστεί ώστε να ενεργοποιεί το OCR και να βελτιστοποιεί την εξαγωγή κειμένου.

συμπέρασμα

Συγχαρητήρια! Έχετε μάθει πώς να ενσωματώνετε το GroupDocs.Parser για .NET στα έργα σας για την αποτελεσματική εξαγωγή κειμένου. Εξερευνήστε το εκτενέςτεκμηρίωση για προηγμένες δυνατότητες και βελτιστοποιήσεις.

Συχνές ερωτήσεις

Είναι το GroupDocs.Parser κατάλληλο για εξαγωγή κειμένου από αρχεία PDF;

Ναι, το GroupDocs.Parser υποστηρίζει την εξαγωγή κειμένου από διάφορες μορφές, συμπεριλαμβανομένου του PDF.

Μπορώ να ενσωματώσω το GroupDocs.Parser στην εφαρμογή ASP.NET μου;

Οπωσδήποτε, το GroupDocs.Parser μπορεί να ενσωματωθεί απρόσκοπτα σε εφαρμογές ASP.NET.

Απαιτεί το GroupDocs.Parser άδεια για εμπορική χρήση;

Ναι, απαιτείται άδεια για εμπορική χρήση. Πάρτε μια προσωρινή άδειαεδώ.

Ποιες μορφές εγγράφων υποστηρίζονται από το GroupDocs.Parser;

Το GroupDocs.Parser υποστηρίζει ένα ευρύ φάσμα μορφών, συμπεριλαμβανομένων των DOCX, PDF, XLSX και άλλων.

Πώς μπορώ να αναζητήσω υποστήριξη ή να κάνω ερωτήσεις σχετικά με το GroupDocs.Parser;

Επισκέψου τοGroupDocs.Parser φόρουμγια υποστήριξη και συζητήσεις.