Φόρτωση εγγράφου από τη ροή
Εισαγωγή
Στον τομέα της επεξεργασίας εγγράφων σε εφαρμογές .NET, η εξαγωγή κειμένου από διάφορες μορφές αρχείων είναι μια κοινή απαίτηση. Το GroupDocs.Parser για .NET προσφέρει μια ισχυρή λύση για την απρόσκοπτη ανάλυση και εξαγωγή κειμένου από μια μεγάλη γκάμα εγγράφων. Αυτό το σεμινάριο θα σας καθοδηγήσει στη διαδικασία χρήσης του GroupDocs.Parser για την εξαγωγή κειμένου από έγγραφα βήμα προς βήμα.
Προαπαιτούμενα
Πριν ξεκινήσετε τη χρήση του GroupDocs.Parser για .NET, βεβαιωθείτε ότι έχετε ρυθμίσει τις ακόλουθες ρυθμίσεις:
- Περιβάλλον ανάπτυξης: Visual Studio ή οποιοδήποτε άλλο περιβάλλον ανάπτυξης .NET.
- GroupDocs.Parser for .NET Package: Κατεβάστε και εγκαταστήστε τη βιβλιοθήκη GroupDocs.Parser για .NET απόεδώ.
- Δείγματα εγγράφων: Έχετε δείγματα εγγράφων έτοιμα για εξαγωγή κειμένου.
Εισαγωγή χώρων ονομάτων
Ξεκινήστε εισάγοντας τους απαραίτητους χώρους ονομάτων στο έργο σας .NET για πρόσβαση στις λειτουργίες GroupDocs.Parser.
using System;
using System.Collections.Generic;
using System.IO;
using System.Linq;
using System.Text;
Τα παρακάτω βήματα δείχνουν πώς να εξαγάγετε κείμενο από ένα έγγραφο χρησιμοποιώντας το GroupDocs.Parser από μια ροή.
Βήμα 1: Φόρτωση εγγράφου από τη ροή
// Δημιουργήστε τη ροή
using (Stream stream = File.OpenRead("YourSampleFile.docx"))
{
// Δημιουργήστε μια παρουσία της κλάσης Parser με τη ροή
using (Parser parser = new Parser(stream))
{
// Εξαγωγή κειμένου στον αναγνώστη
using (TextReader reader = parser.GetText())
{
// Εκτύπωση κειμένου από το έγγραφο
// Εάν η εξαγωγή κειμένου δεν υποστηρίζεται, ο αναγνώστης θα είναι μηδενικός
Console.WriteLine(reader == null ? "Text extraction isn't supported" : reader.ReadToEnd());
}
}
}
Σε αυτό το παράδειγμα:
- Ανοίγουμε μια ροή αρχείων για το αρχείο εγγράφου (
YourSampleFile.docx
). - Αρχικοποίηση α
Parser
παράδειγμα με το ρεύμα. - Χρήση
parser.GetText()
για ανάκτηση αTextReader
που περιέχει το εξαγόμενο κείμενο. - Εκτυπώστε το εξαγόμενο κείμενο ή ένα μήνυμα εάν η εξαγωγή κειμένου δεν υποστηρίζεται για τη μορφή εγγράφου.
συμπέρασμα
Το GroupDocs.Parser για .NET απλοποιεί την εξαγωγή κειμένου από διάφορες μορφές εγγράφων, επιτρέποντας στους προγραμματιστές να επεξεργάζονται και να χρησιμοποιούν αποτελεσματικά το περιεχόμενο κειμένου στις εφαρμογές τους. Ακολουθώντας τα βήματα που περιγράφονται σε αυτό το σεμινάριο, μπορείτε να ενσωματώσετε απρόσκοπτα τις δυνατότητες εξαγωγής κειμένου εγγράφου στα έργα σας .NET.
Συχνές ερωτήσεις
Ποιες μορφές εγγράφων υποστηρίζονται από το GroupDocs.Parser για .NET;
Το GroupDocs.Parser υποστηρίζει ένα ευρύ φάσμα μορφών εγγράφων, όπως DOCX, PDF, XLSX, PPTX, EPUB και άλλα.
Μπορεί το GroupDocs.Parser να εξάγει εικόνες ή μεταδεδομένα από έγγραφα;
Ναι, το GroupDocs.Parser μπορεί να εξάγει εικόνες, μεταδεδομένα και κείμενο από διάφορους τύπους εγγράφων.
Είναι το GroupDocs.Parser συμβατό με εφαρμογές .NET Core;
Ναι, το GroupDocs.Parser είναι συμβατό με εφαρμογές .NET Framework και .NET Core.
Πώς μπορώ να αποκτήσω μια προσωρινή άδεια για το GroupDocs.Parser;
Μπορείτε να αποκτήσετε προσωρινή άδεια απόεδώ.
Πού μπορώ να βρω περισσότερη υποστήριξη ή τεκμηρίωση για το GroupDocs.Parser;
Για πρόσθετη υποστήριξη, επισκεφθείτε τοGroupDocs.Parser Forum ή ανατρέξτε στοτεκμηρίωση.