Εξαγωγή κειμένου από το έγγραφο του Excel ως HTML

Εισαγωγή

Σε αυτό το σεμινάριο, θα εξερευνήσουμε πώς να χρησιμοποιήσετε το GroupDocs.Parser για .NET για την εξαγωγή κειμένου από ένα έγγραφο του Excel και τη μετατροπή του σε μορφή HTML. Το GroupDocs.Parser είναι μια ισχυρή βιβλιοθήκη που επιτρέπει στους προγραμματιστές να εργάζονται με διάφορες μορφές εγγράφων, εξάγοντας κείμενο και μεταδεδομένα αποτελεσματικά.

Προαπαιτούμενα

Πριν ξεκινήσουμε, βεβαιωθείτε ότι έχετε ρυθμίσει τις ακόλουθες ρυθμίσεις:

  • Το Visual Studio είναι εγκατεστημένο στο σύστημά σας.
  • Βασική κατανόηση προγραμματισμού C#.
  • Βιβλιοθήκη GroupDocs.Parser για .NET. Μπορείτε να το κατεβάσετε απόεδώ.

Εισαγωγή χώρων ονομάτων

Ξεκινήστε συμπεριλαμβάνοντας τους απαραίτητους χώρους ονομάτων στο έργο σας C# για πρόσβαση στις λειτουργίες GroupDocs.Parser.

using System;
using System.Collections.Generic;
using System.IO;
using System.Text;
using GroupDocs.Parser.Data;
using GroupDocs.Parser.Options;

Βήμα 1: Δημιουργήστε μια παρουσία κλάσης Parser

Πρώτα, δημιουργήστε τοParser τάξη παρέχοντας τη διαδρομή προς το έγγραφό σας Excel.

using (Parser parser = new Parser("YourSampleFile.xlsx"))
{
    // Περαιτέρω κωδικός θα πάει εδώ
}

Αντικαθιστώ"YourSampleFile.xlsx" με τη διαδρομή προς το αρχείο Excel.

Βήμα 2: Εξαγωγή κειμένου ως HTML

Μέσα στοusing μπλοκ τουParser για παράδειγμα, χρησιμοποιήστε τοGetFormattedText μέθοδος εξαγωγής μορφοποιημένου κειμένου σε λειτουργία HTML.

using (Parser parser = new Parser("YourSampleFile.xlsx"))
{
    using (TextReader reader = parser.GetFormattedText(new FormattedTextOptions(FormattedTextMode.Html)))
    {
        // Περαιτέρω κωδικός θα πάει εδώ
    }
}

Βήμα 3: Διαβάστε και εκτυπώστε εξαγόμενο κείμενο HTML

Στη συνέχεια, διαβάστε το εξαγόμενο κείμενο HTML από τοTextReader και εκτυπώστε το στην κονσόλα.

using (Parser parser = new Parser("YourSampleFile.xlsx"))
{
    using (TextReader reader = parser.GetFormattedText(new FormattedTextOptions(FormattedTextMode.Html)))
    {
        Console.WriteLine(reader.ReadToEnd());
    }
}

Μόλις εκτελεστεί, αυτός ο κώδικας θα εξαγάγει το κείμενο από το έγγραφο του Excel και θα το εμφανίσει ως μορφή HTML στην κονσόλα.

συμπέρασμα

Σε αυτό το σεμινάριο, μάθαμε πώς να χρησιμοποιούμε το GroupDocs.Parser για .NET για την εξαγωγή κειμένου από ένα έγγραφο του Excel και τη μετατροπή του σε μορφή HTML. Αυτή η βιβλιοθήκη παρέχει έναν απλό τρόπο εργασίας με διάφορες μορφές εγγράφων, επιτρέποντας στους προγραμματιστές να χειρίζονται αποτελεσματικά τις εργασίες εξαγωγής κειμένου στις εφαρμογές τους.

Συχνές ερωτήσεις

Μπορεί το GroupDocs.Parser να χειριστεί άλλες μορφές εγγράφων εκτός από το Excel;

Ναι, το GroupDocs.Parser υποστηρίζει ένα ευρύ φάσμα μορφών αρχείων, όπως PDF, Word, PowerPoint και άλλα.

Είναι το GroupDocs.Parser συμβατό με .NET Core;

Ναι, το GroupDocs.Parser είναι συμβατό τόσο με .NET Framework όσο και με .NET Core.

Το GroupDocs.Parser διατηρεί τη μορφοποίηση κατά την εξαγωγή κειμένου;

Ναι, το GroupDocs.Parser μπορεί να διατηρήσει τη μορφοποίηση, όπως γραμματοσειρές, στυλ και διάταξη κατά την εξαγωγή κειμένου.

Μπορώ να εξαγάγω μεταδεδομένα από έγγραφα χρησιμοποιώντας το GroupDocs.Parser;

Ναι, το GroupDocs.Parser επιτρέπει την εξαγωγή μεταδεδομένων όπως ο συγγραφέας, η ημερομηνία δημιουργίας και άλλα από υποστηριζόμενους τύπους εγγράφων.

Υπάρχει διαθέσιμη δωρεάν δοκιμή για το GroupDocs.Parser;

Ναι, μπορείτε να κάνετε λήψη μιας δωρεάν δοκιμής απόεδώ.