Wyodrębnij tekst z arkusza Excel w trybie surowym

Wstęp

tym samouczku przyjrzymy się, jak wyodrębnić tekst z arkuszy programu Excel przy użyciu programu GroupDocs.Parser dla platformy .NET w trybie surowym. GroupDocs.Parser to potężny interfejs API, który umożliwia programistom pracę z różnymi formatami dokumentów, w tym plikami Excel, w celu wyodrębniania i analizy tekstu. Omówimy wymagania wstępne, zaimportujemy przestrzenie nazw i podzielimy każdy krok, aby zademonstrować proces wyodrębniania tekstu z arkuszy programu Excel.

Warunki wstępne

Zanim zaczniesz, upewnij się, że masz skonfigurowane następujące wymagania wstępne:

  • Visual Studio: Zainstaluj Visual Studio IDE na swoim komputerze.
  • GroupDocs.Parser dla .NET: Pobierz i zainstaluj GroupDocs.Parser zstrona pobierania.
  • Przykładowy plik Excel: Przygotuj przykładowy plik Excel, którego będziesz używać do wyodrębniania tekstu.

Importuj przestrzenie nazw

Rozpocznij od zaimportowania niezbędnych przestrzeni nazw do projektu C#, aby uzyskać dostęp do funkcjonalności GroupDocs.Parser:

using System;
using System.Collections.Generic;
using System.IO;
using System.Text;
using GroupDocs.Parser.Data;
using GroupDocs.Parser.Options;

Krok 1: Utwórz instancję klasy analizatora składni

Najpierw utwórz instancjęParser class, podając ścieżkę do przykładowego pliku Excel:

using (Parser parser = new Parser("YourSampleFile.xlsx"))
{
    // Twój kod do wyodrębniania tekstu zostanie umieszczony tutaj
}

Krok 2: Uzyskaj informacje o dokumencie

Pobierz informacje o dokumencie za pomocąGetDocumentInfo() metoda:

IDocumentInfo documentInfo = parser.GetDocumentInfo();

Krok 3: Iteruj po arkuszach

Przejdź przez każdy arkusz w pliku Excel:

for (int p = 0; p < documentInfo.RawPageCount; p++)
{
    Console.WriteLine(string.Format("Page {0}/{1}", p + 1, documentInfo.RawPageCount));
    
    //Twój kod do wyodrębniania tekstu z każdego arkusza znajdzie się tutaj
}

Krok 4: Wyodrębnij tekst z każdego arkusza

Wyodrębnij tekst z każdego arkusza za pomocą aTextReader:

using (TextReader reader = parser.GetText(p, new TextOptions(true)))
{
    Console.WriteLine(reader.ReadToEnd());
}

Wniosek

W tym samouczku omówiliśmy sposób wyodrębniania tekstu z arkuszy programu Excel przy użyciu narzędzia GroupDocs.Parser dla platformy .NET. Wykonując kroki opisane powyżej, możesz efektywnie pobierać dane tekstowe z plików Excel w celu dalszego przetwarzania lub analizy w aplikacjach .NET.

Często zadawane pytania

Czy GroupDocs.Parser może wyodrębnić tekst z dokumentów w innych formatach?

Tak, GroupDocs.Parser obsługuje szeroką gamę formatów dokumentów, w tym Word, PDF, PowerPoint i inne.

Czy GroupDocs.Parser nadaje się do przetwarzania dużych plików Excel?

Tak, GroupDocs.Parser został zaprojektowany do wydajnej obsługi dużych dokumentów.

Gdzie mogę znaleźć więcej dokumentacji dotyczącej GroupDocs.Parser?

Możesz odwołać się dodokumentacja szczegółowe informacje i przykłady.

Jak mogę uzyskać tymczasową licencję na GroupDocs.Parser?

Odwiedzaćten link ubiegać się o licencję tymczasową.

Czy GroupDocs.Parser oferuje obsługę klienta?

Tak, możesz szukać pomocy lub zadawać pytania na stronieForum GroupDocs.