Wyodrębnij tekst z arkusza Excel w trybie surowym
Wstęp
tym samouczku przyjrzymy się, jak wyodrębnić tekst z arkuszy programu Excel przy użyciu programu GroupDocs.Parser dla platformy .NET w trybie surowym. GroupDocs.Parser to potężny interfejs API, który umożliwia programistom pracę z różnymi formatami dokumentów, w tym plikami Excel, w celu wyodrębniania i analizy tekstu. Omówimy wymagania wstępne, zaimportujemy przestrzenie nazw i podzielimy każdy krok, aby zademonstrować proces wyodrębniania tekstu z arkuszy programu Excel.
Warunki wstępne
Zanim zaczniesz, upewnij się, że masz skonfigurowane następujące wymagania wstępne:
- Visual Studio: Zainstaluj Visual Studio IDE na swoim komputerze.
- GroupDocs.Parser dla .NET: Pobierz i zainstaluj GroupDocs.Parser zstrona pobierania.
- Przykładowy plik Excel: Przygotuj przykładowy plik Excel, którego będziesz używać do wyodrębniania tekstu.
Importuj przestrzenie nazw
Rozpocznij od zaimportowania niezbędnych przestrzeni nazw do projektu C#, aby uzyskać dostęp do funkcjonalności GroupDocs.Parser:
using System;
using System.Collections.Generic;
using System.IO;
using System.Text;
using GroupDocs.Parser.Data;
using GroupDocs.Parser.Options;
Krok 1: Utwórz instancję klasy analizatora składni
Najpierw utwórz instancjęParser
class, podając ścieżkę do przykładowego pliku Excel:
using (Parser parser = new Parser("YourSampleFile.xlsx"))
{
// Twój kod do wyodrębniania tekstu zostanie umieszczony tutaj
}
Krok 2: Uzyskaj informacje o dokumencie
Pobierz informacje o dokumencie za pomocąGetDocumentInfo()
metoda:
IDocumentInfo documentInfo = parser.GetDocumentInfo();
Krok 3: Iteruj po arkuszach
Przejdź przez każdy arkusz w pliku Excel:
for (int p = 0; p < documentInfo.RawPageCount; p++)
{
Console.WriteLine(string.Format("Page {0}/{1}", p + 1, documentInfo.RawPageCount));
//Twój kod do wyodrębniania tekstu z każdego arkusza znajdzie się tutaj
}
Krok 4: Wyodrębnij tekst z każdego arkusza
Wyodrębnij tekst z każdego arkusza za pomocą aTextReader
:
using (TextReader reader = parser.GetText(p, new TextOptions(true)))
{
Console.WriteLine(reader.ReadToEnd());
}
Wniosek
W tym samouczku omówiliśmy sposób wyodrębniania tekstu z arkuszy programu Excel przy użyciu narzędzia GroupDocs.Parser dla platformy .NET. Wykonując kroki opisane powyżej, możesz efektywnie pobierać dane tekstowe z plików Excel w celu dalszego przetwarzania lub analizy w aplikacjach .NET.
Często zadawane pytania
Czy GroupDocs.Parser może wyodrębnić tekst z dokumentów w innych formatach?
Tak, GroupDocs.Parser obsługuje szeroką gamę formatów dokumentów, w tym Word, PDF, PowerPoint i inne.
Czy GroupDocs.Parser nadaje się do przetwarzania dużych plików Excel?
Tak, GroupDocs.Parser został zaprojektowany do wydajnej obsługi dużych dokumentów.
Gdzie mogę znaleźć więcej dokumentacji dotyczącej GroupDocs.Parser?
Możesz odwołać się dodokumentacja szczegółowe informacje i przykłady.
Jak mogę uzyskać tymczasową licencję na GroupDocs.Parser?
Odwiedzaćten link ubiegać się o licencję tymczasową.
Czy GroupDocs.Parser oferuje obsługę klienta?
Tak, możesz szukać pomocy lub zadawać pytania na stronieForum GroupDocs.