Extrahera text från Excel-ark i råläge
Introduktion
den här handledningen kommer vi att utforska hur man extraherar text från Excel-ark med GroupDocs.Parser för .NET i råläge. GroupDocs.Parser är ett kraftfullt API som låter utvecklare arbeta med olika dokumentformat, inklusive Excel-filer, för textextraktion och analys. Vi går igenom förutsättningarna, importerar namnrymder och bryter ner varje steg för att demonstrera processen att extrahera text från Excel-ark.
Förutsättningar
Innan du börjar, se till att du har ställt in följande förutsättningar:
- Visual Studio: Installera Visual Studio IDE på din dator.
- GroupDocs.Parser för .NET: Ladda ner och installera GroupDocs.Parser frånnedladdningssida.
- Exempel på Excel-fil: Förbered ett exempel på en Excel-fil som du ska använda för textextraktion.
Importera namnområden
Börja med att importera de nödvändiga namnrymden till ditt C#-projekt för att komma åt funktionerna i GroupDocs.Parser:
using System;
using System.Collections.Generic;
using System.IO;
using System.Text;
using GroupDocs.Parser.Data;
using GroupDocs.Parser.Options;
Steg 1: Skapa en instans av Parser Class
Skapa först en instans avParser
klass genom att ange sökvägen till din exempelfil i Excel:
using (Parser parser = new Parser("YourSampleFile.xlsx"))
{
// Din kod för textextraktion kommer hit
}
Steg 2: Få dokumentinformation
Hämta dokumentinformation med hjälp avGetDocumentInfo()
metod:
IDocumentInfo documentInfo = parser.GetDocumentInfo();
Steg 3: Iterera över ark
Gå igenom varje ark i Excel-filen:
for (int p = 0; p < documentInfo.RawPageCount; p++)
{
Console.WriteLine(string.Format("Page {0}/{1}", p + 1, documentInfo.RawPageCount));
//Din kod för textextraktion från varje ark kommer att hamna här
}
Steg 4: Extrahera text från varje ark
Extrahera text från varje ark med hjälp av enTextReader
:
using (TextReader reader = parser.GetText(p, new TextOptions(true)))
{
Console.WriteLine(reader.ReadToEnd());
}
Slutsats
I den här handledningen har vi täckt hur man extraherar text från Excel-ark med GroupDocs.Parser för .NET. Genom att följa stegen som beskrivs ovan kan du effektivt hämta textdata från Excel-filer för vidare bearbetning eller analys i dina .NET-applikationer.
FAQ’s
Kan GroupDocs.Parser extrahera text från andra dokumentformat?
Ja, GroupDocs.Parser stöder ett brett utbud av dokumentformat inklusive Word, PDF, PowerPoint och mer.
Är GroupDocs.Parser lämplig för bearbetning av stora Excel-filer?
Ja, GroupDocs.Parser är utformad för att hantera stora dokument effektivt.
Var kan jag hitta mer dokumentation om GroupDocs.Parser?
Du kan hänvisa tilldokumentation för detaljerad information och exempel.
Hur kan jag få en tillfällig licens för GroupDocs.Parser?
Besökden här länken att begära en tillfällig licens.
Erbjuder GroupDocs.Parser kundsupport?
Ja, du kan söka hjälp eller ställa frågor omGroupDocs forum.