GetText
GetText()
Extraherar en text från dokumentet.
public TextReader GetText()
Returvärde
En instans avTextReader klass med den extraherade texten; null
om textextraktion inte stöds.
Anmärkningar
Läs mer:
Exempel
Följande exempel visar hur man extraherar en text från ett dokument:
// Skapa en instans av Parser-klassen
using(Parser parser = new Parser(filePath))
{
// Extrahera en text i läsaren
using(TextReader reader = parser.GetText())
{
// Skriv ut en text från dokumentet
// Om textextraktion inte stöds är en läsare null
Console.WriteLine(reader == null ? "Text extraction isn't supported" : reader.ReadToEnd());
}
}
Se även
- class Parser
- namnutrymme GroupDocs.Parser
- hopsättning GroupDocs.Parser
GetText(TextOptions)
Extraherar en textsida från dokumentet med hjälp av textalternativ (för att aktivera läget för rå textextrahering).
public TextReader GetText(TextOptions options)
Parameter | Typ | Beskrivning |
---|---|---|
options | TextOptions | Alternativen för textextraktion. |
Returvärde
En instans avTextReader klass med den extraherade texten; null
om textextraktion inte stöds.
Anmärkningar
Läs mer:
Exempel
Följande exempel visar hur man extraherar en råtext från ett dokument:
// Skapa en instans av Parser-klassen
using(Parser parser = new Parser(filePath))
{
// Extrahera en råtext i läsaren
using(TextReader reader = parser.GetText(new TextOptions(true)))
{
// Skriv ut en text från dokumentet
// Om textextraktion inte stöds är en läsare null
Console.WriteLine(reader == null ? "Text extraction isn't supported" : reader.ReadToEnd());
}
}
Se även
- class TextOptions
- class Parser
- namnutrymme GroupDocs.Parser
- hopsättning GroupDocs.Parser
GetText(int)
Extraherar en text från dokumentsidan.
public TextReader GetText(int pageIndex)
Parameter | Typ | Beskrivning |
---|---|---|
pageIndex | Int32 | Det nollbaserade sidindexet. |
Returvärde
En instans avTextReader klass med den extraherade texten; null
om extrahering av textsidor inte stöds.
Anmärkningar
Läs mer:
Exempel
Följande exempel visar hur man extraherar en text från dokumentsidan:
// Skapa en instans av Parser-klassen
using(Parser parser = new Parser(filePath))
{
// Kontrollera om dokumentet stöder textextraktion
if(!parser.Features.Text)
{
Console.WriteLine("Document isn't supports text extraction.");
return;
}
// Få dokumentinformationen
IDocumentInfo documentInfo = parser.GetDocumentInfo();
// Kontrollera om dokumentet har sidor
if(documentInfo.PageCount == 0)
{
Console.WriteLine("Document hasn't pages.");
return;
}
// Iterera över sidor
for(int p = 0; p<documentInfo.PageCount; p++)
{
// Skriv ut ett sidnummer
Console.WriteLine(string.Format("Page {0}/{1}", p + 1, documentInfo.PageCount));
// Extrahera en text i läsaren
using(TextReader reader = parser.GetText(p))
{
// Skriv ut en text från dokumentet
// Vi ignorerar nollkontroll eftersom vi har kontrollerat stöd för textextrahering tidigare
Console.WriteLine(reader.ReadToEnd());
}
}
}
Se även
- class Parser
- namnutrymme GroupDocs.Parser
- hopsättning GroupDocs.Parser
GetText(int, TextOptions)
Extraherar en text från dokumentsidan med hjälp av textalternativ (för att aktivera råsnabbt textextraktionsläge).
public TextReader GetText(int pageIndex, TextOptions options)
Parameter | Typ | Beskrivning |
---|---|---|
pageIndex | Int32 | Det nollbaserade sidindexet. |
options | TextOptions | Alternativen för textextraktion. |
Returvärde
En instans avTextReader klass med den extraherade texten; null
om extrahering av textsidor inte stöds.
Anmärkningar
Läs mer:
Exempel
Följande exempel visar hur man extraherar en råtext från dokumentsidan:
// Skapa en instans av Parser-klassen
using(Parser parser = new Parser(filePath))
{
// Kontrollera om dokumentet stöder textextraktion
if(!parser.Features.Text)
{
Console.WriteLine("Document isn't supports text extraction.");
return;
}
// Få dokumentinformationen
DocumentInfo documentInfo = parser.GetDocumentInfo() as DocumentInfo;
// Kontrollera om dokumentet har sidor
if(documentInfo == null || documentInfo.RawPageCount == 0)
{
Console.WriteLine("Document hasn't pages.");
return;
}
// Iterera över sidor
for(int p = 0; p<documentInfo.RawPageCount; p++)
{
// Skriv ut ett sidnummer
Console.WriteLine(string.Format("Page {0}/{1}", p + 1, documentInfo.RawPageCount));
// Extrahera en text i läsaren
using(TextReader reader = parser.GetText(p, new TextOptions(true)))
{
// Skriv ut en text från dokumentet
// Vi ignorerar nollkontroll eftersom vi har kontrollerat stöd för textextrahering tidigare
Console.WriteLine(reader.ReadToEnd());
}
}
}
Se även
- class TextOptions
- class Parser
- namnutrymme GroupDocs.Parser
- hopsättning GroupDocs.Parser