GetText
GetText()
Extraheert een tekst uit het document.
public TextReader GetText()
Winstwaarde
Een exemplaar vanTextReader klasse met de geëxtraheerde tekst; nul
als tekstextractie niet wordt ondersteund.
Opmerkingen
Kom meer te weten:
Voorbeelden
Het volgende voorbeeld laat zien hoe u een tekst uit een document haalt:
// Maak een instantie van de Parser-klasse
using(Parser parser = new Parser(filePath))
{
// Extraheer een tekst in de reader
using(TextReader reader = parser.GetText())
{
// Print een tekst uit het document
// Als tekstextractie niet wordt ondersteund, is een lezer null
Console.WriteLine(reader == null ? "Text extraction isn't supported" : reader.ReadToEnd());
}
}
Zie ook
- class Parser
- naamruimte GroupDocs.Parser
- montage GroupDocs.Parser
GetText(TextOptions)
Extraheert een tekstpagina uit het document met behulp van tekstopties (om de modus Raw Fast Text Extraction in te schakelen).
public TextReader GetText(TextOptions options)
Parameter | Type | Beschrijving |
---|---|---|
options | TextOptions | De opties voor tekstextractie. |
Winstwaarde
Een exemplaar vanTextReader klasse met de geëxtraheerde tekst; nul
als tekstextractie niet wordt ondersteund.
Opmerkingen
Kom meer te weten:
Voorbeelden
Het volgende voorbeeld laat zien hoe u een onbewerkte tekst uit een document haalt:
// Maak een instantie van de Parser-klasse
using(Parser parser = new Parser(filePath))
{
// Extraheer een onbewerkte tekst in de lezer
using(TextReader reader = parser.GetText(new TextOptions(true)))
{
// Print een tekst uit het document
// Als tekstextractie niet wordt ondersteund, is een lezer null
Console.WriteLine(reader == null ? "Text extraction isn't supported" : reader.ReadToEnd());
}
}
Zie ook
- class TextOptions
- class Parser
- naamruimte GroupDocs.Parser
- montage GroupDocs.Parser
GetText(int)
Extraheert een tekst van de documentpagina.
public TextReader GetText(int pageIndex)
Parameter | Type | Beschrijving |
---|---|---|
pageIndex | Int32 | De op nul gebaseerde pagina-index. |
Winstwaarde
Een exemplaar vanTextReader klasse met de geëxtraheerde tekst; nul
als tekstpagina-extractie niet wordt ondersteund.
Opmerkingen
Kom meer te weten:
Voorbeelden
Het volgende voorbeeld laat zien hoe een tekst uit de documentpagina gehaald kan worden:
// Maak een instantie van de Parser-klasse
using(Parser parser = new Parser(filePath))
{
// Controleer of het document tekstextractie ondersteunt
if(!parser.Features.Text)
{
Console.WriteLine("Document isn't supports text extraction.");
return;
}
// Haal de documentinfo op
IDocumentInfo documentInfo = parser.GetDocumentInfo();
// Controleer of het document pagina's heeft
if(documentInfo.PageCount == 0)
{
Console.WriteLine("Document hasn't pages.");
return;
}
// Herhaal pagina's
for(int p = 0; p<documentInfo.PageCount; p++)
{
// Druk een paginanummer af
Console.WriteLine(string.Format("Page {0}/{1}", p + 1, documentInfo.PageCount));
// Extraheer een tekst in de reader
using(TextReader reader = parser.GetText(p))
{
// Print een tekst uit het document
// We negeren null-check omdat we eerder de ondersteuning voor tekstextractie hebben gecontroleerd
Console.WriteLine(reader.ReadToEnd());
}
}
}
Zie ook
- class Parser
- naamruimte GroupDocs.Parser
- montage GroupDocs.Parser
GetText(int, TextOptions)
Extraheert een tekst van de documentpagina met behulp van tekstopties (om de modus Raw Fast Text Extraction in te schakelen).
public TextReader GetText(int pageIndex, TextOptions options)
Parameter | Type | Beschrijving |
---|---|---|
pageIndex | Int32 | De op nul gebaseerde pagina-index. |
options | TextOptions | De opties voor tekstextractie. |
Winstwaarde
Een exemplaar vanTextReader klasse met de geëxtraheerde tekst; nul
als tekstpagina-extractie niet wordt ondersteund.
Opmerkingen
Kom meer te weten:
Voorbeelden
Het volgende voorbeeld laat zien hoe u een onbewerkte tekst uit de documentpagina haalt:
// Maak een instantie van de Parser-klasse
using(Parser parser = new Parser(filePath))
{
// Controleer of het document tekstextractie ondersteunt
if(!parser.Features.Text)
{
Console.WriteLine("Document isn't supports text extraction.");
return;
}
// Haal de documentinfo op
DocumentInfo documentInfo = parser.GetDocumentInfo() as DocumentInfo;
// Controleer of het document pagina's heeft
if(documentInfo == null || documentInfo.RawPageCount == 0)
{
Console.WriteLine("Document hasn't pages.");
return;
}
// Herhaal pagina's
for(int p = 0; p<documentInfo.RawPageCount; p++)
{
// Druk een paginanummer af
Console.WriteLine(string.Format("Page {0}/{1}", p + 1, documentInfo.RawPageCount));
// Extraheer een tekst in de reader
using(TextReader reader = parser.GetText(p, new TextOptions(true)))
{
// Print een tekst uit het document
// We negeren null-check omdat we eerder de ondersteuning voor tekstextractie hebben gecontroleerd
Console.WriteLine(reader.ReadToEnd());
}
}
}
Zie ook
- class TextOptions
- class Parser
- naamruimte GroupDocs.Parser
- montage GroupDocs.Parser