GetText

GetText()

Extraheert een tekst uit het document.

public TextReader GetText()

Winstwaarde

Een exemplaar vanTextReader klasse met de geëxtraheerde tekst; nul als tekstextractie niet wordt ondersteund.

Opmerkingen

Kom meer te weten:

Voorbeelden

Het volgende voorbeeld laat zien hoe u een tekst uit een document haalt:

// Maak een instantie van de Parser-klasse
using(Parser parser = new Parser(filePath))
{
    // Extraheer een tekst in de reader
    using(TextReader reader = parser.GetText())
    {
        // Print een tekst uit het document
        // Als tekstextractie niet wordt ondersteund, is een lezer null
        Console.WriteLine(reader == null ? "Text extraction isn't supported" : reader.ReadToEnd());
    }
}

Zie ook


GetText(TextOptions)

Extraheert een tekstpagina uit het document met behulp van tekstopties (om de modus Raw Fast Text Extraction in te schakelen).

public TextReader GetText(TextOptions options)
Parameter Type Beschrijving
options TextOptions De opties voor tekstextractie.

Winstwaarde

Een exemplaar vanTextReader klasse met de geëxtraheerde tekst; nul als tekstextractie niet wordt ondersteund.

Opmerkingen

Kom meer te weten:

Voorbeelden

Het volgende voorbeeld laat zien hoe u een onbewerkte tekst uit een document haalt:

// Maak een instantie van de Parser-klasse
using(Parser parser = new Parser(filePath))
{
    // Extraheer een onbewerkte tekst in de lezer
    using(TextReader reader = parser.GetText(new TextOptions(true)))
    {
        // Print een tekst uit het document
        // Als tekstextractie niet wordt ondersteund, is een lezer null
        Console.WriteLine(reader == null ? "Text extraction isn't supported" : reader.ReadToEnd());
    }
}

Zie ook


GetText(int)

Extraheert een tekst van de documentpagina.

public TextReader GetText(int pageIndex)
Parameter Type Beschrijving
pageIndex Int32 De op nul gebaseerde pagina-index.

Winstwaarde

Een exemplaar vanTextReader klasse met de geëxtraheerde tekst; nul als tekstpagina-extractie niet wordt ondersteund.

Opmerkingen

Kom meer te weten:

Voorbeelden

Het volgende voorbeeld laat zien hoe een tekst uit de documentpagina gehaald kan worden:

// Maak een instantie van de Parser-klasse
using(Parser parser = new Parser(filePath))
{
    // Controleer of het document tekstextractie ondersteunt
    if(!parser.Features.Text)
    {
        Console.WriteLine("Document isn't supports text extraction.");
        return;
    }

    // Haal de documentinfo op
    IDocumentInfo documentInfo = parser.GetDocumentInfo();
    // Controleer of het document pagina's heeft
    if(documentInfo.PageCount == 0)
    {
        Console.WriteLine("Document hasn't pages.");
        return;
    }
 
    // Herhaal pagina's
    for(int p = 0; p<documentInfo.PageCount; p++)
    {
        // Druk een paginanummer af 
        Console.WriteLine(string.Format("Page {0}/{1}", p + 1, documentInfo.PageCount));
 
        // Extraheer een tekst in de reader
        using(TextReader reader = parser.GetText(p))
        {
            // Print een tekst uit het document
            // We negeren null-check omdat we eerder de ondersteuning voor tekstextractie hebben gecontroleerd
            Console.WriteLine(reader.ReadToEnd());
        }
    }
}

Zie ook


GetText(int, TextOptions)

Extraheert een tekst van de documentpagina met behulp van tekstopties (om de modus Raw Fast Text Extraction in te schakelen).

public TextReader GetText(int pageIndex, TextOptions options)
Parameter Type Beschrijving
pageIndex Int32 De op nul gebaseerde pagina-index.
options TextOptions De opties voor tekstextractie.

Winstwaarde

Een exemplaar vanTextReader klasse met de geëxtraheerde tekst; nul als tekstpagina-extractie niet wordt ondersteund.

Opmerkingen

Kom meer te weten:

Voorbeelden

Het volgende voorbeeld laat zien hoe u een onbewerkte tekst uit de documentpagina haalt:

// Maak een instantie van de Parser-klasse
using(Parser parser = new Parser(filePath))
{
    // Controleer of het document tekstextractie ondersteunt
    if(!parser.Features.Text)
    {
        Console.WriteLine("Document isn't supports text extraction.");
        return;
    }

    // Haal de documentinfo op
    DocumentInfo documentInfo = parser.GetDocumentInfo() as DocumentInfo;
    // Controleer of het document pagina's heeft
    if(documentInfo == null || documentInfo.RawPageCount == 0)
    {
        Console.WriteLine("Document hasn't pages.");
        return;
    }
 
    // Herhaal pagina's
    for(int p = 0; p<documentInfo.RawPageCount; p++)
    {
        // Druk een paginanummer af 
        Console.WriteLine(string.Format("Page {0}/{1}", p + 1, documentInfo.RawPageCount));
 
        // Extraheer een tekst in de reader
        using(TextReader reader = parser.GetText(p, new TextOptions(true)))
        {
            // Print een tekst uit het document
            // We negeren null-check omdat we eerder de ondersteuning voor tekstextractie hebben gecontroleerd
            Console.WriteLine(reader.ReadToEnd());
        }
    }
}

Zie ook