GetText

GetText()

Extraheert een tekst uit het document.

public TextReader GetText()

Winstwaarde

Een exemplaar vanTextReader klasse met de geëxtraheerde tekst; nul als tekstextractie niet wordt ondersteund.

Opmerkingen

Kom meer te weten:

Voorbeelden

Het volgende voorbeeld laat zien hoe u een tekst uit een document haalt:

// Maak een instantie van de Parser-klasse
using(Parser parser = new Parser(filePath))
{
    // Extraheer een tekst in de reader
    using(TextReader reader = parser.GetText())
    {
        // Print een tekst uit het document
        // Als tekstextractie niet wordt ondersteund, is een lezer null
        Console.WriteLine(reader == null ? "Text extraction isn't supported" : reader.ReadToEnd());
    }
}

Zie ook

class Parser
naamruimte GroupDocs.Parser
montage GroupDocs.Parser

GetText(TextOptions)

Extraheert een tekstpagina uit het document met behulp van tekstopties (om de modus Raw Fast Text Extraction in te schakelen).

public TextReader GetText(TextOptions options)

Parameter	Type	Beschrijving
options	TextOptions	De opties voor tekstextractie.

Winstwaarde

Een exemplaar vanTextReader klasse met de geëxtraheerde tekst; nul als tekstextractie niet wordt ondersteund.

Opmerkingen

Kom meer te weten:

Voorbeelden

Het volgende voorbeeld laat zien hoe u een onbewerkte tekst uit een document haalt:

// Maak een instantie van de Parser-klasse
using(Parser parser = new Parser(filePath))
{
    // Extraheer een onbewerkte tekst in de lezer
    using(TextReader reader = parser.GetText(new TextOptions(true)))
    {
        // Print een tekst uit het document
        // Als tekstextractie niet wordt ondersteund, is een lezer null
        Console.WriteLine(reader == null ? "Text extraction isn't supported" : reader.ReadToEnd());
    }
}

Zie ook

class TextOptions
class Parser
naamruimte GroupDocs.Parser
montage GroupDocs.Parser

GetText(int)

Extraheert een tekst van de documentpagina.

public TextReader GetText(int pageIndex)

Parameter	Type	Beschrijving
pageIndex	Int32	De op nul gebaseerde pagina-index.

Winstwaarde

Een exemplaar vanTextReader klasse met de geëxtraheerde tekst; nul als tekstpagina-extractie niet wordt ondersteund.

Opmerkingen

Kom meer te weten:

Extraheer tekst in de modus Nauwkeurig

Voorbeelden

Het volgende voorbeeld laat zien hoe een tekst uit de documentpagina gehaald kan worden:

// Maak een instantie van de Parser-klasse
using(Parser parser = new Parser(filePath))
{
    // Controleer of het document tekstextractie ondersteunt
    if(!parser.Features.Text)
    {
        Console.WriteLine("Document isn't supports text extraction.");
        return;
    }

    // Haal de documentinfo op
    IDocumentInfo documentInfo = parser.GetDocumentInfo();
    // Controleer of het document pagina's heeft
    if(documentInfo.PageCount == 0)
    {
        Console.WriteLine("Document hasn't pages.");
        return;
    }
 
    // Herhaal pagina's
    for(int p = 0; p<documentInfo.PageCount; p++)
    {
        // Druk een paginanummer af 
        Console.WriteLine(string.Format("Page {0}/{1}", p + 1, documentInfo.PageCount));
 
        // Extraheer een tekst in de reader
        using(TextReader reader = parser.GetText(p))
        {
            // Print een tekst uit het document
            // We negeren null-check omdat we eerder de ondersteuning voor tekstextractie hebben gecontroleerd
            Console.WriteLine(reader.ReadToEnd());
        }
    }
}

Zie ook

class Parser
naamruimte GroupDocs.Parser
montage GroupDocs.Parser

GetText(int, TextOptions)

Extraheert een tekst van de documentpagina met behulp van tekstopties (om de modus Raw Fast Text Extraction in te schakelen).

public TextReader GetText(int pageIndex, TextOptions options)

Parameter	Type	Beschrijving
pageIndex	Int32	De op nul gebaseerde pagina-index.
options	TextOptions	De opties voor tekstextractie.

Winstwaarde

Een exemplaar vanTextReader klasse met de geëxtraheerde tekst; nul als tekstpagina-extractie niet wordt ondersteund.

Opmerkingen

Kom meer te weten:

Voorbeelden

Het volgende voorbeeld laat zien hoe u een onbewerkte tekst uit de documentpagina haalt:

// Maak een instantie van de Parser-klasse
using(Parser parser = new Parser(filePath))
{
    // Controleer of het document tekstextractie ondersteunt
    if(!parser.Features.Text)
    {
        Console.WriteLine("Document isn't supports text extraction.");
        return;
    }

    // Haal de documentinfo op
    DocumentInfo documentInfo = parser.GetDocumentInfo() as DocumentInfo;
    // Controleer of het document pagina's heeft
    if(documentInfo == null || documentInfo.RawPageCount == 0)
    {
        Console.WriteLine("Document hasn't pages.");
        return;
    }
 
    // Herhaal pagina's
    for(int p = 0; p<documentInfo.RawPageCount; p++)
    {
        // Druk een paginanummer af 
        Console.WriteLine(string.Format("Page {0}/{1}", p + 1, documentInfo.RawPageCount));
 
        // Extraheer een tekst in de reader
        using(TextReader reader = parser.GetText(p, new TextOptions(true)))
        {
            // Print een tekst uit het document
            // We negeren null-check omdat we eerder de ondersteuning voor tekstextractie hebben gecontroleerd
            Console.WriteLine(reader.ReadToEnd());
        }
    }
}

Zie ook

class TextOptions
class Parser
naamruimte GroupDocs.Parser
montage GroupDocs.Parser

GetTables GetTextAreas