GetText

GetText()

Extraherar en text från dokumentet.

public TextReader GetText()

Returvärde

En instans avTextReader klass med den extraherade texten; null om textextraktion inte stöds.

Anmärkningar

Läs mer:

Exempel

Följande exempel visar hur man extraherar en text från ett dokument:

// Skapa en instans av Parser-klassen
using(Parser parser = new Parser(filePath))
{
    // Extrahera en text i läsaren
    using(TextReader reader = parser.GetText())
    {
        // Skriv ut en text från dokumentet
        // Om textextraktion inte stöds är en läsare null
        Console.WriteLine(reader == null ? "Text extraction isn't supported" : reader.ReadToEnd());
    }
}

Se även


GetText(TextOptions)

Extraherar en textsida från dokumentet med hjälp av textalternativ (för att aktivera läget för rå textextrahering).

public TextReader GetText(TextOptions options)
Parameter Typ Beskrivning
options TextOptions Alternativen för textextraktion.

Returvärde

En instans avTextReader klass med den extraherade texten; null om textextraktion inte stöds.

Anmärkningar

Läs mer:

Exempel

Följande exempel visar hur man extraherar en råtext från ett dokument:

// Skapa en instans av Parser-klassen
using(Parser parser = new Parser(filePath))
{
    // Extrahera en råtext i läsaren
    using(TextReader reader = parser.GetText(new TextOptions(true)))
    {
        // Skriv ut en text från dokumentet
        // Om textextraktion inte stöds är en läsare null
        Console.WriteLine(reader == null ? "Text extraction isn't supported" : reader.ReadToEnd());
    }
}

Se även


GetText(int)

Extraherar en text från dokumentsidan.

public TextReader GetText(int pageIndex)
Parameter Typ Beskrivning
pageIndex Int32 Det nollbaserade sidindexet.

Returvärde

En instans avTextReader klass med den extraherade texten; null om extrahering av textsidor inte stöds.

Anmärkningar

Läs mer:

Exempel

Följande exempel visar hur man extraherar en text från dokumentsidan:

// Skapa en instans av Parser-klassen
using(Parser parser = new Parser(filePath))
{
    // Kontrollera om dokumentet stöder textextraktion
    if(!parser.Features.Text)
    {
        Console.WriteLine("Document isn't supports text extraction.");
        return;
    }

    // Få dokumentinformationen
    IDocumentInfo documentInfo = parser.GetDocumentInfo();
    // Kontrollera om dokumentet har sidor
    if(documentInfo.PageCount == 0)
    {
        Console.WriteLine("Document hasn't pages.");
        return;
    }
 
    // Iterera över sidor
    for(int p = 0; p<documentInfo.PageCount; p++)
    {
        // Skriv ut ett sidnummer 
        Console.WriteLine(string.Format("Page {0}/{1}", p + 1, documentInfo.PageCount));
 
        // Extrahera en text i läsaren
        using(TextReader reader = parser.GetText(p))
        {
            // Skriv ut en text från dokumentet
            // Vi ignorerar nollkontroll eftersom vi har kontrollerat stöd för textextrahering tidigare
            Console.WriteLine(reader.ReadToEnd());
        }
    }
}

Se även


GetText(int, TextOptions)

Extraherar en text från dokumentsidan med hjälp av textalternativ (för att aktivera råsnabbt textextraktionsläge).

public TextReader GetText(int pageIndex, TextOptions options)
Parameter Typ Beskrivning
pageIndex Int32 Det nollbaserade sidindexet.
options TextOptions Alternativen för textextraktion.

Returvärde

En instans avTextReader klass med den extraherade texten; null om extrahering av textsidor inte stöds.

Anmärkningar

Läs mer:

Exempel

Följande exempel visar hur man extraherar en råtext från dokumentsidan:

// Skapa en instans av Parser-klassen
using(Parser parser = new Parser(filePath))
{
    // Kontrollera om dokumentet stöder textextraktion
    if(!parser.Features.Text)
    {
        Console.WriteLine("Document isn't supports text extraction.");
        return;
    }

    // Få dokumentinformationen
    DocumentInfo documentInfo = parser.GetDocumentInfo() as DocumentInfo;
    // Kontrollera om dokumentet har sidor
    if(documentInfo == null || documentInfo.RawPageCount == 0)
    {
        Console.WriteLine("Document hasn't pages.");
        return;
    }
 
    // Iterera över sidor
    for(int p = 0; p<documentInfo.RawPageCount; p++)
    {
        // Skriv ut ett sidnummer 
        Console.WriteLine(string.Format("Page {0}/{1}", p + 1, documentInfo.RawPageCount));
 
        // Extrahera en text i läsaren
        using(TextReader reader = parser.GetText(p, new TextOptions(true)))
        {
            // Skriv ut en text från dokumentet
            // Vi ignorerar nollkontroll eftersom vi har kontrollerat stöd för textextrahering tidigare
            Console.WriteLine(reader.ReadToEnd());
        }
    }
}

Se även