GetText

GetText()

Extrae un texto del documento.

public TextReader GetText()

Valor_devuelto

Una instancia deTextReader clase con el texto extraído; nulo si la extracción de texto no es compatible.

Observaciones

Aprende más:

Ejemplos

El siguiente ejemplo muestra cómo extraer un texto de un documento:

// Crea una instancia de la clase Parser
using(Parser parser = new Parser(filePath))
{
    // Extraer un texto en el lector
    using(TextReader reader = parser.GetText())
    {
        // Imprime un texto del documento
        // Si no se admite la extracción de texto, un lector es nulo
        Console.WriteLine(reader == null ? "Text extraction isn't supported" : reader.ReadToEnd());
    }
}

Ver también


GetText(TextOptions)

Extrae una página de texto del documento usando las opciones de texto (para habilitar el modo de extracción rápida de texto sin formato).

public TextReader GetText(TextOptions options)
Parámetro Escribe Descripción
options TextOptions Las opciones de extracción de texto.

Valor_devuelto

Una instancia deTextReader clase con el texto extraído; nulo si la extracción de texto no es compatible.

Observaciones

Aprende más:

Ejemplos

El siguiente ejemplo muestra cómo extraer un texto sin procesar de un documento:

// Crea una instancia de la clase Parser
using(Parser parser = new Parser(filePath))
{
    // Extraer un texto sin procesar en el lector
    using(TextReader reader = parser.GetText(new TextOptions(true)))
    {
        // Imprime un texto del documento
        // Si no se admite la extracción de texto, un lector es nulo
        Console.WriteLine(reader == null ? "Text extraction isn't supported" : reader.ReadToEnd());
    }
}

Ver también


GetText(int)

Extrae un texto de la página del documento.

public TextReader GetText(int pageIndex)
Parámetro Escribe Descripción
pageIndex Int32 El índice de página de base cero.

Valor_devuelto

Una instancia deTextReader clase con el texto extraído; nulo si la extracción de páginas de texto no es compatible.

Observaciones

Aprende más:

Ejemplos

El siguiente ejemplo muestra cómo extraer un texto de la página del documento:

// Crea una instancia de la clase Parser
using(Parser parser = new Parser(filePath))
{
    // Comprobar si el documento admite la extracción de texto
    if(!parser.Features.Text)
    {
        Console.WriteLine("Document isn't supports text extraction.");
        return;
    }

    // Obtener la información del documento
    IDocumentInfo documentInfo = parser.GetDocumentInfo();
    // Comprobar si el documento tiene páginas
    if(documentInfo.PageCount == 0)
    {
        Console.WriteLine("Document hasn't pages.");
        return;
    }
 
    // Iterar sobre páginas
    for(int p = 0; p<documentInfo.PageCount; p++)
    {
        // Imprimir un número de página 
        Console.WriteLine(string.Format("Page {0}/{1}", p + 1, documentInfo.PageCount));
 
        // Extraer un texto en el lector
        using(TextReader reader = parser.GetText(p))
        {
            // Imprime un texto del documento
            // Ignoramos la verificación nula ya que hemos verificado la compatibilidad con la función de extracción de texto anteriormente
            Console.WriteLine(reader.ReadToEnd());
        }
    }
}

Ver también


GetText(int, TextOptions)

Extrae un texto de la página del documento usando las opciones de texto (para habilitar el modo de extracción rápida de texto sin formato).

public TextReader GetText(int pageIndex, TextOptions options)
Parámetro Escribe Descripción
pageIndex Int32 El índice de página de base cero.
options TextOptions Las opciones de extracción de texto.

Valor_devuelto

Una instancia deTextReader clase con el texto extraído; nulo si la extracción de páginas de texto no es compatible.

Observaciones

Aprende más:

Ejemplos

El siguiente ejemplo muestra cómo extraer un texto sin formato de la página del documento:

// Crea una instancia de la clase Parser
using(Parser parser = new Parser(filePath))
{
    // Comprobar si el documento admite la extracción de texto
    if(!parser.Features.Text)
    {
        Console.WriteLine("Document isn't supports text extraction.");
        return;
    }

    // Obtener la información del documento
    DocumentInfo documentInfo = parser.GetDocumentInfo() as DocumentInfo;
    // Comprobar si el documento tiene páginas
    if(documentInfo == null || documentInfo.RawPageCount == 0)
    {
        Console.WriteLine("Document hasn't pages.");
        return;
    }
 
    // Iterar sobre páginas
    for(int p = 0; p<documentInfo.RawPageCount; p++)
    {
        // Imprimir un número de página 
        Console.WriteLine(string.Format("Page {0}/{1}", p + 1, documentInfo.RawPageCount));
 
        // Extraer un texto en el lector
        using(TextReader reader = parser.GetText(p, new TextOptions(true)))
        {
            // Imprime un texto del documento
            // Ignoramos la verificación nula ya que hemos verificado la compatibilidad con la función de extracción de texto anteriormente
            Console.WriteLine(reader.ReadToEnd());
        }
    }
}

Ver también