GetTextAreas

GetTextAreas()

Extrae áreas de texto del documento.

public IEnumerable<PageTextArea> GetTextAreas()

Valor_devuelto

Una colección dePageTextArea objetos; nulo si la extracción de áreas de texto no es compatible.

Observaciones

Aprende más:

Ejemplos

El siguiente ejemplo muestra cómo extraer todas las áreas de texto de todo el documento:

// Crea una instancia de la clase Parser
using(Parser parser = new Parser(filePath))
{
    // Extraer áreas de texto
    IEnumerable<PageTextArea> areas = parser.GetTextAreas();
    // Comprobar si se admite la extracción de áreas de texto
    if(areas == null)
    {
        Console.WriteLine("Page text areas extraction isn't supported");
        return;
    }
 
    // Iterar sobre las áreas de texto de la página
    foreach(PageTextArea a in areas)
    {
        // Imprimir un valor de índice de página, rectángulo y área de texto:
        Console.WriteLine(string.Format("Page: {0}, R: {1}, Text: {2}", a.Page.Index, a.Rectangle, a.Text));
    }
}

Ver también


GetTextAreas(PageTextAreaOptions)

Extrae áreas de texto del documento usando opciones de personalización (expresión regular, mayúsculas y minúsculas, etc.).

public IEnumerable<PageTextArea> GetTextAreas(PageTextAreaOptions options)
Parámetro Escribe Descripción
options PageTextAreaOptions Las opciones para la extracción del área de texto.

Valor_devuelto

Una colección dePageTextArea objetos; nulo si la extracción de áreas de texto no es compatible.

Observaciones

Aprende más:

Ejemplos

El siguiente ejemplo muestra cómo extraer solo áreas de texto con dígitos de la esquina superior izquierda:

// Crea una instancia de la clase Parser
using(Parser parser = new Parser(filePath))
{
    // Crear las opciones que se utilizan para la extracción del área de texto
    PageTextAreaOptions options = new PageTextAreaOptions("[0-9]+", new Rectangle(new Point(0, 0), new Size(300, 100)));

    // Extrae áreas de texto que contienen solo dígitos de la esquina superior izquierda de una página:
    IEnumerable<PageTextArea> areas = parser.GetTextAreas(options);
    // Comprobar si se admite la extracción de áreas de texto
    if(areas == null)
    {
        Console.WriteLine("Page text areas extraction isn't supported");
        return;
    }
 
    // Iterar sobre las áreas de texto de la página
    foreach(PageTextArea a in areas)
    {
        // Imprimir un valor de índice de página, rectángulo y área de texto:
        Console.WriteLine(string.Format("Page: {0}, R: {1}, Text: {2}", a.Page.Index, a.Rectangle, a.Text));
    }
}

Ver también


GetTextAreas(int)

Extrae áreas de texto de la página del documento.

public IEnumerable<PageTextArea> GetTextAreas(int pageIndex)
Parámetro Escribe Descripción
pageIndex Int32 El índice de página de base cero.

Valor_devuelto

Una colección dePageTextArea objetos; nulo si la extracción de áreas de texto no es compatible.

Observaciones

Aprende más:

Ejemplos

Para extraer áreas de texto de una página de documento se utiliza el siguiente método:

// Crea una instancia de la clase Parser
using(Parser parser = new Parser(filePath))
{
    // Comprobar si el documento admite la extracción de áreas de texto
    if(!parser.Features.TextAreas)
    {
        Console.WriteLine("Document isn't supports text areas extraction.");
        return;
    }

    // Obtener la información del documento
    IDocumentInfo documentInfo = parser.GetDocumentInfo();
    // Comprobar si el documento tiene páginas
    if(documentInfo.PageCount == 0)
    {
        Console.WriteLine("Document hasn't pages.");
        return;
    }
 
    // Iterar sobre páginas
    for(int pageIndex = 0; pageIndex<documentInfo.PageCount; pageIndex++)
    {
        // Imprimir un número de página 
        Console.WriteLine(string.Format("Page {0}/{1}", pageIndex + 1, documentInfo.PageCount));
 
        // Iterar sobre las áreas de texto de la página
        // Ignoramos la verificación nula ya que hemos verificado la compatibilidad con la función de extracción de áreas de texto anteriormente
        foreach(PageTextArea a in parser.GetTextAreas(pageIndex))
        {
            // Imprime un rectángulo y un valor de área de texto:
            Console.WriteLine(string.Format("R: {0}, Text: {1}", a.Rectangle, a.Text));
        }
    }
}

Ver también


GetTextAreas(int, PageTextAreaOptions)

Extrae áreas de texto de la página del documento usando opciones de personalización (expresión regular, mayúsculas y minúsculas, etc.).

public IEnumerable<PageTextArea> GetTextAreas(int pageIndex, PageTextAreaOptions options)
Parámetro Escribe Descripción
pageIndex Int32 El índice de página de base cero.
options PageTextAreaOptions Las opciones para la extracción del área de texto.

Valor_devuelto

Una colección dePageTextArea objetos; nulo si la extracción de áreas de texto no es compatible.

Observaciones

Aprende más:

Ver también