GetTextAreas

GetTextAreas()

Estrae aree di testo dal documento.

public IEnumerable<PageTextArea> GetTextAreas()

Valore di ritorno

Una raccolta diPageTextArea oggetti; nullo se l’estrazione delle aree di testo non è supportata.

Osservazioni

Saperne di più:

Esempi

L’esempio seguente mostra come estrarre tutte le aree di testo dall’intero documento:

// Crea un'istanza della classe Parser
using(Parser parser = new Parser(filePath))
{
    // Estrai aree di testo
    IEnumerable<PageTextArea> areas = parser.GetTextAreas();
    // Controlla se l'estrazione delle aree di testo è supportata
    if(areas == null)
    {
        Console.WriteLine("Page text areas extraction isn't supported");
        return;
    }
 
    // Itera sulle aree di testo della pagina
    foreach(PageTextArea a in areas)
    {
        // Stampa un indice di pagina, un rettangolo e un valore dell'area di testo:
        Console.WriteLine(string.Format("Page: {0}, R: {1}, Text: {2}", a.Page.Index, a.Rectangle, a.Text));
    }
}

Guarda anche


GetTextAreas(PageTextAreaOptions)

Estrae le aree di testo dal documento utilizzando le opzioni di personalizzazione (espressione regolare, match case, ecc.).

public IEnumerable<PageTextArea> GetTextAreas(PageTextAreaOptions options)
Parametro Tipo Descrizione
options PageTextAreaOptions Le opzioni per l’estrazione dell’area di testo.

Valore di ritorno

Una raccolta diPageTextArea oggetti; nullo se l’estrazione delle aree di testo non è supportata.

Osservazioni

Saperne di più:

Esempi

L’esempio seguente mostra come estrarre solo le aree di testo con cifre dall’angolo in alto a sinistra:

// Crea un'istanza della classe Parser
using(Parser parser = new Parser(filePath))
{
    // Crea le opzioni utilizzate per l'estrazione dell'area di testo
    PageTextAreaOptions options = new PageTextAreaOptions("[0-9]+", new Rectangle(new Point(0, 0), new Size(300, 100)));

    // Estrai le aree di testo che contengono solo cifre dall'angolo in alto a sinistra di una pagina:
    IEnumerable<PageTextArea> areas = parser.GetTextAreas(options);
    // Controlla se l'estrazione delle aree di testo è supportata
    if(areas == null)
    {
        Console.WriteLine("Page text areas extraction isn't supported");
        return;
    }
 
    // Itera sulle aree di testo della pagina
    foreach(PageTextArea a in areas)
    {
        // Stampa un indice di pagina, un rettangolo e un valore dell'area di testo:
        Console.WriteLine(string.Format("Page: {0}, R: {1}, Text: {2}", a.Page.Index, a.Rectangle, a.Text));
    }
}

Guarda anche


GetTextAreas(int)

Estrae aree di testo dalla pagina del documento.

public IEnumerable<PageTextArea> GetTextAreas(int pageIndex)
Parametro Tipo Descrizione
pageIndex Int32 L’indice della pagina in base zero.

Valore di ritorno

Una raccolta diPageTextArea oggetti; nullo se l’estrazione delle aree di testo non è supportata.

Osservazioni

Saperne di più:

Esempi

Per estrarre aree di testo da una pagina del documento viene utilizzato il seguente metodo:

// Crea un'istanza della classe Parser
using(Parser parser = new Parser(filePath))
{
    // Controlla se il documento supporta l'estrazione delle aree di testo
    if(!parser.Features.TextAreas)
    {
        Console.WriteLine("Document isn't supports text areas extraction.");
        return;
    }

    // Ottieni le informazioni sul documento
    IDocumentInfo documentInfo = parser.GetDocumentInfo();
    // Controlla se il documento ha pagine
    if(documentInfo.PageCount == 0)
    {
        Console.WriteLine("Document hasn't pages.");
        return;
    }
 
    // Itera sulle pagine
    for(int pageIndex = 0; pageIndex<documentInfo.PageCount; pageIndex++)
    {
        // Stampa un numero di pagina 
        Console.WriteLine(string.Format("Page {0}/{1}", pageIndex + 1, documentInfo.PageCount));
 
        // Itera sulle aree di testo della pagina
        // Ignoriamo il controllo dei valori null poiché abbiamo verificato in precedenza il supporto della funzione di estrazione delle aree di testo
        foreach(PageTextArea a in parser.GetTextAreas(pageIndex))
        {
            // Stampa un rettangolo e il valore dell'area di testo:
            Console.WriteLine(string.Format("R: {0}, Text: {1}", a.Rectangle, a.Text));
        }
    }
}

Guarda anche


GetTextAreas(int, PageTextAreaOptions)

Estrae le aree di testo dalla pagina del documento utilizzando le opzioni di personalizzazione (espressione regolare, match case, ecc.).

public IEnumerable<PageTextArea> GetTextAreas(int pageIndex, PageTextAreaOptions options)
Parametro Tipo Descrizione
pageIndex Int32 L’indice della pagina in base zero.
options PageTextAreaOptions Le opzioni per l’estrazione dell’area di testo.

Valore di ritorno

Una raccolta diPageTextArea oggetti; nullo se l’estrazione delle aree di testo non è supportata.

Osservazioni

Saperne di più:

Guarda anche