GetFormattedText

GetFormattedText(FormattedTextOptions)

Estrae un testo formattato dal documento.

public TextReader GetFormattedText(FormattedTextOptions options)
Parametro Tipo Descrizione
options FormattedTextOptions Le opzioni di estrazione del testo formattato.

Valore di ritorno

Un’istanza diTextReader classe con il testo estratto; nullo se l’estrazione del testo formattato non è supportata.

Osservazioni

Saperne di più:

Esempi

L’esempio seguente mostra come estrarre il testo di un documento come testo HTML:

// Crea un'istanza della classe Parser
using (Parser parser = new Parser(filePath))
{
    // Estrai un testo formattato nel lettore
    using (TextReader reader = parser.GetFormattedText(new FormattedTextOptions(FormattedTextMode.Html)))
    {
        // Stampa un testo formattato dal documento
        // Se l'estrazione del testo formattato non è supportata, un lettore è nullo
        Console.WriteLine(reader == null ? "Formatted text extraction isn't suppported" : reader.ReadToEnd());
    }
}

Guarda anche


GetFormattedText(int, FormattedTextOptions)

Estrae un testo formattato dalla pagina del documento.

public TextReader GetFormattedText(int pageIndex, FormattedTextOptions options)
Parametro Tipo Descrizione
pageIndex Int32 L’indice della pagina in base zero.
options FormattedTextOptions Le opzioni di estrazione del testo formattato.

Valore di ritorno

Un’istanza diTextReaderclasse con il testo estratto; nullo se l’estrazione della pagina di testo formattato non è supportata.

Osservazioni

Saperne di più:

Esempi

L’esempio seguente mostra come estrarre il testo di una pagina del documento come testo Markdown:

// Crea un'istanza della classe Parser
using (Parser parser = new Parser(filePath))
{
    // Controlla se il documento supporta l'estrazione di testo formattato
    if (!parser.Features.FormattedText)
    {
        Console.WriteLine("Document isn't supports formatted text extraction.");
        return;
    }
    
    // Ottieni le informazioni sul documento
    IDocumentInfo documentInfo = parser.GetDocumentInfo();
    // Controlla se il documento ha pagine
    if (documentInfo.PageCount == 0)
    {
        Console.WriteLine("Document hasn't pages.");
        return;
    }
    
    // Itera sulle pagine
    for (int p = 0; p<documentInfo.PageCount; p++)
    {
        // Stampa un numero di pagina 
        Console.WriteLine(string.Format("Page {0}/{1}", p + 1, documentInfo.PageCount));
        // Estrai un testo formattato nel lettore
        using (TextReader reader = parser.GetFormattedText(p, new FormattedTextOptions(FormattedTextMode.Markdown)))
        {
            // Stampa un testo formattato dal documento
            // Ignoriamo il controllo null poiché abbiamo controllato in precedenza il supporto della funzione di estrazione del testo formattato
            Console.WriteLine(reader.ReadToEnd());
        }
    }
}

Guarda anche