GetFormattedText
Contenuti
[
Nascondere
]
GetFormattedText(FormattedTextOptions)
Estrae un testo formattato dal documento.
public TextReader GetFormattedText(FormattedTextOptions options)
Parametro | Tipo | Descrizione |
---|---|---|
options | FormattedTextOptions | Le opzioni di estrazione del testo formattato. |
Valore di ritorno
Un’istanza diTextReader classe con il testo estratto; nullo
se l’estrazione del testo formattato non è supportata.
Osservazioni
Saperne di più:
- Estrai il testo formattato dal documento
- Estrarre un testo del documento comeHTML
- Estrarre un testo del documento comeRibasso
- Estrarre un testo del documento comeTesto semplice
Esempi
L’esempio seguente mostra come estrarre il testo di un documento come testo HTML:
// Crea un'istanza della classe Parser
using (Parser parser = new Parser(filePath))
{
// Estrai un testo formattato nel lettore
using (TextReader reader = parser.GetFormattedText(new FormattedTextOptions(FormattedTextMode.Html)))
{
// Stampa un testo formattato dal documento
// Se l'estrazione del testo formattato non è supportata, un lettore è nullo
Console.WriteLine(reader == null ? "Formatted text extraction isn't suppported" : reader.ReadToEnd());
}
}
Guarda anche
- class FormattedTextOptions
- class Parser
- spazio dei nomi GroupDocs.Parser
- assemblea GroupDocs.Parser
GetFormattedText(int, FormattedTextOptions)
Estrae un testo formattato dalla pagina del documento.
public TextReader GetFormattedText(int pageIndex, FormattedTextOptions options)
Parametro | Tipo | Descrizione |
---|---|---|
pageIndex | Int32 | L’indice della pagina in base zero. |
options | FormattedTextOptions | Le opzioni di estrazione del testo formattato. |
Valore di ritorno
Un’istanza diTextReaderclasse con il testo estratto; nullo
se l’estrazione della pagina di testo formattato non è supportata.
Osservazioni
Saperne di più:
- Estrai il testo formattato dalla pagina del documento
- Estrarre un testo del documento comeHTML
- Estrarre un testo del documento comeRibasso
- Estrarre un testo del documento comeTesto semplice
Esempi
L’esempio seguente mostra come estrarre il testo di una pagina del documento come testo Markdown:
// Crea un'istanza della classe Parser
using (Parser parser = new Parser(filePath))
{
// Controlla se il documento supporta l'estrazione di testo formattato
if (!parser.Features.FormattedText)
{
Console.WriteLine("Document isn't supports formatted text extraction.");
return;
}
// Ottieni le informazioni sul documento
IDocumentInfo documentInfo = parser.GetDocumentInfo();
// Controlla se il documento ha pagine
if (documentInfo.PageCount == 0)
{
Console.WriteLine("Document hasn't pages.");
return;
}
// Itera sulle pagine
for (int p = 0; p<documentInfo.PageCount; p++)
{
// Stampa un numero di pagina
Console.WriteLine(string.Format("Page {0}/{1}", p + 1, documentInfo.PageCount));
// Estrai un testo formattato nel lettore
using (TextReader reader = parser.GetFormattedText(p, new FormattedTextOptions(FormattedTextMode.Markdown)))
{
// Stampa un testo formattato dal documento
// Ignoriamo il controllo null poiché abbiamo controllato in precedenza il supporto della funzione di estrazione del testo formattato
Console.WriteLine(reader.ReadToEnd());
}
}
}
Guarda anche
- class FormattedTextOptions
- class Parser
- spazio dei nomi GroupDocs.Parser
- assemblea GroupDocs.Parser