GetFormattedText
Contenido
[
Ocultar
]
GetFormattedText(FormattedTextOptions)
Extrae un texto formateado del documento.
public TextReader GetFormattedText(FormattedTextOptions options)
Parámetro | Escribe | Descripción |
---|---|---|
options | FormattedTextOptions | Las opciones de extracción de texto formateado. |
Valor_devuelto
Una instancia deTextReader clase con el texto extraído; nulo
si la extracción de texto con formato no es compatible.
Observaciones
Aprende más:
- Extraer texto formateado del documento
- Extraer un texto de documento comoHTML
- Extraer un texto de documento comoReducción
- Extraer un texto de documento comoTexto sin formato
Ejemplos
El siguiente ejemplo muestra cómo extraer el texto de un documento como texto HTML:
// Crea una instancia de la clase Parser
using (Parser parser = new Parser(filePath))
{
// Extraer un texto formateado en el lector
using (TextReader reader = parser.GetFormattedText(new FormattedTextOptions(FormattedTextMode.Html)))
{
// Imprime un texto formateado del documento
// Si no se admite la extracción de texto con formato, un lector es nulo
Console.WriteLine(reader == null ? "Formatted text extraction isn't suppported" : reader.ReadToEnd());
}
}
Ver también
- class FormattedTextOptions
- class Parser
- espacio de nombres GroupDocs.Parser
- asamblea GroupDocs.Parser
GetFormattedText(int, FormattedTextOptions)
Extrae un texto formateado de la página del documento.
public TextReader GetFormattedText(int pageIndex, FormattedTextOptions options)
Parámetro | Escribe | Descripción |
---|---|---|
pageIndex | Int32 | El índice de página de base cero. |
options | FormattedTextOptions | Las opciones de extracción de texto formateado. |
Valor_devuelto
Una instancia deTextReaderclase con el texto extraído; nulo
si no se admite la extracción de páginas de texto con formato.
Observaciones
Aprende más:
- Extraer texto formateado de la página del documento
- Extraer un texto de documento comoHTML
- Extraer un texto de documento comoReducción
- Extraer un texto de documento comoTexto sin formato
Ejemplos
El siguiente ejemplo muestra cómo extraer el texto de una página de documento como texto Markdown:
// Crea una instancia de la clase Parser
using (Parser parser = new Parser(filePath))
{
// Comprobar si el documento admite la extracción de texto formateado
if (!parser.Features.FormattedText)
{
Console.WriteLine("Document isn't supports formatted text extraction.");
return;
}
// Obtener la información del documento
IDocumentInfo documentInfo = parser.GetDocumentInfo();
// Comprobar si el documento tiene páginas
if (documentInfo.PageCount == 0)
{
Console.WriteLine("Document hasn't pages.");
return;
}
// Iterar sobre páginas
for (int p = 0; p<documentInfo.PageCount; p++)
{
// Imprimir un número de página
Console.WriteLine(string.Format("Page {0}/{1}", p + 1, documentInfo.PageCount));
// Extraer un texto formateado en el lector
using (TextReader reader = parser.GetFormattedText(p, new FormattedTextOptions(FormattedTextMode.Markdown)))
{
// Imprime un texto formateado del documento
// Ignoramos la comprobación de nulos ya que hemos comprobado anteriormente la compatibilidad con la función de extracción de texto formateado
Console.WriteLine(reader.ReadToEnd());
}
}
}
Ver también
- class FormattedTextOptions
- class Parser
- espacio de nombres GroupDocs.Parser
- asamblea GroupDocs.Parser