GetFormattedText
Contenu
[
Cacher
]
GetFormattedText(FormattedTextOptions)
Extrait un texte formaté du document.
public TextReader GetFormattedText(FormattedTextOptions options)
Paramètre | Taper | La description |
---|---|---|
options | FormattedTextOptions | Les options d’extraction de texte formaté. |
Return_Value
Une instance deTextReader classe avec le texte extrait ; nul
si l’extraction de texte formaté n’est pas prise en charge.
Remarques
Apprendre encore plus:
- Extraire le texte formaté du document
- Extraire un texte de document commeHTML
- Extraire un texte de document commeRéduction
- Extraire un texte de document commeTexte brut
Exemples
L’exemple suivant montre comment extraire le texte d’un document sous forme de texte HTML :
// Crée une instance de la classe Parser
using (Parser parser = new Parser(filePath))
{
// Extraction d'un texte formaté dans le lecteur
using (TextReader reader = parser.GetFormattedText(new FormattedTextOptions(FormattedTextMode.Html)))
{
// Affiche un texte formaté à partir du document
// Si l'extraction de texte formaté n'est pas supportée, un lecteur est nul
Console.WriteLine(reader == null ? "Formatted text extraction isn't suppported" : reader.ReadToEnd());
}
}
Voir également
- class FormattedTextOptions
- class Parser
- espace de noms GroupDocs.Parser
- Assemblée GroupDocs.Parser
GetFormattedText(int, FormattedTextOptions)
Extrait un texte formaté de la page du document.
public TextReader GetFormattedText(int pageIndex, FormattedTextOptions options)
Paramètre | Taper | La description |
---|---|---|
pageIndex | Int32 | L’index de page de base zéro. |
options | FormattedTextOptions | Les options d’extraction de texte formaté. |
Return_Value
Une instance deTextReaderclasse avec le texte extrait ; nul
si l’extraction de page de texte formatée n’est pas prise en charge.
Remarques
Apprendre encore plus:
- Extraire le texte formaté de la page du document
- Extraire un texte de document commeHTML
- Extraire un texte de document commeRéduction
- Extraire un texte de document commeTexte brut
Exemples
L’exemple suivant montre comment extraire le texte d’une page de document sous forme de texte Markdown :
// Crée une instance de la classe Parser
using (Parser parser = new Parser(filePath))
{
// Vérifie si le document prend en charge l'extraction de texte formaté
if (!parser.Features.FormattedText)
{
Console.WriteLine("Document isn't supports formatted text extraction.");
return;
}
// Récupère les informations sur le document
IDocumentInfo documentInfo = parser.GetDocumentInfo();
// Vérifie si le document contient des pages
if (documentInfo.PageCount == 0)
{
Console.WriteLine("Document hasn't pages.");
return;
}
// Itérer sur les pages
for (int p = 0; p<documentInfo.PageCount; p++)
{
// Imprimer un numéro de page
Console.WriteLine(string.Format("Page {0}/{1}", p + 1, documentInfo.PageCount));
// Extraction d'un texte formaté dans le lecteur
using (TextReader reader = parser.GetFormattedText(p, new FormattedTextOptions(FormattedTextMode.Markdown)))
{
// Affiche un texte formaté à partir du document
// Nous ignorons la vérification nulle car nous avons vérifié précédemment la prise en charge de la fonctionnalité d'extraction de texte formaté
Console.WriteLine(reader.ReadToEnd());
}
}
}
Voir également
- class FormattedTextOptions
- class Parser
- espace de noms GroupDocs.Parser
- Assemblée GroupDocs.Parser