Parser

Parser class

Représente la classe principale qui contrôle le texte, les images, l’extraction de conteneurs et la fonctionnalité d’analyse.

public sealed class Parser : IDisposable

Constructeurs

Nom La description
Parser(DbConnection) Initialise une nouvelle instance duParser classe pour extraire des données d’une base de données.
Parser(EmailConnection) Initialise une nouvelle instance duParser classe pour extraire les données d’un serveur de messagerie distant.
Parser(Stream) Initialise une nouvelle instance duParser classe.
Parser(string) Initialise une nouvelle instance duParser classe.
Parser(DbConnection, ParserSettings) Initialise une nouvelle instance duParser classe pour extraire des données d’une base de données.
Parser(EmailConnection, ParserSettings) Initialise une nouvelle instance duParser classe pour extraire les données d’un serveur de messagerie distant.
Parser(Stream, LoadOptions) Initialise une nouvelle instance duParser classe avecLoadOptions .
Parser(Stream, ParserSettings) Initialise une nouvelle instance duParser classe avecParserSettings .
Parser(string, LoadOptions) Initialise une nouvelle instance duParser classe avecLoadOptions .
Parser(string, ParserSettings) Initialise une nouvelle instance duParser classe avecParserSettings .
Parser(Stream, LoadOptions, ParserSettings) Initialise une nouvelle instance duParser classe avecLoadOptions etParserSettings .
Parser(string, LoadOptions, ParserSettings) Initialise une nouvelle instance duParser classe avecLoadOptions etParserSettings .

Propriétés

Nom La description
Features { get; } Obtient les fonctionnalités prises en charge.

Méthodes

Nom La description
Dispose() Effectue des tâches définies par l’application associées à la libération, à la libération ou à la réinitialisation des ressources non gérées.
GeneratePreview(PreviewOptions) Obtenir un aperçu des pages.
GetBarcodes() Extrait les codes-barres du document.
GetBarcodes(int) Extrait les codes-barres de la page du document.
GetBarcodes(PageAreaOptions) Extrait les codes-barres du document à l’aide des options de personnalisation (pour définir la zone rectangulaire contenant les codes-barres).
GetBarcodes(int, PageAreaOptions) Extrait les codes-barres de la page du document à l’aide des options de personnalisation (pour définir la zone rectangulaire contenant les codes-barres).
GetContainer() Extrait un objet conteneur du document pour travailler avec des formats contenant des pièces jointes, des archives ZIP, etc.
GetDocumentInfo() Renvoie les informations générales sur le document.
GetFormattedText(FormattedTextOptions) Extrait un texte formaté du document.
GetFormattedText(int, FormattedTextOptions) Extrait un texte formaté de la page du document.
GetHighlight(int, bool, HighlightOptions) Extrait une surbrillance du document.
GetHyperlinks() Extrait les hyperliens du document.
GetHyperlinks(int) Extrait les hyperliens de la page du document.
GetHyperlinks(PageAreaOptions) Extrait les hyperliens du document à l’aide des options de personnalisation (pour définir la zone rectangulaire contenant les hyperliens).
GetHyperlinks(int, PageAreaOptions) Extrait les hyperliens de la page du document à l’aide des options de personnalisation (pour définir la zone rectangulaire contenant les hyperliens).
GetImages() Extrait les images du document.
GetImages(int) Extrait les images de la page du document.
GetImages(PageAreaOptions) Extrait les images du document à l’aide des options de personnalisation (pour définir la zone rectangulaire contenant les images).
GetImages(int, PageAreaOptions) Extrait les images de la page du document à l’aide des options de personnalisation (pour définir la zone rectangulaire contenant les images).
GetMetadata() Extrait les métadonnées du document.
GetStructure() Extrait un texte structuré du document.
GetTables(PageTableAreaOptions) Extrait les tableaux du document.
GetTables(int, PageTableAreaOptions) Extrait les tableaux de la page du document.
GetText() Extrait un texte du document.
GetText(int) Extrait un texte de la page du document.
GetText(TextOptions) Extrait une page de texte du document à l’aide des options de texte (pour activer le mode d’extraction rapide de texte brut).
GetText(int, TextOptions) Extrait un texte de la page du document à l’aide des options de texte (pour activer le mode d’extraction rapide de texte brut).
GetTextAreas() Extrait des zones de texte du document.
GetTextAreas(int) Extrait les zones de texte de la page du document.
GetTextAreas(PageTextAreaOptions) Extrait des zones de texte du document à l’aide d’options de personnalisation (expression régulière, correspondance de casse, etc.).
GetTextAreas(int, PageTextAreaOptions) Extrait des zones de texte de la page du document à l’aide d’options de personnalisation (expression régulière, correspondance de casse, etc.).
GetToc() Extrait une table des matières du document.
ParseByTemplate(Template) Analyse le document par le modèle généré par l’utilisateur.
ParseForm() Analyse le formulaire de document.
Search(string) Recherche unkeyword dans le document.
Search(string, SearchOptions) Recherche unkeyworddans le document à l’aide des options de recherche (expression régulière, correspondance de casse, etc.).
static GetFileInfo(Stream) Renvoie les informations générales sur un fichier.
static GetFileInfo(string) Renvoie les informations générales sur un fichier.
static GetFileInfo(Stream, LoadOptions) Renvoie les informations générales sur un fichier.
static GetFileInfo(string, LoadOptions) Renvoie les informations générales sur un fichier.

Voir également