Parser

Parser class

Представляет основной класс, управляющий текстом, изображениями, извлечением контейнеров и функциями синтаксического анализа.

public sealed class Parser : IDisposable

Конструкторы

Имя Описание
Parser(DbConnection) Инициализирует новый экземплярParser класс для извлечения данных из базы данных.
Parser(EmailConnection) Инициализирует новый экземплярParser класс для извлечения данных с удаленного почтового сервера.
Parser(Stream) Инициализирует новый экземплярParser класс.
Parser(string) Инициализирует новый экземплярParser класс.
Parser(DbConnection, ParserSettings) Инициализирует новый экземплярParser класс для извлечения данных из базы данных.
Parser(EmailConnection, ParserSettings) Инициализирует новый экземплярParser класс для извлечения данных с удаленного почтового сервера.
Parser(Stream, LoadOptions) Инициализирует новый экземплярParser класс сLoadOptions .
Parser(Stream, ParserSettings) Инициализирует новый экземплярParser класс сParserSettings .
Parser(string, LoadOptions) Инициализирует новый экземплярParser класс сLoadOptions .
Parser(string, ParserSettings) Инициализирует новый экземплярParser класс сParserSettings .
Parser(Stream, LoadOptions, ParserSettings) Инициализирует новый экземплярParser класс сLoadOptions иParserSettings .
Parser(string, LoadOptions, ParserSettings) Инициализирует новый экземплярParser класс сLoadOptions иParserSettings .

Характеристики

Имя Описание
Features { get; } Получает поддерживаемые функции.

Методы

Имя Описание
Dispose() Выполняет определяемые приложением задачи, связанные с освобождением, высвобождением или сбросом неуправляемых ресурсов.
GeneratePreview(PreviewOptions) Получить предварительный просмотр страниц.
GetBarcodes() Извлекает штрих-коды из документа.
GetBarcodes(int) Извлекает штрих-коды со страницы документа.
GetBarcodes(PageAreaOptions) Извлекает штрих-коды из документа с помощью параметров настройки (для установки прямоугольной области, содержащей штрих-коды).
GetBarcodes(int, PageAreaOptions) Извлекает штрих-коды со страницы документа с помощью параметров настройки (для установки прямоугольной области, содержащей штрих-коды).
GetContainer() Извлекает объект-контейнер из документа для работы с форматами, содержащими вложения, ZIP-архивы и т. д.
GetDocumentInfo() Возвращает общую информацию о документе.
GetFormattedText(FormattedTextOptions) Извлекает форматированный текст из документа.
GetFormattedText(int, FormattedTextOptions) Извлекает форматированный текст со страницы документа.
GetHighlight(int, bool, HighlightOptions) Извлекает выделение из документа.
GetHyperlinks() Извлекает гиперссылки из документа.
GetHyperlinks(int) Извлекает гиперссылки со страницы документа.
GetHyperlinks(PageAreaOptions) Извлекает гиперссылки из документа с помощью параметров настройки (для установки прямоугольной области, содержащей гиперссылки).
GetHyperlinks(int, PageAreaOptions) Извлекает гиперссылки со страницы документа с помощью параметров настройки (для установки прямоугольной области, содержащей гиперссылки).
GetImages() Извлекает изображения из документа.
GetImages(int) Извлекает изображения со страницы документа.
GetImages(PageAreaOptions) Извлекает изображения из документа с помощью параметров настройки (для установки прямоугольной области, содержащей изображения).
GetImages(int, PageAreaOptions) Извлекает изображения со страницы документа с помощью параметров настройки (для установки прямоугольной области, содержащей изображения).
GetMetadata() Извлекает метаданные из документа.
GetStructure() Извлекает структурированный текст из документа.
GetTables(PageTableAreaOptions) Извлекает таблицы из документа.
GetTables(int, PageTableAreaOptions) Извлекает таблицы со страницы документа.
GetText() Извлекает текст из документа.
GetText(int) Извлекает текст со страницы документа.
GetText(TextOptions) Извлекает текстовую страницу из документа с помощью параметров текста (чтобы включить режим быстрого извлечения необработанного текста).
GetText(int, TextOptions) Извлекает текст со страницы документа с помощью параметров текста (чтобы включить режим быстрого извлечения необработанного текста).
GetTextAreas() Извлекает текстовые области из документа.
GetTextAreas(int) Извлекает текстовые области со страницы документа.
GetTextAreas(PageTextAreaOptions) Извлекает текстовые области из документа, используя параметры настройки (регулярное выражение, регистр и т. д.).
GetTextAreas(int, PageTextAreaOptions) Извлекает текстовые области со страницы документа, используя параметры настройки (регулярное выражение, регистр и т. д.).
GetToc() Извлекает оглавление из документа.
ParseByTemplate(Template) Разбирает документ по созданному пользователем шаблону.
ParseForm() Разбирает форму документа.
Search(string) Ищетkeyword в документе.
Search(string, SearchOptions) Ищетkeywordв документе с помощью параметров поиска (регулярное выражение, регистр и т. д.).
static GetFileInfo(Stream) Возвращает общую информацию о файле.
static GetFileInfo(string) Возвращает общую информацию о файле.
static GetFileInfo(Stream, LoadOptions) Возвращает общую информацию о файле.
static GetFileInfo(string, LoadOptions) Возвращает общую информацию о файле.

Смотрите также