Parser

Parser class

表示控制文本、图像、容器提取和解析功能的主类。

public sealed class Parser : IDisposable

构造函数

姓名 描述
Parser(DbConnection) 初始化一个新的实例Parser从数据库中提取数据的类。
Parser(EmailConnection) 初始化一个新的实例Parser从远程电子邮件服务器中提取数据的类。
Parser(Stream) 初始化一个新的实例Parser类.
Parser(string) 初始化一个新的实例Parser类.
Parser(DbConnection, ParserSettings) 初始化一个新的实例Parser从数据库中提取数据的类。
Parser(EmailConnection, ParserSettings) 初始化一个新的实例Parser从远程电子邮件服务器中提取数据的类。
Parser(Stream, LoadOptions) 初始化一个新的实例ParserLoadOptions.
Parser(Stream, ParserSettings) 初始化一个新的实例ParserParserSettings.
Parser(string, LoadOptions) 初始化一个新的实例ParserLoadOptions.
Parser(string, ParserSettings) 初始化一个新的实例ParserParserSettings.
Parser(Stream, LoadOptions, ParserSettings) 初始化一个新的实例ParserLoadOptionsParserSettings.
Parser(string, LoadOptions, ParserSettings) 初始化一个新的实例ParserLoadOptionsParserSettings.

特性

姓名 描述
Features { get; } 获取支持的功能。

方法

姓名 描述
Dispose() 执行与释放、释放或重置非托管资源相关的应用程序定义的任务。
GeneratePreview(PreviewOptions) 获取页面预览。
GetBarcodes() 从文档中提取条形码。
GetBarcodes(int) 从文档页面中提取条形码。
GetBarcodes(PageAreaOptions) 使用自定义选项从文档中提取条形码 (设置包含条形码的矩形区域)。
GetBarcodes(int, PageAreaOptions) 使用自定义选项从文档页面中提取条形码 (设置包含条形码的矩形区域)。
GetContainer() 从文档中提取容器对象以处理包含附件、ZIP 存档等的格式。
GetDocumentInfo() 返回有关文档的一般信息。
GetFormattedText(FormattedTextOptions) 从文档中提取格式化文本。
GetFormattedText(int, FormattedTextOptions) 从文档页面中提取格式化文本。
GetHighlight(int, bool, HighlightOptions) 从文档中提取突出显示。
GetHyperlinks() 从文档中提取超链接。
GetHyperlinks(int) 从文档页面中提取超链接。
GetHyperlinks(PageAreaOptions) 使用自定义选项从文档中提取超链接 (设置包含超链接的矩形区域)。
GetHyperlinks(int, PageAreaOptions) 使用自定义选项从文档页面中提取超链接 (设置包含超链接的矩形区域)。
GetImages() 从文档中提取图像。
GetImages(int) 从文档页面中提取图像。
GetImages(PageAreaOptions) 使用自定义选项从文档中提取图像 (设置包含图像的矩形区域)。
GetImages(int, PageAreaOptions) 使用自定义选项从文档页面中提取图像 (设置包含图像的矩形区域)。
GetMetadata() 从文档中提取元数据。
GetStructure() 从文档中提取结构化文本。
GetTables(PageTableAreaOptions) 从文档中提取表格。
GetTables(int, PageTableAreaOptions) 从文档页面中提取表格。
GetText() 从文档中提取文本。
GetText(int) 从文档页面中提取文本。
GetText(TextOptions) 使用文本选项从文档中提取文本页面(以启用原始快速文本提取模式)。
GetText(int, TextOptions) 使用文本选项从文档页面中提取文本(以启用原始快速文本提取模式)。
GetTextAreas() 从文档中提取文本区域。
GetTextAreas(int) 从文档页面中提取文本区域。
GetTextAreas(PageTextAreaOptions) 使用自定义选项(正则表达式、匹配大小写等)从文档中提取文本区域。
GetTextAreas(int, PageTextAreaOptions) 使用自定义选项(正则表达式、匹配大小写等)从文档页面中提取文本区域。
GetToc() 从文档中提取目录。
ParseByTemplate(Template) 通过用户生成的模板解析文档。
ParseForm() 解析文档格式。
Search(string) 搜索一个keyword在文档中.
Search(string, SearchOptions) 搜索一个keyword在文档中使用搜索选项(正则表达式、匹配大小写等)。
static GetFileInfo(Stream) 返回有关文件的一般信息。
static GetFileInfo(string) 返回有关文件的一般信息。
static GetFileInfo(Stream, LoadOptions) 返回有关文件的一般信息。
static GetFileInfo(string, LoadOptions) 返回有关文件的一般信息。

也可以看看