GetText
GetText()
Извлекает текст из документа.
public TextReader GetText()
Возвращаемое значение
ЭкземплярTextReader класс с извлеченным текстом; нулевой если извлечение текста не поддерживается.
Примечания
Узнать больше:
Примеры
В следующем примере показано, как извлечь текст из документа:
// Создаем экземпляр класса Parser
using(Parser parser = new Parser(filePath))
{
    // Извлечь текст в ридер
    using(TextReader reader = parser.GetText())
    {
        // Печатаем текст из документа
        // Если извлечение текста не поддерживается, читатель имеет значение null
        Console.WriteLine(reader == null ? "Text extraction isn't supported" : reader.ReadToEnd());
    }
}
Смотрите также
- class Parser
 - пространство имен GroupDocs.Parser
 - сборка GroupDocs.Parser
 
GetText(TextOptions)
Извлекает текстовую страницу из документа с помощью параметров текста (чтобы включить режим быстрого извлечения необработанного текста).
public TextReader GetText(TextOptions options)
| Параметр | Тип | Описание | 
|---|---|---|
| options | TextOptions | Параметры извлечения текста. | 
Возвращаемое значение
ЭкземплярTextReader класс с извлеченным текстом; нулевой если извлечение текста не поддерживается.
Примечания
Узнать больше:
Примеры
В следующем примере показано, как извлечь необработанный текст из документа:
// Создаем экземпляр класса Parser
using(Parser parser = new Parser(filePath))
{
    // Извлечь необработанный текст в ридер
    using(TextReader reader = parser.GetText(new TextOptions(true)))
    {
        // Печатаем текст из документа
        // Если извлечение текста не поддерживается, читатель имеет значение null
        Console.WriteLine(reader == null ? "Text extraction isn't supported" : reader.ReadToEnd());
    }
}
Смотрите также
- class TextOptions
 - class Parser
 - пространство имен GroupDocs.Parser
 - сборка GroupDocs.Parser
 
GetText(int)
Извлекает текст со страницы документа.
public TextReader GetText(int pageIndex)
| Параметр | Тип | Описание | 
|---|---|---|
| pageIndex | Int32 | Индекс страницы с отсчетом от нуля. | 
Возвращаемое значение
ЭкземплярTextReader класс с извлеченным текстом; нулевой если извлечение текстовой страницы не поддерживается.
Примечания
Узнать больше:
Примеры
В следующем примере показано, как извлечь текст со страницы документа:
// Создаем экземпляр класса Parser
using(Parser parser = new Parser(filePath))
{
    // Проверяем, поддерживает ли документ извлечение текста
    if(!parser.Features.Text)
    {
        Console.WriteLine("Document isn't supports text extraction.");
        return;
    }
    // Получить информацию о документе
    IDocumentInfo documentInfo = parser.GetDocumentInfo();
    // Проверяем, есть ли в документе страницы
    if(documentInfo.PageCount == 0)
    {
        Console.WriteLine("Document hasn't pages.");
        return;
    }
 
    // Перебираем страницы
    for(int p = 0; p<documentInfo.PageCount; p++)
    {
        // Печатаем номер страницы 
        Console.WriteLine(string.Format("Page {0}/{1}", p + 1, documentInfo.PageCount));
 
        // Извлечь текст в ридер
        using(TextReader reader = parser.GetText(p))
        {
            // Печатаем текст из документа
            // Мы игнорируем проверку на null, так как мы проверили поддержку функции извлечения текста ранее
            Console.WriteLine(reader.ReadToEnd());
        }
    }
}
Смотрите также
- class Parser
 - пространство имен GroupDocs.Parser
 - сборка GroupDocs.Parser
 
GetText(int, TextOptions)
Извлекает текст со страницы документа с помощью параметров текста (чтобы включить режим быстрого извлечения необработанного текста).
public TextReader GetText(int pageIndex, TextOptions options)
| Параметр | Тип | Описание | 
|---|---|---|
| pageIndex | Int32 | Индекс страницы с отсчетом от нуля. | 
| options | TextOptions | Параметры извлечения текста. | 
Возвращаемое значение
ЭкземплярTextReader класс с извлеченным текстом; нулевой если извлечение текстовой страницы не поддерживается.
Примечания
Узнать больше:
Примеры
В следующем примере показано, как извлечь необработанный текст со страницы документа:
// Создаем экземпляр класса Parser
using(Parser parser = new Parser(filePath))
{
    // Проверяем, поддерживает ли документ извлечение текста
    if(!parser.Features.Text)
    {
        Console.WriteLine("Document isn't supports text extraction.");
        return;
    }
    // Получить информацию о документе
    DocumentInfo documentInfo = parser.GetDocumentInfo() as DocumentInfo;
    // Проверяем, есть ли в документе страницы
    if(documentInfo == null || documentInfo.RawPageCount == 0)
    {
        Console.WriteLine("Document hasn't pages.");
        return;
    }
 
    // Перебираем страницы
    for(int p = 0; p<documentInfo.RawPageCount; p++)
    {
        // Печатаем номер страницы 
        Console.WriteLine(string.Format("Page {0}/{1}", p + 1, documentInfo.RawPageCount));
 
        // Извлечь текст в ридер
        using(TextReader reader = parser.GetText(p, new TextOptions(true)))
        {
            // Печатаем текст из документа
            // Мы игнорируем проверку на null, так как мы проверили поддержку функции извлечения текста ранее
            Console.WriteLine(reader.ReadToEnd());
        }
    }
}
Смотрите также
- class TextOptions
 - class Parser
 - пространство имен GroupDocs.Parser
 - сборка GroupDocs.Parser