GetFormattedText

GetFormattedText(FormattedTextOptions)

استخراج نص منسق من المستند.

public TextReader GetFormattedText(FormattedTextOptions options)
معامل يكتب وصف
options FormattedTextOptions خيارات استخراج النص المنسق.

قيمة الإرجاع

مثيلTextReader فئة مع النص المستخرج باطل إذا كان استخراج النص المنسق غير مدعوم.

ملاحظات

يتعلم أكثر:

أمثلة

يوضح المثال التالي كيفية استخراج نص مستند كنص HTML:

// إنشاء مثيل لفئة المحلل اللغوي
using (Parser parser = new Parser(filePath))
{
    // استخراج نص منسق في القارئ
    using (TextReader reader = parser.GetFormattedText(new FormattedTextOptions(FormattedTextMode.Html)))
    {
        // طباعة نص منسق من المستند
        // إذا لم يكن استخراج النص المنسق مدعومًا ، يكون القارئ فارغًا
        Console.WriteLine(reader == null ? "Formatted text extraction isn't suppported" : reader.ReadToEnd());
    }
}

أنظر أيضا


GetFormattedText(int, FormattedTextOptions)

استخراج نص منسق من صفحة المستند.

public TextReader GetFormattedText(int pageIndex, FormattedTextOptions options)
معامل يكتب وصف
pageIndex Int32 فهرس الصفحات الصفري.
options FormattedTextOptions خيارات استخراج النص المنسق.

قيمة الإرجاع

مثيلTextReaderفئة مع النص المستخرج ؛ باطل إذا لم يتم دعم استخراج صفحة النص المنسق.

ملاحظات

يتعلم أكثر:

أمثلة

يوضح المثال التالي كيفية استخراج نص صفحة مستند كنص Markdown:

// إنشاء مثيل لفئة المحلل اللغوي
using (Parser parser = new Parser(filePath))
{
    // تحقق مما إذا كان المستند يدعم استخراج النص المنسق
    if (!parser.Features.FormattedText)
    {
        Console.WriteLine("Document isn't supports formatted text extraction.");
        return;
    }
    
    // احصل على معلومات المستند
    IDocumentInfo documentInfo = parser.GetDocumentInfo();
    // تحقق مما إذا كان المستند يحتوي على صفحات
    if (documentInfo.PageCount == 0)
    {
        Console.WriteLine("Document hasn't pages.");
        return;
    }
    
    // تكرار عبر الصفحات
    for (int p = 0; p<documentInfo.PageCount; p++)
    {
        // طباعة رقم الصفحة 
        Console.WriteLine(string.Format("Page {0}/{1}", p + 1, documentInfo.PageCount));
        // استخراج نص منسق في القارئ
        using (TextReader reader = parser.GetFormattedText(p, new FormattedTextOptions(FormattedTextMode.Markdown)))
        {
            // طباعة نص منسق من المستند
            // نتجاهل التحقق من القيم الخالية لأننا تحققنا من دعم ميزة استخراج النص المنسق مسبقًا
            Console.WriteLine(reader.ReadToEnd());
        }
    }
}

أنظر أيضا