GetFormattedText

GetFormattedText(FormattedTextOptions)

Mengekstrak teks yang diformat dari dokumen.

public TextReader GetFormattedText(FormattedTextOptions options)
Parameter Jenis Keterangan
options FormattedTextOptions Opsi ekstraksi teks yang diformat.

Nilai Pengembalian

Contoh dariTextReader kelas dengan teks yang diekstrak; batal jika ekstraksi teks berformat tidak didukung.

Perkataan

Belajarlah lagi:

Contoh

Contoh berikut menunjukkan cara mengekstrak teks dokumen sebagai teks HTML:

// Buat instance dari kelas Parser
using (Parser parser = new Parser(filePath))
{
    // Ekstrak teks yang diformat ke pembaca
    using (TextReader reader = parser.GetFormattedText(new FormattedTextOptions(FormattedTextMode.Html)))
    {
        // Cetak teks yang diformat dari dokumen
        // Jika ekstraksi teks berformat tidak didukung, pembaca adalah null
        Console.WriteLine(reader == null ? "Formatted text extraction isn't suppported" : reader.ReadToEnd());
    }
}

Lihat juga


GetFormattedText(int, FormattedTextOptions)

Mengekstrak teks yang diformat dari halaman dokumen.

public TextReader GetFormattedText(int pageIndex, FormattedTextOptions options)
Parameter Jenis Keterangan
pageIndex Int32 Indeks halaman berbasis nol.
options FormattedTextOptions Opsi ekstraksi teks yang diformat.

Nilai Pengembalian

Contoh dariTextReaderkelas dengan teks yang diekstraksi; batal jika ekstraksi halaman teks berformat tidak didukung.

Perkataan

Belajarlah lagi:

Contoh

Contoh berikut menunjukkan cara mengekstrak teks halaman dokumen sebagai teks Markdown:

// Buat instance dari kelas Parser
using (Parser parser = new Parser(filePath))
{
    // Periksa apakah dokumen mendukung ekstraksi teks berformat
    if (!parser.Features.FormattedText)
    {
        Console.WriteLine("Document isn't supports formatted text extraction.");
        return;
    }
    
    // Dapatkan info dokumen
    IDocumentInfo documentInfo = parser.GetDocumentInfo();
    // Periksa apakah dokumen memiliki halaman
    if (documentInfo.PageCount == 0)
    {
        Console.WriteLine("Document hasn't pages.");
        return;
    }
    
    // Ulangi beberapa halaman
    for (int p = 0; p<documentInfo.PageCount; p++)
    {
        // Cetak nomor halaman 
        Console.WriteLine(string.Format("Page {0}/{1}", p + 1, documentInfo.PageCount));
        // Ekstrak teks yang diformat ke pembaca
        using (TextReader reader = parser.GetFormattedText(p, new FormattedTextOptions(FormattedTextMode.Markdown)))
        {
            // Cetak teks yang diformat dari dokumen
            // Kami mengabaikan pemeriksaan nol karena kami telah memeriksa dukungan fitur ekstraksi teks berformat sebelumnya
            Console.WriteLine(reader.ReadToEnd());
        }
    }
}

Lihat juga