GetFormattedText

GetFormattedText(FormattedTextOptions)

Extrahiert einen formatierten Text aus dem Dokument.

public TextReader GetFormattedText(FormattedTextOptions options)
Parameter Typ Beschreibung
options FormattedTextOptions Die Extraktionsoptionen für formatierten Text.

Rückgabewert

Eine Instanz vonTextReader Klasse mit dem extrahierten Text; Null wenn die Extraktion von formatiertem Text nicht unterstützt wird.

Bemerkungen

Erfahren Sie mehr:

Beispiele

Das folgende Beispiel zeigt, wie Sie einen Dokumenttext als HTML-Text extrahieren:

// Erstellen Sie eine Instanz der Parser-Klasse
using (Parser parser = new Parser(filePath))
{
    // Einen formatierten Text in den Reader extrahieren
    using (TextReader reader = parser.GetFormattedText(new FormattedTextOptions(FormattedTextMode.Html)))
    {
        // Einen formatierten Text aus dem Dokument drucken
        // Wenn die Extraktion von formatiertem Text nicht unterstützt wird, ist ein Reader null
        Console.WriteLine(reader == null ? "Formatted text extraction isn't suppported" : reader.ReadToEnd());
    }
}

Siehe auch


GetFormattedText(int, FormattedTextOptions)

Extrahiert einen formatierten Text aus der Dokumentseite.

public TextReader GetFormattedText(int pageIndex, FormattedTextOptions options)
Parameter Typ Beschreibung
pageIndex Int32 Der nullbasierte Seitenindex.
options FormattedTextOptions Die Extraktionsoptionen für formatierten Text.

Rückgabewert

Eine Instanz vonTextReaderKlasse mit dem extrahierten Text; Null wenn die Extraktion formatierter Textseiten nicht unterstützt wird.

Bemerkungen

Erfahren Sie mehr:

Beispiele

Das folgende Beispiel zeigt, wie Sie einen Dokumentseitentext als Markdown-Text extrahieren:

// Erstellen Sie eine Instanz der Parser-Klasse
using (Parser parser = new Parser(filePath))
{
    // Prüfen Sie, ob das Dokument die Extraktion von formatiertem Text unterstützt
    if (!parser.Features.FormattedText)
    {
        Console.WriteLine("Document isn't supports formatted text extraction.");
        return;
    }
    
    // Holen Sie sich die Dokumentinformationen
    IDocumentInfo documentInfo = parser.GetDocumentInfo();
    // Prüfe, ob das Dokument Seiten hat
    if (documentInfo.PageCount == 0)
    {
        Console.WriteLine("Document hasn't pages.");
        return;
    }
    
    // Über Seiten iterieren
    for (int p = 0; p<documentInfo.PageCount; p++)
    {
        // Eine Seitenzahl drucken 
        Console.WriteLine(string.Format("Page {0}/{1}", p + 1, documentInfo.PageCount));
        // Einen formatierten Text in den Reader extrahieren
        using (TextReader reader = parser.GetFormattedText(p, new FormattedTextOptions(FormattedTextMode.Markdown)))
        {
            // Einen formatierten Text aus dem Dokument drucken
            // Wir ignorieren die Nullprüfung, da wir zuvor die Unterstützung für die Funktion zum Extrahieren von formatiertem Text überprüft haben
            Console.WriteLine(reader.ReadToEnd());
        }
    }
}

Siehe auch