GetText

GetText()

ドキュメントからテキストを抽出します。

public TextReader GetText()

戻り値

のインスタンスTextReader抽出されたテキストを持つクラス; ヌルテキスト抽出がサポートされていない場合.

備考

もっと詳しく知る：

例

次の例は、ドキュメントからテキストを抽出する方法を示しています。

// Parser クラスのインスタンスを作成します
using(Parser parser = new Parser(filePath))
{
    // テキストをリーダーに抽出します
    using(TextReader reader = parser.GetText())
    {
        // ドキュメントからテキストを出力します
        // テキスト抽出がサポートされていない場合、リーダーは null
        Console.WriteLine(reader == null ? "Text extraction isn't supported" : reader.ReadToEnd());
    }
}

GetText(TextOptions)

テキストオプションを使用してドキュメントからテキストページを抽出します (生の高速テキスト抽出モードを有効にするため)。

public TextReader GetText(TextOptions options)

パラメータ	タイプ	説明
options	TextOptions	テキスト抽出オプション。

戻り値

のインスタンスTextReader抽出されたテキストを持つクラス; ヌルテキスト抽出がサポートされていない場合.

備考

もっと詳しく知る：

例

次の例は、ドキュメントから生のテキストを抽出する方法を示しています。

// Parser クラスのインスタンスを作成します
using(Parser parser = new Parser(filePath))
{
    // 生のテキストをリーダーに抽出します
    using(TextReader reader = parser.GetText(new TextOptions(true)))
    {
        // ドキュメントからテキストを出力します
        // テキスト抽出がサポートされていない場合、リーダーは null
        Console.WriteLine(reader == null ? "Text extraction isn't supported" : reader.ReadToEnd());
    }
}

GetText(int)

ドキュメントページからテキストを抽出します。

public TextReader GetText(int pageIndex)

パラメータ	タイプ	説明
pageIndex	Int32	ゼロベースのページインデックス。

戻り値

のインスタンスTextReader抽出されたテキストを持つクラス; ヌルテキストページの抽出がサポートされていない場合.

備考

もっと詳しく知る：

正確なモードでテキストを抽出する

例

次の例は、ドキュメントページからテキストを抽出する方法を示しています。

// Parser クラスのインスタンスを作成します
using(Parser parser = new Parser(filePath))
{
    // ドキュメントがテキスト抽出をサポートしているかどうかを確認します
    if(!parser.Features.Text)
    {
        Console.WriteLine("Document isn't supports text extraction.");
        return;
    }

    // ドキュメント情報を取得する
    IDocumentInfo documentInfo = parser.GetDocumentInfo();
    // ドキュメントにページがあるかどうかを確認します
    if(documentInfo.PageCount == 0)
    {
        Console.WriteLine("Document hasn't pages.");
        return;
    }
 
    // ページを繰り返す
    for(int p = 0; p<documentInfo.PageCount; p++)
    {
        // ページ番号を出力 
        Console.WriteLine(string.Format("Page {0}/{1}", p + 1, documentInfo.PageCount));
 
        // テキストをリーダーに抽出します
        using(TextReader reader = parser.GetText(p))
        {
            // ドキュメントからテキストを出力します
            // テキスト抽出機能のサポートを以前に確認したため、null チェックは無視します
            Console.WriteLine(reader.ReadToEnd());
        }
    }
}

GetText(int, TextOptions)

テキストオプションを使用してドキュメントページからテキストを抽出します (生の高速テキスト抽出モードを有効にするため)。

public TextReader GetText(int pageIndex, TextOptions options)

パラメータ	タイプ	説明
pageIndex	Int32	ゼロベースのページインデックス。
options	TextOptions	テキスト抽出オプション。

戻り値

のインスタンスTextReader抽出されたテキストを持つクラス; ヌルテキストページの抽出がサポートされていない場合.

備考

もっと詳しく知る：

例

次の例は、ドキュメントページから未加工のテキストを抽出する方法を示しています。

// Parser クラスのインスタンスを作成します
using(Parser parser = new Parser(filePath))
{
    // ドキュメントがテキスト抽出をサポートしているかどうかを確認します
    if(!parser.Features.Text)
    {
        Console.WriteLine("Document isn't supports text extraction.");
        return;
    }

    // ドキュメント情報を取得する
    DocumentInfo documentInfo = parser.GetDocumentInfo() as DocumentInfo;
    // ドキュメントにページがあるかどうかを確認します
    if(documentInfo == null || documentInfo.RawPageCount == 0)
    {
        Console.WriteLine("Document hasn't pages.");
        return;
    }
 
    // ページを繰り返す
    for(int p = 0; p<documentInfo.RawPageCount; p++)
    {
        // ページ番号を出力 
        Console.WriteLine(string.Format("Page {0}/{1}", p + 1, documentInfo.RawPageCount));
 
        // テキストをリーダーに抽出します
        using(TextReader reader = parser.GetText(p, new TextOptions(true)))
        {
            // ドキュメントからテキストを出力します
            // テキスト抽出機能のサポートを以前に確認したため、null チェックは無視します
            Console.WriteLine(reader.ReadToEnd());
        }
    }
}

GetText

GetText()

戻り値

備考

例

関連項目

GetText(TextOptions)

戻り値

備考

例

関連項目

GetText(int)

戻り値

備考

例

関連項目

GetText(int, TextOptions)

戻り値

備考

例

関連項目