GetText
コンテンツ
[
隠れる
]
GetText()
ドキュメントからテキストを抽出します。
public TextReader GetText()
戻り値
のインスタンスTextReader抽出されたテキストを持つクラス; ヌル
テキスト抽出がサポートされていない場合.
備考
もっと詳しく知る:
例
次の例は、ドキュメントからテキストを抽出する方法を示しています。
// Parser クラスのインスタンスを作成します
using(Parser parser = new Parser(filePath))
{
// テキストをリーダーに抽出します
using(TextReader reader = parser.GetText())
{
// ドキュメントからテキストを出力します
// テキスト抽出がサポートされていない場合、リーダーは null
Console.WriteLine(reader == null ? "Text extraction isn't supported" : reader.ReadToEnd());
}
}
関連項目
- class Parser
- 名前空間 GroupDocs.Parser
- 組み立て GroupDocs.Parser
GetText(TextOptions)
テキスト オプションを使用してドキュメントからテキスト ページを抽出します (生の高速テキスト抽出モードを有効にするため)。
public TextReader GetText(TextOptions options)
パラメータ | タイプ | 説明 |
---|---|---|
options | TextOptions | テキスト抽出オプション。 |
戻り値
のインスタンスTextReader抽出されたテキストを持つクラス; ヌル
テキスト抽出がサポートされていない場合.
備考
もっと詳しく知る:
例
次の例は、ドキュメントから生のテキストを抽出する方法を示しています。
// Parser クラスのインスタンスを作成します
using(Parser parser = new Parser(filePath))
{
// 生のテキストをリーダーに抽出します
using(TextReader reader = parser.GetText(new TextOptions(true)))
{
// ドキュメントからテキストを出力します
// テキスト抽出がサポートされていない場合、リーダーは null
Console.WriteLine(reader == null ? "Text extraction isn't supported" : reader.ReadToEnd());
}
}
関連項目
- class TextOptions
- class Parser
- 名前空間 GroupDocs.Parser
- 組み立て GroupDocs.Parser
GetText(int)
ドキュメント ページからテキストを抽出します。
public TextReader GetText(int pageIndex)
パラメータ | タイプ | 説明 |
---|---|---|
pageIndex | Int32 | ゼロベースのページ インデックス。 |
戻り値
のインスタンスTextReader抽出されたテキストを持つクラス; ヌル
テキスト ページの抽出がサポートされていない場合.
備考
もっと詳しく知る:
例
次の例は、ドキュメント ページからテキストを抽出する方法を示しています。
// Parser クラスのインスタンスを作成します
using(Parser parser = new Parser(filePath))
{
// ドキュメントがテキスト抽出をサポートしているかどうかを確認します
if(!parser.Features.Text)
{
Console.WriteLine("Document isn't supports text extraction.");
return;
}
// ドキュメント情報を取得する
IDocumentInfo documentInfo = parser.GetDocumentInfo();
// ドキュメントにページがあるかどうかを確認します
if(documentInfo.PageCount == 0)
{
Console.WriteLine("Document hasn't pages.");
return;
}
// ページを繰り返す
for(int p = 0; p<documentInfo.PageCount; p++)
{
// ページ番号を出力
Console.WriteLine(string.Format("Page {0}/{1}", p + 1, documentInfo.PageCount));
// テキストをリーダーに抽出します
using(TextReader reader = parser.GetText(p))
{
// ドキュメントからテキストを出力します
// テキスト抽出機能のサポートを以前に確認したため、null チェックは無視します
Console.WriteLine(reader.ReadToEnd());
}
}
}
関連項目
- class Parser
- 名前空間 GroupDocs.Parser
- 組み立て GroupDocs.Parser
GetText(int, TextOptions)
テキスト オプションを使用してドキュメント ページからテキストを抽出します (生の高速テキスト抽出モードを有効にするため)。
public TextReader GetText(int pageIndex, TextOptions options)
パラメータ | タイプ | 説明 |
---|---|---|
pageIndex | Int32 | ゼロベースのページ インデックス。 |
options | TextOptions | テキスト抽出オプション。 |
戻り値
のインスタンスTextReader抽出されたテキストを持つクラス; ヌル
テキスト ページの抽出がサポートされていない場合.
備考
もっと詳しく知る:
例
次の例は、ドキュメント ページから未加工のテキストを抽出する方法を示しています。
// Parser クラスのインスタンスを作成します
using(Parser parser = new Parser(filePath))
{
// ドキュメントがテキスト抽出をサポートしているかどうかを確認します
if(!parser.Features.Text)
{
Console.WriteLine("Document isn't supports text extraction.");
return;
}
// ドキュメント情報を取得する
DocumentInfo documentInfo = parser.GetDocumentInfo() as DocumentInfo;
// ドキュメントにページがあるかどうかを確認します
if(documentInfo == null || documentInfo.RawPageCount == 0)
{
Console.WriteLine("Document hasn't pages.");
return;
}
// ページを繰り返す
for(int p = 0; p<documentInfo.RawPageCount; p++)
{
// ページ番号を出力
Console.WriteLine(string.Format("Page {0}/{1}", p + 1, documentInfo.RawPageCount));
// テキストをリーダーに抽出します
using(TextReader reader = parser.GetText(p, new TextOptions(true)))
{
// ドキュメントからテキストを出力します
// テキスト抽出機能のサポートを以前に確認したため、null チェックは無視します
Console.WriteLine(reader.ReadToEnd());
}
}
}
関連項目
- class TextOptions
- class Parser
- 名前空間 GroupDocs.Parser
- 組み立て GroupDocs.Parser