特定のファイル形式の読み込み

導入

.NET 開発の世界では、さまざまなファイル形式からテキストを解析して抽出することが一般的な要件です。GroupDocs.Parser for .NET は、このタスクを簡素化する強力なツールを提供します。このチュートリアルでは、GroupDocs.Parser を使用して特定のファイル形式からテキストを読み込み、抽出する手順を段階的に説明します。

前提条件

このチュートリアルに進む前に、次のものを用意してください。

  • C# および .NET 開発に関する基本的な知識。
  • Visual Studio または .NET 開発用の別の IDE がインストールされています。
  • GroupDocs.Parser for .NETライブラリ。ここからダウンロードできます。ここ.
  • サポートされている形式 (Word、PDF、Markdown など) のいずれかのサンプル ファイル。

名前空間のインポート

まず、C# ファイルに必要な名前空間を追加します。

using System;
using System.Collections.Generic;
using System.IO;
using System.Text;
using GroupDocs.Parser.Options;

特定のファイル形式からテキストを読み込んで抽出するには、次の手順に従います。

ステップ1: ファイルストリームを開く

まず、サンプル ファイルへのストリームを開きます。

using (Stream stream = File.OpenRead("YourSampleFile.docx"))
{
    //次のステップに進む
}

交換する"YourSampleFile.docx"サンプル ファイルへのパスを指定します。

ステップ2: パーサーインスタンスを作成する

インスタンス化するParser開かれたストリームを持つクラスを作成し、ファイル形式を指定します。

using (Parser parser = new Parser(stream, new LoadOptions(FileFormat.Docx)))
{
    //次のステップに進む
}

交換するFileFormat.Docxサンプルファイルに基づいて適切なファイル形式の列挙体(例:FileFormat.Pdf, FileFormat.Markup Markdown 用)。

ステップ3: テキスト抽出のサポートを確認する

読み込まれたファイル形式でテキスト抽出がサポートされているかどうかを確認します。

if (!parser.Features.Text)
{
    Console.WriteLine("Text extraction isn't supported.");
    return;
}

ステップ4: ドキュメントからテキストを抽出する

使用parser.GetText()取得するTextReaderインスタンスを作成し、抽出したテキストを読み取ります。

using (TextReader reader = parser.GetText())
{
    string extractedText = reader.ReadToEnd();
    Console.WriteLine(extractedText);
}

結論

GroupDocs.Parser for .NET は、さまざまなファイル形式からのテキスト抽出を簡素化し、C# アプリケーションで効率的なドキュメント処理を可能にします。このチュートリアルでは、GroupDocs.Parser を使用して特定のファイル形式を読み込み、テキストを抽出する方法を学習しました。

よくある質問

GroupDocs.Parser for .NET は無料で使用できますか?

GroupDocs.Parser for .NETには無料と有料のライセンスオプションがあります。ここ.

GroupDocs.Parser for .NET ではどのファイル形式がサポートされていますか?

GroupDocs.Parserは、Word、PDF、Excel、PowerPoint、Markdownなど、幅広いファイル形式をサポートしています。ドキュメントを参照してください。ここ完全なリストについてはこちらをご覧ください。

購入前に GroupDocs.Parser for .NET を試すことはできますか?

はい、無料試用版をご利用いただけますここ.

GroupDocs.Parser for .NET に関するサポートや質問はどこで受けられますか?

GroupDocs.Parser フォーラムにアクセスしてくださいここご質問やサポートが必要な場合は、

GroupDocs.Parser for .NET の一時ライセンスを取得するにはどうすればよいですか?

臨時免許証を取得できますここ.