스트림에서 문서 로드

소개

.NET 애플리케이션의 문서 처리 영역에서는 다양한 파일 형식에서 텍스트를 추출하는 것이 일반적인 요구 사항입니다. .NET용 GroupDocs.Parser는 다양한 범위의 문서에서 텍스트를 원활하게 구문 분석하고 추출할 수 있는 강력한 솔루션을 제공합니다. 이 튜토리얼에서는 GroupDocs.Parser를 활용하여 문서에서 텍스트를 추출하는 과정을 단계별로 안내합니다.

전제 조건

.NET용 GroupDocs.Parser를 사용하기 전에 다음이 설정되어 있는지 확인하세요.

  • 개발 환경: Visual Studio 또는 기타 .NET 개발 환경.
  • .NET용 GroupDocs.Parser 패키지: 다음에서 .NET용 GroupDocs.Parser 라이브러리를 다운로드하고 설치합니다.여기.
  • 문서 샘플: 텍스트 추출을 위한 샘플 문서를 준비합니다.

네임스페이스 가져오기

GroupDocs.Parser 기능에 액세스하려면 필요한 네임스페이스를 .NET 프로젝트로 가져오는 것부터 시작하세요.

using System;
using System.Collections.Generic;
using System.IO;
using System.Linq;
using System.Text;

다음 단계에서는 스트림에서 GroupDocs.Parser를 사용하여 문서에서 텍스트를 추출하는 방법을 보여줍니다.

1단계: 스트림에서 문서 로드

// 스트림 만들기
using (Stream stream = File.OpenRead("YourSampleFile.docx"))
{
    // 스트림을 사용하여 Parser 클래스의 인스턴스를 만듭니다.
    using (Parser parser = new Parser(stream))
    {
        // 리더로 텍스트 추출
        using (TextReader reader = parser.GetText())
        {
            // 문서의 텍스트 인쇄
            // 텍스트 추출이 지원되지 않으면 판독기는 null이 됩니다.
            Console.WriteLine(reader == null ? "Text extraction isn't supported" : reader.ReadToEnd());
        }
    }
}

이 예에서는 다음과 같습니다.

  • 문서 파일에 대한 파일 스트림을 엽니다(YourSampleFile.docx).
  • 초기화Parser 스트림이 있는 인스턴스입니다.
  • 사용parser.GetText() 검색하려면TextReader 추출된 텍스트가 포함되어 있습니다.
  • 해당 문서 형식에 대해 텍스트 추출이 지원되지 않는 경우 추출된 텍스트 또는 메시지를 인쇄합니다.

결론

.NET용 GroupDocs.Parser는 다양한 문서 형식에서 텍스트 추출을 단순화하여 개발자가 응용 프로그램 내에서 텍스트 콘텐츠를 효율적으로 처리하고 활용할 수 있도록 해줍니다. 이 자습서에 설명된 단계를 따르면 문서 텍스트 추출 기능을 .NET 프로젝트에 원활하게 통합할 수 있습니다.

FAQ

.NET용 GroupDocs.Parser는 어떤 문서 형식을 지원합니까?

GroupDocs.Parser는 DOCX, PDF, XLSX, PPTX, EPUB 등을 포함한 광범위한 문서 형식을 지원합니다.

GroupDocs.Parser는 문서에서 이미지나 메타데이터를 추출할 수 있습니까?

예, GroupDocs.Parser는 다양한 문서 유형에서 이미지, 메타데이터 및 텍스트를 추출할 수 있습니다.

GroupDocs.Parser는 .NET Core 애플리케이션과 호환됩니까?

예, GroupDocs.Parser는 .NET Framework 및 .NET Core 애플리케이션 모두와 호환됩니다.

GroupDocs.Parser의 임시 라이센스를 얻으려면 어떻게 해야 합니까?

임시면허를 취득하실 수 있습니다.여기.

GroupDocs.Parser에 대한 추가 지원이나 문서는 어디서 찾을 수 있나요?

추가 지원을 받으려면 다음을 방문하세요.GroupDocs.Parser 포럼 또는선적 서류 비치.