텍스트 인식
소개
.NET 개발 영역에서는 다양한 문서 형식에서 효율적인 텍스트 추출이 가장 중요합니다. .NET용 GroupDocs.Parser는 텍스트를 원활하게 추출할 수 있는 강력한 솔루션을 제공합니다. 이 튜토리얼에서는 GroupDocs.Parser를 사용하여 문서에서 텍스트를 인식하고 추출하는 방법을 단계별로 살펴보겠습니다.
전제 조건
GroupDocs.Parser를 사용하기 전에 다음 전제 조건이 충족되었는지 확인하세요.
- C# 프로그래밍에 대한 기본 이해
- 컴퓨터에 설치된 Visual Studio
- 패키지 다운로드 및 문서 참조를 위한 인터넷 액세스
네임스페이스 가져오기
GroupDocs.Parser 기능을 활용하려면 필요한 네임스페이스를 가져오는 것부터 시작하세요.
using System;
using System.Collections.Generic;
using System.Drawing;
using System.IO;
using System.Linq;
using System.Text;
using Aspose.OCR;
using GroupDocs.Parser.Data;
using GroupDocs.Parser.Options;
1단계: GroupDocs.Parser 설치
먼저 GroupDocs.Parser 라이브러리를 다운로드하여 설치합니다. 에서 획득하실 수 있습니다.다운로드 링크.
2단계: 임시 라이센스 받기
GroupDocs.Parser를 사용하려면 다음에서 임시 라이센스를 얻으십시오.여기.
3단계: ParserSettings 초기화
인스턴스 만들기ParserSettings
필요한 경우 OCR 커넥터를 포함하여 텍스트 추출 설정을 구성하는 클래스입니다.
ParserSettings settings = new ParserSettings(new AsposeOcrOnPremise());
4단계: 파서를 사용하여 텍스트 추출
이제Parser
구성된 설정으로 수업을 진행합니다.
using (Parser parser = new Parser("YourSampleFile.docx", settings))
{
// OCR 사용을 위한 TextOptions 구성
TextOptions options = new TextOptions(false, true);
// OCR을 사용하여 텍스트 추출
using (TextReader reader = parser.GetText(options))
{
// 추출된 텍스트 또는 '지원되지 않음' 메시지 표시
Console.WriteLine(reader == null ? "Text extraction isn't supported" : reader.ReadToEnd());
}
}
이 스니펫에서:
- 바꾸다
"YourSampleFile.docx"
대상 문서의 경로와 함께. TextOptions
OCR을 활성화하고 텍스트 추출을 최적화하도록 구성됩니다.
결론
축하해요! .NET용 GroupDocs.Parser를 프로젝트에 통합하여 텍스트를 효율적으로 추출하는 방법을 배웠습니다. 광범위한 탐색선적 서류 비치 고급 기능 및 최적화를 위해.
FAQ
GroupDocs.Parser는 PDF 파일에서 텍스트를 추출하는 데 적합합니까?
예, GroupDocs.Parser는 PDF를 포함한 다양한 형식의 텍스트 추출을 지원합니다.
GroupDocs.Parser를 ASP.NET 응용 프로그램에 통합할 수 있습니까?
물론, GroupDocs.Parser는 ASP.NET 응용 프로그램에 완벽하게 통합될 수 있습니다.
GroupDocs.Parser를 상업적으로 사용하려면 라이센스가 필요합니까?
예, 상업적으로 사용하려면 라이센스가 필요합니다. 임시 라이센스 받기여기.
GroupDocs.Parser는 어떤 문서 형식을 지원합니까?
GroupDocs.Parser는 DOCX, PDF, XLSX 등을 포함한 광범위한 형식을 지원합니다.
GroupDocs.Parser와 관련된 지원을 구하거나 질문하려면 어떻게 해야 합니까?
방문하다GroupDocs.Parser 포럼지원과 토론을 위해.