템플릿을 사용하여 페이지 구문 분석
소개
이 자습서에서는 .NET용 GroupDocs.Parser를 사용하여 문서에서 데이터를 효율적으로 추출하는 방법을 살펴보겠습니다. GroupDocs.Parser는 PDF, DOCX, PPTX 등과 같은 다양한 문서 형식을 구문 분석할 수 있는 강력한 라이브러리입니다. 바코드와 같은 특정 콘텐츠를 정확하게 추출할 수 있는 템플릿을 사용하여 페이지를 구문 분석하는 데 중점을 둘 것입니다.
전제 조건
시작하기 전에 다음이 설정되어 있는지 확인하세요.
- .NET 라이브러리용 GroupDocs.Parser: 다운로드할 수 있습니다.여기.
- 개발 환경: Visual Studio 또는 모든 .NET 호환 IDE.
- 샘플 문서: 구문 분석하려는 콘텐츠가 포함된 문서를 준비하세요.
네임스페이스 가져오기
C# 프로젝트에 필요한 네임스페이스를 포함하는 것부터 시작하세요.
using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using GroupDocs.Parser.Data;
using GroupDocs.Parser.Templates;
1단계: 바코드 필드 정의
바코드를 추출하려면TemplateBarcode
물체. 위치를 지정합니다(Rectangle
) 및 바코드 유형.
TemplateBarcode barcode = new TemplateBarcode(
new Rectangle(new Point(405, 55), new Size(100, 50)),
"QR");
2단계: 템플릿 만들기
바코드(또는 기타 필드)를 하나의Template
물체.
Template template = new Template(new TemplateItem[] { barcode });
3단계: 파서 인스턴스화
인스턴스 만들기Parser
구문 분석하려는 문서 경로를 지정하십시오.
using (Parser parser = new Parser("YourSampleFile.docx"))
{
// 템플릿을 사용하여 문서 페이지 반복
foreach (DocumentPageData data in parser.ParsePagesByTemplate(template))
{
// 페이지 색인 인쇄
Console.WriteLine("Page: " + data.PageIndex);
// 추출된 데이터 인쇄
for (int i = 0; i < data.Count; i++)
{
Console.Write(data[i].Name + ": ");
PageBarcodeArea area = data[i].PageArea as PageBarcodeArea;
Console.WriteLine(area == null ? "Not a template barcode field" : area.Value);
}
}
}
결론
.NET용 GroupDocs.Parser를 사용하면 문서를 원활하게 구문 분석하고 템플릿을 사용하여 바코드와 같은 특정 콘텐츠를 추출할 수 있습니다. 이 자습서에서는 .NET 애플리케이션에서 문서 구문 분석을 시작하기 위한 기본 단계를 다루었습니다.
FAQ
GroupDocs.Parser는 다양한 문서 형식을 처리할 수 있나요?
예, GroupDocs.Parser는 PDF, DOCX, XLSX 등을 포함한 다양한 형식을 지원합니다.
GroupDocs.Parser는 바코드와 같은 특정 데이터를 추출하는 데 적합합니까?
전적으로! GroupDocs.Parser는 대상 콘텐츠 추출을 위한 정확한 추출 기능을 제공합니다.
GroupDocs.Parser에 대한 자세한 문서는 어디서 찾을 수 있나요?
방문하다선적 서류 비치 종합적인 안내를 위해.
GroupDocs.Parser에 대한 임시 라이센스를 얻으려면 어떻게 해야 합니까?
획득임시면허 평가 또는 개발 목적으로.
GroupDocs는 문제 해결을 위한 지원을 제공합니까?
예, 다음 사항에 대해 도움을 요청할 수 있습니다.GroupDocs 포럼 문의 사항이나 문제가 있으면.