PDF 양식에서 데이터 추출
소개
이 튜토리얼에서는 .NET용 GroupDocs.Parser를 활용하여 PDF 양식에서 데이터를 추출하는 방법을 살펴보겠습니다. GroupDocs.Parser는 개발자가 PDF, DOCX, XLSX 등을 포함한 다양한 문서 형식으로 효율적으로 작업할 수 있는 강력한 라이브러리입니다. PDF 양식에서 특정 필드를 추출하고 추출된 데이터를 처리하는 데 필요한 단계를 살펴보겠습니다.
전제 조건
시작하기 전에 다음 필수 구성 요소가 있는지 확인하세요.
- C# 프로그래밍에 대한 기본 지식.
- 시스템에 Visual Studio가 설치되어 있습니다.
- .NET 라이브러리용 GroupDocs.Parser가 설치되었습니다. 다음에서 다운로드할 수 있습니다.여기.
네임스페이스 가져오기
시작하려면 C# 프로젝트에서 필수 네임스페이스를 가져와야 합니다.
using System;
using System.Linq;
using GroupDocs.Parser.Data;
1단계: 파서 초기화
먼저,Parser
샘플 PDF 파일의 경로를 지정하여 클래스를 지정하세요.
using (Parser parser = new Parser("YourSampleFile.pdf"))
{
//데이터 추출을 위한 코드가 여기에 표시됩니다.
}
2단계: PDF 문서에서 데이터 추출
다음으로, 내에서using
블록, 호출ParseForm
PDF 문서에서 데이터를 추출하는 방법:
DocumentData data = parser.ParseForm();
if (data == null)
{
Console.WriteLine("Form extraction isn't supported.");
return;
}
3단계: 특정 필드 데이터에 액세스
이제 메소드를 정의하세요.GetFieldText
추출된 데이터 내의 특정 필드에서 텍스트를 검색하려면:
private static string GetFieldText(DocumentData data, string fieldName)
{
FieldData fieldData = data.GetFieldsByName(fieldName).FirstOrDefault();
return fieldData != null && fieldData.PageArea is PageTextArea
? (fieldData.PageArea as PageTextArea).Text
: null;
}
4단계: 예비 레코드 개체 생성
정의한 후GetFieldText
메서드를 사용하여PreliminaryRecord
추출된 데이터가 있는 객체:
PreliminaryRecord rec = new PreliminaryRecord();
rec.Name = GetFieldText(data, "Name");
rec.Model = GetFieldText(data, "Model");
rec.Time = GetFieldText(data, "Time");
rec.Description = GetFieldText(data, "Description");
5단계: 추출된 데이터 활용
마지막으로 추출된 데이터를 데이터베이스에 저장하거나 웹 응답으로 보내거나 표시하는 등 필요에 따라 사용할 수 있습니다.
Console.WriteLine("Preliminary record");
Console.WriteLine("Name: {0}", rec.Name);
Console.WriteLine("Model: {0}", rec.Model);
Console.WriteLine("Time: {0}", rec.Time);
Console.WriteLine("Description: {0}", rec.Description);
결론
이 자습서에서는 .NET용 GroupDocs.Parser를 사용하여 PDF 양식에서 데이터를 추출하는 기본 사항을 다루었습니다. 다음 단계를 수행하면 C# 애플리케이션 내의 PDF 문서에서 특정 정보를 효율적으로 검색할 수 있습니다.
FAQ
GroupDocs.Parser는 PDF 이외의 다른 문서 형식과 호환됩니까?
예, GroupDocs.Parser는 DOCX, XLSX, PPTX 등을 포함한 다양한 형식을 지원합니다.
GroupDocs.Parser를 사용하여 이미지와 메타데이터를 추출할 수 있나요?
예, GroupDocs.Parser를 사용하면 문서에서 이미지, 메타데이터 및 텍스트를 추출할 수 있습니다.
GroupDocs.Parser에 대한 추가 지원이나 문서는 어디서 찾을 수 있나요?
당신은 방문 할 수 있습니다GroupDocs.Parser 문서 자세한 정보와 예시를 확인하세요.
GroupDocs.Parser에 대한 무료 평가판이 있습니까?
예, 액세스할 수 있습니다GroupDocs.Parser 무료 평가판 그 특징을 탐구합니다.
GroupDocs.Parser의 임시 라이센스를 얻으려면 어떻게 해야 합니까?
당신은GroupDocs.Parser에 대한 임시 라이센스 귀하의 프로젝트에서 그 능력을 평가합니다.