การจัดการ OCR
การแนะนำ
ในบทช่วยสอนนี้ เราจะสำรวจวิธีใช้ GroupDocs.Parser สำหรับ .NET เพื่อจัดการงาน Optical Character Recognition (OCR) ได้อย่างมีประสิทธิภาพ ไลบรารีนี้มีเครื่องมืออันทรงพลังในการแยกข้อความจากเอกสาร และด้วย OCR คุณสามารถแยกข้อความจากรูปภาพหรือเอกสารที่สแกนได้ มาดำดิ่งสู่กระบวนการทีละขั้นตอน
ข้อกำหนดเบื้องต้น
ก่อนที่เราจะเริ่ม ตรวจสอบให้แน่ใจว่าคุณได้ตั้งค่าดังต่อไปนี้:
- GroupDocs.Parser สำหรับ .NET Library: ดาวน์โหลดไลบรารีจากที่นี่.
- ไฟล์ตัวอย่างของคุณ: เตรียมไฟล์ตัวอย่าง (เอกสารหรือรูปภาพ) ที่คุณต้องการแยกข้อความ
- ความรู้พื้นฐานเกี่ยวกับสภาพแวดล้อม C# และ .NET
นำเข้าเนมสเปซ
ขั้นแรก คุณต้องนำเข้าเนมสเปซที่จำเป็นเพื่อใช้ฟังก์ชัน GroupDocs.Parser ในแอปพลิเคชัน .NET ของคุณ
using System;
using System.Collections.Generic;
using System.Drawing;
using System.IO;
using System.Linq;
using System.Text;
using Aspose.OCR;
using GroupDocs.Parser.Data;
using GroupDocs.Parser.Options;
ขั้นตอนที่ 1: สร้างการตั้งค่า Parser ด้วย OCR Connector
เริ่มต้นParserSettings
คลาสที่มีขั้วต่อ OCR ตัวอย่างเช่น การใช้ Aspose OCR ภายในองค์กร
ParserSettings settings = new ParserSettings(new AsposeOcrOnPremise());
ขั้นตอนที่ 2: กำหนดค่าตัวเลือก OCR
ตั้งค่าอันOcrEventHandler
เพื่อจัดการคำเตือนระหว่างการประมวลผล OCR
OcrEventHandler handler = new OcrEventHandler();
OcrOptions ocrOptions = new OcrOptions(handler);
ขั้นตอนที่ 3: กำหนดค่าตัวเลือกการแยกข้อความ
สร้างTextOptions
เพื่อเปิดใช้งานการแยกข้อความตาม OCR
TextOptions options = new TextOptions(false, true, ocrOptions);
ขั้นตอนที่ 4: แยกข้อความโดยใช้ OCR
ยกตัวอย่างParser
คลาสด้วยการตั้งค่าและแยกข้อความโดยใช้ OCR
using (Parser parser = new Parser("YourSampleFile.pdf", settings))
{
using (TextReader reader = parser.GetText(options))
{
if (reader == null)
{
Console.WriteLine("Text extraction isn't supported.");
}
else
{
Console.WriteLine(reader.ReadToEnd());
}
}
if (handler.HasWarnings)
{
Console.WriteLine("The following warnings occurred during text recognition:");
foreach (string w in handler.Warnings)
{
Console.WriteLine("\t* " + w);
}
}
else
{
Console.WriteLine("Text recognition was performed without any warnings.");
}
}
บทสรุป
ด้วยการทำตามขั้นตอนเหล่านี้ คุณสามารถใช้ประโยชน์จาก GroupDocs.Parser สำหรับ .NET เพื่อจัดการงาน OCR ภายในแอปพลิเคชันของคุณได้อย่างมีประสิทธิภาพ การแยกข้อความออกจากรูปภาพหรือเอกสารที่สแกนจะราบรื่นด้วยความสามารถอันทรงพลังที่นำเสนอโดยไลบรารีนี้
คำถามที่พบบ่อย
GroupDocs.Parser for .NET เข้ากันได้กับรูปแบบไฟล์ที่แตกต่างกันหรือไม่
ใช่ GroupDocs.Parser รองรับรูปแบบไฟล์ที่หลากหลาย รวมถึง PDF, DOCX, PPTX, XLSX, รูปภาพ (JPEG, PNG, TIFF) และอื่นๆ
ฉันสามารถใช้ GroupDocs.Parser สำหรับ .NET ในโครงการเชิงพาณิชย์ของฉันได้หรือไม่
ได้ คุณสามารถรวม GroupDocs.Parser สำหรับ .NET เข้ากับแอปพลิเคชันเชิงพาณิชย์ของคุณได้หลังจากซื้อใบอนุญาตแล้ว
GroupDocs.Parser จัดการไฟล์ที่เข้ารหัสหรือป้องกันด้วยรหัสผ่านหรือไม่
GroupDocs.Parser สามารถแยกและแยกข้อความจากเอกสาร PDF ที่มีการป้องกันด้วยรหัสผ่าน
มีรุ่นทดลองใช้สำหรับ GroupDocs.Parser สำหรับ .NET หรือไม่
ใช่ คุณสามารถดาวน์โหลดเวอร์ชันทดลองใช้ฟรีได้จากที่นี่.
ฉันจะรับการสนับสนุนหรือถามคำถามที่เกี่ยวข้องกับ GroupDocs.Parser for .NET ได้ที่ไหน
ท่านสามารถเยี่ยมชมได้ที่ฟอรัม GroupDocs.Parser สำหรับข้อสงสัยหรือการสนทนาการสนับสนุน