แยกข้อความจากหน้าในรูปแบบ PDF ในโหมด Raw
การแนะนำ
ในบทช่วยสอนนี้ เราจะสำรวจวิธีใช้ GroupDocs.Parser สำหรับ .NET เพื่อแยกข้อความจากหน้าในเอกสาร PDF โดยใช้โหมด Raw GroupDocs.Parser เป็นเครื่องมืออันทรงพลังที่ช่วยให้นักพัฒนาสามารถทำงานกับเอกสารรูปแบบต่างๆ โดยทางโปรแกรม
ข้อกำหนดเบื้องต้น
ก่อนที่จะเริ่มบทช่วยสอนนี้ ตรวจสอบให้แน่ใจว่าคุณมีสิ่งต่อไปนี้:
- ติดตั้ง Visual Studio บนเครื่องของคุณแล้ว
- ความรู้พื้นฐานเกี่ยวกับการเขียนโปรแกรม C#
- GroupDocs.Parser สำหรับไลบรารี .NET ซึ่งคุณสามารถทำได้ดาวน์โหลดได้ที่นี่.
- ไฟล์ PDF ตัวอย่างเพื่อการทดสอบ
นำเข้าเนมสเปซ
ขั้นแรก ตรวจสอบให้แน่ใจว่าได้นำเข้าเนมสเปซที่จำเป็นในโปรเจ็กต์ C# ของคุณ:
using System;
using System.Collections.Generic;
using System.IO;
using System.Text;
using GroupDocs.Parser.Data;
using GroupDocs.Parser.Options;
ขั้นตอนที่ 1: สร้างอินสแตนซ์ของ Parser Class
ในการเริ่มต้น ให้ยกตัวอย่างParser
คลาสโดยระบุเส้นทางไปยังไฟล์ PDF ตัวอย่างของคุณ
using (Parser parser = new Parser("YourSampleFile.pdf"))
{
// รหัสของคุณอยู่ที่นี่
}
ขั้นตอนที่ 2: รับข้อมูลเอกสารและวนซ้ำหน้าต่างๆ
จากนั้น ดึงข้อมูลเอกสารและวนซ้ำแต่ละหน้าเพื่อแยกข้อความ
IDocumentInfo documentInfo = parser.GetDocumentInfo();
for (int p = 0; p < documentInfo.RawPageCount; p++)
{
Console.WriteLine($"Page {p + 1}/{documentInfo.RawPageCount}");
// รหัสของคุณสำหรับการแยกข้อความอยู่ที่นี่
}
ขั้นตอนที่ 3: แยกข้อความจากแต่ละหน้า
ภายในลูปให้ใช้GetText
วิธีการแยกข้อความจากแต่ละหน้าแล้วพิมพ์
using (TextReader reader = parser.GetText(p, new TextOptions(true)))
{
Console.WriteLine(reader.ReadToEnd());
}
บทสรุป
ในบทช่วยสอนนี้ เราได้เรียนรู้วิธีแยกข้อความจากหน้า PDF ในโหมด Raw โดยใช้ GroupDocs.Parser สำหรับ .NET กระบวนการนี้เกี่ยวข้องกับการสร้างParser
เช่น การได้รับข้อมูลเอกสาร การวนซ้ำแต่ละหน้า และการแยกข้อความโดยใช้GetText
วิธี.
คำถามที่พบบ่อย
GroupDocs.Parser สำหรับ .NET คืออะไร
GroupDocs.Parser สำหรับ .NET เป็น API การแยกวิเคราะห์เอกสารที่ช่วยให้นักพัฒนาสามารถดึงข้อความ ข้อมูลเมตา และข้อมูลอื่น ๆ จากรูปแบบไฟล์ต่างๆ โดยทางโปรแกรม
ฉันจะดาวน์โหลด GroupDocs.Parser สำหรับ .NET ได้อย่างไร
คุณสามารถดาวน์โหลดห้องสมุดได้จากเว็บไซต์กรุ๊ปดอคส์.
มีการทดลองใช้ฟรีหรือไม่?
ใช่ คุณสามารถเข้าถึง GroupDocs.Parser สำหรับ .NET รุ่นทดลองใช้ฟรีได้จากที่นี่.
ฉันจะรับการสนับสนุนสำหรับ GroupDocs.Parser สำหรับ .NET ได้ที่ไหน
สำหรับความช่วยเหลือด้านเทคนิคและการสนับสนุนชุมชน โปรดไปที่ฟอรัม GroupDocs.
ฉันจะซื้อใบอนุญาตสำหรับ GroupDocs.Parser สำหรับ .NET ได้อย่างไร
คุณสามารถซื้อใบอนุญาตได้จากหน้าซื้อ หรือได้รับใบอนุญาตชั่วคราวที่นี่.