แยกข้อความจากหน้าในรูปแบบ PDF ในโหมด Raw

การแนะนำ

ในบทช่วยสอนนี้ เราจะสำรวจวิธีใช้ GroupDocs.Parser สำหรับ .NET เพื่อแยกข้อความจากหน้าในเอกสาร PDF โดยใช้โหมด Raw GroupDocs.Parser เป็นเครื่องมืออันทรงพลังที่ช่วยให้นักพัฒนาสามารถทำงานกับเอกสารรูปแบบต่างๆ โดยทางโปรแกรม

ข้อกำหนดเบื้องต้น

ก่อนที่จะเริ่มบทช่วยสอนนี้ ตรวจสอบให้แน่ใจว่าคุณมีสิ่งต่อไปนี้:

  • ติดตั้ง Visual Studio บนเครื่องของคุณแล้ว
  • ความรู้พื้นฐานเกี่ยวกับการเขียนโปรแกรม C#
  • GroupDocs.Parser สำหรับไลบรารี .NET ซึ่งคุณสามารถทำได้ดาวน์โหลดได้ที่นี่.
  • ไฟล์ PDF ตัวอย่างเพื่อการทดสอบ

นำเข้าเนมสเปซ

ขั้นแรก ตรวจสอบให้แน่ใจว่าได้นำเข้าเนมสเปซที่จำเป็นในโปรเจ็กต์ C# ของคุณ:

using System;
using System.Collections.Generic;
using System.IO;
using System.Text;
using GroupDocs.Parser.Data;
using GroupDocs.Parser.Options;

ขั้นตอนที่ 1: สร้างอินสแตนซ์ของ Parser Class

ในการเริ่มต้น ให้ยกตัวอย่างParserคลาสโดยระบุเส้นทางไปยังไฟล์ PDF ตัวอย่างของคุณ

using (Parser parser = new Parser("YourSampleFile.pdf"))
{
    // รหัสของคุณอยู่ที่นี่
}

ขั้นตอนที่ 2: รับข้อมูลเอกสารและวนซ้ำหน้าต่างๆ

จากนั้น ดึงข้อมูลเอกสารและวนซ้ำแต่ละหน้าเพื่อแยกข้อความ

IDocumentInfo documentInfo = parser.GetDocumentInfo();
for (int p = 0; p < documentInfo.RawPageCount; p++)
{
    Console.WriteLine($"Page {p + 1}/{documentInfo.RawPageCount}");
    // รหัสของคุณสำหรับการแยกข้อความอยู่ที่นี่
}

ขั้นตอนที่ 3: แยกข้อความจากแต่ละหน้า

ภายในลูปให้ใช้GetText วิธีการแยกข้อความจากแต่ละหน้าแล้วพิมพ์

using (TextReader reader = parser.GetText(p, new TextOptions(true)))
{
    Console.WriteLine(reader.ReadToEnd());
}

บทสรุป

ในบทช่วยสอนนี้ เราได้เรียนรู้วิธีแยกข้อความจากหน้า PDF ในโหมด Raw โดยใช้ GroupDocs.Parser สำหรับ .NET กระบวนการนี้เกี่ยวข้องกับการสร้างParser เช่น การได้รับข้อมูลเอกสาร การวนซ้ำแต่ละหน้า และการแยกข้อความโดยใช้GetText วิธี.

คำถามที่พบบ่อย

GroupDocs.Parser สำหรับ .NET คืออะไร

GroupDocs.Parser สำหรับ .NET เป็น API การแยกวิเคราะห์เอกสารที่ช่วยให้นักพัฒนาสามารถดึงข้อความ ข้อมูลเมตา และข้อมูลอื่น ๆ จากรูปแบบไฟล์ต่างๆ โดยทางโปรแกรม

ฉันจะดาวน์โหลด GroupDocs.Parser สำหรับ .NET ได้อย่างไร

คุณสามารถดาวน์โหลดห้องสมุดได้จากเว็บไซต์กรุ๊ปดอคส์.

มีการทดลองใช้ฟรีหรือไม่?

ใช่ คุณสามารถเข้าถึง GroupDocs.Parser สำหรับ .NET รุ่นทดลองใช้ฟรีได้จากที่นี่.

ฉันจะรับการสนับสนุนสำหรับ GroupDocs.Parser สำหรับ .NET ได้ที่ไหน

สำหรับความช่วยเหลือด้านเทคนิคและการสนับสนุนชุมชน โปรดไปที่ฟอรัม GroupDocs.

ฉันจะซื้อใบอนุญาตสำหรับ GroupDocs.Parser สำหรับ .NET ได้อย่างไร

คุณสามารถซื้อใบอนุญาตได้จากหน้าซื้อ หรือได้รับใบอนุญาตชั่วคราวที่นี่.