Mengenali Teks
Perkenalan
Dalam bidang pengembangan .NET, ekstraksi teks yang efisien dari berbagai format dokumen adalah yang terpenting. GroupDocs.Parser untuk .NET memberikan solusi tangguh untuk mengekstrak teks dengan lancar. Dalam tutorial ini, kita akan mempelajari penggunaan GroupDocs.Parser langkah demi langkah untuk mengenali dan mengekstrak teks dari dokumen.
Prasyarat
Sebelum kita mulai menggunakan GroupDocs.Parser, pastikan Anda memiliki prasyarat berikut:
- Pemahaman dasar pemrograman C#
- Visual Studio diinstal pada mesin Anda
- Akses ke internet untuk download paket dan referensi dokumentasi
Impor Namespace
Mulailah dengan mengimpor namespace yang diperlukan untuk memanfaatkan fungsionalitas GroupDocs.Parser:
using System;
using System.Collections.Generic;
using System.Drawing;
using System.IO;
using System.Linq;
using System.Text;
using Aspose.OCR;
using GroupDocs.Parser.Data;
using GroupDocs.Parser.Options;
Langkah 1: Instal GroupDocs.Parser
Pertama, unduh dan instal perpustakaan GroupDocs.Parser. Anda dapat memperolehnya daritautan unduhan.
Langkah 2: Dapatkan Lisensi Sementara
Untuk menggunakan GroupDocs.Parser, dapatkan lisensi sementara dariDi Sini.
Langkah 3: Menginisialisasi ParserSettings
Buat sebuah contoh dariParserSettings
kelas untuk mengonfigurasi pengaturan ekstraksi teks, termasuk konektor OCR jika diperlukan.
ParserSettings settings = new ParserSettings(new AsposeOcrOnPremise());
Langkah 4: Menggunakan Parser untuk Mengekstrak Teks
Sekarang, buat sebuah instance dariParser
kelas dengan pengaturan yang dikonfigurasi.
using (Parser parser = new Parser("YourSampleFile.docx", settings))
{
// Konfigurasikan TextOptions untuk penggunaan OCR
TextOptions options = new TextOptions(false, true);
// Ekstrak teks menggunakan OCR
using (TextReader reader = parser.GetText(options))
{
// Menampilkan teks yang diekstrak atau pesan 'tidak didukung'
Console.WriteLine(reader == null ? "Text extraction isn't supported" : reader.ReadToEnd());
}
}
Dalam cuplikan ini:
- Mengganti
"YourSampleFile.docx"
dengan jalur ke dokumen target Anda. TextOptions
dikonfigurasi untuk mengaktifkan OCR dan mengoptimalkan ekstraksi teks.
Kesimpulan
Selamat! Anda telah mempelajari cara mengintegrasikan GroupDocs.Parser untuk .NET ke dalam proyek Anda untuk mengekstrak teks secara efisien. Jelajahi yang luasdokumentasi untuk fitur lanjutan dan pengoptimalan.
FAQ
Apakah GroupDocs.Parser cocok untuk mengekstrak teks dari file PDF?
Ya, GroupDocs.Parser mendukung ekstraksi teks dari berbagai format, termasuk PDF.
Bisakah saya mengintegrasikan GroupDocs.Parser ke dalam aplikasi ASP.NET saya?
Tentu saja, GroupDocs.Parser dapat diintegrasikan dengan mulus ke dalam aplikasi ASP.NET.
Apakah GroupDocs.Parser memerlukan lisensi untuk penggunaan komersial?
Ya, lisensi diperlukan untuk penggunaan komersial. Dapatkan lisensi sementaraDi Sini.
Format dokumen apa yang didukung oleh GroupDocs.Parser?
GroupDocs.Parser mendukung berbagai format, termasuk DOCX, PDF, XLSX, dan banyak lagi.
Bagaimana saya bisa mencari dukungan atau mengajukan pertanyaan terkait GroupDocs.Parser?
MengunjungiForum GroupDocs.Parseruntuk dukungan dan diskusi.