Załaduj dokument z adresu URL
Wstęp
tym samouczku omówimy, jak wykorzystać GroupDocs.Parser dla .NET do wyodrębnienia tekstu z dokumentów. GroupDocs.Parser to potężne narzędzie do wyodrębniania tekstu, metadanych i innych informacji z różnych formatów dokumentów, takich jak PDF, Word, Excel i innych. Omówimy krok po kroku proces ładowania dokumentu z adresu URL i wydobywania jego zawartości tekstowej.
Warunki wstępne
Zanim zaczniemy, upewnij się, że masz skonfigurowane następujące wymagania wstępne:
- Visual Studio: Zainstaluj Visual Studio w swoim systemie.
- GroupDocs.Parser dla .NET: Pobierz i zainstaluj GroupDocs.Parser dla .NET zstrona pobierania.
- Podstawowa znajomość języka C#: Znajomość języka programowania C#.
Importuj przestrzenie nazw
Zacznij od dołączenia niezbędnych przestrzeni nazw do kodu C#:
using System;
using System.Collections.Generic;
using System.IO;
using System.Linq;
using System.Text;
Najpierw pokażemy, jak załadować dokument z adresu URL i wyodrębnić jego treść tekstową.
Krok 1: Określ adres URL dokumentu
Podaj adres URL dokumentu, z którego chcesz wyodrębnić tekst:
Uri uri = new Uri("https://www.bu.edu/csmet/files/2021/03/Getting-Started-with-SQLite.pdf");
Krok 2: Utwórz instancję analizatora składni
Utwórz instancjęParser
class z adresem URL dokumentu:
using (Parser parser = new Parser(uri))
{
// Twój kod trafia tutaj
}
Krok 3: Wyodrębnij tekst z dokumentu
W środkuusing
blokować, używaćparser.GetText()
aby wyodrębnić tekst z dokumentu:
using (TextReader reader = parser.GetText())
{
// Twój kod trafia tutaj
}
Krok 4: Wyświetl wyodrębniony tekst
Przeczytaj i wydrukuj wyodrębniony tekst z dokumentu:
Console.WriteLine(reader == null ? "Text extraction isn't supported" : reader.ReadToEnd());
Wniosek
W tym samouczku omówiliśmy podstawy wyodrębniania tekstu z dokumentu przy użyciu programu GroupDocs.Parser dla platformy .NET. Wykonując te kroki, możesz łatwo zintegrować możliwości wyodrębniania tekstu dokumentu z aplikacjami C#.
Często zadawane pytania
Czy GroupDocs.Parser jest kompatybilny z różnymi formatami dokumentów?
Tak, GroupDocs.Parser obsługuje szeroką gamę formatów dokumentów, w tym PDF, Word, Excel, PowerPoint i inne.
Czy mogę wyodrębnić metadane wraz z tekstem za pomocą GroupDocs.Parser?
Tak, GroupDocs.Parser umożliwia wyodrębnianie metadanych, tekstu i innych informacji z dokumentów.
Czy dostępna jest wersja próbna programu GroupDocs.Parser?
Tak, możesz pobrać bezpłatną wersję próbną GroupDocs.Parser ze stronyTutaj.
Gdzie mogę znaleźć dokumentację GroupDocs.Parser?
Dostępna jest szczegółowa dokumentacja GroupDocs.ParserTutaj.
Jak mogę uzyskać pomoc techniczną dla GroupDocs.Parser?
Możesz szukać pomocy technicznej i zadawać pytania na forum GroupDocs.ParserTutaj.