Załaduj dokument z adresu URL

Wstęp

tym samouczku omówimy, jak wykorzystać GroupDocs.Parser dla .NET do wyodrębnienia tekstu z dokumentów. GroupDocs.Parser to potężne narzędzie do wyodrębniania tekstu, metadanych i innych informacji z różnych formatów dokumentów, takich jak PDF, Word, Excel i innych. Omówimy krok po kroku proces ładowania dokumentu z adresu URL i wydobywania jego zawartości tekstowej.

Warunki wstępne

Zanim zaczniemy, upewnij się, że masz skonfigurowane następujące wymagania wstępne:

Visual Studio: Zainstaluj Visual Studio w swoim systemie.
GroupDocs.Parser dla .NET: Pobierz i zainstaluj GroupDocs.Parser dla .NET zstrona pobierania.
Podstawowa znajomość języka C#: Znajomość języka programowania C#.

Importuj przestrzenie nazw

Zacznij od dołączenia niezbędnych przestrzeni nazw do kodu C#:

using System;
using System.Collections.Generic;
using System.IO;
using System.Linq;
using System.Text;

Najpierw pokażemy, jak załadować dokument z adresu URL i wyodrębnić jego treść tekstową.

Krok 1: Określ adres URL dokumentu

Podaj adres URL dokumentu, z którego chcesz wyodrębnić tekst:

Uri uri = new Uri("https://www.bu.edu/csmet/files/2021/03/Getting-Started-with-SQLite.pdf");

Krok 2: Utwórz instancję analizatora składni

Utwórz instancjęParser class z adresem URL dokumentu:

using (Parser parser = new Parser(uri))
{
    // Twój kod trafia tutaj
}

Krok 3: Wyodrębnij tekst z dokumentu

W środkuusingblokować, używaćparser.GetText() aby wyodrębnić tekst z dokumentu:

using (TextReader reader = parser.GetText())
{
    // Twój kod trafia tutaj
}

Krok 4: Wyświetl wyodrębniony tekst

Przeczytaj i wydrukuj wyodrębniony tekst z dokumentu:

Console.WriteLine(reader == null ? "Text extraction isn't supported" : reader.ReadToEnd());

Wniosek

W tym samouczku omówiliśmy podstawy wyodrębniania tekstu z dokumentu przy użyciu programu GroupDocs.Parser dla platformy .NET. Wykonując te kroki, możesz łatwo zintegrować możliwości wyodrębniania tekstu dokumentu z aplikacjami C#.

Często zadawane pytania

Czy GroupDocs.Parser jest kompatybilny z różnymi formatami dokumentów?

Tak, GroupDocs.Parser obsługuje szeroką gamę formatów dokumentów, w tym PDF, Word, Excel, PowerPoint i inne.

Czy mogę wyodrębnić metadane wraz z tekstem za pomocą GroupDocs.Parser?

Tak, GroupDocs.Parser umożliwia wyodrębnianie metadanych, tekstu i innych informacji z dokumentów.

Czy dostępna jest wersja próbna programu GroupDocs.Parser?

Tak, możesz pobrać bezpłatną wersję próbną GroupDocs.Parser ze stronyTutaj.

Gdzie mogę znaleźć dokumentację GroupDocs.Parser?

Dostępna jest szczegółowa dokumentacja GroupDocs.ParserTutaj.

Jak mogę uzyskać pomoc techniczną dla GroupDocs.Parser?

Możesz szukać pomocy technicznej i zadawać pytania na forum GroupDocs.ParserTutaj.

Załaduj dokument ze strumienia Ładowanie określonych formatów plików