GetHyperlinks

Extraherar hyperlänkar från dokumentet.

public IEnumerable<PageHyperlinkArea> GetHyperlinks()

Returvärde

En samling avPageHyperlinkArea objekt; null om extrahering av hyperlänkar inte stöds.

Exempel

Följande exempel visar hur man extraherar alla hyperlänkar från hela dokumentet:

// Skapa en instans av Parser-klassen
using (Parser parser = new Parser(filePath))
{
    // Kontrollera om dokumentet stöder extraktion av hyperlänkar
    if (!parser.Features.Hyperlinks)
    {
        Console.WriteLine("Document isn't supports hyperlink extraction.");
        return;
    }
    // Extrahera hyperlänkar från dokumentet
    IEnumerable<PageHyperlinkArea> hyperlinks = parser.GetHyperlinks();
    // Iterera över hyperlänkar
    foreach (PageHyperlinkArea h in hyperlinks)
    {
        // Skriv ut hyperlänkstexten
        Console.WriteLine(h.Text);
        // Skriv ut hyperlänkens URL
        Console.WriteLine(h.Url);
        Console.WriteLine();
    }
}

Se även


Extraherar hyperlänkar från dokumentsidan.

public IEnumerable<PageHyperlinkArea> GetHyperlinks(int pageIndex)
Parameter Typ Beskrivning
pageIndex Int32 Det nollbaserade sidindexet.

Returvärde

En samling avPageHyperlinkArea objekt; null om extrahering av hyperlänkar inte stöds.

Exempel

Följande exempel visar hur man extraherar hyperlänkar från dokumentsidan:

// Skapa en instans av Parser-klassen
using (Parser parser = new Parser(filePath))
{
    // Kontrollera om dokumentet stöder extraktion av hyperlänkar
    if (!parser.Features.Hyperlinks)
    {
        Console.WriteLine("Document isn't supports hyperlink extraction.");
        return;
    }
    // Få dokumentinformationen
    IDocumentInfo documentInfo = parser.GetDocumentInfo();
    // Kontrollera om dokumentet har sidor
    if (documentInfo.PageCount == 0)
    {
        Console.WriteLine("Document hasn't pages.");
        return;
    }
    // Iterera över sidor
    for (int pageIndex = 0; pageIndex < documentInfo.PageCount; pageIndex++)
    {
        // Skriv ut ett sidnummer 
        Console.WriteLine(string.Format("Page {0}/{1}", pageIndex + 1, documentInfo.PageCount));
        // Extrahera hyperlänkar från dokumentsidan
        IEnumerable<PageHyperlinkArea> hyperlinks = parser.GetHyperlinks(pageIndex);
        // Iterera över hyperlänkar
        foreach (PageHyperlinkArea h in hyperlinks)
        {
            // Skriv ut hyperlänkstexten
            Console.WriteLine(h.Text);
            // Skriv ut hyperlänkens URL
            Console.WriteLine(h.Url);
            Console.WriteLine();
        }
    }
}

Se även


Extraherar hyperlänkar från dokumentet med hjälp av anpassningsalternativ (för att ställa in det rektangulära område som innehåller hyperlänkar).

public IEnumerable<PageHyperlinkArea> GetHyperlinks(PageAreaOptions options)
Parameter Typ Beskrivning
options PageAreaOptions Alternativen för extrahering av hyperlänkar.

Returvärde

En samling avPageHyperlinkArea objekt; null om extrahering av hyperlänkar inte stöds.

Exempel

Följande exempel visar hur man extraherar hyperlänkar från dokumentsidans område:

// Skapa en instans av Parser-klassen
using (Parser parser = new Parser(filePath))
{
    // Kontrollera om dokumentet stöder extraktion av hyperlänkar
    if (!parser.Features.Hyperlinks)
    {
        Console.WriteLine("Document isn't supports hyperlink extraction.");
        return;
    }
    // Skapa alternativen som används för extrahering av hyperlänkar
    PageAreaOptions options = new PageAreaOptions(new Rectangle(new Point(380, 90), new Size(150, 50)));
    // Extrahera hyperlänkar från dokumentsidans område
    IEnumerable<PageHyperlinkArea> hyperlinks = parser.GetHyperlinks(options);
    // Iterera över hyperlänkar
    foreach (PageHyperlinkArea h in hyperlinks)
    {
        // Skriv ut hyperlänkstexten
        Console.WriteLine(h.Text);
        // Skriv ut hyperlänkens URL
        Console.WriteLine(h.Url);
        Console.WriteLine();
    }
}

Se även


Extraherar hyperlänkar från dokumentsidan med hjälp av anpassningsalternativ (för att ställa in det rektangulära område som innehåller hyperlänkar).

public IEnumerable<PageHyperlinkArea> GetHyperlinks(int pageIndex, PageAreaOptions options)
Parameter Typ Beskrivning
pageIndex Int32 Det nollbaserade sidindexet.
options PageAreaOptions Alternativen för extrahering av hyperlänkar.

Returvärde

En samling avPageHyperlinkArea objekt; null om extrahering av hyperlänkar inte stöds.

Exempel

Följande exempel visar hur man extraherar hyperlänkar från dokumentsidans område med hjälp av anpassningsalternativ:

// Skapa en instans av Parser-klassen
using (Parser parser = new Parser(filePath))
{
    // Kontrollera om dokumentet stöder extraktion av hyperlänkar
    if (!parser.Features.Hyperlinks)
    {
        Console.WriteLine("Document isn't supports hyperlink extraction.");
        return;
    }
    
    // Få dokumentinformationen
    IDocumentInfo documentInfo = parser.GetDocumentInfo();
    // Kontrollera om dokumentet har sidor
    if (documentInfo.PageCount == 0)
    {
        Console.WriteLine("Document hasn't pages.");
        return;
    }
    
    // Skapa alternativen som används för extrahering av hyperlänkar
    PageAreaOptions options = new PageAreaOptions(new Rectangle(new Point(380, 90), new Size(150, 50)));
    // Iterera över sidor
    for (int pageIndex = 0; pageIndex < documentInfo.PageCount; pageIndex++)
    {
        // Skriv ut ett sidnummer 
        Console.WriteLine(string.Format("Page {0}/{1}", pageIndex + 1, documentInfo.PageCount));         
        // Extrahera hyperlänkar från dokumentsidans område
        IEnumerable<PageHyperlinkArea> hyperlinks = parser.GetHyperlinks(pageIndex, options);
        // Iterera över hyperlänkar
        foreach (PageHyperlinkArea h in hyperlinks)
        {
            // Skriv ut hyperlänkstexten
            Console.WriteLine(h.Text);
            // Skriv ut hyperlänkens URL
            Console.WriteLine(h.Url);
            Console.WriteLine();
        }
}

Se även