GetTextAreas
GetTextAreas()
Extraherar textområden från dokumentet.
public IEnumerable<PageTextArea> GetTextAreas()
Returvärde
En samling avPageTextArea
objekt; null
om extrahering av textområden inte stöds.
Anmärkningar
Läs mer:
Exempel
Följande exempel visar hur man extraherar alla textområden från hela dokumentet:
// Skapa en instans av Parser-klassen
using(Parser parser = new Parser(filePath))
{
// Extrahera textområden
IEnumerable<PageTextArea> areas = parser.GetTextAreas();
// Kontrollera om extraktion av textområden stöds
if(areas == null)
{
Console.WriteLine("Page text areas extraction isn't supported");
return;
}
// Iterera över sidtextområden
foreach(PageTextArea a in areas)
{
// Skriv ut ett sidindex, rektangel och textområdesvärde:
Console.WriteLine(string.Format("Page: {0}, R: {1}, Text: {2}", a.Page.Index, a.Rectangle, a.Text));
}
}
Se även
- class PageTextArea
- class Parser
- namnutrymme GroupDocs.Parser
- hopsättning GroupDocs.Parser
GetTextAreas(PageTextAreaOptions)
Extraherar textområden från dokumentet med hjälp av anpassningsalternativ (reguljärt uttryck, skiftläge, etc.).
public IEnumerable<PageTextArea> GetTextAreas(PageTextAreaOptions options)
Parameter | Typ | Beskrivning |
---|---|---|
options | PageTextAreaOptions | Alternativen för extrahering av textområde. |
Returvärde
En samling avPageTextArea
objekt; null
om extrahering av textområden inte stöds.
Anmärkningar
Läs mer:
Exempel
Följande exempel visar hur man extraherar endast textområden med siffror från det övre vänstra hörnet:
// Skapa en instans av Parser-klassen
using(Parser parser = new Parser(filePath))
{
// Skapa alternativen som används för att extrahera textområde
PageTextAreaOptions options = new PageTextAreaOptions("[0-9]+", new Rectangle(new Point(0, 0), new Size(300, 100)));
// Extrahera textområden som bara innehåller siffror från det övre vänstra hörnet på en sida:
IEnumerable<PageTextArea> areas = parser.GetTextAreas(options);
// Kontrollera om extraktion av textområden stöds
if(areas == null)
{
Console.WriteLine("Page text areas extraction isn't supported");
return;
}
// Iterera över sidtextområden
foreach(PageTextArea a in areas)
{
// Skriv ut ett sidindex, rektangel och textområdesvärde:
Console.WriteLine(string.Format("Page: {0}, R: {1}, Text: {2}", a.Page.Index, a.Rectangle, a.Text));
}
}
Se även
- class PageTextArea
- class PageTextAreaOptions
- class Parser
- namnutrymme GroupDocs.Parser
- hopsättning GroupDocs.Parser
GetTextAreas(int)
Extraherar textområden från dokumentsidan.
public IEnumerable<PageTextArea> GetTextAreas(int pageIndex)
Parameter | Typ | Beskrivning |
---|---|---|
pageIndex | Int32 | Det nollbaserade sidindexet. |
Returvärde
En samling avPageTextArea
objekt; null
om extrahering av textområden inte stöds.
Anmärkningar
Läs mer:
Exempel
För att extrahera textområden från en dokumentsida används följande metod:
// Skapa en instans av Parser-klassen
using(Parser parser = new Parser(filePath))
{
// Kontrollera om dokumentet stöder extraktion av textområden
if(!parser.Features.TextAreas)
{
Console.WriteLine("Document isn't supports text areas extraction.");
return;
}
// Få dokumentinformationen
IDocumentInfo documentInfo = parser.GetDocumentInfo();
// Kontrollera om dokumentet har sidor
if(documentInfo.PageCount == 0)
{
Console.WriteLine("Document hasn't pages.");
return;
}
// Iterera över sidor
for(int pageIndex = 0; pageIndex<documentInfo.PageCount; pageIndex++)
{
// Skriv ut ett sidnummer
Console.WriteLine(string.Format("Page {0}/{1}", pageIndex + 1, documentInfo.PageCount));
// Iterera över sidtextområden
// Vi ignorerar nollkontroll eftersom vi har kontrollerat stöd för extraheringsfunktioner för textområden tidigare
foreach(PageTextArea a in parser.GetTextAreas(pageIndex))
{
// Skriv ut en rektangel och ett textområdesvärde:
Console.WriteLine(string.Format("R: {0}, Text: {1}", a.Rectangle, a.Text));
}
}
}
Se även
- class PageTextArea
- class Parser
- namnutrymme GroupDocs.Parser
- hopsättning GroupDocs.Parser
GetTextAreas(int, PageTextAreaOptions)
Extraherar textområden från dokumentsidan med hjälp av anpassningsalternativ (reguljärt uttryck, skiftläge, etc.).
public IEnumerable<PageTextArea> GetTextAreas(int pageIndex, PageTextAreaOptions options)
Parameter | Typ | Beskrivning |
---|---|---|
pageIndex | Int32 | Det nollbaserade sidindexet. |
options | PageTextAreaOptions | Alternativen för extrahering av textområde. |
Returvärde
En samling avPageTextArea
objekt; null
om extrahering av textområden inte stöds.
Anmärkningar
Läs mer:
Se även
- class PageTextArea
- class PageTextAreaOptions
- class Parser
- namnutrymme GroupDocs.Parser
- hopsättning GroupDocs.Parser