GetTextAreas
GetTextAreas()
Εξάγει περιοχές κειμένου από το έγγραφο.
public IEnumerable<PageTextArea> GetTextAreas()
Επιστρεφόμενη Αξία
Μια συλλογή απόPageTextArea
αντικείμενα; μηδενικό
εάν η εξαγωγή περιοχών κειμένου δεν υποστηρίζεται.
Παρατηρήσεις
Μάθε περισσότερα:
Παραδείγματα
Το ακόλουθο παράδειγμα δείχνει πώς να εξαγάγετε όλες τις περιοχές κειμένου από ολόκληρο το έγγραφο:
// Δημιουργία μιας παρουσίας κλάσης Parser
using(Parser parser = new Parser(filePath))
{
// Εξαγωγή περιοχών κειμένου
IEnumerable<PageTextArea> areas = parser.GetTextAreas();
// Ελέγξτε εάν υποστηρίζεται η εξαγωγή περιοχών κειμένου
if(areas == null)
{
Console.WriteLine("Page text areas extraction isn't supported");
return;
}
// Επανάληψη περιοχών κειμένου σελίδας
foreach(PageTextArea a in areas)
{
// Εκτύπωση τιμής ευρετηρίου σελίδας, ορθογωνίου και περιοχής κειμένου:
Console.WriteLine(string.Format("Page: {0}, R: {1}, Text: {2}", a.Page.Index, a.Rectangle, a.Text));
}
}
Δείτε επίσης
- class PageTextArea
- class Parser
- χώρος ονομάτων GroupDocs.Parser
- συνέλευση GroupDocs.Parser
GetTextAreas(PageTextAreaOptions)
Εξάγει περιοχές κειμένου από το έγγραφο χρησιμοποιώντας επιλογές προσαρμογής (κανονική έκφραση, κεφαλαία αντιστοίχισης, κ.λπ.).
public IEnumerable<PageTextArea> GetTextAreas(PageTextAreaOptions options)
Παράμετρος | Τύπος | Περιγραφή |
---|---|---|
options | PageTextAreaOptions | Οι επιλογές για εξαγωγή περιοχής κειμένου. |
Επιστρεφόμενη Αξία
Μια συλλογή απόPageTextArea
αντικείμενα; μηδενικό
εάν η εξαγωγή περιοχών κειμένου δεν υποστηρίζεται.
Παρατηρήσεις
Μάθε περισσότερα:
Παραδείγματα
Το ακόλουθο παράδειγμα δείχνει πώς να εξαγάγετε μόνο περιοχές κειμένου με ψηφία από την επάνω αριστερή γωνία:
// Δημιουργία μιας παρουσίας κλάσης Parser
using(Parser parser = new Parser(filePath))
{
// Δημιουργήστε τις επιλογές που χρησιμοποιούνται για την εξαγωγή της περιοχής κειμένου
PageTextAreaOptions options = new PageTextAreaOptions("[0-9]+", new Rectangle(new Point(0, 0), new Size(300, 100)));
// Εξαγωγή περιοχών κειμένου που περιέχουν μόνο ψηφία από την επάνω αριστερή γωνία μιας σελίδας:
IEnumerable<PageTextArea> areas = parser.GetTextAreas(options);
// Ελέγξτε εάν υποστηρίζεται η εξαγωγή περιοχών κειμένου
if(areas == null)
{
Console.WriteLine("Page text areas extraction isn't supported");
return;
}
// Επανάληψη περιοχών κειμένου σελίδας
foreach(PageTextArea a in areas)
{
// Εκτύπωση τιμής ευρετηρίου σελίδας, ορθογωνίου και περιοχής κειμένου:
Console.WriteLine(string.Format("Page: {0}, R: {1}, Text: {2}", a.Page.Index, a.Rectangle, a.Text));
}
}
Δείτε επίσης
- class PageTextArea
- class PageTextAreaOptions
- class Parser
- χώρος ονομάτων GroupDocs.Parser
- συνέλευση GroupDocs.Parser
GetTextAreas(int)
Εξάγει περιοχές κειμένου από τη σελίδα του εγγράφου.
public IEnumerable<PageTextArea> GetTextAreas(int pageIndex)
Παράμετρος | Τύπος | Περιγραφή |
---|---|---|
pageIndex | Int32 | Το ευρετήριο σελίδας που βασίζεται σε μηδέν. |
Επιστρεφόμενη Αξία
Μια συλλογή απόPageTextArea
αντικείμενα; μηδενικό
εάν η εξαγωγή περιοχών κειμένου δεν υποστηρίζεται.
Παρατηρήσεις
Μάθε περισσότερα:
Παραδείγματα
Για την εξαγωγή περιοχών κειμένου από μια σελίδα εγγράφου χρησιμοποιείται η ακόλουθη μέθοδος:
// Δημιουργία μιας παρουσίας κλάσης Parser
using(Parser parser = new Parser(filePath))
{
// Ελέγξτε εάν το έγγραφο υποστηρίζει την εξαγωγή περιοχών κειμένου
if(!parser.Features.TextAreas)
{
Console.WriteLine("Document isn't supports text areas extraction.");
return;
}
// Λάβετε τις πληροφορίες του εγγράφου
IDocumentInfo documentInfo = parser.GetDocumentInfo();
// Ελέγξτε εάν το έγγραφο έχει σελίδες
if(documentInfo.PageCount == 0)
{
Console.WriteLine("Document hasn't pages.");
return;
}
// Επανάληψη σε σελίδες
for(int pageIndex = 0; pageIndex<documentInfo.PageCount; pageIndex++)
{
// Εκτύπωση αριθμού σελίδας
Console.WriteLine(string.Format("Page {0}/{1}", pageIndex + 1, documentInfo.PageCount));
// Επανάληψη περιοχών κειμένου σελίδας
// Αγνοούμε τον μηδενικό έλεγχο καθώς έχουμε ελέγξει νωρίτερα την υποστήριξη δυνατοτήτων εξαγωγής περιοχών κειμένου
foreach(PageTextArea a in parser.GetTextAreas(pageIndex))
{
// Εκτύπωση τιμής ορθογωνίου και περιοχής κειμένου:
Console.WriteLine(string.Format("R: {0}, Text: {1}", a.Rectangle, a.Text));
}
}
}
Δείτε επίσης
- class PageTextArea
- class Parser
- χώρος ονομάτων GroupDocs.Parser
- συνέλευση GroupDocs.Parser
GetTextAreas(int, PageTextAreaOptions)
Εξάγει περιοχές κειμένου από τη σελίδα του εγγράφου χρησιμοποιώντας επιλογές προσαρμογής (κανονική έκφραση, κεφαλαία αντιστοίχισης κ.λπ.).
public IEnumerable<PageTextArea> GetTextAreas(int pageIndex, PageTextAreaOptions options)
Παράμετρος | Τύπος | Περιγραφή |
---|---|---|
pageIndex | Int32 | Το ευρετήριο σελίδας που βασίζεται σε μηδέν. |
options | PageTextAreaOptions | Οι επιλογές για εξαγωγή περιοχής κειμένου. |
Επιστρεφόμενη Αξία
Μια συλλογή απόPageTextArea
αντικείμενα; μηδενικό
εάν η εξαγωγή περιοχών κειμένου δεν υποστηρίζεται.
Παρατηρήσεις
Μάθε περισσότερα:
Δείτε επίσης
- class PageTextArea
- class PageTextAreaOptions
- class Parser
- χώρος ονομάτων GroupDocs.Parser
- συνέλευση GroupDocs.Parser