GetTextAreas

GetTextAreas()

दस्तावेज़ से पाठ क्षेत्रों को निकालता है।

public IEnumerable<PageTextArea> GetTextAreas()

प्रतिलाभ की मात्रा

का संग्रहPageTextArea ऑब्जेक्ट्स; व्यर्थ यदि टेक्स्ट क्षेत्र निकालना समर्थित नहीं है.

टिप्पणियों

और अधिक जानें:

उदाहरण

निम्न उदाहरण दिखाता है कि संपूर्ण दस्तावेज़ से सभी पाठ क्षेत्रों को कैसे निकाला जाए:

// पार्सर वर्ग का एक उदाहरण बनाएँ
using(Parser parser = new Parser(filePath))
{
    // पाठ क्षेत्रों को निकालें
    IEnumerable<PageTextArea> areas = parser.GetTextAreas();
    // जांचें कि टेक्स्ट क्षेत्र निष्कर्षण समर्थित है या नहीं
    if(areas == null)
    {
        Console.WriteLine("Page text areas extraction isn't supported");
        return;
    }
 
    // पृष्ठ पाठ क्षेत्रों पर पुनरावृति करें
    foreach(PageTextArea a in areas)
    {
        // एक पेज इंडेक्स, आयत और टेक्स्ट एरिया वैल्यू प्रिंट करें:
        Console.WriteLine(string.Format("Page: {0}, R: {1}, Text: {2}", a.Page.Index, a.Rectangle, a.Text));
    }
}

यह सभी देखें


GetTextAreas(PageTextAreaOptions)

अनुकूलन विकल्पों (रेगुलर एक्सप्रेशन, मैच केस, आदि) का उपयोग करके दस्तावेज़ से टेक्स्ट क्षेत्र निकालता है।

public IEnumerable<PageTextArea> GetTextAreas(PageTextAreaOptions options)
पैरामीटर प्रकार विवरण
options PageTextAreaOptions पाठ क्षेत्र निष्कर्षण के लिए विकल्प।

प्रतिलाभ की मात्रा

का संग्रहPageTextArea ऑब्जेक्ट्स; व्यर्थ यदि टेक्स्ट क्षेत्र निकालना समर्थित नहीं है.

टिप्पणियों

और अधिक जानें:

उदाहरण

निम्न उदाहरण दिखाता है कि केवल ऊपरी-बाएँ कोने से अंकों वाले टेक्स्ट क्षेत्रों को कैसे निकाला जाए:

// पार्सर वर्ग का एक उदाहरण बनाएँ
using(Parser parser = new Parser(filePath))
{
    // पाठ क्षेत्र निष्कर्षण के लिए उपयोग किए जाने वाले विकल्प बनाएं
    PageTextAreaOptions options = new PageTextAreaOptions("[0-9]+", new Rectangle(new Point(0, 0), new Size(300, 100)));

    // उन पाठ क्षेत्रों को निकालें जिनमें पृष्ठ के ऊपरी-बाएँ कोने से केवल अंक होते हैं:
    IEnumerable<PageTextArea> areas = parser.GetTextAreas(options);
    // जांचें कि टेक्स्ट क्षेत्र निष्कर्षण समर्थित है या नहीं
    if(areas == null)
    {
        Console.WriteLine("Page text areas extraction isn't supported");
        return;
    }
 
    // पृष्ठ पाठ क्षेत्रों पर पुनरावृति करें
    foreach(PageTextArea a in areas)
    {
        // एक पेज इंडेक्स, आयत और टेक्स्ट एरिया वैल्यू प्रिंट करें:
        Console.WriteLine(string.Format("Page: {0}, R: {1}, Text: {2}", a.Page.Index, a.Rectangle, a.Text));
    }
}

यह सभी देखें


GetTextAreas(int)

दस्तावेज़ पृष्ठ से टेक्स्ट क्षेत्र निकालता है.

public IEnumerable<PageTextArea> GetTextAreas(int pageIndex)
पैरामीटर प्रकार विवरण
pageIndex Int32 शून्य-आधारित पृष्ठ अनुक्रमणिका।

प्रतिलाभ की मात्रा

का संग्रहPageTextArea ऑब्जेक्ट्स; व्यर्थ यदि टेक्स्ट क्षेत्र निकालना समर्थित नहीं है.

टिप्पणियों

और अधिक जानें:

उदाहरण

दस्तावेज़ पृष्ठ से टेक्स्ट क्षेत्र निकालने के लिए निम्न विधि का उपयोग किया जाता है:

// पार्सर वर्ग का एक उदाहरण बनाएँ
using(Parser parser = new Parser(filePath))
{
    // जांचें कि क्या दस्तावेज़ पाठ क्षेत्र निष्कर्षण का समर्थन करता है
    if(!parser.Features.TextAreas)
    {
        Console.WriteLine("Document isn't supports text areas extraction.");
        return;
    }

    // दस्तावेज़ की जानकारी प्राप्त करें
    IDocumentInfo documentInfo = parser.GetDocumentInfo();
    // जांचें कि क्या दस्तावेज़ में पृष्ठ हैं
    if(documentInfo.PageCount == 0)
    {
        Console.WriteLine("Document hasn't pages.");
        return;
    }
 
    // पृष्ठों पर पुनरावृति
    for(int pageIndex = 0; pageIndex<documentInfo.PageCount; pageIndex++)
    {
        // पेज नंबर प्रिंट करें 
        Console.WriteLine(string.Format("Page {0}/{1}", pageIndex + 1, documentInfo.PageCount));
 
        // पृष्ठ पाठ क्षेत्रों पर पुनरावृति करें
        // हम अशक्त-जाँच को अनदेखा करते हैं क्योंकि हमने पहले पाठ क्षेत्र निष्कर्षण सुविधा समर्थन की जाँच की है
        foreach(PageTextArea a in parser.GetTextAreas(pageIndex))
        {
            // एक आयत और पाठ क्षेत्र मान प्रिंट करें:
            Console.WriteLine(string.Format("R: {0}, Text: {1}", a.Rectangle, a.Text));
        }
    }
}

यह सभी देखें


GetTextAreas(int, PageTextAreaOptions)

अनुकूलन विकल्पों (रेगुलर एक्सप्रेशन, मैच केस, आदि) का उपयोग करके दस्तावेज़ पृष्ठ से पाठ क्षेत्रों को निकालता है।

public IEnumerable<PageTextArea> GetTextAreas(int pageIndex, PageTextAreaOptions options)
पैरामीटर प्रकार विवरण
pageIndex Int32 शून्य-आधारित पृष्ठ अनुक्रमणिका।
options PageTextAreaOptions पाठ क्षेत्र निष्कर्षण के लिए विकल्प।

प्रतिलाभ की मात्रा

का संग्रहPageTextArea ऑब्जेक्ट्स; व्यर्थ यदि टेक्स्ट क्षेत्र निकालना समर्थित नहीं है.

टिप्पणियों

और अधिक जानें:

यह सभी देखें