ASPOSE.OCR के साथ छवियों से तालिकाओं और टेबल डेटा निकालने के लिए कैसे

ASPOSE.OCR के साथ छवियों से तालिकाओं और टेबल डेटा निकालने के लिए कैसे

छवियों, फॉर्मों, या स्कैन किए गए रिपोर्टों से तालिकाओं को निकालना चुनौतीपूर्ण है – मैन्युअल रिटाइपिंग धीमी और त्रुटि-प्रेरित है. Aspose.OCR टेबल-टू-टेक्स्ट के लिए .NET तस्वीरों और फोटो से टैबलेट डेटा के निकालने और संरचना को स्वचालित करता है।

असली दुनिया की समस्या

वित्तीय रिपोर्ट, सर्वेक्षण फॉर्म और वैज्ञानिक परिणाम अक्सर स्कैन किए गए तालिकाओं या छवियों में फंस जाते हैं. मैन्युअल रूप से इस डेटा को पुनर्जीवित करना घंटों और त्रुटियों का जोखिम बर्बाद करता है.

समाधान समीक्षा

.NET के लिए Aspose.OCR सटीक रूप से छवियों या स्कैन किए गए पीडीएफ से तालिकाओं का पता लगाने, निकालने और परिवर्तित करने में सक्षम है - मशीन-पढ़ने योग्य प्रारूपों में - Excel, रिपोर्टिंग, या कार्यप्रवाह स्वचालन के साथ सही।

Prerequisites

  • Visual Studio 2019 या बाद में
  • .NET 6.0 या बाद में (या .Net Framework 4.6.2+)
  • NuGet से .NET के लिए Aspose.OCR
  • C# ज्ञान
PM> Install-Package Aspose.OCR

चरण-दर-चरण कार्यान्वयन

चरण 1: Aspose.OCR स्थापित करें और सेट करें

using Aspose.OCR;

चरण 2: तालिकाओं के साथ स्कैन या फोटो छवियों

OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("table1.jpg");
input.Add("report_page.png");

चरण 3: टेबल पहचान सेटिंग्स सेट करें

RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.TABLE; // Key for tables

चरण 4: टेबल निकालने की प्रक्रिया चलाएं

AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);

चरण 5: निर्यात तालिका डेटा

foreach (RecognitionResult result in results)
{
    result.Save("table_data.xlsx", SaveFormat.Xlsx); // Excel output
    result.Save("table_data.csv", SaveFormat.Csv);   // CSV output
    result.Save("table_data.txt", SaveFormat.Text);  // Plain text output
}

चरण 6: त्रुटियों को संभालने और पुष्टिकरण जोड़ें

try
{
    AsposeOcr ocr = new AsposeOcr();
    List<RecognitionResult> results = ocr.Recognize(input, settings);
    // Further processing
}
catch (Exception ex)
{
    Console.WriteLine($"Error: {ex.Message}");
}

चरण 7: जटिल, घुमावदार या बहु-पृष्ठ तालिकाओं के लिए अनुकूलन करें

  • प्री-प्रसंस्करण छवियों को deskew या crop के लिए
  • उच्च रिज़ॉल्यूशन स्कैन या फोटो का उपयोग करें
  • कई पृष्ठों के पीडीएफ के लिए, प्रत्येक पृष्ठ को एक अलग इनपुट के रूप में जोड़ें
foreach (string file in Directory.GetFiles("./scans", "*.png"))
{
    input.Add(file);
}

चरण 8: पूर्ण उदाहरण

using Aspose.OCR;
using System;
using System.Collections.Generic;

class Program
{
    static void Main(string[] args)
    {
        try
        {
            OcrInput input = new OcrInput(InputType.SingleImage);
            input.Add("table1.jpg");
            input.Add("report_page.png");

            RecognitionSettings settings = new RecognitionSettings();
            settings.Language = Language.English;
            settings.DetectAreasMode = DetectAreasMode.TABLE;

            AsposeOcr ocr = new AsposeOcr();
            List<RecognitionResult> results = ocr.Recognize(input, settings);

            foreach (RecognitionResult result in results)
            {
                result.Save("table_data.xlsx", SaveFormat.Xlsx);
                result.Save("table_data.csv", SaveFormat.Csv);
                result.Save("table_data.txt", SaveFormat.Text);
            }
        }
        catch (Exception ex)
        {
            Console.WriteLine($"Error: {ex.Message}");
        }
    }
}

मामलों और अनुप्रयोगों का उपयोग करें

वित्तीय और वैज्ञानिक रिपोर्टिंग

Excel में त्वरित विश्लेषण के लिए वित्तीय रिपोर्टों, प्रयोगशाला परिणामों या अनुसंधान दस्तावेजों से तालिकाओं को निकालना।

सर्वेक्षण और फॉर्म प्रसंस्करण

स्कैन किए गए फॉर्म, चेकलिस्ट या सेंसर रिकॉर्ड से तालिकाओं को डिजिटल करें।

कार्यप्रवाह ऑटोमेशन

संरचित तालिका डेटा को सीधे आपके व्यवसाय अनुप्रयोगों, बीआई उपकरणों या डाटाबेस में डालें।

आम चुनौतियां और समाधान

चुनौती 1: खराब गुणवत्ता या जटिल तालिकाएं

** समाधान:** उच्च रिज़ल छवियों का उपयोग करें और नमूना सेट पर परीक्षण करें. स्पष्टता में सुधार करने के लिए प्रारंभिक प्रक्रिया.

चुनौती 2: घुमावदार या विचलित तालिकाएं

** समाधान:** प्रसंस्करण से पहले छवियों को डिस्केव करें; DetectAreasMode.TABLE का उपयोग करें।

चुनौती 3: बहु-पृष्ठ रिपोर्ट

** समाधान:** बैच प्रसंस्करण के लिए प्रत्येक पृष्ठ को एक अलग इनपुट के रूप में जोड़ें।

प्रदर्शन विचार

  • गति के लिए बैच प्रक्रिया
  • उच्च गुणवत्ता वाले स्कैन / फोटो का उपयोग करें
  • बड़े दौड़ के बाद ओसीआर वस्तुओं की उपलब्धता

सर्वश्रेष्ठ अभ्यास

  • एकीकरण से पहले उत्पादन की पुष्टि करें
  • जरूरत के अनुसार टेबल पहचान सेटिंग्स
  • मूल और डिजिटल डेटा का बैकअप
  • तैनात करने से पहले वास्तविक नमूनों का परीक्षण करें

उन्नत परिदृश्य

परिदृश्य 1: बहुभाषी टेबल निष्कर्षण

settings.Language = Language.German;

परिदृश्य 2: डेटा पाइपलाइनों के लिए JSON में निर्यात

foreach (RecognitionResult result in results)
{
    result.Save("table_data.json", SaveFormat.Json);
}

Conclusion

.NET के लिए Aspose.OCR टेबल-टू-टेक्स्ट छवियों और स्कैन को संचालित, संरचित तालिका डेटा में परिवर्तित करता है - विश्लेषण, रिपोर्टिंग और स्वचालन के लिये तैयार।

अधिक तालिका पहचान कोड नमूने देखें .NET API संदर्भ के लिए Aspose.OCR .

 हिंदी