Aspose.OCR के साथ छवियों से तालिका डेटा निकालने के लिए कैसे
स्कैनिंग या चित्रित छवियों से तालिकाओं को निकालना अक्सर एक मैन्युअल, त्रुटि-प्रेरित प्रक्रिया है. .NET के लिए Aspose.OCR टेबल-टू-टेक्स्ट के साथ, आप इमेजिंग से संरचित तालिबैक डेटा का निष्कर्षण स्वचालित कर सकते हैं – समय बचाते हैं, गलतियों को कम करते हैं और डेटिंग बेस, एक्सेल या रिपोर्टिंग उपकरणों से अनियंत्रित एकीकरण की अनुमति देते हैं।
असली दुनिया की समस्या
व्यवसायों को अक्सर बिलों, रिपोर्टों, या छवियों या स्कैन के रूप में फॉर्म में तालिकाएं मिलती हैं. मैन्युअल रूप से इस डेटा को स्पेडबोर्ड या विश्लेषण प्लेटफार्मों में फिर से डालना अप्रभावी और त्रुटि-प्रेरित है, खासकर बड़े वॉल्यूम या जटिल टेबल के लिए।
समाधान समीक्षा
.NET के लिए ASPOSE.OCR टेबल-टू-टेक्स्ट तालिका पहचान और छवियों से डेटा निकालना स्वचालित करता है, सटीक रूप से सेल संरचना और सामग्री का पता लगाता है. यह आपको स्कैन किए गए या चित्रों को संरचित, खोज योग्य और संपादित प्रारूपों में परिवर्तित करने की अनुमति देता है कम से कम कोड के साथ।
Prerequisites
शुरू करने से पहले, आपको आवश्यकता होगी:
- Visual Studio 2019 या बाद में
- .NET 6.0 या बाद में (या .Net Framework 4.6.2+)
- NuGet से .NET के लिए Aspose.OCR
- C# ज्ञान
PM> Install-Package Aspose.OCR
चरण-दर-चरण कार्यान्वयन
चरण 1: Aspose.OCR स्थापित करें और सेट करें
Aspose.OCR पैकेज जोड़ें और आवश्यक नाम स्थान शामिल करें:
using Aspose.OCR;
चरण 2: टेबल छवि इनपुट तैयार करें
अपने इनपुट में एक या अधिक तालिका छवियों को जोड़ें. बैच निकालने के लिए, कई फ़ाइलों का उपयोग करें.
OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("table1.png");
input.Add("table2.jpg");
चरण 3: टेबल पहचान सेटिंग्स सेट करें
टेबल डिटेक्शन मोड सुनिश्चित करने के लिए संरचना को सटीक रूप से पहचाना जाता है।
RecognitionSettings settings = new RecognitionSettings();
settings.DetectAreasMode = DetectAreasMode.TABLE;
settings.Language = Language.English; // Adjust if table contains non-English text
चरण 4: टेबल पहचान प्रक्रिया चलाएं
स्थापित सेटिंग्स के साथ तालिकाओं की पहचान करें:
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
चरण 5: तालिका डेटा का निर्यात और उपयोग करें
आप पाठ, Excel, JSON, या अन्य प्रारूपों में निर्यात कर सकते हैं।
foreach (RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText); // Raw table as text
result.Save("table.csv", SaveFormat.Csv); // Save as CSV
result.Save("table.xlsx", SaveFormat.Xlsx); // Save as Excel
}
चरण 6: त्रुटि को संभालने के लिए जोड़ें
मजबूत समाधान बनाने के लिए अपवाद प्रबंधन जोड़ें।
try
{
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
// further processing...
}
catch (Exception ex)
{
Console.WriteLine($"Error: {ex.Message}");
}
चरण 7: जटिल तालिकाओं के लिए अनुकूलन
- सटीक संरचना का पता लगाने के लिए उच्च रिज़ॉल्यूशन स्कैन / फोटो का उपयोग करें
- विभिन्न टेबल लेआउट के साथ परीक्षण (मिश्रित कोशिकाएं, मल्टी-लाइन हेडर्स, सीमाएं)
- जरूरत पड़ने पर ट्यूनिंग सिस्टम
// Example: Add all images from a folder
foreach (string file in Directory.GetFiles("./tables", "*.png"))
{
input.Add(file);
}
चरण 8: पूर्ण कार्य उदाहरण
using Aspose.OCR;
using System;
using System.Collections.Generic;
class Program
{
static void Main(string[] args)
{
try
{
OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("table1.png");
input.Add("table2.jpg");
RecognitionSettings settings = new RecognitionSettings();
settings.DetectAreasMode = DetectAreasMode.TABLE;
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
foreach (RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
result.Save("table.csv", SaveFormat.Csv);
result.Save("table.xlsx", SaveFormat.Xlsx);
}
}
catch (Exception ex)
{
Console.WriteLine($"Error: {ex.Message}");
}
}
}
मामलों और अनुप्रयोगों का उपयोग करें
वित्तीय रिपोर्ट और बिल
छवियों से लेनदेन तालिकाओं को Excel या डेटाबेस सिस्टम में स्वचालित रूप से निकालें।
अनुसंधान और विश्लेषण
डेटा विश्लेषण के लिए स्कैन किए गए प्रकाशनों या सर्वेक्षण फॉर्म से तालिकाओं को डिजिटल करें।
स्वचालित डेटा प्रवास
विरासत दस्तावेजों या स्कैन किए गए पेपर रिकॉर्ड को आधुनिक संरचित प्रारूपों में स्थानांतरित करें।
आम चुनौतियां और समाधान
चुनौती 1: Blurry या जटिल टेबल छवियों
** समाधान:** संरचना पहचान में सुधार के लिए स्पष्ट छवियों या प्री-प्रसंस्करण के साथ प्रयोग का उपयोग करें।
चुनौती 2: गैर-मानक टेबल लेआउट
** समाधान:** जटिल लेआउट या सीमाहीन तालिकाओं के लिए सेटिंग्स का परीक्षण और समायोजन करें।
चुनौती 3: बड़े पैमाने या मिश्रित छवि प्रकार
** समाधान:** कई फ़ाइलों से निष्कर्ष निकालने के लिए बैच प्रसंस्करण और निर्देशिका स्कैन का उपयोग करें।
प्रदर्शन विचार
- अच्छी तरह से उज्ज्वल, उच्च-रेस छवियों का उपयोग करें
- प्रभावीता के लिए बैच प्रक्रिया
- उपयोग के बाद ओसीआर वस्तुओं की तैयारी
सर्वश्रेष्ठ अभ्यास
- हमेशा आगे प्रसंस्करण से पहले निर्यात तालिका डेटा सत्यापित करें
- इष्टतम संरचना का पता लगाने के लिए प्री-प्रसंस्करण छवियों
- सुरक्षित और मूल स्कैन / छवियों का बैकअप
- अपने कार्यप्रवाह के लिए सही निर्यात प्रारूप का उपयोग करें (CSV, XLSX, JSON)
उन्नत परिदृश्य
परिदृश्य 1: मिश्रित-भाषा टेबल निकालना
settings.Language = Language.Chinese;
परिदृश्य 2: टेबल और पाठ निकालने के संयोजन
settings.DetectAreasMode = DetectAreasMode.COMBINE;
Conclusion
.NET के लिए Aspose.OCR टेबल-टू-टेक्स्ट छवि तालिकाओं को संरचित, संपादित डेटा में परिवर्तित करता है – कोई मैन्युअल इनपुट की आवश्यकता नहीं है. वित्तीय रिपोर्टिंग, विश्लेषण और डिजिटल संग्रह को तेज करें, सटीक, स्वचालित टैबलेट निकालने के साथ।
अधिक उदाहरण और तकनीकी विवरण के लिए, देखें .NET API संदर्भ के लिए Aspose.OCR .