Aspose.OCR का उपयोग करके OCR नौकरियों के बैच प्रसंस्करण और कार्यक्रम को स्वचालित करने के लिए कैसे

Aspose.OCR का उपयोग करके OCR नौकरियों के बैच प्रसंस्करण और कार्यक्रम को स्वचालित करने के लिए कैसे

.NET के लिए Aspose.OCR पूर्ण बैच स्वचालितता का समर्थन करता है - मॉनिटर फ़ोल्डर, कार्यक्रम कार्य, बड़ी मात्रा में प्रसंस्करण, और अधिकतम दक्षता के साथ त्रुटियों से वसूली।

असली दुनिया की समस्या

कंपनियों को हर रात या सप्ताह हजारों स्कैन किए गए फ़ाइलों को संसाधित करना होगा. मैन्युअल या इंटरैक्टिव ओसीआर स्केल नहीं करता है और त्रुटि के जोखिम को बढ़ाता है. ऑटोमेशन और अनुसूची काम को विश्वसनीय रूप से, यहां तक कि रात भर या घंटों में भी चलने में मदद करती है।

समाधान समीक्षा

Aspose.OCR बैच एपीआई, फ़ाइल / फ़ोल्डर निगरानी, और कार्यक्रम उपकरण (टास्क शेड्यूलर, cron, आदि) को स्केल पर OCR स्वचालित करने के लिए संयोजित करें. नए फाइलों, पैच में प्रसंस्करण और वांछित प्रारूपों और संग्रह में परिणामों को निर्यात करने का मॉनिटर.

Prerequisites

  • Visual Studio 2019 या बाद में
  • .NET 6.0 या बाद में (या .Net Framework 4.6.2+)
  • NuGet से .NET के लिए Aspose.OCR
  • (वैकल्पिक) Windows Task Scheduler, cron, या अन्य नौकरी स्वचालन उपकरण
PM> Install-Package Aspose.OCR

चरण-दर-चरण कार्यान्वयन

चरण 1: Aspose.OCR स्थापित करें और सेट करें

using Aspose.OCR;

चरण 2: बैच प्रसंस्करण के लिए फ़ाइलों का पता लगाएं

string inputFolder = "./input";
string[] files = Directory.GetFiles(inputFolder, "*.jpg", SearchOption.AllDirectories);

चरण 3: बैच में OCR चलाएं

OcrInput input = new OcrInput(InputType.SingleImage);
foreach (string file in files)
{
    input.Add(file);
}
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);

चरण 4: निर्यात और संग्रह परिणाम

int count = 1;
foreach (RecognitionResult result in results)
{
    result.Save($"./output/result_{count}.txt", SaveFormat.Text);
    count++;
}

चरण 5: नौकरियों और गलतियों को रिकॉर्ड करें

try
{
    // Batch OCR code
}
catch (Exception ex)
{
    File.AppendAllText("ocr_errors.log", ex.Message + Environment.NewLine);
}

चरण 6: स्वचालित अनुसूची (Windows Task Scheduler उदाहरण)

  • एक बैच फ़ाइल या PowerShell स्क्रिप्ट बनाएं ताकि आप अपने OCR कार्य को एक कार्यक्रम में चला सकें
  • हर दिन, रात में या ट्रिगर पर चलने के लिए कार्य कार्यक्रम का उपयोग करें
# Example: schedule_ocr.bat
# > dotnet run --project YourOcrProject.csproj

चरण 7: नए फ़ाइलों के लिए उन्नत – फ़ोल्डर निगरानी

FileSystemWatcher watcher = new FileSystemWatcher("./input", "*.jpg");
watcher.Created += (s, e) => { /* Trigger batch OCR on new file */ };
watcher.EnableRaisingEvents = true;

चरण 8: पूर्ण उदाहरण

using Aspose.OCR;
using System;
using System.IO;
using System.Collections.Generic;

class Program
{
    static void Main(string[] args)
    {
        try
        {
            string inputFolder = "./input";
            string[] files = Directory.GetFiles(inputFolder, "*.jpg", SearchOption.AllDirectories);
            OcrInput input = new OcrInput(InputType.SingleImage);
            foreach (string file in files)
            {
                input.Add(file);
            }
            RecognitionSettings settings = new RecognitionSettings();
            settings.Language = Language.English;
            AsposeOcr ocr = new AsposeOcr();
            List<RecognitionResult> results = ocr.Recognize(input, settings);
            int count = 1;
            foreach (RecognitionResult result in results)
            {
                result.Save($"./output/result_{count}.txt", SaveFormat.Text);
                count++;
            }
        }
        catch (Exception ex)
        {
            File.AppendAllText("ocr_errors.log", ex.Message + Environment.NewLine);
        }
    }
}

मामलों और अनुप्रयोगों का उपयोग करें

कॉर्पोरेट मेल रूम और डिजिटल इनबॉक्स

आयातित दस्तावेजों के बैच को बिना किसी मैन्युअल प्रयास के स्वचालित रूप से संसाधित करें।

स्वास्थ्य देखभाल, कानूनी और संग्रहीत कार्यप्रवाह

चिकित्सा रिकॉर्ड, अनुबंध, या संग्रह के लिए रात-रात या साप्ताहिक OCR नौकरियों की योजना बनाएं।

वित्तीय और अनुपालन संचालन

स्वचालित रिपोर्टिंग और अनुपालन नौकरियां जो बड़े स्कैन बैट्स को घंटों के बाहर संसाधित करती हैं।

आम चुनौतियां और समाधान

चुनौती 1: अविश्वसनीय मैनुअल प्रारंभ

समाधान: हमेशा अप्रत्याशित नौकरियों के लिए कार्यक्रम उपकरणों का उपयोग करें।

चुनौती 2: बड़े बैच में गलतियां

** समाधान:** स्थिर संचालन के लिए स्वचालित लॉगिंग और त्रुटियों का प्रबंधन।

चुनौती 3: नौकरी या संसाधन संकीर्णताएं

** समाधान:** स्टैगर नौकरियां, संसाधनों की निगरानी, और धीमी गति या विफलताओं के बारे में चेतावनी।

प्रदर्शन विचार

  • उच्च वॉल्यूम कार्यों के दौरान सीपीयू, स्मृति और डिस्क की निगरानी
  • काम के बाद विश्लेषण के लिए आउटपुट और त्रुटि लॉग का उपयोग करें
  • प्रभाव से बचने के लिए बैच नौकरियों को अवधि से बाहर रखा जाना चाहिए

सर्वश्रेष्ठ अभ्यास

  • विभिन्न फ़ाइल प्रकार और वॉल्यूम के साथ परीक्षण नौकरियां
  • असफलता या धीमी प्रदर्शन के लिए निगरानी रिकॉर्ड
  • सुरक्षित और संग्रहीत दोनों स्रोत और आउटपुट फ़ाइलें
  • स्वचालित स्क्रिप्ट को अपडेट और बनाए रखें

उन्नत परिदृश्य

परिदृश्य 1: बैच नौकरियों को समानांतर या वितरित करें

स्केल के लिए कई सर्वर या वीएम के माध्यम से नौकरियों को विभाजित करें।

परिदृश्य 2: नौकरी के पूरा होने पर वास्तविक समय चेतावनी

योजनाबद्ध कार्य समाप्त होने के बाद ईमेल या वेबहॉक सूचना भेजें।

Conclusion

.NET के लिए Aspose.OCR मजबूत, अप्रत्याशित OCR नौकरी स्वचालित करने की अनुमति देता है. बैच प्रसंस्करण और अनुसूची के साथ, आप समय पर, विश्वसनीय और त्रुटि-प्रतिरोधी कार्यप्रवाह सुनिश्चित कर सकते हैं. देखें .NET API संदर्भ के लिए Aspose.OCR बैच ऑटोमेशन टिप्स और कोड के लिए।

 हिंदी