چگونگی اتوماسیون پردازش و برنامه ریزی کارهای OCR با استفاده از Aspose.OCR

چگونگی اتوماسیون پردازش و برنامه ریزی کارهای OCR با استفاده از Aspose.OCR

جریان های کار اسناد جمعی نیاز به پردازش OCR قابل اعتماد و غیر منتظره دارد. ASPOSE.OCR برای .NET از اتوماسیون کامل مجموعه پشتیبانی می کند – پوشه های مانیتور، کارهای برنامه ریزی شده، فرآیند حجم بزرگ و بازسازی از خطا برای حداکثر بهره وری.

مشکل دنیای واقعی

کسب و کارها باید هزاران فایل اسکن شده را هر شب یا هفته پردازش کنند. OCR های دستی یا تعاملی در مقیاس قرار نمی گیرند و خطر خطا را افزایش می دهند. اتوماسیون و برنامه نویسی اطمینان حاصل می کند که شغل ها به طور قابل اعتماد، حتی در طول شب و یا در ساعات خارج از کار، اجرا می شوند.

بررسی راه حل

ترکیب Aspose.OCR بسته APIs، فایل / پوشه نظارت، و برنامه نویسی ابزار (برنامه کار، cron و غیره) برای اتوماسیون OCR در مقیاس.نمایش برای فایل های جدید، پردازش در بسته ها و صادرات نتایج به فرمت های مورد نظر و اسناد.

پیش شرط

  • Visual Studio 2019 یا بالاتر
  • .NET 6.0 یا بالاتر (یا .Net Framework 4.6.2+)
  • Aspose.OCR برای .NET از NuGet
  • (اختیاری) Windows Task Scheduler، cron یا سایر ابزارهای اتوماسیون کار
PM> Install-Package Aspose.OCR

پیاده سازی گام به گام

مرحله 1: نصب و تنظیم Aspose.OCR

using Aspose.OCR;

مرحله 2: کشف فایل ها برای پردازش باتچ

string inputFolder = "./input";
string[] files = Directory.GetFiles(inputFolder, "*.jpg", SearchOption.AllDirectories);

مرحله سوم: OCR را در بسته ها اجرا کنید

OcrInput input = new OcrInput(InputType.SingleImage);
foreach (string file in files)
{
    input.Add(file);
}
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);

مرحله 4: صادرات و نتایج آرشیو

int count = 1;
foreach (RecognitionResult result in results)
{
    result.Save($"./output/result_{count}.txt", SaveFormat.Text);
    count++;
}

مرحله پنجم: کارها و اشتباهات را ثبت کنید

try
{
    // Batch OCR code
}
catch (Exception ex)
{
    File.AppendAllText("ocr_errors.log", ex.Message + Environment.NewLine);
}

مرحله 6: برنامه ریزی اتوماتیک (مثال برنامه نویس وظایف ویندوز)

  • ایجاد یک فایل بسته یا اسکریپت PowerShell برای انجام وظایف OCR خود را در یک برنامه
  • استفاده از Task Scheduler برای اجرا روزانه، شبانه یا بر روی راه اندازی
# Example: schedule_ocr.bat
# > dotnet run --project YourOcrProject.csproj

مرحله 7: پیشرفته – نظارت بر اسناد برای فایل های جدید

FileSystemWatcher watcher = new FileSystemWatcher("./input", "*.jpg");
watcher.Created += (s, e) => { /* Trigger batch OCR on new file */ };
watcher.EnableRaisingEvents = true;

مرحله هشتم: نمونه کامل

using Aspose.OCR;
using System;
using System.IO;
using System.Collections.Generic;

class Program
{
    static void Main(string[] args)
    {
        try
        {
            string inputFolder = "./input";
            string[] files = Directory.GetFiles(inputFolder, "*.jpg", SearchOption.AllDirectories);
            OcrInput input = new OcrInput(InputType.SingleImage);
            foreach (string file in files)
            {
                input.Add(file);
            }
            RecognitionSettings settings = new RecognitionSettings();
            settings.Language = Language.English;
            AsposeOcr ocr = new AsposeOcr();
            List<RecognitionResult> results = ocr.Recognize(input, settings);
            int count = 1;
            foreach (RecognitionResult result in results)
            {
                result.Save($"./output/result_{count}.txt", SaveFormat.Text);
                count++;
            }
        }
        catch (Exception ex)
        {
            File.AppendAllText("ocr_errors.log", ex.Message + Environment.NewLine);
        }
    }
}

استفاده از موارد و برنامه ها

اتاق های ایمیل شرکت ها و جعبه های دیجیتال

به طور خودکار بسته های اسناد ورودی را بدون تلاش دستی پردازش می کند.

مراقبت های بهداشتی، حقوقی و آرشیو جریان کار

برنامه شبانه یا هفتگی کارهای OCR برای سوابق پزشکی، قراردادهای یا اسناد.

عملیات مالی و انطباق

گزارش های اتوماتیک و وظایف انطباق که بسته های اسکن بزرگ را در ساعات خارج پردازش می کنند.

چالش ها و راه حل های مشترک

چالش اول: شروع دستی غیر قابل اعتماد

** راه حل:** همیشه از ابزارهای برنامه ریزی برای شغل های غیر منتظره استفاده کنید.

چالش ۲: اشتباهات در بازی های بزرگ

** راه حل:** سوابق اتوماتیک و مدیریت خطا برای عملکرد قوی.

چالش سوم: محدودیت های شغلی و یا کمبود منابع

** راه حل: ** شغل ها را به تعویق بیندازید، منابع را نظارت کنید و هشدار در مورد تاخیر یا شکست ها داشته باشید.

بررسی عملکرد

  • مانیتور CPU، حافظه و دیسک در هنگام کار با حجم بالا
  • استفاده از سوابق خروجی و خطا برای تجزیه و تحلیل پس از کار
  • شغل های بتچ باید به صورت غیرمستقیم برنامه ریزی شود تا از تاثیر آن اجتناب شود.

بهترین شیوه‌ها

  • کارهای آزمایشی با انواع و حجم فایل های مختلف
  • نظارت بر سوابق برای شکست یا عملکرد آهسته
  • حفظ و ذخیره فایل های منبع و خروجی
  • به روز رسانی و نگهداری اسکریپت های اتوماسیون

سناریوهای پیشرفته

سناریو ۱: پاراگراف کردن یا توزیع شغل های بسته بندی

توزیع شغل در چندین سرور یا VM برای مقیاس.

سناریو 2: هشدار در زمان واقعی در مورد تکمیل شغل

ارسال ایمیل یا هشدار webhook پس از پایان کار برنامه ریزی شده.

نتیجه گیری

Aspose.OCR برای .NET امکان اتوماسیون کار OCR قوی و غیر منتظره را در مقیاس فراهم می کند.با پردازش بسته و برنامه ریزی، شما می توانید جریان های کاری به موقع، قابل اعتماد و مقاوم در برابر خطا را تضمین کنید. Aspose.OCR برای .NET API مرجع برای اتوماسیون باتچ راهنمایی و کد.

 فارسی