چگونگی اتوماسیون پردازش و برنامه ریزی کارهای OCR با استفاده از Aspose.OCR
جریان های کار اسناد جمعی نیاز به پردازش OCR قابل اعتماد و غیر منتظره دارد. ASPOSE.OCR برای .NET از اتوماسیون کامل مجموعه پشتیبانی می کند – پوشه های مانیتور، کارهای برنامه ریزی شده، فرآیند حجم بزرگ و بازسازی از خطا برای حداکثر بهره وری.
مشکل دنیای واقعی
کسب و کارها باید هزاران فایل اسکن شده را هر شب یا هفته پردازش کنند. OCR های دستی یا تعاملی در مقیاس قرار نمی گیرند و خطر خطا را افزایش می دهند. اتوماسیون و برنامه نویسی اطمینان حاصل می کند که شغل ها به طور قابل اعتماد، حتی در طول شب و یا در ساعات خارج از کار، اجرا می شوند.
بررسی راه حل
ترکیب Aspose.OCR بسته APIs، فایل / پوشه نظارت، و برنامه نویسی ابزار (برنامه کار، cron و غیره) برای اتوماسیون OCR در مقیاس.نمایش برای فایل های جدید، پردازش در بسته ها و صادرات نتایج به فرمت های مورد نظر و اسناد.
پیش شرط
- Visual Studio 2019 یا بالاتر
- .NET 6.0 یا بالاتر (یا .Net Framework 4.6.2+)
- Aspose.OCR برای .NET از NuGet
- (اختیاری) Windows Task Scheduler، cron یا سایر ابزارهای اتوماسیون کار
PM> Install-Package Aspose.OCR
پیاده سازی گام به گام
مرحله 1: نصب و تنظیم Aspose.OCR
using Aspose.OCR;
مرحله 2: کشف فایل ها برای پردازش باتچ
string inputFolder = "./input";
string[] files = Directory.GetFiles(inputFolder, "*.jpg", SearchOption.AllDirectories);
مرحله سوم: OCR را در بسته ها اجرا کنید
OcrInput input = new OcrInput(InputType.SingleImage);
foreach (string file in files)
{
input.Add(file);
}
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
مرحله 4: صادرات و نتایج آرشیو
int count = 1;
foreach (RecognitionResult result in results)
{
result.Save($"./output/result_{count}.txt", SaveFormat.Text);
count++;
}
مرحله پنجم: کارها و اشتباهات را ثبت کنید
try
{
// Batch OCR code
}
catch (Exception ex)
{
File.AppendAllText("ocr_errors.log", ex.Message + Environment.NewLine);
}
مرحله 6: برنامه ریزی اتوماتیک (مثال برنامه نویس وظایف ویندوز)
- ایجاد یک فایل بسته یا اسکریپت PowerShell برای انجام وظایف OCR خود را در یک برنامه
- استفاده از Task Scheduler برای اجرا روزانه، شبانه یا بر روی راه اندازی
# Example: schedule_ocr.bat
# > dotnet run --project YourOcrProject.csproj
مرحله 7: پیشرفته – نظارت بر اسناد برای فایل های جدید
FileSystemWatcher watcher = new FileSystemWatcher("./input", "*.jpg");
watcher.Created += (s, e) => { /* Trigger batch OCR on new file */ };
watcher.EnableRaisingEvents = true;
مرحله هشتم: نمونه کامل
using Aspose.OCR;
using System;
using System.IO;
using System.Collections.Generic;
class Program
{
static void Main(string[] args)
{
try
{
string inputFolder = "./input";
string[] files = Directory.GetFiles(inputFolder, "*.jpg", SearchOption.AllDirectories);
OcrInput input = new OcrInput(InputType.SingleImage);
foreach (string file in files)
{
input.Add(file);
}
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
int count = 1;
foreach (RecognitionResult result in results)
{
result.Save($"./output/result_{count}.txt", SaveFormat.Text);
count++;
}
}
catch (Exception ex)
{
File.AppendAllText("ocr_errors.log", ex.Message + Environment.NewLine);
}
}
}
استفاده از موارد و برنامه ها
اتاق های ایمیل شرکت ها و جعبه های دیجیتال
به طور خودکار بسته های اسناد ورودی را بدون تلاش دستی پردازش می کند.
مراقبت های بهداشتی، حقوقی و آرشیو جریان کار
برنامه شبانه یا هفتگی کارهای OCR برای سوابق پزشکی، قراردادهای یا اسناد.
عملیات مالی و انطباق
گزارش های اتوماتیک و وظایف انطباق که بسته های اسکن بزرگ را در ساعات خارج پردازش می کنند.
چالش ها و راه حل های مشترک
چالش اول: شروع دستی غیر قابل اعتماد
** راه حل:** همیشه از ابزارهای برنامه ریزی برای شغل های غیر منتظره استفاده کنید.
چالش ۲: اشتباهات در بازی های بزرگ
** راه حل:** سوابق اتوماتیک و مدیریت خطا برای عملکرد قوی.
چالش سوم: محدودیت های شغلی و یا کمبود منابع
** راه حل: ** شغل ها را به تعویق بیندازید، منابع را نظارت کنید و هشدار در مورد تاخیر یا شکست ها داشته باشید.
بررسی عملکرد
- مانیتور CPU، حافظه و دیسک در هنگام کار با حجم بالا
- استفاده از سوابق خروجی و خطا برای تجزیه و تحلیل پس از کار
- شغل های بتچ باید به صورت غیرمستقیم برنامه ریزی شود تا از تاثیر آن اجتناب شود.
بهترین شیوهها
- کارهای آزمایشی با انواع و حجم فایل های مختلف
- نظارت بر سوابق برای شکست یا عملکرد آهسته
- حفظ و ذخیره فایل های منبع و خروجی
- به روز رسانی و نگهداری اسکریپت های اتوماسیون
سناریوهای پیشرفته
سناریو ۱: پاراگراف کردن یا توزیع شغل های بسته بندی
توزیع شغل در چندین سرور یا VM برای مقیاس.
سناریو 2: هشدار در زمان واقعی در مورد تکمیل شغل
ارسال ایمیل یا هشدار webhook پس از پایان کار برنامه ریزی شده.
نتیجه گیری
Aspose.OCR برای .NET امکان اتوماسیون کار OCR قوی و غیر منتظره را در مقیاس فراهم می کند.با پردازش بسته و برنامه ریزی، شما می توانید جریان های کاری به موقع، قابل اعتماد و مقاوم در برابر خطا را تضمین کنید. Aspose.OCR برای .NET API مرجع برای اتوماسیون باتچ راهنمایی و کد.