چگونگی کاشت اسناد اسکن شده برای OCR در .NET

چگونگی کاشت اسناد اسکن شده برای OCR در .NET

هنگام آماده سازی اسناد اسکن شده برای تشخیص شخصیت بصری (OCR)، ضروری است که تصاویر کاشته شود تا بر روی مناطق سنگین متن تمرکز کند. کاشت بخش های نامناسب اسناد اطمینان حاصل می کند که نرم افزار OCR می تواند متن را دقیق تر و کارآمد تر استخراج کند. Aspose.Imaging برای .NET ابزارهای لازم برای کاشت اسناد اسکن شده و آماده سازی آنها برای پردازش OCR را فراهم می کند.

مزایای استفاده از اسناد اسکن شده برای OCR

  • تصمیم گیری دقیق تر:- تمرکز تلاش های OCR بر بخش های متن مربوطه، اجتناب از سر و صدا و یا محتوای نامناسب.

  • زمان پردازش کاهش یافته:- محصول تصویر را برای به حداقل رساندن منطقه مورد پردازش، سرعت بخشیدن به فرآیند OCR.

  • تصویری بهتر از متن:- اطمینان حاصل کنید که متن به درستی هماهنگ و به خوبی برای موتورهای OCR طراحی شده است.

آرشیو برچسب ها: تصور

  • نصب آن .NET SDK در سیستم شما
  • اضافه کردن Aspose.Imaging به پروژه شما: dotnet add package Aspose.Imaging
  • یک مجوز اندازه گیری شده دریافت کنید و آن را با استفاده از SetMeteredKey().

راهنمای گام به گام برای کاشت اسناد اسکن شده برای OCR

مرحله اول: تنظیم مجوز اندازه گیری

تنظیم Aspose.Imaging برای دسترسی نامحدود به ویژگی های حفاری.

using Aspose.Imaging;

Metered license = new Metered();
license.SetMeteredKey("<your public key>", "<your private key>");
Console.WriteLine("Metered license configured successfully.");

مرحله دوم: تصویر اسکن شده را بارگذاری کنید

فایل اسناد اسکن شده را که برای آماده سازی OCR مورد نیاز است، بارگذاری کنید.

string inputPath = @"c:\documents\scanned_document.png";
using (var image = Image.Load(inputPath))
{
    Console.WriteLine($"Loaded scanned document: {inputPath}");
}

مرحله سوم: منطقه کاشت را تعیین کنید

منطقه مستطیل را در اطراف متن تعیین کنید که باید استخراج شود.

var cropArea = new Rectangle(50, 50, 500, 500); // Crop area: x, y, width, height
image.Crop(cropArea);
Console.WriteLine($"Cropped image to the defined area: {cropArea.Width}x{cropArea.Height}");

مرحله چهارم: عملیات کاشت را اجرا کنید

استفاده از Crop() روش برای استخراج بخش متن مورد نیاز از تصویر.

image.Crop(cropArea);
Console.WriteLine("Applied crop operation to isolate text for OCR.");

مرحله پنجم: تصویر را ذخیره کنید

ذخیره تصویر خرد شده برای پردازش OCR.

image.Save(@"c:\output\ocr_ready_image.png", new PngOptions());
Console.WriteLine("Cropped image saved successfully for OCR.");

راه اندازی و استفاده

  • سیستم های پردازش اسناد:- اجرای حفاری در سیستم های اسکن اسناد اتوماتیک برای آماده سازی تصاویر برای OCR.

  • تولید جریان کار OCR:- اسناد محصول قبل از انتقال آنها به موتورهای OCR برای استخراج سریع تر و دقیق تر متن.

  • تولید خروجی:- تصویر خرد شده را باز کنید تا اطمینان حاصل شود که متن به وضوح قابل مشاهده و به درستی فریم شده است.

برنامه های کاربردی دنیای واقعی

  • اسکن اسناد قانونی و پزشکی:- کاشت اسکن قراردادهای یا سوابق پزشکی برای تمرکز بر متن مهم برای پردازش OCR.

  • سیستم های آرشیو:- آماده سازی اسناد تاریخی برای استخراج و دیجیتالی شدن متن.

  • خدمات مدیریت الکترونیکی:- اتوماتیک کردن استخراج متن از فرم ها یا برنامه های اسکن شده.

مشکلات و اصلاحات مشترک

  • منطقه گیاهی نادرست:- اطمینان حاصل کنید که Rectangle هماهنگی بخش با متن مطابقت دارد.

  • تصاویر با کیفیت پایین:- اطمینان حاصل کنید که تصویر اسکن شده دارای رزولوشن کافی برای دقت OCR است.

  • تصویری از مجوزها:- بررسی دایرکتوری های خروجی دارای مجوزهای نوشتاری مناسب است.

نتیجه گیری

با استفاده از Aspose.Imaging برای .NET، شما می توانید به راحتی اسناد اسکن شده را برای تمرکز بر بخش های مهم برای پردازش OCR، بهبود دقت و بهره وری.این راه حل ایده آل برای جریان های کار خودکار در مدیریت اسناد، سیستم های حقوقی و مراقبت های بهداشتی است.

 فارسی