چگونه اسناد اسکن شده را برای OCR در .NET برش دهیم

چگونه اسناد اسکن شده را برای OCR در .NET برش دهیم

When preparing scanned documents for تشخیص کاراکتر نوری (OCR)، ضروری است که تصاویر را برش دهید تا بر روی نواحی پرمتن تمرکز کنید. برش بخش‌های غیر مرتبط از سند اطمینان می‌دهد که نرم‌افزار OCR می‌تواند متن را دقیق‌تر و کارآمدتر استخراج کند. Aspose.Imaging for .NET ابزارهای لازم برای برش اسناد اسکن شده و آماده‌سازی آنها برای پردازش OCR را فراهم می‌کند.

مزایای برش اسناد اسکن شده برای OCR

  1. دقت بهبود یافته:
    • تلاش‌های OCR را بر روی بخش‌های متنی مرتبط متمرکز کنید و از نویز یا محتوای غیر مرتبط اجتناب کنید.
  2. کاهش زمان پردازش:
    • تصویر را برش دهید تا مساحت پردازش شده را کاهش دهید و فرآیند OCR را تسریع کنید.
  3. استخراج متن بهتر:
    • اطمینان حاصل کنید که متن به درستی تراز شده و به خوبی برای موتورهای OCR قاب‌بندی شده است.

پیش‌نیازها: راه‌اندازی Aspose.Imaging

  1. .NET SDK را بر روی سیستم خود نصب کنید.
  2. Aspose.Imaging را به پروژه خود اضافه کنید:
    dotnet add package Aspose.Imaging
  3. یک مجوز متری بدست آورید و آن را با استفاده از SetMeteredKey() پیکربندی کنید.

راهنمای گام به گام برای برش اسناد اسکن شده برای OCR

گام 1: پیکربندی مجوز متری

Aspose.Imaging را برای دسترسی نامحدود به ویژگی‌های برش تنظیم کنید.

using Aspose.Imaging;

Metered license = new Metered();
license.SetMeteredKey("<your public key>", "<your private key>");
Console.WriteLine("مجوز متری با موفقیت پیکربندی شد.");

گام 2: بارگذاری تصویر سند اسکن شده

فایل سند اسکن شده‌ای که نیاز به برش برای آماده‌سازی OCR دارد را بارگذاری کنید.

string inputPath = @"c:\documents\scanned_document.png";
using (var image = Image.Load(inputPath))
{
    Console.WriteLine($"سند اسکن شده بارگذاری شد: {inputPath}");
}

گام 3: تعریف منطقه برش

منطقه مستطیلی اطراف متنی که باید استخراج شود را تعریف کنید.

var cropArea = new Rectangle(50, 50, 500, 500); // منطقه برش: x, y, عرض, ارتفاع
image.Crop(cropArea);
Console.WriteLine($"تصویر به منطقه تعریف شده برش داده شد: {cropArea.Width}x{cropArea.Height}");

گام 4: اعمال عملیات برش

از متد Crop() برای استخراج بخش متن مورد نیاز از تصویر استفاده کنید.

image.Crop(cropArea);
Console.WriteLine("عملیات برش برای ایزوله کردن متن برای OCR اعمال شد.");

گام 5: ذخیره تصویر برش داده شده

تصویر برش داده شده را برای پردازش OCR ذخیره کنید.

image.Save(@"c:\output\ocr_ready_image.png", new PngOptions());
Console.WriteLine("تصویر برش داده شده با موفقیت برای OCR ذخیره شد.");

استقرار و استفاده

  1. سیستم‌های پردازش سند:
    • برش را در سیستم‌های اسکن خودکار اسناد پیاده‌سازی کنید تا تصاویر را برای OCR آماده کنید.
  2. ادغام جریان کار OCR:
    • اسناد را قبل از ارسال به موتورهای OCR برش دهید تا استخراج متن سریع‌تر و دقیق‌تری داشته باشید.
  3. اعتبارسنجی خروجی:
    • تصویر برش داده شده را باز کنید تا اطمینان حاصل کنید که متن به وضوح قابل مشاهده و به درستی قاب‌بندی شده است.

کاربردهای دنیای واقعی

  1. اسکن اسناد قانونی و پزشکی:
    • قراردادهای اسکن شده یا سوابق پزشکی را برش دهید تا بر روی متن‌های مهم برای پردازش OCR تمرکز کنید.
  2. سیستم‌های بایگانی:
    • اسناد تاریخی را برای استخراج متن و دیجیتالی‌سازی آماده کنید.
  3. خدمات دولت الکترونیک:
    • استخراج متن از فرم‌ها یا درخواست‌های اسکن شده را خودکار کنید.

مسائل و راه‌حل‌های رایج

  1. منطقه برش نادرست:
    • اطمینان حاصل کنید که مختصات Rectangle با بخشی که دارای متن است مطابقت دارد.
  2. تصاویر با کیفیت پایین:
    • اطمینان حاصل کنید که تصویر اسکن شده دارای وضوح کافی برای دقت OCR است.
  3. مجوزهای فایل:
    • بررسی کنید که دایرکتوری‌های خروجی دارای مجوزهای نوشتن مناسب هستند.

نتیجه‌گیری

با استفاده از Aspose.Imaging for .NET، می‌توانید به راحتی اسناد اسکن شده را برش دهید تا بر روی بخش‌های مهم برای پردازش OCR تمرکز کنید و دقت و کارایی را بهبود بخشید. این راه‌حل برای جریان‌های خودکار در مدیریت اسناد، سیستم‌های قانونی و مراقبت‌های بهداشتی ایده‌آل است.

 فارسی