چگونه اسناد اسکن شده را برای OCR در .NET برش دهیم
When preparing scanned documents for تشخیص کاراکتر نوری (OCR)، ضروری است که تصاویر را برش دهید تا بر روی نواحی پرمتن تمرکز کنید. برش بخشهای غیر مرتبط از سند اطمینان میدهد که نرمافزار OCR میتواند متن را دقیقتر و کارآمدتر استخراج کند. Aspose.Imaging for .NET ابزارهای لازم برای برش اسناد اسکن شده و آمادهسازی آنها برای پردازش OCR را فراهم میکند.
مزایای برش اسناد اسکن شده برای OCR
- دقت بهبود یافته:
- تلاشهای OCR را بر روی بخشهای متنی مرتبط متمرکز کنید و از نویز یا محتوای غیر مرتبط اجتناب کنید.
- کاهش زمان پردازش:
- تصویر را برش دهید تا مساحت پردازش شده را کاهش دهید و فرآیند OCR را تسریع کنید.
- استخراج متن بهتر:
- اطمینان حاصل کنید که متن به درستی تراز شده و به خوبی برای موتورهای OCR قاببندی شده است.
پیشنیازها: راهاندازی Aspose.Imaging
- .NET SDK را بر روی سیستم خود نصب کنید.
- Aspose.Imaging را به پروژه خود اضافه کنید:
dotnet add package Aspose.Imaging
- یک مجوز متری بدست آورید و آن را با استفاده از
SetMeteredKey()
پیکربندی کنید.
راهنمای گام به گام برای برش اسناد اسکن شده برای OCR
گام 1: پیکربندی مجوز متری
Aspose.Imaging را برای دسترسی نامحدود به ویژگیهای برش تنظیم کنید.
using Aspose.Imaging;
Metered license = new Metered();
license.SetMeteredKey("<your public key>", "<your private key>");
Console.WriteLine("مجوز متری با موفقیت پیکربندی شد.");
گام 2: بارگذاری تصویر سند اسکن شده
فایل سند اسکن شدهای که نیاز به برش برای آمادهسازی OCR دارد را بارگذاری کنید.
string inputPath = @"c:\documents\scanned_document.png";
using (var image = Image.Load(inputPath))
{
Console.WriteLine($"سند اسکن شده بارگذاری شد: {inputPath}");
}
گام 3: تعریف منطقه برش
منطقه مستطیلی اطراف متنی که باید استخراج شود را تعریف کنید.
var cropArea = new Rectangle(50, 50, 500, 500); // منطقه برش: x, y, عرض, ارتفاع
image.Crop(cropArea);
Console.WriteLine($"تصویر به منطقه تعریف شده برش داده شد: {cropArea.Width}x{cropArea.Height}");
گام 4: اعمال عملیات برش
از متد Crop()
برای استخراج بخش متن مورد نیاز از تصویر استفاده کنید.
image.Crop(cropArea);
Console.WriteLine("عملیات برش برای ایزوله کردن متن برای OCR اعمال شد.");
گام 5: ذخیره تصویر برش داده شده
تصویر برش داده شده را برای پردازش OCR ذخیره کنید.
image.Save(@"c:\output\ocr_ready_image.png", new PngOptions());
Console.WriteLine("تصویر برش داده شده با موفقیت برای OCR ذخیره شد.");
استقرار و استفاده
- سیستمهای پردازش سند:
- برش را در سیستمهای اسکن خودکار اسناد پیادهسازی کنید تا تصاویر را برای OCR آماده کنید.
- ادغام جریان کار OCR:
- اسناد را قبل از ارسال به موتورهای OCR برش دهید تا استخراج متن سریعتر و دقیقتری داشته باشید.
- اعتبارسنجی خروجی:
- تصویر برش داده شده را باز کنید تا اطمینان حاصل کنید که متن به وضوح قابل مشاهده و به درستی قاببندی شده است.
کاربردهای دنیای واقعی
- اسکن اسناد قانونی و پزشکی:
- قراردادهای اسکن شده یا سوابق پزشکی را برش دهید تا بر روی متنهای مهم برای پردازش OCR تمرکز کنید.
- سیستمهای بایگانی:
- اسناد تاریخی را برای استخراج متن و دیجیتالیسازی آماده کنید.
- خدمات دولت الکترونیک:
- استخراج متن از فرمها یا درخواستهای اسکن شده را خودکار کنید.
مسائل و راهحلهای رایج
- منطقه برش نادرست:
- اطمینان حاصل کنید که مختصات
Rectangle
با بخشی که دارای متن است مطابقت دارد.
- اطمینان حاصل کنید که مختصات
- تصاویر با کیفیت پایین:
- اطمینان حاصل کنید که تصویر اسکن شده دارای وضوح کافی برای دقت OCR است.
- مجوزهای فایل:
- بررسی کنید که دایرکتوریهای خروجی دارای مجوزهای نوشتن مناسب هستند.
نتیجهگیری
با استفاده از Aspose.Imaging for .NET، میتوانید به راحتی اسناد اسکن شده را برش دهید تا بر روی بخشهای مهم برای پردازش OCR تمرکز کنید و دقت و کارایی را بهبود بخشید. این راهحل برای جریانهای خودکار در مدیریت اسناد، سیستمهای قانونی و مراقبتهای بهداشتی ایدهآل است.