چگونه برای بهبود دقت OCR در تصاویر با کیفیت پایین با Aspose.OCR
بسیاری از تصاویر انتقادی کسب و کار با کیفیت پایین هستند – اسکن های خنده دار، عکس های گوشی های هوشمند، گیرنده های مخفی و یا فکس های سر و صدا. این چالش ها دقت OCR را کاهش می دهند. Aspose.OCR برای .NET ابزارهای ساخته شده و بهترین شیوه ها را برای استخراج بهترین متن ممکن از حتی تصاویر دشوار ارائه می دهد.
مشکل دنیای واقعی
هنگامی که اسکن ها خشمگین، تاریک، کم تناقض هستند یا سر و صدا پس زمینه دارند، OCR استاندارد می تواند کلمات را از دست بدهد یا کاراکترها را اشتباه تشخیص دهد.
بررسی راه حل
با استفاده از پیش پردازش (نمایش، رد، تنظیم کنتراست) و تنظیمات Aspose.OCR، شما می توانید به طور چشمگیری استخراج متن را بهبود ببخشید – حتی از تصاویر فرعی.
پیش شرط
- Visual Studio 2019 یا بالاتر
- .NET 6.0 یا بالاتر (یا .Net Framework 4.6.2+)
- Aspose.OCR برای .NET از NuGet
- مهارت های C#
PM> Install-Package Aspose.OCR
پیاده سازی گام به گام
مرحله 1: نصب و تنظیم Aspose.OCR
using Aspose.OCR;
مرحله دوم: کیفیت تصویر را ارزیابی کنید
برای بررسی :
- Blurriness
- Skew / چرخش
- صدای پس زمینه
- کنتراست کم
- نور ضعیف / سایه
مرحله 3: استفاده از تصویر پیش پردازش و بهبود
ASPOSE.OCR دارای فیلترها برای انکار، انحراف، دوگانه سازی، کنتراست و بیشتر است:
RecognitionSettings settings = new RecognitionSettings();
settings.AutoContrast = true; // Improve contrast automatically
settings.Denoising = true; // Remove background noise
settings.Deskew = true; // Correct rotated images
settings.Binarization = true; // Convert to black/white for clarity
مرحله 4: تنظیمات تشخیص را برای تصاویر دشوار تنظیم کنید
شما می توانید نتایج بهتری را با tuning دریافت کنید:
Language
املاک و مستغلات (برای نزدیک ترین مسابقه انتخاب کنید)DetectAreasMode
(تصویر ماشین در مقابل عکس)
settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.PHOTO; // If image is a photo
مرحله 5: استخراج متن و اعتباربخشی
OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("blurry_invoice.jpg");
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
foreach (RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
}
مرحله 6: Iterate و Test با تنظیمات مختلف
چندین ترکیبی از فیلترها و تنظیمات پیش پردازش را امتحان کنید و سپس نتایج را برای بهترین دقت بررسی کنید.
مرحله 7: پیش پردازش اتوماتیک برای شغل های جمعی
پردازش تمام تصاویر در یک دایرکتوری با تنظیمات مطلوب:
foreach (string file in Directory.GetFiles("./problem_images", "*.png"))
{
input.Add(file);
}
مرحله هشتم: نمونه کامل
using Aspose.OCR;
using System;
using System.Collections.Generic;
using System.IO;
class Program
{
static void Main(string[] args)
{
try
{
OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("blurry_invoice.jpg");
RecognitionSettings settings = new RecognitionSettings();
settings.AutoContrast = true;
settings.Denoising = true;
settings.Deskew = true;
settings.Binarization = true;
settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.PHOTO;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
foreach (RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
}
}
catch (Exception ex)
{
Console.WriteLine($"Error: {ex.Message}");
}
}
}
استفاده از موارد و برنامه ها
دیجیتالی کردن گیرنده ها و فکس ها
داده ها را از ورودی ها و صورتحساب های فاکس شده یا خراب شده استخراج کنید.
اتوماسیون حساب های پرداختی با اسکن های ضعیف
بازیافت را کاهش دهید و پردازش AP را حتی از منابع بد نیز تسریع کنید.
بایگانی برچسب ها: Legacy Paperwork
متن قابل استفاده را از آرشیو های قدیمی و تخریب شده و یادداشت های دستی ذخیره کنید.
چالش ها و راه حل های مشترک
چالش اول: تصاویر غیر قابل خواندن
** راه حل:** درخواست نجات یا استفاده از ابزارهای پیشرفته در صورت لزوم.
چالش دوم: پردازش بطری های بسته بندی
** راه حل: ** پیش پردازش اتوماتیک و برنامه ریزی شغل های خارج از ساعت.
چالش سوم: ورودی های بسیار متغیر
** راه حل:** بهترین تنظیمات را با توجه به نوع سند ذخیره کنید؛ به طور منظم تایید کنید.
بررسی عملکرد
- پیش پردازش زمان CPU را اضافه می کند اما می تواند دقت OCR را دو برابر کند
- اندازه بسته آزمایشی برای سخت افزار شما
- استفاده از اشیاء OCR پس از دویدن
بهترین شیوهها
- ذخیره تصاویر اصلی برای حسابرسی
- تصدیق محصول قبل از ادغام
- استفاده از چک های کنترل کیفیت برای جریان های مهم کار
- به طور منظم به روز رسانی Aspose.OCR برای بهبود
سناریوهای پیشرفته
سناریو 1: پیش پردازش با ابزارهای خارجی (اختیاری)
بهبود تصاویر با یک ابزار مانند ImageMagick یا OpenCV قبل از OCR برای موارد شدید.
سناریو ۲: فیلتر کردن سفارشی بر اساس نوع سند
ذخیره و استفاده مجدد از تنظیمات بر اساس منبع یا جریان کار برای حداکثر دقت.
نتیجه گیری
با پیش پردازش و تنظیمات مناسب، Aspose.OCR برای .NET می تواند داده های ارزشمند را حتی از تصاویر با کیفیت ضعیف نجات دهد، اتوماسیون و انطباق را افزایش دهد.
برای راهنمایی های پیشرفته و آخرین فیلترها، بررسی کنید Aspose.OCR برای .NET API مرجع .