چگونه برای بهبود دقت OCR در تصاویر با کیفیت پایین با Aspose.OCR

چگونه برای بهبود دقت OCR در تصاویر با کیفیت پایین با Aspose.OCR

بسیاری از تصاویر انتقادی کسب و کار با کیفیت پایین هستند – اسکن های خنده دار، عکس های گوشی های هوشمند، گیرنده های مخفی و یا فکس های سر و صدا. این چالش ها دقت OCR را کاهش می دهند. Aspose.OCR برای .NET ابزارهای ساخته شده و بهترین شیوه ها را برای استخراج بهترین متن ممکن از حتی تصاویر دشوار ارائه می دهد.

مشکل دنیای واقعی

هنگامی که اسکن ها خشمگین، تاریک، کم تناقض هستند یا سر و صدا پس زمینه دارند، OCR استاندارد می تواند کلمات را از دست بدهد یا کاراکترها را اشتباه تشخیص دهد.

بررسی راه حل

با استفاده از پیش پردازش (نمایش، رد، تنظیم کنتراست) و تنظیمات Aspose.OCR، شما می توانید به طور چشمگیری استخراج متن را بهبود ببخشید – حتی از تصاویر فرعی.

پیش شرط

  • Visual Studio 2019 یا بالاتر
  • .NET 6.0 یا بالاتر (یا .Net Framework 4.6.2+)
  • Aspose.OCR برای .NET از NuGet
  • مهارت های C#
PM> Install-Package Aspose.OCR

پیاده سازی گام به گام

مرحله 1: نصب و تنظیم Aspose.OCR

using Aspose.OCR;

مرحله دوم: کیفیت تصویر را ارزیابی کنید

برای بررسی :

  • Blurriness
  • Skew / چرخش
  • صدای پس زمینه
  • کنتراست کم
  • نور ضعیف / سایه

مرحله 3: استفاده از تصویر پیش پردازش و بهبود

ASPOSE.OCR دارای فیلترها برای انکار، انحراف، دوگانه سازی، کنتراست و بیشتر است:

RecognitionSettings settings = new RecognitionSettings();
settings.AutoContrast = true; // Improve contrast automatically
settings.Denoising = true;    // Remove background noise
settings.Deskew = true;       // Correct rotated images
settings.Binarization = true; // Convert to black/white for clarity

مرحله 4: تنظیمات تشخیص را برای تصاویر دشوار تنظیم کنید

شما می توانید نتایج بهتری را با tuning دریافت کنید:

  • Language املاک و مستغلات (برای نزدیک ترین مسابقه انتخاب کنید)
  • DetectAreasMode (تصویر ماشین در مقابل عکس)
settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.PHOTO; // If image is a photo

مرحله 5: استخراج متن و اعتباربخشی

OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("blurry_invoice.jpg");
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
foreach (RecognitionResult result in results)
{
    Console.WriteLine(result.RecognitionText);
}

مرحله 6: Iterate و Test با تنظیمات مختلف

چندین ترکیبی از فیلترها و تنظیمات پیش پردازش را امتحان کنید و سپس نتایج را برای بهترین دقت بررسی کنید.

مرحله 7: پیش پردازش اتوماتیک برای شغل های جمعی

پردازش تمام تصاویر در یک دایرکتوری با تنظیمات مطلوب:

foreach (string file in Directory.GetFiles("./problem_images", "*.png"))
{
    input.Add(file);
}

مرحله هشتم: نمونه کامل

using Aspose.OCR;
using System;
using System.Collections.Generic;
using System.IO;

class Program
{
    static void Main(string[] args)
    {
        try
        {
            OcrInput input = new OcrInput(InputType.SingleImage);
            input.Add("blurry_invoice.jpg");

            RecognitionSettings settings = new RecognitionSettings();
            settings.AutoContrast = true;
            settings.Denoising = true;
            settings.Deskew = true;
            settings.Binarization = true;
            settings.Language = Language.English;
            settings.DetectAreasMode = DetectAreasMode.PHOTO;

            AsposeOcr ocr = new AsposeOcr();
            List<RecognitionResult> results = ocr.Recognize(input, settings);

            foreach (RecognitionResult result in results)
            {
                Console.WriteLine(result.RecognitionText);
            }
        }
        catch (Exception ex)
        {
            Console.WriteLine($"Error: {ex.Message}");
        }
    }
}

استفاده از موارد و برنامه ها

دیجیتالی کردن گیرنده ها و فکس ها

داده ها را از ورودی ها و صورتحساب های فاکس شده یا خراب شده استخراج کنید.

اتوماسیون حساب های پرداختی با اسکن های ضعیف

بازیافت را کاهش دهید و پردازش AP را حتی از منابع بد نیز تسریع کنید.

بایگانی برچسب ها: Legacy Paperwork

متن قابل استفاده را از آرشیو های قدیمی و تخریب شده و یادداشت های دستی ذخیره کنید.

چالش ها و راه حل های مشترک

چالش اول: تصاویر غیر قابل خواندن

** راه حل:** درخواست نجات یا استفاده از ابزارهای پیشرفته در صورت لزوم.

چالش دوم: پردازش بطری های بسته بندی

** راه حل: ** پیش پردازش اتوماتیک و برنامه ریزی شغل های خارج از ساعت.

چالش سوم: ورودی های بسیار متغیر

** راه حل:** بهترین تنظیمات را با توجه به نوع سند ذخیره کنید؛ به طور منظم تایید کنید.

بررسی عملکرد

  • پیش پردازش زمان CPU را اضافه می کند اما می تواند دقت OCR را دو برابر کند
  • اندازه بسته آزمایشی برای سخت افزار شما
  • استفاده از اشیاء OCR پس از دویدن

بهترین شیوه‌ها

  • ذخیره تصاویر اصلی برای حسابرسی
  • تصدیق محصول قبل از ادغام
  • استفاده از چک های کنترل کیفیت برای جریان های مهم کار
  • به طور منظم به روز رسانی Aspose.OCR برای بهبود

سناریوهای پیشرفته

سناریو 1: پیش پردازش با ابزارهای خارجی (اختیاری)

بهبود تصاویر با یک ابزار مانند ImageMagick یا OpenCV قبل از OCR برای موارد شدید.

سناریو ۲: فیلتر کردن سفارشی بر اساس نوع سند

ذخیره و استفاده مجدد از تنظیمات بر اساس منبع یا جریان کار برای حداکثر دقت.

نتیجه گیری

با پیش پردازش و تنظیمات مناسب، Aspose.OCR برای .NET می تواند داده های ارزشمند را حتی از تصاویر با کیفیت ضعیف نجات دهد، اتوماسیون و انطباق را افزایش دهد.

برای راهنمایی های پیشرفته و آخرین فیلترها، بررسی کنید Aspose.OCR برای .NET API مرجع .

 فارسی