วิธีการปรับปรุงความแม่นยําของ OCR บนภาพที่มีคุณภาพต่ําด้วย Aspose.OCR

วิธีการปรับปรุงความแม่นยําของ OCR บนภาพที่มีคุณภาพต่ําด้วย Aspose.OCR

ภาพที่สําคัญสําหรับธุรกิจจํานวนมากมีคุณภาพต่ํา - scans blurry, รูปภาพของสมาร์ทโฟน, ใบรับรองที่สแกนหรือแฟกซ์เสียง ความท้าทายเหล่านี้ลดความแม่นยําของ OCR. Aspose.OCR สําหรับ .NET มีเครื่องมือที่บูรณาการและปฏิบัติที่ดีที่สุดในการ استخراجข้อความที่ดีที่สุดจากภาพที่ยาก

ปัญหาโลกจริง

เมื่อการสแกนเป็น blurry, dark, low-contrast หรือมีเสียงรบกวนพื้นหลัง OCR มาตรฐานอาจพลาดคําหรือความเข้าใจผิดของตัวอักษร ซึ่งนําไปสู่ข้อมูลที่ไม่ดีในระบบ Downstream หรือการทํางานใหม่ด้วยตนเอง

ความคิดเห็นเกี่ยวกับโซลูชัน

โดยการใช้งานการประมวลผลก่อน (deskew, denoise, การปรับความตึงประสงค์) และท่อการตั้งค่า Aspose.OCR คุณสามารถปรับปรุงการสกัดข้อความอย่างมากแม้แต่จากภาพ subpar

ข้อกําหนด

  • Visual Studio 2019 หรือภายหลัง
  • .NET 6.0 หรือเร็วกว่า (หรือ .Net Framework 4.6.2+)
  • Aspose.OCR สําหรับ .NET จาก NuGet
  • ความสามารถพื้นฐาน C#
PM> Install-Package Aspose.OCR

การดําเนินการขั้นตอนขั้นตอน

ขั้นตอน 1: ติดตั้งและตั้งค่า Aspose.OCR

using Aspose.OCR;

ขั้นตอน 2: การประเมินคุณภาพของภาพ

ตรวจสอบสําหรับ:

  • Blurriness
  • สกปรก / การหมุน
  • เสียงพื้นหลัง
  • ความต้านทานต่ํา
  • โคมไฟ / สีดํา

ขั้นตอนที่ 3: ใช้ภาพการประมวลผลและปรับปรุง

Aspose.OCR มีตัวกรองสําหรับการปฏิเสธการปลดลัดการไบนารีความต้านทานและอื่น ๆ:

RecognitionSettings settings = new RecognitionSettings();
settings.AutoContrast = true; // Improve contrast automatically
settings.Denoising = true;    // Remove background noise
settings.Deskew = true;       // Correct rotated images
settings.Binarization = true; // Convert to black/white for clarity

ขั้นตอนที่ 4: การตั้งค่าการรับรู้สําหรับภาพที่ยาก

คุณสามารถได้รับผลลัพธ์ที่ดีขึ้นโดยการดูด:

  • Language คุณสมบัติ (เลือกเกมที่ใกล้ที่สุด)
  • DetectAreasMode (รถยนต์ vs. ภาพถ่าย)
settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.PHOTO; // If image is a photo

ขั้นตอน 5: สารสกัดข้อความและยืนยัน

OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("blurry_invoice.jpg");
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
foreach (RecognitionResult result in results)
{
    Console.WriteLine(result.RecognitionText);
}

ขั้นตอน 6: Iterate และทดสอบด้วยการตั้งค่าที่แตกต่างกัน

ลองการผสมผสานหลายตัวของตัวกรองและตั้งค่าการประมวลผลก่อนแล้วตรวจสอบผลผลิตเพื่อความแม่นยําที่ดีที่สุด

ขั้นตอน 7: การประมวลผลก่อนอัตโนมัติสําหรับงานจํานวนมาก

การประมวลผลภาพทั้งหมดในตารางที่มีการตั้งค่าที่ดีที่สุด:

foreach (string file in Directory.GetFiles("./problem_images", "*.png"))
{
    input.Add(file);
}

ขั้นตอน 8: ตัวอย่างที่สมบูรณ์

using Aspose.OCR;
using System;
using System.Collections.Generic;
using System.IO;

class Program
{
    static void Main(string[] args)
    {
        try
        {
            OcrInput input = new OcrInput(InputType.SingleImage);
            input.Add("blurry_invoice.jpg");

            RecognitionSettings settings = new RecognitionSettings();
            settings.AutoContrast = true;
            settings.Denoising = true;
            settings.Deskew = true;
            settings.Binarization = true;
            settings.Language = Language.English;
            settings.DetectAreasMode = DetectAreasMode.PHOTO;

            AsposeOcr ocr = new AsposeOcr();
            List<RecognitionResult> results = ocr.Recognize(input, settings);

            foreach (RecognitionResult result in results)
            {
                Console.WriteLine(result.RecognitionText);
            }
        }
        catch (Exception ex)
        {
            Console.WriteLine($"Error: {ex.Message}");
        }
    }
}

ใช้กรณีและแอปพลิเคชัน

การดิจิทัลรายได้และแฟกซ์

สารสกัดข้อมูลจากใบรับรองและรายงานที่ซับซ้อนหรือโฟกัส

การอัตโนมัติบัญชีที่สามารถชําระเงินได้ด้วยสแกนที่ไม่ดี

ลดการทํางานใหม่และเร่งการประมวลผล AP แม้จะมาจากแหล่งที่มาที่ไม่ดี

กระดาษที่เก็บรวบรวม

การบันทึกข้อความที่สามารถใช้ได้จากเอกสารเก่าและจดหมายการเขียนด้วยมือ

ความท้าทายและโซลูชั่นทั่วไป

ความท้าทาย 1: ภาพยังคงไม่อ่านได้

**โซลูชัน: **ขอการกู้คืนหรือใช้เครื่องมือปรับปรุงขั้นสูงตามความต้องการ

ปลั๊ก 2: Batch การประมวลผล Bottlenecks

โซลูชัน: การประมวลผลก่อนอัตโนมัติและการวางแผนการทํางานกลางวัน

ความท้าทาย 3: อินพุตที่แตกต่างกันมาก

**โซลูชัน: **จัดเก็บการตั้งค่าที่ดีที่สุดตามประเภทเอกสาร การรับรองเป็นประจํา

การพิจารณาประสิทธิภาพ

  • Preprocessing เพิ่มเวลา CPU แต่สามารถเพิ่มความแม่นยํา OCR
  • ขนาดชุดทดสอบสําหรับฮาร์ดแวร์ของคุณ
  • การจัดหาวัตถุ OCR หลังจากล้อ

แนวทางที่ดีที่สุด

  • การจัดเก็บภาพเดิมสําหรับการตรวจสอบ
  • การยืนยันการผลิตก่อนการรวมกัน
  • ใช้ตรวจสอบการควบคุมคุณภาพสําหรับกระบวนการทํางานที่สําคัญ
  • ปรับปรุง Aspose.OCR โดยปกติสําหรับการปรับปรุง

การ์ตูนขั้นสูง

ฉาก 1: การประมวลผลก่อนด้วยเครื่องมือภายนอก (ตัวเลือก)

ปรับปรุงภาพด้วยเครื่องมือเช่น ImageMagick หรือ OpenCV ก่อน OCR สําหรับกรณีที่รุนแรง

ฉาก 2: การกรองที่กําหนดเองตามประเภทเอกสาร

การจัดเก็บและใช้ใหม่การตั้งค่าตามแหล่งหรือกระแสทํางานเพื่อความแม่นยําสูงสุด

ข้อสรุป

ด้วยการประมวลผลก่อนและตั้งค่าที่เหมาะสม Aspose.OCR for .NET สามารถบันทึกข้อมูลที่มีค่าแม้จากภาพที่มีคุณภาพไม่ดีเพิ่มอัตโนมัติและการปฏิบัติตาม

สําหรับเคล็ดลับขั้นสูงและตัวกรองล่าสุดตรวจสอบ Aspose.OCR สําหรับการอ้างอิง API .NET .

 แบบไทย