วิธีการเพิ่มความแม่นยําและประสิทธิภาพของ OCR โดยใช้ Aspose.OCR

วิธีการเพิ่มความแม่นยําและประสิทธิภาพของ OCR โดยใช้ Aspose.OCR

การบรรลุความแม่นยํา OCR สูงและการประมวลผลที่รวดเร็วเป็นสิ่งสําคัญสําหรับการยอมรับในโลกจริง บทความนี้ให้คําแนะนําที่สามารถดําเนินการได้เพื่อการสั่นสะเทือนทั้งผลการรับรู้และส่งผ่านกับ Aspose.OCR สําหรับ .NET

ปัญหาโลกจริง

รูปภาพ输入ที่ไม่ดีการตั้งค่าภาษาที่ไม่ถูกต้องหรือรหัสที่ไม่มีประสิทธิภาพอาจนําไปสู่ผลลัพธ์ที่ไม่แม่นยําและงานชุดช้า การสั่นสะเทือนอย่างต่อเนื่องเป็นสิ่งสําคัญสําหรับความน่าเชื่อถือในการผลิต

ความคิดเห็นเกี่ยวกับโซลูชัน

ทําตามการปฏิบัติที่ดีที่สุดที่ได้รับการพิสูจน์ - การเพิ่มประสิทธิภาพของภาพเข้าการตั้งค่าการประมวลผลก่อนการเลือกภาษาการรับรู้ที่เหมาะสมและการปรับตัวชุดนี้เพื่อให้แน่ใจว่าคุณได้รับผลลัพธ์ที่ดีที่สุดจาก Aspose.OCR ในแต่ละโครงการ

ข้อกําหนด

  • Visual Studio 2019 หรือภายหลัง
  • .NET 6.0 หรือเร็วกว่า (หรือ .Net Framework 4.6.2+)
  • Aspose.OCR สําหรับ .NET จาก NuGet
PM> Install-Package Aspose.OCR

การดําเนินการขั้นตอนขั้นตอน

ขั้นตอนที่ 1: ปรับปรุงคุณภาพของภาพเข้า

  • ใช้การสแกนความละเอียดสูงหรือภาพถ่าย (น้อยกว่า 300 DPI สําหรับการพิมพ์ 150 dpi สําหรับหน้าจอ)
  • หลีกเลี่ยงการหล่อลื่นหรือเงา ขนดกและรูปภาพหมุนตามความต้องการ

ขั้นตอนที่ 2: การประมวลผลก่อนภาพด้วยตัวกรอง

RecognitionSettings settings = new RecognitionSettings();
settings.AutoContrast = true;
settings.AutoSkew = true;
settings.Denoising = true;
settings.Binarization = true; // For black/white documents

ขั้นตอนที่ 3: การตั้งค่าภาษาการรับรู้และโหมด

settings.Language = Language.English; // or target language
// For photos or tables, set detection mode
settings.DetectAreasMode = DetectAreasMode.PHOTO; // or DetectAreasMode.TABLE

ขั้นตอนที่ 4: การประมวลผลแบตช์และคู่มือ

การประมวลผลภาพหลายภาพในเวลาเดียวกัน:

OcrInput input = new OcrInput(InputType.SingleImage);
foreach (string file in Directory.GetFiles("./input", "*.jpg"))
{
    input.Add(file);
}

สําหรับโหลดหนักใช้ async หรือ Task Parallel Library:

Parallel.ForEach(files, file => {
    // Run OCR on each file
});

ขั้นตอน 5: ตรวจสอบและตรวจสอบผล OCR

  • ตรวจสอบข้อความที่ได้รับการยอมรับสําหรับคําหายไปหรือไม่ถูกต้อง
  • ใช้สคริปต์การยืนยันหรือการตรวจสอบคู่มือสําหรับเอกสารที่สําคัญ

ขั้นตอน 6: การจัดการข้อผิดพลาดและ Outliers

try
{
    // OCR processing
}
catch (Exception ex)
{
    // Log error, move file to review folder
}

ขั้นตอน 7: ตัวอย่างที่สมบูรณ์

using Aspose.OCR;
using System;
using System.Collections.Generic;
using System.IO;

class Program
{
    static void Main(string[] args)
    {
        try
        {
            OcrInput input = new OcrInput(InputType.SingleImage);
            foreach (string file in Directory.GetFiles("./input", "*.jpg"))
            {
                input.Add(file);
            }
            RecognitionSettings settings = new RecognitionSettings();
            settings.Language = Language.English;
            settings.AutoContrast = true;
            settings.AutoSkew = true;
            settings.Denoising = true;
            settings.Binarization = true;
            AsposeOcr ocr = new AsposeOcr();
            List<RecognitionResult> results = ocr.Recognize(input, settings);
            int count = 1;
            foreach (RecognitionResult result in results)
            {
                result.Save($"./output/result_{count}.txt", SaveFormat.Text);
                count++;
            }
        }
        catch (Exception ex)
        {
            File.AppendAllText("ocr_errors.log", ex.Message + Environment.NewLine);
        }
    }
}

ใช้กรณีและแอปพลิเคชัน

บัญชีที่มีความแม่นยําสูงและสกัดสัญญา

ปรับปรุงคุณภาพและความน่าเชื่อถือของการอัตโนมัติเอกสารทางกฎหมาย/ทางการเงิน

การประมวลผลภาพจํานวนมาก / Text Archive

ปรับปรุงความเร็วของชุดและลดความล้มเหลวที่ซื่อสัตย์หรือ BI

R&D และการประเมินรูปแบบ

Tune สําหรับการจัดตั้งภาษาหรือประเภทภาพใหม่ในสถาปัตยกรรมวิจัย

ความท้าทายและโซลูชั่นทั่วไป

ความท้าทาย 1: ภาพเข้าต่ํา

โซลูชัน: ใช้การสแกน / ภาพที่ดีขึ้นการปรับปรุงภาพและป้ายสําหรับการตรวจสอบหากความมั่นใจใน OCR น้อย

ความท้าทาย 2: ประสิทธิภาพต่ําในงานขนาดใหญ่

โซลูชัน: บัตร, คู่มือและตรวจสอบทรัพยากรของระบบในระหว่างการทํางาน

ความท้าทาย 3: ข้อผิดพลาดการรับรู้ที่ไม่คาดหวัง

โซลูชัน: รับรองการส่งออกการจัดการข้อผิดพลาดและรักษาซอฟต์แวร์ที่ทันสมัย

การพิจารณาประสิทธิภาพ

  • ขนาดแบทช์ Tune, การใช้หน่วยความจําและการประมวลผลก่อนสําหรับงานขนาดใหญ่
  • ตรวจสอบทรัพยากรระบบและสุขภาพโฟลเดอร์การส่งออก
  • ใช้รูปแบบ async/parallel สําหรับการวางสินค้าขนาดใหญ่

แนวทางที่ดีที่สุด

  • การยืนยันการตั้งค่าบนตัวอย่างก่อนที่จะสแกนขึ้น
  • การตรวจสอบอัตโนมัติและการแจ้งเตือนข้อผิดพลาด
  • บันทึกทั้งภาพแหล่งข้อมูลและผลลัพธ์ได้อย่างปลอดภัย
  • อัปเดต Aspose.OCR สําหรับความแม่นยํา / ประสิทธิภาพที่เพิ่มขึ้น

การ์ตูนขั้นสูง

ฉาก 1: การประมวลผลก่อนการปรับแต่งสําหรับเนื้อหาผสม

กําหนดโหมดตรวจจับแบบไดนามิกสําหรับภาพป้อนแต่ละครั้ง

ฉาก 2: การปรับปรุงอย่างต่อเนื่องและการตอบสนอง

Feed OCR output errors back into process for correction และ retraining

ข้อสรุป

ความแม่นยําและการส่งผ่านให้แน่ใจว่าผลลัพธ์ที่ดีที่สุดจาก Aspose.OCR สําหรับ .NET ในกระบวนการทํางานใด ๆ สําหรับเทคนิคการเพิ่มประสิทธิภาพเพิ่มเติมเยี่ยมชม Aspose.OCR สําหรับการอ้างอิง API .NET .

 แบบไทย