วิธีการปรับปรุงความแม่นยําของ OCR บนภาพที่มีคุณภาพต่ําด้วย Aspose.OCR
ภาพที่สําคัญสําหรับธุรกิจจํานวนมากมีคุณภาพต่ํา - scans blurry, รูปภาพของสมาร์ทโฟน, ใบรับรองที่สแกนหรือแฟกซ์เสียง ความท้าทายเหล่านี้ลดความแม่นยําของ OCR. Aspose.OCR สําหรับ .NET มีเครื่องมือที่บูรณาการและปฏิบัติที่ดีที่สุดในการ استخراجข้อความที่ดีที่สุดจากภาพที่ยาก
ปัญหาโลกจริง
เมื่อการสแกนเป็น blurry, dark, low-contrast หรือมีเสียงรบกวนพื้นหลัง OCR มาตรฐานอาจพลาดคําหรือความเข้าใจผิดของตัวอักษร ซึ่งนําไปสู่ข้อมูลที่ไม่ดีในระบบ Downstream หรือการทํางานใหม่ด้วยตนเอง
ความคิดเห็นเกี่ยวกับโซลูชัน
โดยการใช้งานการประมวลผลก่อน (deskew, denoise, การปรับความตึงประสงค์) และท่อการตั้งค่า Aspose.OCR คุณสามารถปรับปรุงการสกัดข้อความอย่างมากแม้แต่จากภาพ subpar
ข้อกําหนด
- Visual Studio 2019 หรือภายหลัง
- .NET 6.0 หรือเร็วกว่า (หรือ .Net Framework 4.6.2+)
- Aspose.OCR สําหรับ .NET จาก NuGet
- ความสามารถพื้นฐาน C#
PM> Install-Package Aspose.OCR
การดําเนินการขั้นตอนขั้นตอน
ขั้นตอน 1: ติดตั้งและตั้งค่า Aspose.OCR
using Aspose.OCR;
ขั้นตอน 2: การประเมินคุณภาพของภาพ
ตรวจสอบสําหรับ:
- Blurriness
- สกปรก / การหมุน
- เสียงพื้นหลัง
- ความต้านทานต่ํา
- โคมไฟ / สีดํา
ขั้นตอนที่ 3: ใช้ภาพการประมวลผลและปรับปรุง
Aspose.OCR มีตัวกรองสําหรับการปฏิเสธการปลดลัดการไบนารีความต้านทานและอื่น ๆ:
RecognitionSettings settings = new RecognitionSettings();
settings.AutoContrast = true; // Improve contrast automatically
settings.Denoising = true; // Remove background noise
settings.Deskew = true; // Correct rotated images
settings.Binarization = true; // Convert to black/white for clarity
ขั้นตอนที่ 4: การตั้งค่าการรับรู้สําหรับภาพที่ยาก
คุณสามารถได้รับผลลัพธ์ที่ดีขึ้นโดยการดูด:
Language
คุณสมบัติ (เลือกเกมที่ใกล้ที่สุด)DetectAreasMode
(รถยนต์ vs. ภาพถ่าย)
settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.PHOTO; // If image is a photo
ขั้นตอน 5: สารสกัดข้อความและยืนยัน
OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("blurry_invoice.jpg");
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
foreach (RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
}
ขั้นตอน 6: Iterate และทดสอบด้วยการตั้งค่าที่แตกต่างกัน
ลองการผสมผสานหลายตัวของตัวกรองและตั้งค่าการประมวลผลก่อนแล้วตรวจสอบผลผลิตเพื่อความแม่นยําที่ดีที่สุด
ขั้นตอน 7: การประมวลผลก่อนอัตโนมัติสําหรับงานจํานวนมาก
การประมวลผลภาพทั้งหมดในตารางที่มีการตั้งค่าที่ดีที่สุด:
foreach (string file in Directory.GetFiles("./problem_images", "*.png"))
{
input.Add(file);
}
ขั้นตอน 8: ตัวอย่างที่สมบูรณ์
using Aspose.OCR;
using System;
using System.Collections.Generic;
using System.IO;
class Program
{
static void Main(string[] args)
{
try
{
OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("blurry_invoice.jpg");
RecognitionSettings settings = new RecognitionSettings();
settings.AutoContrast = true;
settings.Denoising = true;
settings.Deskew = true;
settings.Binarization = true;
settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.PHOTO;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
foreach (RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
}
}
catch (Exception ex)
{
Console.WriteLine($"Error: {ex.Message}");
}
}
}
ใช้กรณีและแอปพลิเคชัน
การดิจิทัลรายได้และแฟกซ์
สารสกัดข้อมูลจากใบรับรองและรายงานที่ซับซ้อนหรือโฟกัส
การอัตโนมัติบัญชีที่สามารถชําระเงินได้ด้วยสแกนที่ไม่ดี
ลดการทํางานใหม่และเร่งการประมวลผล AP แม้จะมาจากแหล่งที่มาที่ไม่ดี
กระดาษที่เก็บรวบรวม
การบันทึกข้อความที่สามารถใช้ได้จากเอกสารเก่าและจดหมายการเขียนด้วยมือ
ความท้าทายและโซลูชั่นทั่วไป
ความท้าทาย 1: ภาพยังคงไม่อ่านได้
**โซลูชัน: **ขอการกู้คืนหรือใช้เครื่องมือปรับปรุงขั้นสูงตามความต้องการ
ปลั๊ก 2: Batch การประมวลผล Bottlenecks
โซลูชัน: การประมวลผลก่อนอัตโนมัติและการวางแผนการทํางานกลางวัน
ความท้าทาย 3: อินพุตที่แตกต่างกันมาก
**โซลูชัน: **จัดเก็บการตั้งค่าที่ดีที่สุดตามประเภทเอกสาร การรับรองเป็นประจํา
การพิจารณาประสิทธิภาพ
- Preprocessing เพิ่มเวลา CPU แต่สามารถเพิ่มความแม่นยํา OCR
- ขนาดชุดทดสอบสําหรับฮาร์ดแวร์ของคุณ
- การจัดหาวัตถุ OCR หลังจากล้อ
แนวทางที่ดีที่สุด
- การจัดเก็บภาพเดิมสําหรับการตรวจสอบ
- การยืนยันการผลิตก่อนการรวมกัน
- ใช้ตรวจสอบการควบคุมคุณภาพสําหรับกระบวนการทํางานที่สําคัญ
- ปรับปรุง Aspose.OCR โดยปกติสําหรับการปรับปรุง
การ์ตูนขั้นสูง
ฉาก 1: การประมวลผลก่อนด้วยเครื่องมือภายนอก (ตัวเลือก)
ปรับปรุงภาพด้วยเครื่องมือเช่น ImageMagick หรือ OpenCV ก่อน OCR สําหรับกรณีที่รุนแรง
ฉาก 2: การกรองที่กําหนดเองตามประเภทเอกสาร
การจัดเก็บและใช้ใหม่การตั้งค่าตามแหล่งหรือกระแสทํางานเพื่อความแม่นยําสูงสุด
ข้อสรุป
ด้วยการประมวลผลก่อนและตั้งค่าที่เหมาะสม Aspose.OCR for .NET สามารถบันทึกข้อมูลที่มีค่าแม้จากภาพที่มีคุณภาพไม่ดีเพิ่มอัตโนมัติและการปฏิบัติตาม
สําหรับเคล็ดลับขั้นสูงและตัวกรองล่าสุดตรวจสอบ Aspose.OCR สําหรับการอ้างอิง API .NET .