วิธีการเพิ่มความแม่นยําและประสิทธิภาพของ OCR โดยใช้ Aspose.OCR
การบรรลุความแม่นยํา OCR สูงและการประมวลผลที่รวดเร็วเป็นสิ่งสําคัญสําหรับการยอมรับในโลกจริง บทความนี้ให้คําแนะนําที่สามารถดําเนินการได้เพื่อการสั่นสะเทือนทั้งผลการรับรู้และส่งผ่านกับ Aspose.OCR สําหรับ .NET
ปัญหาโลกจริง
รูปภาพ输入ที่ไม่ดีการตั้งค่าภาษาที่ไม่ถูกต้องหรือรหัสที่ไม่มีประสิทธิภาพอาจนําไปสู่ผลลัพธ์ที่ไม่แม่นยําและงานชุดช้า การสั่นสะเทือนอย่างต่อเนื่องเป็นสิ่งสําคัญสําหรับความน่าเชื่อถือในการผลิต
ความคิดเห็นเกี่ยวกับโซลูชัน
ทําตามการปฏิบัติที่ดีที่สุดที่ได้รับการพิสูจน์ - การเพิ่มประสิทธิภาพของภาพเข้าการตั้งค่าการประมวลผลก่อนการเลือกภาษาการรับรู้ที่เหมาะสมและการปรับตัวชุดนี้เพื่อให้แน่ใจว่าคุณได้รับผลลัพธ์ที่ดีที่สุดจาก Aspose.OCR ในแต่ละโครงการ
ข้อกําหนด
- Visual Studio 2019 หรือภายหลัง
- .NET 6.0 หรือเร็วกว่า (หรือ .Net Framework 4.6.2+)
- Aspose.OCR สําหรับ .NET จาก NuGet
PM> Install-Package Aspose.OCR
การดําเนินการขั้นตอนขั้นตอน
ขั้นตอนที่ 1: ปรับปรุงคุณภาพของภาพเข้า
- ใช้การสแกนความละเอียดสูงหรือภาพถ่าย (น้อยกว่า 300 DPI สําหรับการพิมพ์ 150 dpi สําหรับหน้าจอ)
- หลีกเลี่ยงการหล่อลื่นหรือเงา ขนดกและรูปภาพหมุนตามความต้องการ
ขั้นตอนที่ 2: การประมวลผลก่อนภาพด้วยตัวกรอง
RecognitionSettings settings = new RecognitionSettings();
settings.AutoContrast = true;
settings.AutoSkew = true;
settings.Denoising = true;
settings.Binarization = true; // For black/white documents
ขั้นตอนที่ 3: การตั้งค่าภาษาการรับรู้และโหมด
settings.Language = Language.English; // or target language
// For photos or tables, set detection mode
settings.DetectAreasMode = DetectAreasMode.PHOTO; // or DetectAreasMode.TABLE
ขั้นตอนที่ 4: การประมวลผลแบตช์และคู่มือ
การประมวลผลภาพหลายภาพในเวลาเดียวกัน:
OcrInput input = new OcrInput(InputType.SingleImage);
foreach (string file in Directory.GetFiles("./input", "*.jpg"))
{
input.Add(file);
}
สําหรับโหลดหนักใช้ async หรือ Task Parallel Library:
Parallel.ForEach(files, file => {
// Run OCR on each file
});
ขั้นตอน 5: ตรวจสอบและตรวจสอบผล OCR
- ตรวจสอบข้อความที่ได้รับการยอมรับสําหรับคําหายไปหรือไม่ถูกต้อง
- ใช้สคริปต์การยืนยันหรือการตรวจสอบคู่มือสําหรับเอกสารที่สําคัญ
ขั้นตอน 6: การจัดการข้อผิดพลาดและ Outliers
try
{
// OCR processing
}
catch (Exception ex)
{
// Log error, move file to review folder
}
ขั้นตอน 7: ตัวอย่างที่สมบูรณ์
using Aspose.OCR;
using System;
using System.Collections.Generic;
using System.IO;
class Program
{
static void Main(string[] args)
{
try
{
OcrInput input = new OcrInput(InputType.SingleImage);
foreach (string file in Directory.GetFiles("./input", "*.jpg"))
{
input.Add(file);
}
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
settings.AutoContrast = true;
settings.AutoSkew = true;
settings.Denoising = true;
settings.Binarization = true;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
int count = 1;
foreach (RecognitionResult result in results)
{
result.Save($"./output/result_{count}.txt", SaveFormat.Text);
count++;
}
}
catch (Exception ex)
{
File.AppendAllText("ocr_errors.log", ex.Message + Environment.NewLine);
}
}
}
ใช้กรณีและแอปพลิเคชัน
บัญชีที่มีความแม่นยําสูงและสกัดสัญญา
ปรับปรุงคุณภาพและความน่าเชื่อถือของการอัตโนมัติเอกสารทางกฎหมาย/ทางการเงิน
การประมวลผลภาพจํานวนมาก / Text Archive
ปรับปรุงความเร็วของชุดและลดความล้มเหลวที่ซื่อสัตย์หรือ BI
R&D และการประเมินรูปแบบ
Tune สําหรับการจัดตั้งภาษาหรือประเภทภาพใหม่ในสถาปัตยกรรมวิจัย
ความท้าทายและโซลูชั่นทั่วไป
ความท้าทาย 1: ภาพเข้าต่ํา
โซลูชัน: ใช้การสแกน / ภาพที่ดีขึ้นการปรับปรุงภาพและป้ายสําหรับการตรวจสอบหากความมั่นใจใน OCR น้อย
ความท้าทาย 2: ประสิทธิภาพต่ําในงานขนาดใหญ่
โซลูชัน: บัตร, คู่มือและตรวจสอบทรัพยากรของระบบในระหว่างการทํางาน
ความท้าทาย 3: ข้อผิดพลาดการรับรู้ที่ไม่คาดหวัง
โซลูชัน: รับรองการส่งออกการจัดการข้อผิดพลาดและรักษาซอฟต์แวร์ที่ทันสมัย
การพิจารณาประสิทธิภาพ
- ขนาดแบทช์ Tune, การใช้หน่วยความจําและการประมวลผลก่อนสําหรับงานขนาดใหญ่
- ตรวจสอบทรัพยากรระบบและสุขภาพโฟลเดอร์การส่งออก
- ใช้รูปแบบ async/parallel สําหรับการวางสินค้าขนาดใหญ่
แนวทางที่ดีที่สุด
- การยืนยันการตั้งค่าบนตัวอย่างก่อนที่จะสแกนขึ้น
- การตรวจสอบอัตโนมัติและการแจ้งเตือนข้อผิดพลาด
- บันทึกทั้งภาพแหล่งข้อมูลและผลลัพธ์ได้อย่างปลอดภัย
- อัปเดต Aspose.OCR สําหรับความแม่นยํา / ประสิทธิภาพที่เพิ่มขึ้น
การ์ตูนขั้นสูง
ฉาก 1: การประมวลผลก่อนการปรับแต่งสําหรับเนื้อหาผสม
กําหนดโหมดตรวจจับแบบไดนามิกสําหรับภาพป้อนแต่ละครั้ง
ฉาก 2: การปรับปรุงอย่างต่อเนื่องและการตอบสนอง
Feed OCR output errors back into process for correction และ retraining
ข้อสรุป
ความแม่นยําและการส่งผ่านให้แน่ใจว่าผลลัพธ์ที่ดีที่สุดจาก Aspose.OCR สําหรับ .NET ในกระบวนการทํางานใด ๆ สําหรับเทคนิคการเพิ่มประสิทธิภาพเพิ่มเติมเยี่ยมชม Aspose.OCR สําหรับการอ้างอิง API .NET .