วิธีการเตรียมภาพสแกนสําหรับ OCR กับ Deskew ใช้ .NET
ความแม่นยํา OCR (การรับรู้ตัวละครออฟติคอล) เริ่มต้นด้วยภาพที่สอดคล้องอย่างสมบูรณ์ การสแกนแบบสกปรกหรือแบบหมุนลดความถูกต้องของ OCR ดังนั้นการลบเป็นขั้นตอนที่สําคัญในการประมวลผลก่อน Aspose.Imaging สําหรับ .NET ช่วยให้คุณสามารถสกรูเอกสาร / ภาพเพื่อให้ได้ผลลัพธ์ที่ดีที่สุดในเครื่องมือ OKR ภายนอกใด ๆ
ปัญหาโลกจริง
มอเตอร์ OCR จะทํางานได้ดีที่สุดบนภาพที่สอดคล้องกันดี การสแกนแบบสกปรกทําให้เกิดตัวอักษรที่หายไปหรือข้อผิดพลาดในข้อความ การกรอกด้วยมือช้าเกินไปสําหรับชุดขนาดใหญ่
ความคิดเห็นเกี่ยวกับโซลูชัน
ใช้ Aspose.Imaging สําหรับ .NET เพื่อลบภาพที่สแกนโดยอัตโนมัติ เก็บไว้ในรูปแบบที่ไม่มีการสูญเสียเช่น PNG หรือ TIFF พร้อมที่จะนําเข้าสู่ซอฟต์แวร์ OCR ของคุณเลือก (Asposa.OCR, Tesseract ฯลฯ)
ข้อกําหนด
- Visual Studio 2019 หรือภายหลัง
- .NET 6.0 หรือเร็วกว่า (หรือ .Net Framework 4.6.2+)
- Aspose.Imaging สําหรับ .NET จาก NuGet
- เอกสารหรือภาพที่สแกน (JPEG, PNG, TIFF, ฯลฯ)
PM> Install-Package Aspose.Imaging
การดําเนินการขั้นตอนขั้นตอน
ขั้นตอนที่ 1: ลบภาพสแกน
using Aspose.Imaging;
using Aspose.Imaging.ImageOptions;
string inputPath = "./input/scan_for_ocr.png";
string outputPath = "./output/scan_for_ocr_deskewed.png";
using (var image = (RasterImage)Image.Load(inputPath))
{
// Deskew and use white background for optimal OCR results
image.NormalizeAngle(false, Color.White);
image.Save(outputPath, new PngOptions()); // PNG or TIFF recommended
}
ขั้นตอนที่ 2: ผ่านภาพที่ซ่อนอยู่ไปยังเครื่องยนต์ OCR ใด ๆ
- ใช้เครื่องมือ OCR ที่ชื่นชอบของคุณเพื่อรับรู้ข้อความจากภาพที่กําหนดเอง
- ตัวอย่าง: การนําเข้า
scan_for_ocr_deskewed.png
ในท่อ OCR หรือซอฟต์แวร์ของคุณ (Aspose.OCR, Tesseract, ABBYY ฯลฯ)
ขั้นตอนที่ 3: รีวิวและฟื้นฟู
- ตรวจสอบผล OCR หากความแม่นยําต่ําปรับการตั้งค่าพื้นหลังหรือคุณภาพการสแกน
- โปรดพิจารณาการประมวลผลชุดสําหรับสแกนใหม่ทั้งหมดเพื่อให้กระบวนการทํางานการดิจิทัลของคุณมีประสิทธิภาพ
ใช้กรณีและแอปพลิเคชัน
- การดิจิทัลไฟล์ใบรับรองสัญญาหรือรูปแบบสําหรับข้อความที่สามารถค้นหาได้
- การเตรียมเอกสารธุรกิจสําหรับการปฏิบัติตามและการตรวจสอบ
- เพิ่มความแม่นยําใน OCR หรือท่ออัตโนมัติเอกสารใด ๆ
ความท้าทายและโซลูชั่นทั่วไป
**ภาพที่ซ่อนอยู่ยังคงทําให้เกิดข้อผิดพลาด OCR:**ลองสีพื้นหลังที่แตกต่างกันการกรองก่อนสําหรับเสียงรบกวนหรือสแกนความละเอียดสูง
**ไฟล์ออกเป็นขนาดใหญ่เกินไป: ** ใช้ TIFF กับการบีบอัดหรือ PNG หากความโปร่งใสเป็นสิ่งจําเป็น
** ผสมรูปแบบภาพ: ** ปกติการสแกนทั้งหมดไปยังรูปแบบที่ไม่มีการสูญเสียก่อน OCR
แนวทางที่ดีที่สุด
- ใช้รูปแบบภาพที่ไม่มีการสูญเสียเสมอสําหรับ OCR
- เก็บภาพเดิมและประมวลผลสําหรับการอ้างอิง
- รายละเอียดการทํางานและดิจิตอลของคุณสําหรับทีม
FAQ
Q: ฉันสามารถจัดเก็บภาพทั้งหมดในโฟลเดอร์ได้หรือไม่ตอบ: ใช่ - ลองรหัสนี้ในรูบนไฟล์ทั้งหมดตามที่แสดงในตัวอย่างชุดก่อนหน้านี้
**Q: สีพื้นหลังที่ทํางานได้ดีที่สุดสําหรับ OCR?**A: สีขาวปลอดภัยที่สุดสําหรับข้อความ ใช้โปร่งใสสําหรับกราฟิกหรือตรงกับเอกสารของคุณ
**Q: มัน OK เพื่อบีบอัดไฟล์หลังจากการลบ?**A: ใช้การบีบอัดที่ไม่มีการสูญเสียเพื่อหลีกเลี่ยงวัสดุที่ลดความแม่นยําของ OCR
ข้อสรุป
การเปิดตัวด้วย Aspose.Imaging สําหรับ .NET เป็นสิ่งจําเป็นสําหรับ OCR ที่น่าเชื่อถือการดิจิทัลและการอัตโนมัติทางธุรกิจ ให้ท่อของคุณสะอาดรวดเร็วและแม่นยํา! สําหรับข้อมูลเพิ่มเติมดู Aspose.Imaging สําหรับ .NET API Reference .