วิธีการเตรียมภาพสแกนสําหรับ OCR กับ Deskew ใช้ .NET

วิธีการเตรียมภาพสแกนสําหรับ OCR กับ Deskew ใช้ .NET

ความแม่นยํา OCR (การรับรู้ตัวละครออฟติคอล) เริ่มต้นด้วยภาพที่สอดคล้องอย่างสมบูรณ์ การสแกนแบบสกปรกหรือแบบหมุนลดความถูกต้องของ OCR ดังนั้นการลบเป็นขั้นตอนที่สําคัญในการประมวลผลก่อน Aspose.Imaging สําหรับ .NET ช่วยให้คุณสามารถสกรูเอกสาร / ภาพเพื่อให้ได้ผลลัพธ์ที่ดีที่สุดในเครื่องมือ OKR ภายนอกใด ๆ

ปัญหาโลกจริง

มอเตอร์ OCR จะทํางานได้ดีที่สุดบนภาพที่สอดคล้องกันดี การสแกนแบบสกปรกทําให้เกิดตัวอักษรที่หายไปหรือข้อผิดพลาดในข้อความ การกรอกด้วยมือช้าเกินไปสําหรับชุดขนาดใหญ่

ความคิดเห็นเกี่ยวกับโซลูชัน

ใช้ Aspose.Imaging สําหรับ .NET เพื่อลบภาพที่สแกนโดยอัตโนมัติ เก็บไว้ในรูปแบบที่ไม่มีการสูญเสียเช่น PNG หรือ TIFF พร้อมที่จะนําเข้าสู่ซอฟต์แวร์ OCR ของคุณเลือก (Asposa.OCR, Tesseract ฯลฯ)

ข้อกําหนด

  • Visual Studio 2019 หรือภายหลัง
  • .NET 6.0 หรือเร็วกว่า (หรือ .Net Framework 4.6.2+)
  • Aspose.Imaging สําหรับ .NET จาก NuGet
  • เอกสารหรือภาพที่สแกน (JPEG, PNG, TIFF, ฯลฯ)
PM> Install-Package Aspose.Imaging

การดําเนินการขั้นตอนขั้นตอน

ขั้นตอนที่ 1: ลบภาพสแกน

using Aspose.Imaging;
using Aspose.Imaging.ImageOptions;

string inputPath = "./input/scan_for_ocr.png";
string outputPath = "./output/scan_for_ocr_deskewed.png";

using (var image = (RasterImage)Image.Load(inputPath))
{
    // Deskew and use white background for optimal OCR results
    image.NormalizeAngle(false, Color.White);
    image.Save(outputPath, new PngOptions()); // PNG or TIFF recommended
}

ขั้นตอนที่ 2: ผ่านภาพที่ซ่อนอยู่ไปยังเครื่องยนต์ OCR ใด ๆ

  • ใช้เครื่องมือ OCR ที่ชื่นชอบของคุณเพื่อรับรู้ข้อความจากภาพที่กําหนดเอง
  • ตัวอย่าง: การนําเข้า scan_for_ocr_deskewed.png ในท่อ OCR หรือซอฟต์แวร์ของคุณ (Aspose.OCR, Tesseract, ABBYY ฯลฯ)

ขั้นตอนที่ 3: รีวิวและฟื้นฟู

  • ตรวจสอบผล OCR หากความแม่นยําต่ําปรับการตั้งค่าพื้นหลังหรือคุณภาพการสแกน
  • โปรดพิจารณาการประมวลผลชุดสําหรับสแกนใหม่ทั้งหมดเพื่อให้กระบวนการทํางานการดิจิทัลของคุณมีประสิทธิภาพ

ใช้กรณีและแอปพลิเคชัน

  • การดิจิทัลไฟล์ใบรับรองสัญญาหรือรูปแบบสําหรับข้อความที่สามารถค้นหาได้
  • การเตรียมเอกสารธุรกิจสําหรับการปฏิบัติตามและการตรวจสอบ
  • เพิ่มความแม่นยําใน OCR หรือท่ออัตโนมัติเอกสารใด ๆ

ความท้าทายและโซลูชั่นทั่วไป

**ภาพที่ซ่อนอยู่ยังคงทําให้เกิดข้อผิดพลาด OCR:**ลองสีพื้นหลังที่แตกต่างกันการกรองก่อนสําหรับเสียงรบกวนหรือสแกนความละเอียดสูง

**ไฟล์ออกเป็นขนาดใหญ่เกินไป: ** ใช้ TIFF กับการบีบอัดหรือ PNG หากความโปร่งใสเป็นสิ่งจําเป็น

** ผสมรูปแบบภาพ: ** ปกติการสแกนทั้งหมดไปยังรูปแบบที่ไม่มีการสูญเสียก่อน OCR

แนวทางที่ดีที่สุด

  • ใช้รูปแบบภาพที่ไม่มีการสูญเสียเสมอสําหรับ OCR
  • เก็บภาพเดิมและประมวลผลสําหรับการอ้างอิง
  • รายละเอียดการทํางานและดิจิตอลของคุณสําหรับทีม

FAQ

Q: ฉันสามารถจัดเก็บภาพทั้งหมดในโฟลเดอร์ได้หรือไม่ตอบ: ใช่ - ลองรหัสนี้ในรูบนไฟล์ทั้งหมดตามที่แสดงในตัวอย่างชุดก่อนหน้านี้

**Q: สีพื้นหลังที่ทํางานได้ดีที่สุดสําหรับ OCR?**A: สีขาวปลอดภัยที่สุดสําหรับข้อความ ใช้โปร่งใสสําหรับกราฟิกหรือตรงกับเอกสารของคุณ

**Q: มัน OK เพื่อบีบอัดไฟล์หลังจากการลบ?**A: ใช้การบีบอัดที่ไม่มีการสูญเสียเพื่อหลีกเลี่ยงวัสดุที่ลดความแม่นยําของ OCR

ข้อสรุป

การเปิดตัวด้วย Aspose.Imaging สําหรับ .NET เป็นสิ่งจําเป็นสําหรับ OCR ที่น่าเชื่อถือการดิจิทัลและการอัตโนมัติทางธุรกิจ ให้ท่อของคุณสะอาดรวดเร็วและแม่นยํา! สําหรับข้อมูลเพิ่มเติมดู Aspose.Imaging สําหรับ .NET API Reference .

 แบบไทย