วิธีการปลูกเอกสารสแกนสําหรับ OCR ใน .NET
เมื่อเตรียมเอกสารสแกนสําหรับ การรับรู้ตัวอักษรแสง (OCR) มันเป็นสิ่งสําคัญที่จะปลูกภาพเพื่อมุ่งเน้นไปที่พื้นที่หนักของข้อความ การสแกนชิ้นส่วนที่ไม่เกี่ยวข้องของเอกสารให้แน่ใจว่าซอฟต์แวร์ OCR สามารถสกัดข้อความได้อย่างแม่นยําและมีประสิทธิภาพมากขึ้น Aspose.Imaging for .NET ให้เครื่องมือที่จําเป็นสําหรับการสแกนเอกสารและเตรียมพวกเขาสําหรับการประมวลผล OCR
ประโยชน์ของเอกสารสแกน Cropping สําหรับ OCR
ปรับปรุงความแม่นยํา:- มุ่งเน้นความพยายามของ OCR บนส่วนข้อความที่เกี่ยวข้องหลีกเลี่ยงเสียงรบกวนหรือเนื้อหาที่ไม่เกี่ยวข้อง
เวลาการประมวลผลที่ลดลง:- พืชภาพเพื่อลดพื้นที่ที่จะได้รับการประมวลผลโดยเร่งกระบวนการ OCR
การสกัดข้อความที่ดีกว่า:- ตรวจสอบให้แน่ใจว่าข้อความมีความสม่ําเสมอและได้รับการกรอบดีสําหรับเครื่องยนต์ OCR
ข้อกําหนด: การตั้งค่า Aspose.Imaging
- ติดตั้ง .NET SDK ในระบบของคุณ
- เพิ่ม Aspose.Imaging ไปยังโครงการของคุณ:
dotnet add package Aspose.Imaging
- รับใบอนุญาตวัดและกําหนดค่าโดยใช้
SetMeteredKey()
.
คู่มือขั้นตอนสําหรับเอกสารสแกนสําหรับ OCR
ขั้นตอนที่ 1: การตั้งค่าใบอนุญาต Metered
การตั้งค่า Aspose.Imaging สําหรับการเข้าถึงไม่ จํากัด สําหรับคุณสมบัติการกัดกร่อน
using Aspose.Imaging;
Metered license = new Metered();
license.SetMeteredKey("<your public key>", "<your private key>");
Console.WriteLine("Metered license configured successfully.");
ขั้นตอนที่ 2: ดาวน์โหลดภาพเอกสารสแกน
ดาวน์โหลดไฟล์เอกสารที่สแกนที่จําเป็นต้องเก็บรวบรวมสําหรับการเตรียม OCR
string inputPath = @"c:\documents\scanned_document.png";
using (var image = Image.Load(inputPath))
{
Console.WriteLine($"Loaded scanned document: {inputPath}");
}
ขั้นตอนที่ 3: กําหนดพื้นที่ปลูก
define the rectangular area around the text that needs to be extracted. defines the rectangular area around the text that needs to be extracted. defines the rectangular area around the text that needs to be extracted.
var cropArea = new Rectangle(50, 50, 500, 500); // Crop area: x, y, width, height
image.Crop(cropArea);
Console.WriteLine($"Cropped image to the defined area: {cropArea.Width}x{cropArea.Height}");
ขั้นตอนที่ 4: ใช้กระบวนการพืช
ใช้ Crop()
วิธีการที่จะเอาส่วนข้อความที่ต้องการจากภาพ
image.Crop(cropArea);
Console.WriteLine("Applied crop operation to isolate text for OCR.");
ขั้นตอน 5: การบันทึกภาพที่ซับซ้อน
บันทึกภาพที่รวบรวมสําหรับการประมวลผล OCR
image.Save(@"c:\output\ocr_ready_image.png", new PngOptions());
Console.WriteLine("Cropped image saved successfully for OCR.");
การใช้งานและการใช้งาน
ระบบการประมวลผลเอกสาร:- การประยุกต์ใช้การรวบรวมในระบบสแกนเอกสารอัตโนมัติเพื่อเตรียมภาพสําหรับ OCR
การบูรณาการกระบวนการทํางาน OCR:- ใบรับรองผลไม้ก่อนที่จะส่งไปยังเครื่องยนต์ OCR สําหรับการสกัดข้อความที่รวดเร็วและแม่นยํามากขึ้น
การยืนยันการส่งออก:- เปิดภาพที่รวบรวมเพื่อให้แน่ใจว่าข้อความจะเห็นได้ชัดและกรอบอย่างถูกต้อง
การประยุกต์ใช้ในโลกจริง
การสแกนเอกสารทางกฎหมายและทางการแพทย:- Crop สแกนสัญญาหรือบันทึกทางการแพทย์เพื่อมุ่งเน้นไปที่ข้อความที่สําคัญสําหรับการประมวลผล OCR
ระบบการจัดเก็บข้อมูล:- การเตรียมเอกสารประวัติศาสตร์สําหรับการสกัดข้อความและการดิจิทัล
บริการอีเมลของรัฐบาล:- อัตโนมัติการสกัดข้อความจากรูปแบบหรือแอพที่สแกน
ปัญหาทั่วไปและข้อกําหนด
พื้นที่เพาะปลูกที่ไม่ถูกต้อง:- ให้แน่ใจว่า
Rectangle
การสอดคล้องของส่วนกับข้อความภาพที่มีคุณภาพต่ํา:- ตรวจสอบให้แน่ใจว่าภาพสแกนมีความละเอียดสูงเพียงพอสําหรับความแม่นยํา OCR
ใบอนุญาตไฟล:- ตรวจสอบไดเรกทอรีการออกมีอนุญาตการเขียนที่เหมาะสม
ข้อสรุป
โดยใช้ Aspose.Imaging สําหรับ .NET คุณสามารถเพาะปลูกเอกสารสแกนได้อย่างง่ายดายเพื่อเน้นส่วนที่สําคัญสําหรับการประมวลผล OCR ปรับปรุงความแม่นยําและประสิทธิภาพ โซลูชันนี้เหมาะสําหรับการทํางานอัตโนมัติในการจัดการเอกสารระบบทางกฎหมายและการดูแลสุขภาพ