วิธีการอัตโนมัติเข้าข้อมูลจากแบบฟอร์มด้วย Aspose.OCR
การสกัดข้อมูลจากแบบฟอร์มกระดาษคําถามหรือสํารวจเป็นเครื่องป้อนข้อมูลแบบคลาสสิก ด้วย Aspose.OCR สําหรับ .NET คุณสามารถดิจิทัลข้อมูลรูปแบบจากสแกนหรือรูปภาพลดข้อผิดพลาดและแปลงเอกสารที่ไม่ได้โครงสร้างเป็นข้อมูลที่สามารถแก้ไขได้
ปัญหาโลกจริง
การเข้าถึงข้อมูลแบบฟอร์มแบบคู่มือนั้นช้าราคาแพงและมีแนวโน้มที่จะเกิดข้อผิดพลาดโดยเฉพาะอย่างยิ่งในองค์กรขนาดใหญ่การวิจัยหรือทาง logistics การเขียนด้วยตนเองการจัดตั้งที่แตกต่างกันและประเภท field mixed ทําให้การอัตโนมัติเป็นเรื่องยากโดยไม่ต้องใช้เครื่องมือ OCR ที่แข็งแกร่ง
ความคิดเห็นเกี่ยวกับโซลูชัน
Aspose.OCR สําหรับ .NET ให้การตั้งค่าการรับรู้ที่ยืดหยุ่นเพื่อ استخراجข้อความที่พิมพ์และเขียนด้วยมือจากแบบฟอร์มกระบวนการและผลลัพธ์ที่โครงสร้างการผลิตเหมาะสําหรับธุรกิจการดูแลสุขภาพ HR การศึกษาและอื่น ๆ
ข้อกําหนด
ก่อนที่คุณจะเริ่มต้นให้แน่ใจว่าคุณมี:
- Visual Studio 2019 หรือภายหลัง
- .NET 6.0 หรือเร็วกว่า (หรือ .Net Framework 4.6.2+)
- Aspose.OCR สําหรับ .NET จาก NuGet
- ประสบการณ์พื้นฐาน C#
PM> Install-Package Aspose.OCR
การดําเนินการขั้นตอนขั้นตอน
ขั้นตอน 1: ติดตั้งและตั้งค่า Aspose.OCR
using Aspose.OCR;
ขั้นตอนที่ 2: สแกนหรือถ่ายรูปแบบฟอร์มของคุณ
การเตรียมภาพแบบฟอร์มของคุณ (JPEG, PNG, PDF, หรือ TIFF) คุณสามารถเพิ่มไฟล์หลายไฟล์สําหรับการ استخراجชุด
OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("form1.png");
input.Add("form2.jpg");
ขั้นตอนที่ 3: การตั้งค่าการยอมรับ
การปรับการตั้งค่าสําหรับการตรวจจับภาษาการจัดวางและ (หากจําเป็น) การเขียนด้วยมือ
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.DOCUMENT; // For complex or multi-field forms
ขั้นตอนที่ 4: เปิดกระบวนการสกัดข้อมูล
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
ขั้นตอน 5: การส่งออกหรือใช้ข้อมูลดิจิตอล
foreach (RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText); // Extracted text
result.Save("form_data.txt", SaveFormat.Text); // Save as plain text
result.Save("form_data.xlsx", SaveFormat.Xlsx); // Save as spreadsheet
}
ขั้นตอน 6: เพิ่มการจัดการข้อผิดพลาด
try
{
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
// further processing
}
catch (Exception ex)
{
Console.WriteLine($"Error: {ex.Message}");
}
ขั้นตอน 7: ปรับปรุงการจัดตั้งและการเขียนด้วยมือ
- สําหรับฟิลด์ที่เขียนด้วยมือใช้สแกน DPI สูงขึ้นและปรับการตั้งค่าภาษา
- ใช้ DetectAreasMode.TABLE สําหรับรูปแบบตารางหรือ DOCUMENT สําหรับการจัดตั้งที่แตกต่างกัน
- การทดสอบด้วยรูปแบบตัวอย่างเพื่อการตั้งค่า toning
// Example: Add all images from a directory
foreach (string file in Directory.GetFiles("./forms", "*.png"))
{
input.Add(file);
}
ขั้นตอน 8: ตัวอย่างที่สมบูรณ์
using Aspose.OCR;
using System;
using System.Collections.Generic;
class Program
{
static void Main(string[] args)
{
try
{
OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("form1.png");
input.Add("form2.jpg");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.DOCUMENT;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
foreach (RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
result.Save("form_data.txt", SaveFormat.Text);
result.Save("form_data.xlsx", SaveFormat.Xlsx);
}
}
catch (Exception ex)
{
Console.WriteLine($"Error: {ex.Message}");
}
}
}
ใช้กรณีและแอปพลิเคชัน
การดูแลสุขภาพและ HR
สารสกัดและดิจิทัลข้อมูลแบบฟอร์มสําหรับผู้ป่วยการสมัครงานหรือสํารวจ
การวิจัยและการศึกษา
การประมวลผลคําถามอัตโนมัติและการสอบถามเพื่อการวิเคราะห์อย่างรวดเร็ว
logistics และธุรกิจ
บันทึกการจัดส่งแบบดิจิตอลแบบฟอร์มการตรวจสอบหรือรายการตรวจสอบ inventory
ความท้าทายและโซลูชั่นทั่วไป
ความท้าทาย 1: การเขียนด้วยมือหรือด้านคุณภาพต่ํา
โซลูชัน: ใช้การสแกนที่มีคุณภาพสูงและปรับการตั้งค่าการรับรู้สําหรับการเขียนด้วยมือ
ความท้าทาย 2: การจัดรูปแบบที่ผิดปกติ
โซลูชัน: ใช้โหมดเอกสารสําหรับการจัดตั้งที่ซับซ้อนและทดสอบตัวอย่าง
ความท้าทาย 3: Batch Extraction
โซลูชัน: ใช้การประมวลผลชุดแบบดิสก์สําหรับรูปแบบปริมาณสูง
การพิจารณาประสิทธิภาพ
- กระบวนการแบทช์สําหรับความเร็วและสแกน
- มีวัตถุ OCR หลังจากใช้
- การยืนยันการผลิตก่อนการรวมกัน
แนวทางที่ดีที่สุด
- ตรวจสอบข้อมูลดิจิตอลเพื่อความแม่นยําก่อนอัตโนมัติ
- การตั้งค่า Tune สําหรับแต่ละรูปแบบประเภทรูปแบบ
- Archive for การตรวจสอบ
- ปรับปรุง Aspose.OCR โดยปกติสําหรับการปรับปรุงฟังก์ชั่น
การ์ตูนขั้นสูง
สภาพแวดล้อม 1: การสกัดการเขียนด้วยมือจากรูปแบบ
settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.DOCUMENT;
// Optionally, pre-filter for handwriting using image preprocessing
ฉาก 2: การส่งออกไปยัง JSON สําหรับการนําเข้าฐานข้อมูล
foreach (RecognitionResult result in results)
{
result.Save("form_data.json", SaveFormat.Json);
}
ข้อสรุป
Aspose.OCR สําหรับเครื่องอัตโนมัติ .NET สร้างการ استخراجข้อมูล - การกําจัดการเข้าด้วยตนเองและเร่งการทํางานทางธุรกิจการวิจัยหรือการบริหาร
ดูตัวอย่างการใช้งานและรหัสขั้นสูงมากขึ้นใน Aspose.OCR สําหรับการอ้างอิง API .NET .