วิธีการอัตโนมัติเข้าข้อมูลจากแบบฟอร์มด้วย Aspose.OCR

วิธีการอัตโนมัติเข้าข้อมูลจากแบบฟอร์มด้วย Aspose.OCR

การสกัดข้อมูลจากแบบฟอร์มกระดาษคําถามหรือสํารวจเป็นเครื่องป้อนข้อมูลแบบคลาสสิก ด้วย Aspose.OCR สําหรับ .NET คุณสามารถดิจิทัลข้อมูลรูปแบบจากสแกนหรือรูปภาพลดข้อผิดพลาดและแปลงเอกสารที่ไม่ได้โครงสร้างเป็นข้อมูลที่สามารถแก้ไขได้

ปัญหาโลกจริง

การเข้าถึงข้อมูลแบบฟอร์มแบบคู่มือนั้นช้าราคาแพงและมีแนวโน้มที่จะเกิดข้อผิดพลาดโดยเฉพาะอย่างยิ่งในองค์กรขนาดใหญ่การวิจัยหรือทาง logistics การเขียนด้วยตนเองการจัดตั้งที่แตกต่างกันและประเภท field mixed ทําให้การอัตโนมัติเป็นเรื่องยากโดยไม่ต้องใช้เครื่องมือ OCR ที่แข็งแกร่ง

ความคิดเห็นเกี่ยวกับโซลูชัน

Aspose.OCR สําหรับ .NET ให้การตั้งค่าการรับรู้ที่ยืดหยุ่นเพื่อ استخراجข้อความที่พิมพ์และเขียนด้วยมือจากแบบฟอร์มกระบวนการและผลลัพธ์ที่โครงสร้างการผลิตเหมาะสําหรับธุรกิจการดูแลสุขภาพ HR การศึกษาและอื่น ๆ

ข้อกําหนด

ก่อนที่คุณจะเริ่มต้นให้แน่ใจว่าคุณมี:

  • Visual Studio 2019 หรือภายหลัง
  • .NET 6.0 หรือเร็วกว่า (หรือ .Net Framework 4.6.2+)
  • Aspose.OCR สําหรับ .NET จาก NuGet
  • ประสบการณ์พื้นฐาน C#
PM> Install-Package Aspose.OCR

การดําเนินการขั้นตอนขั้นตอน

ขั้นตอน 1: ติดตั้งและตั้งค่า Aspose.OCR

using Aspose.OCR;

ขั้นตอนที่ 2: สแกนหรือถ่ายรูปแบบฟอร์มของคุณ

การเตรียมภาพแบบฟอร์มของคุณ (JPEG, PNG, PDF, หรือ TIFF) คุณสามารถเพิ่มไฟล์หลายไฟล์สําหรับการ استخراجชุด

OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("form1.png");
input.Add("form2.jpg");

ขั้นตอนที่ 3: การตั้งค่าการยอมรับ

การปรับการตั้งค่าสําหรับการตรวจจับภาษาการจัดวางและ (หากจําเป็น) การเขียนด้วยมือ

RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.DOCUMENT; // For complex or multi-field forms

ขั้นตอนที่ 4: เปิดกระบวนการสกัดข้อมูล

AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);

ขั้นตอน 5: การส่งออกหรือใช้ข้อมูลดิจิตอล

foreach (RecognitionResult result in results)
{
    Console.WriteLine(result.RecognitionText); // Extracted text
    result.Save("form_data.txt", SaveFormat.Text); // Save as plain text
    result.Save("form_data.xlsx", SaveFormat.Xlsx); // Save as spreadsheet
}

ขั้นตอน 6: เพิ่มการจัดการข้อผิดพลาด

try
{
    AsposeOcr ocr = new AsposeOcr();
    List<RecognitionResult> results = ocr.Recognize(input, settings);
    // further processing
}
catch (Exception ex)
{
    Console.WriteLine($"Error: {ex.Message}");
}

ขั้นตอน 7: ปรับปรุงการจัดตั้งและการเขียนด้วยมือ

  • สําหรับฟิลด์ที่เขียนด้วยมือใช้สแกน DPI สูงขึ้นและปรับการตั้งค่าภาษา
  • ใช้ DetectAreasMode.TABLE สําหรับรูปแบบตารางหรือ DOCUMENT สําหรับการจัดตั้งที่แตกต่างกัน
  • การทดสอบด้วยรูปแบบตัวอย่างเพื่อการตั้งค่า toning
// Example: Add all images from a directory
foreach (string file in Directory.GetFiles("./forms", "*.png"))
{
    input.Add(file);
}

ขั้นตอน 8: ตัวอย่างที่สมบูรณ์

using Aspose.OCR;
using System;
using System.Collections.Generic;

class Program
{
    static void Main(string[] args)
    {
        try
        {
            OcrInput input = new OcrInput(InputType.SingleImage);
            input.Add("form1.png");
            input.Add("form2.jpg");

            RecognitionSettings settings = new RecognitionSettings();
            settings.Language = Language.English;
            settings.DetectAreasMode = DetectAreasMode.DOCUMENT;

            AsposeOcr ocr = new AsposeOcr();
            List<RecognitionResult> results = ocr.Recognize(input, settings);

            foreach (RecognitionResult result in results)
            {
                Console.WriteLine(result.RecognitionText);
                result.Save("form_data.txt", SaveFormat.Text);
                result.Save("form_data.xlsx", SaveFormat.Xlsx);
            }
        }
        catch (Exception ex)
        {
            Console.WriteLine($"Error: {ex.Message}");
        }
    }
}

ใช้กรณีและแอปพลิเคชัน

การดูแลสุขภาพและ HR

สารสกัดและดิจิทัลข้อมูลแบบฟอร์มสําหรับผู้ป่วยการสมัครงานหรือสํารวจ

การวิจัยและการศึกษา

การประมวลผลคําถามอัตโนมัติและการสอบถามเพื่อการวิเคราะห์อย่างรวดเร็ว

logistics และธุรกิจ

บันทึกการจัดส่งแบบดิจิตอลแบบฟอร์มการตรวจสอบหรือรายการตรวจสอบ inventory

ความท้าทายและโซลูชั่นทั่วไป

ความท้าทาย 1: การเขียนด้วยมือหรือด้านคุณภาพต่ํา

โซลูชัน: ใช้การสแกนที่มีคุณภาพสูงและปรับการตั้งค่าการรับรู้สําหรับการเขียนด้วยมือ

ความท้าทาย 2: การจัดรูปแบบที่ผิดปกติ

โซลูชัน: ใช้โหมดเอกสารสําหรับการจัดตั้งที่ซับซ้อนและทดสอบตัวอย่าง

ความท้าทาย 3: Batch Extraction

โซลูชัน: ใช้การประมวลผลชุดแบบดิสก์สําหรับรูปแบบปริมาณสูง

การพิจารณาประสิทธิภาพ

  • กระบวนการแบทช์สําหรับความเร็วและสแกน
  • มีวัตถุ OCR หลังจากใช้
  • การยืนยันการผลิตก่อนการรวมกัน

แนวทางที่ดีที่สุด

  • ตรวจสอบข้อมูลดิจิตอลเพื่อความแม่นยําก่อนอัตโนมัติ
  • การตั้งค่า Tune สําหรับแต่ละรูปแบบประเภทรูปแบบ
  • Archive for การตรวจสอบ
  • ปรับปรุง Aspose.OCR โดยปกติสําหรับการปรับปรุงฟังก์ชั่น

การ์ตูนขั้นสูง

สภาพแวดล้อม 1: การสกัดการเขียนด้วยมือจากรูปแบบ

settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.DOCUMENT;
// Optionally, pre-filter for handwriting using image preprocessing

ฉาก 2: การส่งออกไปยัง JSON สําหรับการนําเข้าฐานข้อมูล

foreach (RecognitionResult result in results)
{
    result.Save("form_data.json", SaveFormat.Json);
}

ข้อสรุป

Aspose.OCR สําหรับเครื่องอัตโนมัติ .NET สร้างการ استخراجข้อมูล - การกําจัดการเข้าด้วยตนเองและเร่งการทํางานทางธุรกิจการวิจัยหรือการบริหาร

ดูตัวอย่างการใช้งานและรหัสขั้นสูงมากขึ้นใน Aspose.OCR สําหรับการอ้างอิง API .NET .

 แบบไทย