วิธีการสกัดข้อมูลโครงสร้างจากตารางและรูปแบบในภาพ

วิธีการสกัดข้อมูลโครงสร้างจากตารางและรูปแบบในภาพ

การ extracting data from scanned tables or filled forms is essential for business automation, reporting, and compliance. Aspose.OCR Table to Text for .NET simplifies this process, accurately detecting cell and field structure and exporting to editable formats. การดึงดูดข้อมูลจากตารางที่สแกนหรือแบบฟอร์มที่เต็มรูปแบบเป็นสิ่งสําคัญสําหรับการอัตโนมัติการรายงานและการปฏิบัติตามธุรกิจ.

ปัญหาโลกจริง

ธุรกิจมักจะได้รับบัญชีรายงานหรือแบบฟอร์มเป็นภาพหรือสแกน การเข้าถึงแบบมือของข้อมูลตารางหรือฟิลด์รูปแบบเป็นช้าข้อผิดพลาดและมีค่าใช้จ่ายในระดับ

ความคิดเห็นเกี่ยวกับโซลูชัน

ด้วย Table to Text for .NET คุณสามารถสกัดข้อมูลที่โครงสร้างรวมทั้งเส้นคอลัมน์และค่าฟิลด์ได้โดยตรงจากภาพ ผลลัพธ์สามารถส่งออกไปยัง Excel, JSON หรือรวมกับฐานข้อมูลและแพลตฟอร์มอัตโนมัติ

ข้อกําหนด

  • Visual Studio 2019 หรือภายหลัง
  • .NET 6.0 หรือเร็วกว่า (หรือ .Net Framework 4.6.2+)
  • Aspose.OCR สําหรับ .NET จาก NuGet
  • ความสามารถพื้นฐาน C#
PM> Install-Package Aspose.OCR

การดําเนินการขั้นตอนขั้นตอน

ขั้นตอน 1: ติดตั้งและตั้งค่า Aspose.OCR

using Aspose.OCR;

ขั้นตอนที่ 2: การเตรียมตารางหรือรูปภาพ

OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("scanned_invoice.png");
input.Add("filled_form.jpg");

ขั้นตอนที่ 3: การตั้งค่าการยอมรับสําหรับตาราง / รูปแบบ

RecognitionSettings settings = new RecognitionSettings();
settings.DetectAreasMode = DetectAreasMode.TABLE; // or DetectAreasMode.FORM
settings.Language = Language.English;

ขั้นตอน 4: extract ตารางหรือข้อมูลแบบฟอร์ม

AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);

ขั้นตอน 5: การส่งออกที่โครงสร้างการผลิต

foreach (RecognitionResult result in results)
{
    result.Save("output_table.xlsx", SaveFormat.Xlsx); // Spreadsheet
    result.Save("output_table.json", SaveFormat.Json); // JSON
    result.Save("output_table.txt", SaveFormat.Text);  // Text
}

ขั้นตอน 6: การจัดการข้อผิดพลาดและผลลัพธ์ที่ถูกต้อง

try
{
    AsposeOcr ocr = new AsposeOcr();
    List<RecognitionResult> results = ocr.Recognize(input, settings);
    // Further processing...
}
catch (Exception ex)
{
    Console.WriteLine($"Error: {ex.Message}");
}

ขั้นตอน 7: ปรับปรุงการเปลี่ยนแปลงตาราง / รูปแบบ

  • การทดสอบบนตัวอย่างที่มีขอบเขตที่แตกต่างกันอักษรหรือตําแหน่งสนาม
  • Tune Preprocessing Settings สําหรับการตรวจจับที่ดีที่สุด

ขั้นตอน 8: อัตโนมัติ Batch Extraction

การประมวลผลภาพที่เกี่ยวข้องทั้งหมดในโฟลเดอร์:

foreach (string file in Directory.GetFiles("./forms", "*.jpg"))
{
    input.Add(file);
}

ขั้นตอนที่ 9: ตัวอย่างสมบูรณ์

using Aspose.OCR;
using System;
using System.Collections.Generic;
using System.IO;

class Program
{
    static void Main(string[] args)
    {
        try
        {
            OcrInput input = new OcrInput(InputType.SingleImage);
            input.Add("scanned_invoice.png");
            input.Add("filled_form.jpg");

            RecognitionSettings settings = new RecognitionSettings();
            settings.DetectAreasMode = DetectAreasMode.TABLE;
            settings.Language = Language.English;

            AsposeOcr ocr = new AsposeOcr();
            List<RecognitionResult> results = ocr.Recognize(input, settings);

            foreach (RecognitionResult result in results)
            {
                result.Save("output_table.xlsx", SaveFormat.Xlsx);
                result.Save("output_table.json", SaveFormat.Json);
                result.Save("output_table.txt", SaveFormat.Text);
            }
        }
        catch (Exception ex)
        {
            Console.WriteLine($"Error: {ex.Message}");
        }
    }
}

ใช้กรณีและแอปพลิเคชัน

บัญชีและรายงานอัตโนมัติ

สารสกัดข้อมูลทางการเงินสําหรับการบัญชีหรือวิเคราะห์

การสอบถามและการลงทะเบียนแบบฟอร์ม

ปลั๊กตอบสนองโครงสร้างสําหรับระบบ CRM, ERP หรือ BI

การปฏิบัติตามและการตรวจสอบ

การสกัดและยืนยันข้อมูลโดยอัตโนมัติจากแบบฟอร์มหรือตารางที่ส่ง

ความท้าทายและโซลูชั่นทั่วไป

ความท้าทาย 1: ขอบเขตของตารางที่ผิดปกติหรือการจัดตั้ง

โซลูชัน: ใช้การประมวลผลก่อนและการดูดตัวอย่างเพื่อปรับปรุงการตรวจจับ

ความท้าทาย 2: เนื้อหาผสม (ข้อความและตาราง)

**โซลูชัน: **ทํางานด้วย AUTO หรือแยกตามประเภทภาพเพื่อให้ได้ผลลัพธ์ที่ดีที่สุด

ความท้าทาย 3: รูปแบบที่ซับซ้อนที่มีหลายฟิลด์

โซลูชัน: การทดสอบและการรับรู้แบบ tweak สําหรับรูปแบบความหนาแน่นสูง

การพิจารณาประสิทธิภาพ

  • การรับรู้ตารางมีความเข้มข้นมากขึ้น CPU; การตรวจสอบงานชุด
  • การรับรองผลลัพธ์สําหรับกระแสการทํางานที่สําคัญ
  • Batch Export สําหรับการบูรณาการกับเครื่องมืออื่น ๆ

แนวทางที่ดีที่สุด

  • การยืนยันข้อมูลที่โครงสร้างขึ้นบนตัวอย่างก่อนการสแกน
  • การรักษาความปลอดภัยและเก็บข้อมูลทั้งภาพแหล่งที่มาและผลลัพธ์ที่สกัด
  • ปรับปรุง Aspose.OCR โดยปกติเพื่อปรับปรุงความแม่นยํา
  • การตั้งค่า Tune สําหรับการจัดตั้งเอกสารใหม่

การ์ตูนขั้นสูง

ฉาก 1: การส่งออกไปยังฐานข้อมูลหรือเครื่องมือ BI

// Use JSON or Excel export for integration with data pipelines

สภาพแวดล้อม 2: การสกัดในเวลาจริงในแอปเว็บ

// Integrate extraction logic into ASP.NET or workflow API

ข้อสรุป

Aspose.OCR Table to Text for .NET ช่วยให้คุณสามารถอัตโนมัติการสกัดข้อมูลที่โครงสร้างจากภาพและแบบฟอร์มเพื่อสนับสนุนทุกอย่างตั้งแต่การ automatisation ของธุรกิจไปจนถึงการปฏิบัติตามและการวิเคราะห์

สําหรับคุณสมบัติการสกัดตารางขั้นสูงเยี่ยมชม Aspose.OCR สําหรับการอ้างอิง API .NET .

 แบบไทย