كيفية استخراج البيانات المنظمة من اللوحات والنماذج في الصور

كيفية استخراج البيانات المنظمة من اللوحات والنماذج في الصور

استخراج البيانات من اللوحات المسجلة أو النماذج المملوءة أمر بالغ الأهمية لأتمتة الأعمال والإبلاغ والامتثال. Aspose.OCR Table to Text for .NET يعزز هذه العملية، ويكتشف بدقة هيكل الخلايا والمجال وتصديرها إلى تنسيقات قابلة للتعديل.

مشكلة العالم الحقيقي

وتتلقى الشركات في كثير من الأحيان الفواتير أو التقارير، أو النماذج مثل الصور أو الفحوصات.الإدخال اليدوي لبيانات الجدول أو الحقول النموذجية بطيئة وخطأ ومكلفة على نطاق واسع.

نظرة عامة على الحل

باستخدام جدول إلى نص لـ .NET، يمكنك استخراج البيانات المنظمة – بما في ذلك الصفوف والعمود والقيم الميدانية – مباشرة من الصور.

المتطلبات

  • Visual Studio 2019 أو أحدث
  • .NET 6.0 أو أعلى (أو .Net Framework 4.6.2+)
  • Aspose.OCR لـ .NET من NuGet
  • مهارات C# الأساسية
PM> Install-Package Aspose.OCR

تنفيذ خطوة بخطوة

الخطوة 1: تثبيت وتكوين Aspose.OCR

using Aspose.OCR;

الخطوة 2: إعداد لوحة أو شكل الصور

OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("scanned_invoice.png");
input.Add("filled_form.jpg");

الخطوة 3: قم بتعيين إعدادات التعرف على اللوحات / النماذج

RecognitionSettings settings = new RecognitionSettings();
settings.DetectAreasMode = DetectAreasMode.TABLE; // or DetectAreasMode.FORM
settings.Language = Language.English;

الخطوة 4: استخراج جدول أو بيانات النموذج

AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);

الخطوة الخامسة: تصدير المنتجات المنظمة

foreach (RecognitionResult result in results)
{
    result.Save("output_table.xlsx", SaveFormat.Xlsx); // Spreadsheet
    result.Save("output_table.json", SaveFormat.Json); // JSON
    result.Save("output_table.txt", SaveFormat.Text);  // Text
}

الخطوة 6: التعامل مع الأخطاء والتحقق من النتائج

try
{
    AsposeOcr ocr = new AsposeOcr();
    List<RecognitionResult> results = ocr.Recognize(input, settings);
    // Further processing...
}
catch (Exception ex)
{
    Console.WriteLine($"Error: {ex.Message}");
}

الخطوة 7: تحسين التغيرات في الجدول / النموذج

  • اختبار على العينات ذات الحدود المختلفة أو الخطوط أو مواقع الميدان
  • إعدادات المعالجة المسبقة للتحديد الأفضل

الخطوة الثامنة: استخراج التوت التلقائي

معالجة جميع الصور ذات الصلة في مجلد:

foreach (string file in Directory.GetFiles("./forms", "*.jpg"))
{
    input.Add(file);
}

الخطوة 9: نموذج كامل

using Aspose.OCR;
using System;
using System.Collections.Generic;
using System.IO;

class Program
{
    static void Main(string[] args)
    {
        try
        {
            OcrInput input = new OcrInput(InputType.SingleImage);
            input.Add("scanned_invoice.png");
            input.Add("filled_form.jpg");

            RecognitionSettings settings = new RecognitionSettings();
            settings.DetectAreasMode = DetectAreasMode.TABLE;
            settings.Language = Language.English;

            AsposeOcr ocr = new AsposeOcr();
            List<RecognitionResult> results = ocr.Recognize(input, settings);

            foreach (RecognitionResult result in results)
            {
                result.Save("output_table.xlsx", SaveFormat.Xlsx);
                result.Save("output_table.json", SaveFormat.Json);
                result.Save("output_table.txt", SaveFormat.Text);
            }
        }
        catch (Exception ex)
        {
            Console.WriteLine($"Error: {ex.Message}");
        }
    }
}

استخدام الحالات والتطبيقات

الفواتير والتقارير الأتمتة

استخراج البيانات المالية للمحاسبة أو التحليلات.

نموذج الاستطلاع والتسجيل

استجابة مركبة لـ CRM أو ERP أو BI.

الامتثال والمراجعة

استخراج وتصديق البيانات تلقائيًا من النماذج أو اللوحات المقدمة.

التحديات والحلول المشتركة

التحدي الأول: حدود الطاولة غير المنتظمة أو التخطيطات

الحل: استخدم المعالجة المسبقة وتجهيز العينات لتحسين الكشف.

التحدي 2: المحتوى المختلط (النص والجدول)

** الحل:** تشغيل مع AUTO أو منفصلة حسب نوع الصورة للحصول على أفضل النتائج.

التحدي الثالث: أشكال معقدة مع العديد من الحقول

الحلول: اختبار واختبار التعرف على الأشكال ذات الكثافة العالية.

اعتبارات الأداء

  • التعرف على الطاولة هو أكثر كثافة CPU؛ مراقبة وظائف المجموعة
  • تأكيد النتائج لنتائج العمل الحرجة
  • تداول الخيارات الثنائية للتكامل مع الأدوات الأخرى

أفضل الممارسات

  • تأكيد البيانات المنظمة على العينات قبل التوسع
  • تأمين وتخزين الصور المصدرية والنتائج المستخرجة
  • تحديث Aspose.OCR بانتظام لتحسين الدقة
  • إعدادات Tune لترتيب المستندات الجديدة

سيناريوهات متقدمة

السيناريو 1: تصدير إلى قاعدة البيانات أو أدوات BI

// Use JSON or Excel export for integration with data pipelines

سيناريو 2: استخراج في الوقت الحقيقي في تطبيقات الويب

// Integrate extraction logic into ASP.NET or workflow API

استنتاجات

يتيح لك Aspose.OCR Table to Text for .NET تلقائيًا استخراج البيانات المنظمة من الصور والنماذج ، ودعم كل شيء من الأتمتة التجارية إلى الامتثال والتحليل.

للحصول على ميزات استخراج الطاولة المتقدمة، قم بزيارة أرشيف الوسم : .NET API Reference .

 عربي