كيفية استخراج اللوحات والبيانات من الصور باستخدام Aspose.OCR

كيفية استخراج اللوحات والبيانات من الصور باستخدام Aspose.OCR

إن استخراج الجداول من الصور أو النماذج أو التقارير التي تم فحصها مثيرًا للاهتمام - إن التصحيح اليدوي بطيئ وخطأ.تلقى Aspose.OCR Table to Text for .NET تلقائياً استخراج وتكوين البيانات من الصورة والصور.

مشكلة العالم الحقيقي

غالبًا ما يتم إغلاق البيانات المالية ونماذج الاستطلاع والنتائج العلمية في اللوحات أو الصور التي يتم فحصها.

نظرة عامة على الحل

يمكن لـ Aspose.OCR for .NET الكشف بدقة واستخراج وتحويل اللوحات من الصور أو ملفات PDF الماسح الضوئية إلى تنسيقات قابلة للقراءة بالآلة – مثالية لتطبيق Excel أو التقارير أو أوتوماتيك سير العمل.

المتطلبات

  • Visual Studio 2019 أو أحدث
  • .NET 6.0 أو أعلى (أو .Net Framework 4.6.2+)
  • Aspose.OCR لـ .NET من NuGet
  • معرفة أساسية C#
PM> Install-Package Aspose.OCR

تنفيذ خطوة بخطوة

الخطوة 1: تثبيت وتكوين Aspose.OCR

using Aspose.OCR;

الخطوة 2: فحص أو تصوير الصور التي تحتوي على لوحات

OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("table1.jpg");
input.Add("report_page.png");

الخطوة 3: قم بتعيين إعدادات التعرف على الجدول

RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.TABLE; // Key for tables

الخطوة 4: تشغيل عملية استخراج الطاولة

AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);

الخطوة 5: بيانات جدول التصدير

foreach (RecognitionResult result in results)
{
    result.Save("table_data.xlsx", SaveFormat.Xlsx); // Excel output
    result.Save("table_data.csv", SaveFormat.Csv);   // CSV output
    result.Save("table_data.txt", SaveFormat.Text);  // Plain text output
}

الخطوة 6: إضافة التعامل مع الأخطاء والتصديق

try
{
    AsposeOcr ocr = new AsposeOcr();
    List<RecognitionResult> results = ocr.Recognize(input, settings);
    // Further processing
}
catch (Exception ex)
{
    Console.WriteLine($"Error: {ex.Message}");
}

الخطوة 7: تحسين لوحات معقدة أو مدرجة أو متعددة الصفحات

  • إعادة معالجة الصور إلى الحصاد أو الزراعة
  • استخدم الفحص عالي الدقة أو الصور
  • بالنسبة لملفات PDF متعددة الصفحات ، أضف كل صفحة كإدخال منفصل
foreach (string file in Directory.GetFiles("./scans", "*.png"))
{
    input.Add(file);
}

الخطوة الثامنة: نموذج كامل

using Aspose.OCR;
using System;
using System.Collections.Generic;

class Program
{
    static void Main(string[] args)
    {
        try
        {
            OcrInput input = new OcrInput(InputType.SingleImage);
            input.Add("table1.jpg");
            input.Add("report_page.png");

            RecognitionSettings settings = new RecognitionSettings();
            settings.Language = Language.English;
            settings.DetectAreasMode = DetectAreasMode.TABLE;

            AsposeOcr ocr = new AsposeOcr();
            List<RecognitionResult> results = ocr.Recognize(input, settings);

            foreach (RecognitionResult result in results)
            {
                result.Save("table_data.xlsx", SaveFormat.Xlsx);
                result.Save("table_data.csv", SaveFormat.Csv);
                result.Save("table_data.txt", SaveFormat.Text);
            }
        }
        catch (Exception ex)
        {
            Console.WriteLine($"Error: {ex.Message}");
        }
    }
}

استخدام الحالات والتطبيقات

التقارير المالية والعلومية

استخراج اللوحات من التقارير المالية أو نتائج المختبر أو ورقات البحث للتحليل الفوري في Excel.

استطلاع وتشكيل المعالجة

قم بتصنيف الجداول من النماذج المسجلة أو قوائم التحقق أو سجلات الرقابة.

أوتوماتيك سير العمل

إدخال بيانات الجدول المنظمة مباشرة إلى تطبيقات عملك أو أدوات BI أو قواعد البيانات.

التحديات والحلول المشتركة

التحدي الأول: الجودة السيئة أو اللوحات المعقدة

** الحل:** استخدم صور عالية الضوء واختبارها على مجموعات العينات.

التحدي الثاني: اللوحات المنحنية أو المكسورة

الحل: قم بتخزين الصور قبل المعالجة؛ استخدم DetectAreasMode.TABLE.

التحدي الثالث: تقارير متعددة الصفحات

** الحل:** إضافة كل صفحة كإدخال منفصل لمعالجة المجموعة.

اعتبارات الأداء

  • عملية Batch للسرعة
  • استخدم صور / صور عالية الجودة
  • توفير أدوات OCR بعد الجولات الكبيرة

أفضل الممارسات

  • تأكيد الإنتاج قبل التكامل
  • إعدادات التعرف على الطاولة حسب الحاجة
  • استرداد البيانات الأصلية والرقمية
  • اختبار مع العينات الحقيقية قبل نشرها

سيناريوهات متقدمة

السيناريو 1: استخراج طاولة متعددة اللغات

settings.Language = Language.German;

سيناريو 2: تصدير إلى JSON للأنابيب البيانات

foreach (RecognitionResult result in results)
{
    result.Save("table_data.json", SaveFormat.Json);
}

استنتاجات

يقوم Aspose.OCR Table to Text for .NET بتحويل الصور والتسجيلات إلى بيانات جدول قابلة للتنفيذ والمنظمة – جاهزة للتحليل والإبلاغ والأتمتة.

انظر المزيد من عينات رمز التعرف على الجدول في أرشيف الوسم : .NET API Reference .

 عربي