كيفية استخراج بيانات الجدول من الصور باستخدام Aspose.OCR

كيفية استخراج بيانات الجدول من الصور باستخدام Aspose.OCR

باستخدام Aspose.OCR Table to Text for .NET ، يمكنك تلقائيًا استخراج بيانات الجدول المنظمة من الصور - توفير الوقت ، والحد من الأخطاء ، وإمكانية التكامل الداخلي مع قواعد البيانات أو Excel أو أدوات الإبلاغ.

مشكلة العالم الحقيقي

تتلقى الشركات في كثير من الأحيان لوحات في الفواتير أو التقارير، أو النماذج مثل الصور أو المسح اليدوي إعادة إدخال هذه البيانات في اللوحات أو المنصات التحليلية غير فعالة وخطأ، وخاصة بالنسبة للمجموعات الكبيرة أو الجدول المعقدة.

نظرة عامة على الحل

Aspose.OCR Table to Text for .NET تلقائيًا التعرف على اللوحة واستخراج البيانات من الصور ، وتحديد بنية الخلية ومحتوىها بدقة.وهذا يسمح لك بتحويل الجداول المسجلة أو المصورة إلى تنسيق قابل للبحث والتحرير مع الحد الأدنى من الرمز.

المتطلبات

قبل البدء ، ستحتاج إلى:

  • Visual Studio 2019 أو أحدث
  • .NET 6.0 أو أعلى (أو .Net Framework 4.6.2+)
  • Aspose.OCR لـ .NET من NuGet
  • معرفة أساسية C#
PM> Install-Package Aspose.OCR

تنفيذ خطوة بخطوة

الخطوة 1: تثبيت وتكوين Aspose.OCR

إضافة حزمة Aspose.OCR وتشمل المساحات الاسمية اللازمة:

using Aspose.OCR;

الخطوة 2: إعداد لوحات الصورة

أضف صورة لوحة واحدة أو أكثر إلى إدخالك.لإخراج المجموعة، استخدم ملفات متعددة.

OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("table1.png");
input.Add("table2.jpg");

الخطوة 3: قم بتعيين إعدادات التعرف على الجدول

إمكانية وضع الكشف عن الطاولة لضمان التعرف الدقيق على الهيكل.

RecognitionSettings settings = new RecognitionSettings();
settings.DetectAreasMode = DetectAreasMode.TABLE;
settings.Language = Language.English; // Adjust if table contains non-English text

الخطوة 4: تشغيل عملية التعرف على الطاولة

التعرف على اللوحات مع الإعدادات المعدلة:

AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);

الخطوة 5: تصدير واستخدام بيانات الجدول

حفظ أو معالجة بيانات الجدول المعترف بها.يمكنك تصديرها إلى النص أو Excel أو JSON أو غيرها من التنسيقات.

foreach (RecognitionResult result in results)
{
    Console.WriteLine(result.RecognitionText); // Raw table as text
    result.Save("table.csv", SaveFormat.Csv); // Save as CSV
    result.Save("table.xlsx", SaveFormat.Xlsx); // Save as Excel
}

الخطوة 6: إضافة خطأ التعامل

إضافة التعامل مع الاستثناءات لبناء حلول قوية.

try
{
    AsposeOcr ocr = new AsposeOcr();
    List<RecognitionResult> results = ocr.Recognize(input, settings);
    // further processing...
}
catch (Exception ex)
{
    Console.WriteLine($"Error: {ex.Message}");
}

الخطوة 7: تحسين لوحات معقدة

  • استخدم فحوصات/صور عالية الدقة للكشف عن الهيكل الدقيق
  • اختبار مع مجموعة متنوعة من ترتيبات الطاولة (الخلايا المختلطة، ورؤوس متعددة الخطوط، الحدود)
  • إعدادات التعرف التونسي حسب الحاجة
// Example: Add all images from a folder
foreach (string file in Directory.GetFiles("./tables", "*.png"))
{
    input.Add(file);
}

الخطوة الثامنة: نموذج العمل الكامل

using Aspose.OCR;
using System;
using System.Collections.Generic;

class Program
{
    static void Main(string[] args)
    {
        try
        {
            OcrInput input = new OcrInput(InputType.SingleImage);
            input.Add("table1.png");
            input.Add("table2.jpg");

            RecognitionSettings settings = new RecognitionSettings();
            settings.DetectAreasMode = DetectAreasMode.TABLE;
            settings.Language = Language.English;

            AsposeOcr ocr = new AsposeOcr();
            List<RecognitionResult> results = ocr.Recognize(input, settings);

            foreach (RecognitionResult result in results)
            {
                Console.WriteLine(result.RecognitionText);
                result.Save("table.csv", SaveFormat.Csv);
                result.Save("table.xlsx", SaveFormat.Xlsx);
            }
        }
        catch (Exception ex)
        {
            Console.WriteLine($"Error: {ex.Message}");
        }
    }
}

استخدام الحالات والتطبيقات

التقارير المالية والمحاسبة

استخراج لوحات المعاملات من الصور إلى Excel أو أنظمة البيانات تلقائيًا.

البحث والتحليل

الرقمنة الجدول من المنشورات المسح الضوئي أو نماذج الاستطلاع لتحليل البيانات.

الهجرة الآلية للبيانات

نقل وثائق التراث أو سجلات الورق الماسح الضوئي إلى تنسيقات منظمة حديثة.

التحديات والحلول المشتركة

التحدي الأول: صور المائدة المزدحمة أو المختلطة

** الحل:** استخدم صور أكثر وضوحًا أو تجربة مع المعالجة المسبقة لتحسين التعرف على الهيكل.

التحدي الثاني: إعدادات الطاولة غير القياسية

الحلول: اختبار وتعديل الإعدادات لتصميمات معقدة أو لوحات بلا حدود.

التحدي الثالث: الكرات الكبيرة أو أنواع الصور المختلطة

الحل: استخدم معالجة المجموعات ومسح الدليل لتلقائي استخراج من العديد من الملفات.

اعتبارات الأداء

  • استخدم الصور الرائعة والمتميزة
  • عملية Batch للكفاءة
  • توفير أدوات OCR بعد الاستخدام

أفضل الممارسات

  • تأكيد دائمًا بيانات الجدول المستوردة قبل مزيد من المعالجة
  • صور ما قبل المعالجة للكشف عن الهيكل الأمثل
  • أمان و النسخ الاحتياطي للمسح الأصلي / الصور
  • استخدم تنسيق التصدير الصحيح لتدفق العمل الخاص بك (CSV، XLSX، JSON)

سيناريوهات متقدمة

السيناريو 1: استخراج طاولة اللغات المختلطة

settings.Language = Language.Chinese;

السيناريو 2: الجمع بين الجدول واستخراج النص

settings.DetectAreasMode = DetectAreasMode.COMBINE;

استنتاجات

Aspose.OCR Table to Text for .NET يحول لوحات الصورة إلى بيانات مركزة قابلة للتعديل – لا يوجد إدخال يدوي مطلوب.

لمزيد من الأمثلة والتفاصيل التقنية، يرجى زيارة أرشيف الوسم : .NET API Reference .

 عربي