چگونگی اتوماسیون ورودی داده ها از فرم ها با Aspose.OCR

چگونگی اتوماسیون ورودی داده ها از فرم ها با Aspose.OCR

استخراج اطلاعات از فرم های کاغذی، پرسشنامه ها یا نظرسنجی ها یک جعبه ورودی داده کلاسیک است.با Aspose.OCR برای .NET، شما می توانید داده های فرم را از اسکن ها و یا عکس ها دیجیتالی کنید، خطاها را کاهش دهید و اسناد غیر ساختاری را به اطلاعات ساختار یافته و قابل ویرایش تبدیل کنید.

مشکل دنیای واقعی

ورودی داده های فرم دستی آهسته، گران قیمت و بسیار آسیب پذیر به اشتباهات است – به ویژه در سازمان های بزرگ، تحقیق و یا تدارکات. نوشتن دستی، طرح های متنوع و انواع زمینه های مخلوط باعث می شود اتوماسیون بدون ابزار OCR قدرتمند چالش برانگیز است.

بررسی راه حل

Aspose.OCR برای .NET تنظیمات شناختی انعطاف پذیر را برای استخراج متن تایپ شده و دست نوشته شده از فرم ها، جعبه های فرآیند و نتایج ساختار یافته ارائه می دهد – ایده آل برای کسب و کار، مراقبت های بهداشتی، منابع انسانی، آموزش و پرورش و بیشتر.

پیش شرط

قبل از شروع، مطمئن شوید که:

  • Visual Studio 2019 یا بالاتر
  • .NET 6.0 یا بالاتر (یا .Net Framework 4.6.2+)
  • Aspose.OCR برای .NET از NuGet
  • تجربه C#
PM> Install-Package Aspose.OCR

پیاده سازی گام به گام

مرحله 1: نصب و تنظیم Aspose.OCR

using Aspose.OCR;

مرحله 2: اسکن و یا عکاسی فرم های خود را

تصاویر فرم خود را آماده کنید (JPEG، PNG، PDF، یا TIFF).شما می توانید چندین فایل را برای استخراج بسته اضافه کنید.

OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("form1.png");
input.Add("form2.jpg");

مرحله 3: تنظیم تنظیمات شناختی

تنظیمات برای تشخیص زبان، طرح و (در صورت لزوم) نوشتن دستی.

RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.DOCUMENT; // For complex or multi-field forms

مرحله چهارم: فرآیند استخراج داده ها را اجرا کنید

AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);

مرحله 5: صادرات و یا استفاده از داده های دیجیتال

foreach (RecognitionResult result in results)
{
    Console.WriteLine(result.RecognitionText); // Extracted text
    result.Save("form_data.txt", SaveFormat.Text); // Save as plain text
    result.Save("form_data.xlsx", SaveFormat.Xlsx); // Save as spreadsheet
}

مرحله ششم: اضافه کردن خطا

try
{
    AsposeOcr ocr = new AsposeOcr();
    List<RecognitionResult> results = ocr.Recognize(input, settings);
    // further processing
}
catch (Exception ex)
{
    Console.WriteLine($"Error: {ex.Message}");
}

مرحله 7: بهینه سازی برای طرح و نوشتن دستی

  • برای زمینه های دست نوشته، از اسکن های DPI بالاتر و تنظیمات زبان استفاده کنید.
  • از DetectAreasMode.TABLE برای فرم های جدول یا DOCUMENT برای طرح های متنوع استفاده کنید
  • آزمایش با فرم های نمونه برای تنظیمات تن
// Example: Add all images from a directory
foreach (string file in Directory.GetFiles("./forms", "*.png"))
{
    input.Add(file);
}

مرحله هشتم: نمونه کامل

using Aspose.OCR;
using System;
using System.Collections.Generic;

class Program
{
    static void Main(string[] args)
    {
        try
        {
            OcrInput input = new OcrInput(InputType.SingleImage);
            input.Add("form1.png");
            input.Add("form2.jpg");

            RecognitionSettings settings = new RecognitionSettings();
            settings.Language = Language.English;
            settings.DetectAreasMode = DetectAreasMode.DOCUMENT;

            AsposeOcr ocr = new AsposeOcr();
            List<RecognitionResult> results = ocr.Recognize(input, settings);

            foreach (RecognitionResult result in results)
            {
                Console.WriteLine(result.RecognitionText);
                result.Save("form_data.txt", SaveFormat.Text);
                result.Save("form_data.xlsx", SaveFormat.Xlsx);
            }
        }
        catch (Exception ex)
        {
            Console.WriteLine($"Error: {ex.Message}");
        }
    }
}

استفاده از موارد و برنامه ها

خدمات بهداشتی و HR

استخراج و دیجیتالی کردن فرم داده ها برای مصرف بیماران، درخواست های شغلی یا نظرسنجی ها.

تحقیق و آموزش

پرسشنامه اتوماتیک و پردازش نظرسنجی برای تجزیه و تحلیل سریع تر

لجستیک و کسب و کار

یادداشت های تحویل، فرم های بازرسی و یا لیست های چک ذخیره سازی را دیجیتال کنید.

چالش ها و راه حل های مشترک

چالش ۱: زمینه های دست نوشته یا با کیفیت پایین

** راه حل:** از اسکن های با کیفیت بالا استفاده کنید و تنظیمات تشخیص را برای نوشتن دستی تنظیم کنید.

چالش دوم: طرح های غیرقانونی

** راه حل:** از حالت مستند برای طرح های پیچیده استفاده کنید و روی نمونه ها تست کنید.

چالش سوم: استخراج بتچ

** راه حل:** از پردازش مجموعه مبتنی بر دایرکتوری برای فرم های حجم بالا استفاده کنید.

بررسی عملکرد

  • فرآیند باتچ برای سرعت و مقیاس پذیری
  • استفاده از اشیاء OCR پس از استفاده
  • تصدیق محصول قبل از ادغام

بهترین شیوه‌ها

  • بررسی داده های دیجیتالی برای دقت قبل از اتوماسیون
  • تنظیمات تن برای هر نوع قالب فرم
  • آرشیو اصلی برای حسابرسی
  • به روز رسانی Aspose.OCR به طور منظم برای بهبود ویژگی ها

سناریوهای پیشرفته

سناریو 1: استخراج دست نوشته از فرم ها

settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.DOCUMENT;
// Optionally, pre-filter for handwriting using image preprocessing

سناریو 2: صادرات به JSON برای واردات پایگاه داده

foreach (RecognitionResult result in results)
{
    result.Save("form_data.json", SaveFormat.Json);
}

نتیجه گیری

Aspose.OCR برای اتوماتیک های .NET استخراج داده ها را شکل می دهد – حذف ورودی دستی و سرعت بخشیدن به کسب و کار، تحقیقات و یا جریان های کاری اداری.

مشاهده نمونه های پیشرفته تر استفاده و کد در Aspose.OCR برای .NET API مرجع .

 فارسی