چگونگی اتوماسیون ورودی داده ها از فرم ها با Aspose.OCR
استخراج اطلاعات از فرم های کاغذی، پرسشنامه ها یا نظرسنجی ها یک جعبه ورودی داده کلاسیک است.با Aspose.OCR برای .NET، شما می توانید داده های فرم را از اسکن ها و یا عکس ها دیجیتالی کنید، خطاها را کاهش دهید و اسناد غیر ساختاری را به اطلاعات ساختار یافته و قابل ویرایش تبدیل کنید.
مشکل دنیای واقعی
ورودی داده های فرم دستی آهسته، گران قیمت و بسیار آسیب پذیر به اشتباهات است – به ویژه در سازمان های بزرگ، تحقیق و یا تدارکات. نوشتن دستی، طرح های متنوع و انواع زمینه های مخلوط باعث می شود اتوماسیون بدون ابزار OCR قدرتمند چالش برانگیز است.
بررسی راه حل
Aspose.OCR برای .NET تنظیمات شناختی انعطاف پذیر را برای استخراج متن تایپ شده و دست نوشته شده از فرم ها، جعبه های فرآیند و نتایج ساختار یافته ارائه می دهد – ایده آل برای کسب و کار، مراقبت های بهداشتی، منابع انسانی، آموزش و پرورش و بیشتر.
پیش شرط
قبل از شروع، مطمئن شوید که:
- Visual Studio 2019 یا بالاتر
- .NET 6.0 یا بالاتر (یا .Net Framework 4.6.2+)
- Aspose.OCR برای .NET از NuGet
- تجربه C#
PM> Install-Package Aspose.OCR
پیاده سازی گام به گام
مرحله 1: نصب و تنظیم Aspose.OCR
using Aspose.OCR;
مرحله 2: اسکن و یا عکاسی فرم های خود را
تصاویر فرم خود را آماده کنید (JPEG، PNG، PDF، یا TIFF).شما می توانید چندین فایل را برای استخراج بسته اضافه کنید.
OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("form1.png");
input.Add("form2.jpg");
مرحله 3: تنظیم تنظیمات شناختی
تنظیمات برای تشخیص زبان، طرح و (در صورت لزوم) نوشتن دستی.
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.DOCUMENT; // For complex or multi-field forms
مرحله چهارم: فرآیند استخراج داده ها را اجرا کنید
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
مرحله 5: صادرات و یا استفاده از داده های دیجیتال
foreach (RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText); // Extracted text
result.Save("form_data.txt", SaveFormat.Text); // Save as plain text
result.Save("form_data.xlsx", SaveFormat.Xlsx); // Save as spreadsheet
}
مرحله ششم: اضافه کردن خطا
try
{
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
// further processing
}
catch (Exception ex)
{
Console.WriteLine($"Error: {ex.Message}");
}
مرحله 7: بهینه سازی برای طرح و نوشتن دستی
- برای زمینه های دست نوشته، از اسکن های DPI بالاتر و تنظیمات زبان استفاده کنید.
- از DetectAreasMode.TABLE برای فرم های جدول یا DOCUMENT برای طرح های متنوع استفاده کنید
- آزمایش با فرم های نمونه برای تنظیمات تن
// Example: Add all images from a directory
foreach (string file in Directory.GetFiles("./forms", "*.png"))
{
input.Add(file);
}
مرحله هشتم: نمونه کامل
using Aspose.OCR;
using System;
using System.Collections.Generic;
class Program
{
static void Main(string[] args)
{
try
{
OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("form1.png");
input.Add("form2.jpg");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.DOCUMENT;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
foreach (RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
result.Save("form_data.txt", SaveFormat.Text);
result.Save("form_data.xlsx", SaveFormat.Xlsx);
}
}
catch (Exception ex)
{
Console.WriteLine($"Error: {ex.Message}");
}
}
}
استفاده از موارد و برنامه ها
خدمات بهداشتی و HR
استخراج و دیجیتالی کردن فرم داده ها برای مصرف بیماران، درخواست های شغلی یا نظرسنجی ها.
تحقیق و آموزش
پرسشنامه اتوماتیک و پردازش نظرسنجی برای تجزیه و تحلیل سریع تر
لجستیک و کسب و کار
یادداشت های تحویل، فرم های بازرسی و یا لیست های چک ذخیره سازی را دیجیتال کنید.
چالش ها و راه حل های مشترک
چالش ۱: زمینه های دست نوشته یا با کیفیت پایین
** راه حل:** از اسکن های با کیفیت بالا استفاده کنید و تنظیمات تشخیص را برای نوشتن دستی تنظیم کنید.
چالش دوم: طرح های غیرقانونی
** راه حل:** از حالت مستند برای طرح های پیچیده استفاده کنید و روی نمونه ها تست کنید.
چالش سوم: استخراج بتچ
** راه حل:** از پردازش مجموعه مبتنی بر دایرکتوری برای فرم های حجم بالا استفاده کنید.
بررسی عملکرد
- فرآیند باتچ برای سرعت و مقیاس پذیری
- استفاده از اشیاء OCR پس از استفاده
- تصدیق محصول قبل از ادغام
بهترین شیوهها
- بررسی داده های دیجیتالی برای دقت قبل از اتوماسیون
- تنظیمات تن برای هر نوع قالب فرم
- آرشیو اصلی برای حسابرسی
- به روز رسانی Aspose.OCR به طور منظم برای بهبود ویژگی ها
سناریوهای پیشرفته
سناریو 1: استخراج دست نوشته از فرم ها
settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.DOCUMENT;
// Optionally, pre-filter for handwriting using image preprocessing
سناریو 2: صادرات به JSON برای واردات پایگاه داده
foreach (RecognitionResult result in results)
{
result.Save("form_data.json", SaveFormat.Json);
}
نتیجه گیری
Aspose.OCR برای اتوماتیک های .NET استخراج داده ها را شکل می دهد – حذف ورودی دستی و سرعت بخشیدن به کسب و کار، تحقیقات و یا جریان های کاری اداری.
مشاهده نمونه های پیشرفته تر استفاده و کد در Aspose.OCR برای .NET API مرجع .