Как да автоматизирате вноса на данни от формуляри с Aspose.OCR

Как да автоматизирате вноса на данни от формуляри с Aspose.OCR

Извличането на информация от хартиени формуляри, анкети или проучвания е класическа бутилка за въвеждане на данни. с Aspose.OCR за .NET можете да цифровизирате данните на формата от сканиране или снимки, да намалите грешките и да превърнете неструктурираните документи в структурирани, редактируеми данни.

Реални световни проблеми

Вносът на данни на ръчната форма е бавен, скъп и много податлив на грешки – особено в големите организации, научни изследвания или логистика. ръчно писане, разнообразни оформления и смесени полеви типове правят автоматизацията предизвикателна без мощни OCR инструменти.

Преглед на решението

Aspose.OCR за .NET осигурява гъвкави настройки за разпознаване, за да се извлече както типичен, така и ръчно написан текст от формуляри, процесни контролни кутии и структурирани резултати – идеални за бизнеса, здравеопазването, човешките ресурси, образованието и много други.

Предупреждения

Преди да започнете, уверете се, че имате:

  • Visual Studio 2019 или по-късно
  • .NET 6.0 или по-късно (или .Net Framework 4.6.2+)
  • ASPOSE.OCR за .NET от NuGet
  • Основен C# опит
PM> Install-Package Aspose.OCR

Стъпка по стъпка изпълнение

Стъпка 1: Инсталирайте и конфигурирайте Aspose.OCR

using Aspose.OCR;

Стъпка 2: Скениране или снимка на вашите форми

Подгответе вашия формуляр изображения (JPEG, PNG, PDF, или TIFF). можете да добавите няколко файла за екстракция на комплект.

OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("form1.png");
input.Add("form2.jpg");

Стъпка 3: Настройване на настройките за разпознаване

Регулиране на настройките за откриване на език, расположение и (ако е необходимо) ръчно писане.

RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.DOCUMENT; // For complex or multi-field forms

Стъпка 4: Извършете процеса на извличане на данни

AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);

Стъпка 5: Износ или използване на цифрови данни

foreach (RecognitionResult result in results)
{
    Console.WriteLine(result.RecognitionText); // Extracted text
    result.Save("form_data.txt", SaveFormat.Text); // Save as plain text
    result.Save("form_data.xlsx", SaveFormat.Xlsx); // Save as spreadsheet
}

Стъпка 6: Добавете обработка на грешки

try
{
    AsposeOcr ocr = new AsposeOcr();
    List<RecognitionResult> results = ocr.Recognize(input, settings);
    // further processing
}
catch (Exception ex)
{
    Console.WriteLine($"Error: {ex.Message}");
}

Стъпка 7: Оптимизиране на оформлението и ръчното писане

  • За ръчно написани полета, използвайте по-високи скани на DPI и коригирайте езиковите настройки
  • Използвайте DetectAreasMode.TABLE за таблични формуляри или DOCUMENT за различни оформления
  • Тест с шаблонни форми за тониране на настройките
// Example: Add all images from a directory
foreach (string file in Directory.GetFiles("./forms", "*.png"))
{
    input.Add(file);
}

Стъпка 8: Допълнителен пример

using Aspose.OCR;
using System;
using System.Collections.Generic;

class Program
{
    static void Main(string[] args)
    {
        try
        {
            OcrInput input = new OcrInput(InputType.SingleImage);
            input.Add("form1.png");
            input.Add("form2.jpg");

            RecognitionSettings settings = new RecognitionSettings();
            settings.Language = Language.English;
            settings.DetectAreasMode = DetectAreasMode.DOCUMENT;

            AsposeOcr ocr = new AsposeOcr();
            List<RecognitionResult> results = ocr.Recognize(input, settings);

            foreach (RecognitionResult result in results)
            {
                Console.WriteLine(result.RecognitionText);
                result.Save("form_data.txt", SaveFormat.Text);
                result.Save("form_data.xlsx", SaveFormat.Xlsx);
            }
        }
        catch (Exception ex)
        {
            Console.WriteLine($"Error: {ex.Message}");
        }
    }
}

Използване на случаи и приложения

Здравеопазване и HR

Извличане и цифровизиране на формуляри данни за прием на пациенти, заявления за работа, или проучвания.

Научни изследвания и образование

Автоматизиране на анкетата и обработката на проучванията за по-бърза анализа.

Логистика и бизнес

Дигитализирайте бележки за доставка, формуляри за проверка или списъци с проверки на запасите.

Съвместни предизвикателства и решения

Предизвикателство 1: ръчно написани или нискокачествени полета

Решение: Използвайте висококачествени скани и коригирайте настройките за разпознаване за ръчно писане.

Предизвикателство 2: Нерегулярни форми

Решение: Използвайте режим DOCUMENT за сложни оформления и тествайте на проби.

Предизвикателство 3: Батч екстракция

Решение: Използвайте обработка на комплекти на базата на директории за форми с висок обем.

Преглед на изпълнението

  • Процесът на бач за скорост и скалабилност
  • Използване на OCR предмети след употреба
  • Валидиране на производството преди интеграцията

Най-добрите практики

  • Преглед на цифровизираните данни за точност преди автоматизация
  • Тънки настройки за всеки тип шаблон на формуляр
  • Архив на оригинала за одитиране
  • Актуализирайте Aspose.OCR редовно за подобрения на функционалността

Разширени сценарии

Сценарий 1: Извличане на ръчно писане от форми

settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.DOCUMENT;
// Optionally, pre-filter for handwriting using image preprocessing

Сценарий 2: Износ към JSON за внос на база данни

foreach (RecognitionResult result in results)
{
    result.Save("form_data.json", SaveFormat.Json);
}

заключение

Aspose.OCR за .NET автомати формират извличане на данни – премахване на ръчен вход и ускоряване на бизнес, научни изследвания или административни работни потоци.

Вижте по-напреднали проби за използване и код в Aspose.OCR за .NET API Референт .

 Български