Како аутоматизовати улазак података из обрасца са Aspose.OCR

Како аутоматизовати улазак података из обрасца са Aspose.OCR

Екстракција информација из папирних обрасца, анкетира или анкета је класична бочица за улазак података. са Асписе.ОЦР за .НЕТ, можете дигитализовати податке о облику из скенирања или фотографија, смањити грешке и претворити неструктурисане документе у структуриране, уређујуће информације.

Реал светски проблем

Ручни образац података улазак је споро, скупо, и веома погодан за грешке – посебно у великим организацијама, истраживања, или логистике. ручно писање, разноврсне распореде и мешане врсте поља чине аутоматизацију изазов без моћних ОЦР алата.

Преглед решења

Aspose.OCR for .NET пружа флексибилне подешавања препознавања за извлачење и штампаног и ручно написаног текста из обрасца, процесних контролних кутија и резултата структурираних - идеалан за пословне послове, здравствене заштите, људске ресурсе, образовање и још много тога.

Принципи

Пре него што почнете, уверите се да имате:

  • Visual Studio 2019 или касније
  • .NET 6.0 или новији (или .Net Framework 4.6.2+)
  • Aspose.OCR za .NET od NuGet
  • Основни C# искуство
PM> Install-Package Aspose.OCR

Корак по корак спровођење

Корак 1: Инсталирајте и конфигуришете Aspose.OCR

using Aspose.OCR;

Корак 2: Скенирајте или фотографишете своје облике

Припремите слике вашег обрасца (JPEG, PNG, PDF, или TIFF). можете додати више датотека за екстракцију бацх.

OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("form1.png");
input.Add("form2.jpg");

Корак 3: Подешавање подешавања препознавања

Прилагодите подешавања за откривање језика, распореда и (ако је потребно) рукописивања.

RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.DOCUMENT; // For complex or multi-field forms

Корак 4: Покрените процес извлачења података

AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);

Корак 5: Извоз или коришћење дигитализованих података

foreach (RecognitionResult result in results)
{
    Console.WriteLine(result.RecognitionText); // Extracted text
    result.Save("form_data.txt", SaveFormat.Text); // Save as plain text
    result.Save("form_data.xlsx", SaveFormat.Xlsx); // Save as spreadsheet
}

Корак 6: Додајте третман грешака

try
{
    AsposeOcr ocr = new AsposeOcr();
    List<RecognitionResult> results = ocr.Recognize(input, settings);
    // further processing
}
catch (Exception ex)
{
    Console.WriteLine($"Error: {ex.Message}");
}

Корак 7: Оптимизација за распоред и рукопис

  • За ручно писане поље, користите виши ДПИ скенирање и прилагођавање подешавања језика
  • Користите DetectAreasMode.TABLE за табелне обрасце, или ДОКУМЕНТ за различите распореде
  • Тест са обрасцима узорка за туне подешавања
// Example: Add all images from a directory
foreach (string file in Directory.GetFiles("./forms", "*.png"))
{
    input.Add(file);
}

Корак 8: Потпуни пример

using Aspose.OCR;
using System;
using System.Collections.Generic;

class Program
{
    static void Main(string[] args)
    {
        try
        {
            OcrInput input = new OcrInput(InputType.SingleImage);
            input.Add("form1.png");
            input.Add("form2.jpg");

            RecognitionSettings settings = new RecognitionSettings();
            settings.Language = Language.English;
            settings.DetectAreasMode = DetectAreasMode.DOCUMENT;

            AsposeOcr ocr = new AsposeOcr();
            List<RecognitionResult> results = ocr.Recognize(input, settings);

            foreach (RecognitionResult result in results)
            {
                Console.WriteLine(result.RecognitionText);
                result.Save("form_data.txt", SaveFormat.Text);
                result.Save("form_data.xlsx", SaveFormat.Xlsx);
            }
        }
        catch (Exception ex)
        {
            Console.WriteLine($"Error: {ex.Message}");
        }
    }
}

Коришћење случајева и апликација

Здравство и ХР

Екстрактирајте и дигитализујете податке о обрасцима за пацијенте, апликације за посао или анкете.

Истраживање и образовање

Аутоматска анкета и обрада анкете за бржу анализу.

Логистика и бизнис

Дигитализација података о испоруци, обрасца за инспекцију или контролних листа за складиштење.

Заједнички изазови и решења

Проблем 1: Ручно писане или нискоквалитетне поље

Решење: Користите висококвалитетне скене и прилагодите подешавања препознавања за рукопис.

Проблем 2: Нерегуларни облик распореда

Решење: Користите режим ДОКУМЕНТА за сложене распореде и тестирајте узорке.

Проблем 3: Батцх Екстракција

Решење: Користите обраду бацх-а засновану на директоријуму за велике облике.

Размишљање о перформанси

  • Процес бацања за брзину и скалабилност
  • Постављање ОЦР објеката након употребе
  • Проверите производњу пре интеграције

Најбоља пракса

  • Преглед дигитализованих података за тачност пре аутоматизације
  • Тун подешавања за сваки тип шаблона облика
  • Архиве оригинала за ревизију
  • Редовно ажурирајте Aspose.OCR за побољшање функција

Напредни сценарио

Сценарио 1: Екстракт ручног писања из облика

settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.DOCUMENT;
// Optionally, pre-filter for handwriting using image preprocessing

Сценарио 2: Експорт на ЈСОН за увоз базе података

foreach (RecognitionResult result in results)
{
    result.Save("form_data.json", SaveFormat.Json);
}

Закључак

Aspose.OCR za .NET automate formira ekstrakciju podataka – uklanjajući ručni ulaz i ubrzavajući poslovne, istraživačke ili administrativne tokove rada.

Види више напредне употребе и код узорке на Aspose.OCR за .NET API референце .

 Српски