Как да автоматизирате вноса на данни от формуляри с Aspose.OCR
Извличането на информация от хартиени формуляри, анкети или проучвания е класическа бутилка за въвеждане на данни. с Aspose.OCR за .NET можете да цифровизирате данните на формата от сканиране или снимки, да намалите грешките и да превърнете неструктурираните документи в структурирани, редактируеми данни.
Реални световни проблеми
Вносът на данни на ръчната форма е бавен, скъп и много податлив на грешки – особено в големите организации, научни изследвания или логистика. ръчно писане, разнообразни оформления и смесени полеви типове правят автоматизацията предизвикателна без мощни OCR инструменти.
Преглед на решението
Aspose.OCR за .NET осигурява гъвкави настройки за разпознаване, за да се извлече както типичен, така и ръчно написан текст от формуляри, процесни контролни кутии и структурирани резултати – идеални за бизнеса, здравеопазването, човешките ресурси, образованието и много други.
Предупреждения
Преди да започнете, уверете се, че имате:
- Visual Studio 2019 или по-късно
- .NET 6.0 или по-късно (или .Net Framework 4.6.2+)
- ASPOSE.OCR за .NET от NuGet
- Основен C# опит
PM> Install-Package Aspose.OCR
Стъпка по стъпка изпълнение
Стъпка 1: Инсталирайте и конфигурирайте Aspose.OCR
using Aspose.OCR;
Стъпка 2: Скениране или снимка на вашите форми
Подгответе вашия формуляр изображения (JPEG, PNG, PDF, или TIFF). можете да добавите няколко файла за екстракция на комплект.
OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("form1.png");
input.Add("form2.jpg");
Стъпка 3: Настройване на настройките за разпознаване
Регулиране на настройките за откриване на език, расположение и (ако е необходимо) ръчно писане.
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.DOCUMENT; // For complex or multi-field forms
Стъпка 4: Извършете процеса на извличане на данни
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
Стъпка 5: Износ или използване на цифрови данни
foreach (RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText); // Extracted text
result.Save("form_data.txt", SaveFormat.Text); // Save as plain text
result.Save("form_data.xlsx", SaveFormat.Xlsx); // Save as spreadsheet
}
Стъпка 6: Добавете обработка на грешки
try
{
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
// further processing
}
catch (Exception ex)
{
Console.WriteLine($"Error: {ex.Message}");
}
Стъпка 7: Оптимизиране на оформлението и ръчното писане
- За ръчно написани полета, използвайте по-високи скани на DPI и коригирайте езиковите настройки
- Използвайте DetectAreasMode.TABLE за таблични формуляри или DOCUMENT за различни оформления
- Тест с шаблонни форми за тониране на настройките
// Example: Add all images from a directory
foreach (string file in Directory.GetFiles("./forms", "*.png"))
{
input.Add(file);
}
Стъпка 8: Допълнителен пример
using Aspose.OCR;
using System;
using System.Collections.Generic;
class Program
{
static void Main(string[] args)
{
try
{
OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("form1.png");
input.Add("form2.jpg");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.DOCUMENT;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
foreach (RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
result.Save("form_data.txt", SaveFormat.Text);
result.Save("form_data.xlsx", SaveFormat.Xlsx);
}
}
catch (Exception ex)
{
Console.WriteLine($"Error: {ex.Message}");
}
}
}
Използване на случаи и приложения
Здравеопазване и HR
Извличане и цифровизиране на формуляри данни за прием на пациенти, заявления за работа, или проучвания.
Научни изследвания и образование
Автоматизиране на анкетата и обработката на проучванията за по-бърза анализа.
Логистика и бизнес
Дигитализирайте бележки за доставка, формуляри за проверка или списъци с проверки на запасите.
Съвместни предизвикателства и решения
Предизвикателство 1: ръчно написани или нискокачествени полета
Решение: Използвайте висококачествени скани и коригирайте настройките за разпознаване за ръчно писане.
Предизвикателство 2: Нерегулярни форми
Решение: Използвайте режим DOCUMENT за сложни оформления и тествайте на проби.
Предизвикателство 3: Батч екстракция
Решение: Използвайте обработка на комплекти на базата на директории за форми с висок обем.
Преглед на изпълнението
- Процесът на бач за скорост и скалабилност
- Използване на OCR предмети след употреба
- Валидиране на производството преди интеграцията
Най-добрите практики
- Преглед на цифровизираните данни за точност преди автоматизация
- Тънки настройки за всеки тип шаблон на формуляр
- Архив на оригинала за одитиране
- Актуализирайте Aspose.OCR редовно за подобрения на функционалността
Разширени сценарии
Сценарий 1: Извличане на ръчно писане от форми
settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.DOCUMENT;
// Optionally, pre-filter for handwriting using image preprocessing
Сценарий 2: Износ към JSON за внос на база данни
foreach (RecognitionResult result in results)
{
result.Save("form_data.json", SaveFormat.Json);
}
заключение
Aspose.OCR за .NET автомати формират извличане на данни – премахване на ръчен вход и ускоряване на бизнес, научни изследвания или административни работни потоци.
Вижте по-напреднали проби за използване и код в Aspose.OCR за .NET API Референт .