Како аутоматизовати улазак података из обрасца са Aspose.OCR
Екстракција информација из папирних обрасца, анкетира или анкета је класична бочица за улазак података. са Асписе.ОЦР за .НЕТ, можете дигитализовати податке о облику из скенирања или фотографија, смањити грешке и претворити неструктурисане документе у структуриране, уређујуће информације.
Реал светски проблем
Ручни образац података улазак је споро, скупо, и веома погодан за грешке – посебно у великим организацијама, истраживања, или логистике. ручно писање, разноврсне распореде и мешане врсте поља чине аутоматизацију изазов без моћних ОЦР алата.
Преглед решења
Aspose.OCR for .NET пружа флексибилне подешавања препознавања за извлачење и штампаног и ручно написаног текста из обрасца, процесних контролних кутија и резултата структурираних - идеалан за пословне послове, здравствене заштите, људске ресурсе, образовање и још много тога.
Принципи
Пре него што почнете, уверите се да имате:
- Visual Studio 2019 или касније
- .NET 6.0 или новији (или .Net Framework 4.6.2+)
- Aspose.OCR za .NET od NuGet
- Основни C# искуство
PM> Install-Package Aspose.OCR
Корак по корак спровођење
Корак 1: Инсталирајте и конфигуришете Aspose.OCR
using Aspose.OCR;
Корак 2: Скенирајте или фотографишете своје облике
Припремите слике вашег обрасца (JPEG, PNG, PDF, или TIFF). можете додати више датотека за екстракцију бацх.
OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("form1.png");
input.Add("form2.jpg");
Корак 3: Подешавање подешавања препознавања
Прилагодите подешавања за откривање језика, распореда и (ако је потребно) рукописивања.
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.DOCUMENT; // For complex or multi-field forms
Корак 4: Покрените процес извлачења података
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
Корак 5: Извоз или коришћење дигитализованих података
foreach (RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText); // Extracted text
result.Save("form_data.txt", SaveFormat.Text); // Save as plain text
result.Save("form_data.xlsx", SaveFormat.Xlsx); // Save as spreadsheet
}
Корак 6: Додајте третман грешака
try
{
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
// further processing
}
catch (Exception ex)
{
Console.WriteLine($"Error: {ex.Message}");
}
Корак 7: Оптимизација за распоред и рукопис
- За ручно писане поље, користите виши ДПИ скенирање и прилагођавање подешавања језика
- Користите DetectAreasMode.TABLE за табелне обрасце, или ДОКУМЕНТ за различите распореде
- Тест са обрасцима узорка за туне подешавања
// Example: Add all images from a directory
foreach (string file in Directory.GetFiles("./forms", "*.png"))
{
input.Add(file);
}
Корак 8: Потпуни пример
using Aspose.OCR;
using System;
using System.Collections.Generic;
class Program
{
static void Main(string[] args)
{
try
{
OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("form1.png");
input.Add("form2.jpg");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.DOCUMENT;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
foreach (RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
result.Save("form_data.txt", SaveFormat.Text);
result.Save("form_data.xlsx", SaveFormat.Xlsx);
}
}
catch (Exception ex)
{
Console.WriteLine($"Error: {ex.Message}");
}
}
}
Коришћење случајева и апликација
Здравство и ХР
Екстрактирајте и дигитализујете податке о обрасцима за пацијенте, апликације за посао или анкете.
Истраживање и образовање
Аутоматска анкета и обрада анкете за бржу анализу.
Логистика и бизнис
Дигитализација података о испоруци, обрасца за инспекцију или контролних листа за складиштење.
Заједнички изазови и решења
Проблем 1: Ручно писане или нискоквалитетне поље
Решење: Користите висококвалитетне скене и прилагодите подешавања препознавања за рукопис.
Проблем 2: Нерегуларни облик распореда
Решење: Користите режим ДОКУМЕНТА за сложене распореде и тестирајте узорке.
Проблем 3: Батцх Екстракција
Решење: Користите обраду бацх-а засновану на директоријуму за велике облике.
Размишљање о перформанси
- Процес бацања за брзину и скалабилност
- Постављање ОЦР објеката након употребе
- Проверите производњу пре интеграције
Најбоља пракса
- Преглед дигитализованих података за тачност пре аутоматизације
- Тун подешавања за сваки тип шаблона облика
- Архиве оригинала за ревизију
- Редовно ажурирајте Aspose.OCR за побољшање функција
Напредни сценарио
Сценарио 1: Екстракт ручног писања из облика
settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.DOCUMENT;
// Optionally, pre-filter for handwriting using image preprocessing
Сценарио 2: Експорт на ЈСОН за увоз базе података
foreach (RecognitionResult result in results)
{
result.Save("form_data.json", SaveFormat.Json);
}
Закључак
Aspose.OCR za .NET automate formira ekstrakciju podataka – uklanjajući ručni ulaz i ubrzavajući poslovne, istraživačke ili administrativne tokove rada.
Види више напредне употребе и код узорке на Aspose.OCR за .NET API референце .