Kaip automatiškai įvesti duomenis iš formų su Aspose.OCR
Informacija iš popierinių formų, klausimynų ar apklausų yra klasikinis duomenų įvedimo buteliukas. su Aspose.OCR .NET, galite skaitmenizuoti formos duomenis iš skenavimo ar nuotraukų, sumažinti klaidas ir paversti nekontroliuojamus dokumentus struktūrizuotais, redaguojamais duomenimis.
Realaus pasaulio problemos
Duomenų įvedimas rankiniu būdu yra lėtas, brangus ir labai linkęs į klaidas, ypač didelėse organizacijose, mokslinių tyrimų ar logistikos srityse. rankų rašymas, įvairūs išdėstymai ir mišrių lauko tipai daro automatizaciją sudėtinga be galingų OCR įrankių.
Sprendimo apžvalga
ASPOSE.OCR .NET suteikia lanksčias atpažinimo nustatymus, kad būtų galima ištraukti tiek rašytinį, tiek rankiniu būdu parašytą tekstą iš formų, procesų kontrolės dėžutės ir rezultatus – idealiai tinka verslo, sveikatos priežiūros, žmogiškųjų išteklių, švietimo ir kt.
Prerequisites
Prieš pradėdami, įsitikinkite, kad turite:
- „Visual Studio 2019“ arba vėliau
- .NET 6.0 arba naujesnė (arba .Net Framework 4.6.2+)
- ASPOSE.OCR už .NET iš NuGet
- Pagrindinė C# patirtis
PM> Install-Package Aspose.OCR
Žingsnis po žingsnio įgyvendinimas
1 žingsnis: Įdiegti ir konfigūruoti Aspose.OCR
using Aspose.OCR;
2 žingsnis: skenuoti ar fotografuoti savo formą
Paruoškite savo formos vaizdus (JPEG, PNG, PDF arba TIFF).
OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("form1.png");
input.Add("form2.jpg");
3 žingsnis: nustatyti atpažinimo nustatymus
Pritaikykite nustatymus kalbos, išdėstymo ir (jei reikia) rankų rašymo aptikimui.
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.DOCUMENT; // For complex or multi-field forms
4 žingsnis: paleiskite duomenų ekstrakcijos procesą
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
5 žingsnis: eksportuoti arba naudoti skaitmeninius duomenis
foreach (RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText); // Extracted text
result.Save("form_data.txt", SaveFormat.Text); // Save as plain text
result.Save("form_data.xlsx", SaveFormat.Xlsx); // Save as spreadsheet
}
6 žingsnis: pridėti klaidų tvarkymą
try
{
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
// further processing
}
catch (Exception ex)
{
Console.WriteLine($"Error: {ex.Message}");
}
7 žingsnis: optimizuokite išdėstymą ir rankų rašymą
- Rankiniu būdu parašytų laukų atveju naudokite aukštesnius DPI skenus ir pritaikykite kalbos nustatymus
- Naudokite DetectAreasMode.TABLE lentelių formoms arba DOCUMENT skirtingiems dizainams
- Testas su mėginių formomis tonizuoti nustatymus
// Example: Add all images from a directory
foreach (string file in Directory.GetFiles("./forms", "*.png"))
{
input.Add(file);
}
8 žingsnis: pilnas pavyzdys
using Aspose.OCR;
using System;
using System.Collections.Generic;
class Program
{
static void Main(string[] args)
{
try
{
OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("form1.png");
input.Add("form2.jpg");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.DOCUMENT;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
foreach (RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
result.Save("form_data.txt", SaveFormat.Text);
result.Save("form_data.xlsx", SaveFormat.Xlsx);
}
}
catch (Exception ex)
{
Console.WriteLine($"Error: {ex.Message}");
}
}
}
Naudokite atvejus ir paraiškas
Sveikatos priežiūra ir HR
Išgauti ir skaitmeninti formos duomenis pacientų vartojimo, darbo paraiškų ar apklausų.
Tyrimai ir švietimas
Automatiškas klausimynas ir apklausos apdorojimas greitesnei analizei.
Logistika ir verslas
Skaitmenizuokite pristatymo įrašus, patikrinimo formas ar inventoriaus kontrolinius sąrašus.
Bendrieji iššūkiai ir sprendimai
1 iššūkis: rankiniu būdu arba žemos kokybės laukai
Išsprendimas: Naudokite aukštos kokybės skenavimus ir pritaikykite atpažinimo nustatymus rankų rašymui.
2 iššūkis: nereguliari forma
Išsprendimas: Naudokite dokumentų režimą sudėtingoms išdėstymams ir bandykite mėginius.
Iššūkis 3: Batch ekstrakcija
Išsprendimas: Naudokite direktorių pagrįstą batch apdorojimą didelio tūrio formoms.
Veiksmingumo apžvalgos
- Batch procesas greičiui ir skalavimui
- OCR objektai po naudojimo
- Išleidimas prieš integraciją
Geriausios praktikos
- Patikrinkite skaitmeninius duomenis tikslumui prieš automatizavimą
- Tune nustatymai kiekvienam formos šablonų tipui
- Originalus archyvas auditui
- Reguliariai atnaujinkite Aspose.OCR funkcijų tobulinimui
Išplėstiniai scenarijai
1 scenarijus: rankų rašymas iš formų
settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.DOCUMENT;
// Optionally, pre-filter for handwriting using image preprocessing
2 scenarijus: eksportuoti į JSON duomenų bazės importui
foreach (RecognitionResult result in results)
{
result.Save("form_data.json", SaveFormat.Json);
}
Conclusion
Aspose.OCR .NET automatai formuoja duomenų ekstrakciją – pašalina rankinius įėjimus ir pagreitina verslo, mokslinių tyrimų ar administracinių darbo srautus.
Žiūrėti daugiau pažangių naudojimo ir kodo pavyzdžių ASPOSE.OCR už .NET API nuorodą .