Kaip automatiškai įvesti duomenis iš formų su Aspose.OCR

Kaip automatiškai įvesti duomenis iš formų su Aspose.OCR

Informacija iš popierinių formų, klausimynų ar apklausų yra klasikinis duomenų įvedimo buteliukas. su Aspose.OCR .NET, galite skaitmenizuoti formos duomenis iš skenavimo ar nuotraukų, sumažinti klaidas ir paversti nekontroliuojamus dokumentus struktūrizuotais, redaguojamais duomenimis.

Realaus pasaulio problemos

Duomenų įvedimas rankiniu būdu yra lėtas, brangus ir labai linkęs į klaidas, ypač didelėse organizacijose, mokslinių tyrimų ar logistikos srityse. rankų rašymas, įvairūs išdėstymai ir mišrių lauko tipai daro automatizaciją sudėtinga be galingų OCR įrankių.

Sprendimo apžvalga

ASPOSE.OCR .NET suteikia lanksčias atpažinimo nustatymus, kad būtų galima ištraukti tiek rašytinį, tiek rankiniu būdu parašytą tekstą iš formų, procesų kontrolės dėžutės ir rezultatus – idealiai tinka verslo, sveikatos priežiūros, žmogiškųjų išteklių, švietimo ir kt.

Prerequisites

Prieš pradėdami, įsitikinkite, kad turite:

  • „Visual Studio 2019“ arba vėliau
  • .NET 6.0 arba naujesnė (arba .Net Framework 4.6.2+)
  • ASPOSE.OCR už .NET iš NuGet
  • Pagrindinė C# patirtis
PM> Install-Package Aspose.OCR

Žingsnis po žingsnio įgyvendinimas

1 žingsnis: Įdiegti ir konfigūruoti Aspose.OCR

using Aspose.OCR;

2 žingsnis: skenuoti ar fotografuoti savo formą

Paruoškite savo formos vaizdus (JPEG, PNG, PDF arba TIFF).

OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("form1.png");
input.Add("form2.jpg");

3 žingsnis: nustatyti atpažinimo nustatymus

Pritaikykite nustatymus kalbos, išdėstymo ir (jei reikia) rankų rašymo aptikimui.

RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.DOCUMENT; // For complex or multi-field forms

4 žingsnis: paleiskite duomenų ekstrakcijos procesą

AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);

5 žingsnis: eksportuoti arba naudoti skaitmeninius duomenis

foreach (RecognitionResult result in results)
{
    Console.WriteLine(result.RecognitionText); // Extracted text
    result.Save("form_data.txt", SaveFormat.Text); // Save as plain text
    result.Save("form_data.xlsx", SaveFormat.Xlsx); // Save as spreadsheet
}

6 žingsnis: pridėti klaidų tvarkymą

try
{
    AsposeOcr ocr = new AsposeOcr();
    List<RecognitionResult> results = ocr.Recognize(input, settings);
    // further processing
}
catch (Exception ex)
{
    Console.WriteLine($"Error: {ex.Message}");
}

7 žingsnis: optimizuokite išdėstymą ir rankų rašymą

  • Rankiniu būdu parašytų laukų atveju naudokite aukštesnius DPI skenus ir pritaikykite kalbos nustatymus
  • Naudokite DetectAreasMode.TABLE lentelių formoms arba DOCUMENT skirtingiems dizainams
  • Testas su mėginių formomis tonizuoti nustatymus
// Example: Add all images from a directory
foreach (string file in Directory.GetFiles("./forms", "*.png"))
{
    input.Add(file);
}

8 žingsnis: pilnas pavyzdys

using Aspose.OCR;
using System;
using System.Collections.Generic;

class Program
{
    static void Main(string[] args)
    {
        try
        {
            OcrInput input = new OcrInput(InputType.SingleImage);
            input.Add("form1.png");
            input.Add("form2.jpg");

            RecognitionSettings settings = new RecognitionSettings();
            settings.Language = Language.English;
            settings.DetectAreasMode = DetectAreasMode.DOCUMENT;

            AsposeOcr ocr = new AsposeOcr();
            List<RecognitionResult> results = ocr.Recognize(input, settings);

            foreach (RecognitionResult result in results)
            {
                Console.WriteLine(result.RecognitionText);
                result.Save("form_data.txt", SaveFormat.Text);
                result.Save("form_data.xlsx", SaveFormat.Xlsx);
            }
        }
        catch (Exception ex)
        {
            Console.WriteLine($"Error: {ex.Message}");
        }
    }
}

Naudokite atvejus ir paraiškas

Sveikatos priežiūra ir HR

Išgauti ir skaitmeninti formos duomenis pacientų vartojimo, darbo paraiškų ar apklausų.

Tyrimai ir švietimas

Automatiškas klausimynas ir apklausos apdorojimas greitesnei analizei.

Logistika ir verslas

Skaitmenizuokite pristatymo įrašus, patikrinimo formas ar inventoriaus kontrolinius sąrašus.

Bendrieji iššūkiai ir sprendimai

1 iššūkis: rankiniu būdu arba žemos kokybės laukai

Išsprendimas: Naudokite aukštos kokybės skenavimus ir pritaikykite atpažinimo nustatymus rankų rašymui.

2 iššūkis: nereguliari forma

Išsprendimas: Naudokite dokumentų režimą sudėtingoms išdėstymams ir bandykite mėginius.

Iššūkis 3: Batch ekstrakcija

Išsprendimas: Naudokite direktorių pagrįstą batch apdorojimą didelio tūrio formoms.

Veiksmingumo apžvalgos

  • Batch procesas greičiui ir skalavimui
  • OCR objektai po naudojimo
  • Išleidimas prieš integraciją

Geriausios praktikos

  • Patikrinkite skaitmeninius duomenis tikslumui prieš automatizavimą
  • Tune nustatymai kiekvienam formos šablonų tipui
  • Originalus archyvas auditui
  • Reguliariai atnaujinkite Aspose.OCR funkcijų tobulinimui

Išplėstiniai scenarijai

1 scenarijus: rankų rašymas iš formų

settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.DOCUMENT;
// Optionally, pre-filter for handwriting using image preprocessing

2 scenarijus: eksportuoti į JSON duomenų bazės importui

foreach (RecognitionResult result in results)
{
    result.Save("form_data.json", SaveFormat.Json);
}

Conclusion

Aspose.OCR .NET automatai formuoja duomenų ekstrakciją – pašalina rankinius įėjimus ir pagreitina verslo, mokslinių tyrimų ar administracinių darbo srautus.

Žiūrėti daugiau pažangių naudojimo ir kodo pavyzdžių ASPOSE.OCR už .NET API nuorodą .

 Lietuvių