Kako automatizirati ulazak podataka iz obrazaca s Aspose.OCR-om

Kako automatizirati ulazak podataka iz obrazaca s Aspose.OCR-om

Izvlačenje informacija iz papirnih obrazaca, upitnika ili anketa je klasična bočica za ulazak podataka. uz Aspose.OCR za .NET, možete digitalizirati podatke o obrazcu iz skeniranja ili fotografija, smanjiti pogreške i pretvoriti nestrukturirane dokumente u strukturirane, uređivane podatke.

Real-svjetski problem

Uvod podataka u ručni obrazac je usporen, skup i vrlo je sklon pogreškama – osobito u velikim organizacijama, istraživanju ili logistici. rukopis, raznovrsni raspored i mješoviti tipovi polja čine automatizaciju izazovnom bez moćnih OCR alata.

Pregled rješenja

Aspose.OCR za .NET pruža fleksibilne postavke prepoznavanja kako bi se iz obrazaca, procesnih kontrolnih kutija i rezultata strukturiranog ishodom izvukla i pisana tekst – idealna za poslovanje, zdravstvo, ljudska prava, obrazovanje i još mnogo toga.

Preduzeća

Prije nego što počnete, pobrinite se da imate:

  • Visual Studio 2019 ili kasnije
  • .NET 6.0 ili noviji (ili .Net Framework 4.6.2+)
  • Aspose.OCR za .NET od NuGet
  • Osnovna C# iskustva
PM> Install-Package Aspose.OCR

Korak po korak provedba

Korak 1: Instaliranje i konfiguracija Aspose.OCR

using Aspose.OCR;

Korak 2: Skanirajte ili snimite svoje oblike

Pripremite slike obrazaca (JPEG, PNG, PDF ili TIFF). možete dodati više datoteka za ekstrakciju paketa.

OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("form1.png");
input.Add("form2.jpg");

Korak 3: Konfigurirajte postavke prepoznavanja

Prilagodite postavke za otkrivanje jezika, rasporeda i (ako je potrebno) rukopisa.

RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.DOCUMENT; // For complex or multi-field forms

Korak 4: Provedite proces ekstrakcije podataka

AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);

Korak 5: Izvoz ili korištenje digitalnih podataka

foreach (RecognitionResult result in results)
{
    Console.WriteLine(result.RecognitionText); // Extracted text
    result.Save("form_data.txt", SaveFormat.Text); // Save as plain text
    result.Save("form_data.xlsx", SaveFormat.Xlsx); // Save as spreadsheet
}

Korak 6: Dodajte rješavanje pogrešaka

try
{
    AsposeOcr ocr = new AsposeOcr();
    List<RecognitionResult> results = ocr.Recognize(input, settings);
    // further processing
}
catch (Exception ex)
{
    Console.WriteLine($"Error: {ex.Message}");
}

Korak 7: Optimizacija za raspored i rukopis

  • Za ručno pisana polja, koristite veće DPI skeniranje i prilagodite postavke jezika
  • Koristite DetectAreasMode.TABLE za tablice ili DOCUMENT za različite rasporedove
  • Test s uzorcima za toniranje postavki
// Example: Add all images from a directory
foreach (string file in Directory.GetFiles("./forms", "*.png"))
{
    input.Add(file);
}

Sljedeći Članak 8: Popuniti primjer

using Aspose.OCR;
using System;
using System.Collections.Generic;

class Program
{
    static void Main(string[] args)
    {
        try
        {
            OcrInput input = new OcrInput(InputType.SingleImage);
            input.Add("form1.png");
            input.Add("form2.jpg");

            RecognitionSettings settings = new RecognitionSettings();
            settings.Language = Language.English;
            settings.DetectAreasMode = DetectAreasMode.DOCUMENT;

            AsposeOcr ocr = new AsposeOcr();
            List<RecognitionResult> results = ocr.Recognize(input, settings);

            foreach (RecognitionResult result in results)
            {
                Console.WriteLine(result.RecognitionText);
                result.Save("form_data.txt", SaveFormat.Text);
                result.Save("form_data.xlsx", SaveFormat.Xlsx);
            }
        }
        catch (Exception ex)
        {
            Console.WriteLine($"Error: {ex.Message}");
        }
    }
}

Korištenje slučajeva i aplikacija

Zdravstveno osiguranje i HR

Izvadite i digitalizirajte podatke o obrazacima za uzimanje pacijenata, zahtjeve za posao ili ankete.

Istraživanje i obrazovanje

Automatizirani upitnik i obrada istraživanja za brzu analizu.

Logistika i poslovanje

Digitalizirajte brojeve isporuke, inspekcijske obrasce ili kontrolne popise zapisa.

Zajednički izazovi i rješenja

Izazov 1: Ručno pisano ili nisko kvalitetno polje

Rješenje: Koristite visoke kvalitete skeniranja i prilagodite postavke prepoznavanja za ručno pisanje.

Izazov 2: Neregularni oblik rasporeda

Rješenje: Koristite način dokumentacije za složene postavke i testirajte na uzorcima.

Izazov 3: Batch ekstrakcija

Rješenje: Koristite obradu na bazi direktora za visoke količine obrasca.

Razmatranje učinkovitosti

  • Batch proces za brzinu i skalabilnost
  • Uklanjanje OCR predmeta nakon korištenja
  • Potvrdite proizvodnju prije integracije

Najbolje prakse

  • Pregled digitalnih podataka za točnost prije automatizacije
  • Tune postavke za svaku vrstu obrasca
  • Originalni arhivi za reviziju
  • Redovito ažurirati Aspose.OCR za poboljšanje funkcija

Napredni scenariji

Scenarij 1: Izvadite ručno pisanje iz oblika

settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.DOCUMENT;
// Optionally, pre-filter for handwriting using image preprocessing

Scenarij 2: Izvoz u JSON za uvoz baze podataka

foreach (RecognitionResult result in results)
{
    result.Save("form_data.json", SaveFormat.Json);
}

zaključak

Aspose.OCR za .NET automate formira ekstrakciju podataka – uklanjajući ručni ulaz i ubrzavajući poslovne, istraživačke ili administrativne radne tokove.

Pogledajte više naprednih uzoraka upotrebe i koda na Aspose.OCR za .NET API reference .

 Hrvatski