Kā automātiski ievadīt datus no veidlapām ar Aspose.OCR

Kā automātiski ievadīt datus no veidlapām ar Aspose.OCR

Informāciju izņemšana no papīra veidlapām, anketām vai aptaujām ir klasisks datu ievades pudeles. ar Aspose.OCR .NET, jūs varat digitalizēt veidlapu datus no skenēšanas vai fotogrāfijas, samazinot kļūdas un pārvēršot nestrukturētus dokumentus strukturētiem, rediģējamiem datiem.

Reālā pasaules problēma

Manuālā veidlapas datu ievade ir lēna, dārga un ļoti pakļauta kļūdām – it īpaši lielajās organizācijās, pētniecībā vai loģistikā. rokasgrāmata, dažādi izkārtojumi un sajauktie lauku veidi padara automatizāciju izaicinošu bez spēcīgiem OCR rīkiem.

Risinājumu pārskats

Aspose.OCR for .NET nodrošina elastīgus atpazīšanas iestatījumus, lai iegūtu gan rakstīto, gan manuālo tekstu no veidlapām, procesu pārbaudes un rezultātu strukturētiem rezultātiem – ideāli piemēroti biznesam, veselības aprūpei, HR, izglītībai un vairāk.

Prerequisites

Pirms sākat, pārliecinieties, ka jums ir:

  • Visual Studio 2019 vai vēlāk
  • .NET 6.0 vai jaunāks (vai .Net Framework 4.6.2+)
  • Aspose.OCR par .NET no NuGet
  • C# pieredze
PM> Install-Package Aspose.OCR

Step-by-step īstenošana

1. solis: Uzstādīt un konfigurēt Aspose.OCR

using Aspose.OCR;

2. solis: skenēt vai fotografēt veidlapas

Sagatavojiet veidlapas attēlus (JPEG, PNG, PDF vai TIFF).

OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("form1.png");
input.Add("form2.jpg");

3. solis: Iestatīt atpazīšanas iestatījumus

Pielāgojiet iestatījumus valodas, izkārtojuma un (ja nepieciešams) rokasgrāmatu atklāšanai.

RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.DOCUMENT; // For complex or multi-field forms

4. solis: Izveidojiet datu ekstrakcijas procesu

AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);

5. solis: digitalizētu datu eksportēšana vai izmantošana

foreach (RecognitionResult result in results)
{
    Console.WriteLine(result.RecognitionText); // Extracted text
    result.Save("form_data.txt", SaveFormat.Text); // Save as plain text
    result.Save("form_data.xlsx", SaveFormat.Xlsx); // Save as spreadsheet
}

6. solis: pievienojiet kļūdu apstrādi

try
{
    AsposeOcr ocr = new AsposeOcr();
    List<RecognitionResult> results = ocr.Recognize(input, settings);
    // further processing
}
catch (Exception ex)
{
    Console.WriteLine($"Error: {ex.Message}");
}

7. solis: optimizēt izkārtojumu un manuālo rakstīšanu

  • Rūpīgi rakstītiem laukiem izmanto augstāku DPI skenēšanu un valodas iestatījumus
  • Izmantojiet DetectAreasMode.TABLE tabulas veidlapām vai DOCUMENT dažādām izkārtojumiem
  • Testēt ar paraugu veidlapām, lai tonētu iestatījumus
// Example: Add all images from a directory
foreach (string file in Directory.GetFiles("./forms", "*.png"))
{
    input.Add(file);
}

8. solis: pilns piemērs

using Aspose.OCR;
using System;
using System.Collections.Generic;

class Program
{
    static void Main(string[] args)
    {
        try
        {
            OcrInput input = new OcrInput(InputType.SingleImage);
            input.Add("form1.png");
            input.Add("form2.jpg");

            RecognitionSettings settings = new RecognitionSettings();
            settings.Language = Language.English;
            settings.DetectAreasMode = DetectAreasMode.DOCUMENT;

            AsposeOcr ocr = new AsposeOcr();
            List<RecognitionResult> results = ocr.Recognize(input, settings);

            foreach (RecognitionResult result in results)
            {
                Console.WriteLine(result.RecognitionText);
                result.Save("form_data.txt", SaveFormat.Text);
                result.Save("form_data.xlsx", SaveFormat.Xlsx);
            }
        }
        catch (Exception ex)
        {
            Console.WriteLine($"Error: {ex.Message}");
        }
    }
}

Izmantojiet gadījumus un pieteikumus

Veselības aprūpe un HR

Izrakstīt un digitalizēt veidlapas datus pacienta ieņemšanai, darba pieteikumiem vai aptaujām.

Pētniecība un izglītība

Automātiskā anketas un aptaujas apstrāde ātrākai analīzei.

Logistika un bizness

Digitalizējiet piegādes pārskatus, inspekcijas veidlapas vai inventāra pārbaudes sarakstu.

Kopīgi izaicinājumi un risinājumi

1. izaicinājums: manuāli rakstītie vai zemas kvalitātes lauki

Lēmums: Izmanto augstas kvalitātes skenēšanu un pielāgo atpazīšanas iestatījumus manuāli rakstīšanai.

2. izaicinājums: neregulārās formas izkārtojumi

Rīze: Izmantojiet dokumentu režīmu sarežģītām izkārtojumiem un pārbaudiet uz paraugiem.

Izteikums 3: Batch ekstrakcija

Rīkojums: Izmanto katalogā balstītu partiju apstrādi augsta apjoma veidlapām.

Darbības apsvērumi

  • Batch process ātrumam un skalabilitātei
  • OCR priekšmeti pēc lietošanas
  • Pārbaudiet produkciju pirms integrācijas

Labākās prakses

  • Pārskatiet digitalizētus datus precīzi pirms automācijas
  • Tune iestatījumi katram veidlapas veidnes veida
  • Arhīvs oriģināls revīzijai
  • Aspose.OCR regulāri atjaunina funkciju uzlabošanai

Augstākie scenāriji

Scenārija 1: Izrakstīt rokasgrāmatu no veidlapām

settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.DOCUMENT;
// Optionally, pre-filter for handwriting using image preprocessing

2. scenārijs: eksports uz JSON datu bāzes importam

foreach (RecognitionResult result in results)
{
    result.Save("form_data.json", SaveFormat.Json);
}

Conclusion

Aspose.OCR for .NET automates veido datu ekstrakciju – novērš manuālo ieejas un paātrina uzņēmējdarbības, pētniecības vai administratīvo darba plūsmu.

Skatīt vairāk uzlabotas lietošanas un kodēšanas paraugus Aspose.OCR par .NET API atsauci .

 Latviski