Hogyan lehet automatizálni az adatbevételt az űrlapokból az Aspose.OCR segítségével

Hogyan lehet automatizálni az adatbevételt az űrlapokból az Aspose.OCR segítségével

A papírformátumokból, kérdőívekből vagy felmérésekből származó információk kivonása egy klasszikus adatbevételi üveg. Az Aspose.OCR for .NET segítségével digitalizálhatja a formanyomtatványokat a szkennelésektől vagy a fotóktól, csökkenti a hibákat és szerkezet nélküli dokumentumokat szerkeszthető, strukturált adatokká alakíthat.

Valódi problémák

A kézi formanyomtatvány adatbevétele lassú, költséges és nagyon hajlamos a hibákra – különösen a nagy szervezetekben, kutatásokban vagy logisztikában.A kézírás, a változatos elrendezések és a vegyes mezőtípusok az automatizálást kihívást jelentenek anélkül, hogy erős OCR eszközök lennének.

megoldás áttekintése

Az ASPOSE.OCR for .NET rugalmas felismerési beállításokat biztosít a nyomtatott és kézzel írt szövegek kivonására a formanyomtatványokból, a folyamatellenőrző dobozokról és az eredmény strukturált eredményekből – ideális üzleti, egészségügyi, HR, oktatási és egyéb célokra.

előfeltételek

Mielőtt elkezdené, győződjön meg róla, hogy:

  • Visual Studio 2019 vagy újabb
  • .NET 6.0 vagy újabb (vagy .Net Framework 4.6.2+)
  • ASPOSE.OCR for .NET a NuGet-ről
  • C# tapasztalat
PM> Install-Package Aspose.OCR

lépésről lépésre megvalósítás

1. lépés: Az Aspose.OCR telepítése és konfigurálása

using Aspose.OCR;

2. lépés: szkennelje vagy fényképezze az űrlapokat

Készítsd el a formanyomtatványokat (JPEG, PNG, PDF vagy TIFF). Több fájlt hozzáadhat a csomag kivonásához.

OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("form1.png");
input.Add("form2.jpg");

3. lépés: A felismerési beállítások beállítása

Ajánlása beállítások nyelv, elrendezés, és (ha szükséges) kézirat felismerése.

RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.DOCUMENT; // For complex or multi-field forms

4. lépés: Indítsa el az adatgyűjtési folyamatot

AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);

5. lépés: Digitalizált adatok exportálása vagy felhasználása

foreach (RecognitionResult result in results)
{
    Console.WriteLine(result.RecognitionText); // Extracted text
    result.Save("form_data.txt", SaveFormat.Text); // Save as plain text
    result.Save("form_data.xlsx", SaveFormat.Xlsx); // Save as spreadsheet
}

6. lépés: Hibaelhárítás hozzáadása

try
{
    AsposeOcr ocr = new AsposeOcr();
    List<RecognitionResult> results = ocr.Recognize(input, settings);
    // further processing
}
catch (Exception ex)
{
    Console.WriteLine($"Error: {ex.Message}");
}

7. lépés: Optimalizálja a layout és a kézirat

  • A kézzel írt mezők esetében használjon magasabb DPI szkennelést és módosítsa a nyelvi beállításokat
  • Használja a DetectAreasMode.TABLE táblázati formanyomtatványokhoz, vagy a DOCUMENT különböző elrendezésekhez
  • Tesztelés mintákkal a tune beállításokhoz
// Example: Add all images from a directory
foreach (string file in Directory.GetFiles("./forms", "*.png"))
{
    input.Add(file);
}

8. lépés: Teljes példa

using Aspose.OCR;
using System;
using System.Collections.Generic;

class Program
{
    static void Main(string[] args)
    {
        try
        {
            OcrInput input = new OcrInput(InputType.SingleImage);
            input.Add("form1.png");
            input.Add("form2.jpg");

            RecognitionSettings settings = new RecognitionSettings();
            settings.Language = Language.English;
            settings.DetectAreasMode = DetectAreasMode.DOCUMENT;

            AsposeOcr ocr = new AsposeOcr();
            List<RecognitionResult> results = ocr.Recognize(input, settings);

            foreach (RecognitionResult result in results)
            {
                Console.WriteLine(result.RecognitionText);
                result.Save("form_data.txt", SaveFormat.Text);
                result.Save("form_data.xlsx", SaveFormat.Xlsx);
            }
        }
        catch (Exception ex)
        {
            Console.WriteLine($"Error: {ex.Message}");
        }
    }
}

Esetek és alkalmazások használata

Egészségügy és HR

A formanyomtatványok kivonása és digitalizálása a betegbevitelre, a munkakeresésre vagy a felmérésekre vonatkozóan.

Kutatás és oktatás

Automatikus kérdőív és felmérés feldolgozása gyorsabb elemzéshez.

Logisztika és üzleti

Digitalizáljon szállítási jegyzeteket, ellenőrzési formanyomtatványokat vagy készletellenőrzési listákat.

Közös kihívások és megoldások

1. kihívás: kézzel írt vagy alacsony minőségű mezők

** Megoldás:** Használjon kiváló minőségű szkennelést és módosítsa a felismerési beállításokat a kézirathoz.

2. kihívás: szabálytalan formájú elrendezések

** Megoldás:** A dokumentum mód használata összetett elrendezésekhez, valamint a minták tesztelése.

3. kihívás: Batch Extraction

** Megoldás:** A nagy mennyiségű formanyomtatványok esetében használja a katalóguson alapuló csomagfeldolgozást.

A teljesítmény megfontolása

  • Batch folyamat a sebesség és a skálázhatóság érdekében
  • Az OCR objektumok használata után
  • Megerősítse az integráció előtti eredményt

Legjobb gyakorlatok

  • Digitalizált adatok felülvizsgálata az automatizálás előtt
  • Tüneti beállítások minden formanyomtatvány típusához
  • Archívumok a könyvvizsgálatra
  • Az ASPOSE.OCR rendszeres frissítése a funkciók javítása érdekében

fejlett forgatókönyvek

1. forgatókönyv: Kézikönyv kivonása formából

settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.DOCUMENT;
// Optionally, pre-filter for handwriting using image preprocessing

2. forgatókönyv: Export JSON adatbázis import

foreach (RecognitionResult result in results)
{
    result.Save("form_data.json", SaveFormat.Json);
}

következtetések

Az ASPOSE.OCR for .NET automates formálja az adatok kivonását – megszünteti a kézi belépést és felgyorsítja az üzleti, kutatási vagy adminisztratív munkafolyamatokat.

Lásd továbbfejlesztett használati és kódmintákat a Az ASPOSE.OCR a .NET API referenciájához .

 Magyar