Kuinka automaattisesti tallentaa tietoja lomakkeista Aspose.OCR:llä

Kuinka automaattisesti tallentaa tietoja lomakkeista Aspose.OCR:llä

Paperin lomakkeista, kyselylomakkeesta tai kyselyistä saadut tiedot ovat klassinen tiedonsiirto. .NET:n Aspose.OCR:llä voit digitalisoida lomakkeen tietoja skannauksista tai valokuvissa, vähentää virheitä ja muuttaa rakenteamattomia asiakirjoja jäsenneltyihin, muokattaviin tietoihin.

Reaalimaailman ongelma

Manuaalinen lomakkeen tiedot ovat hitaita, kalliita ja alttiita virheisiin - erityisesti suurissa organisaatioissa, tutkimuksessa tai logistiikassa. käsikirjoitus, monipuoliset järjestelmät ja sekoitettu kenttätyypit tekevät automaatiosta haastavaa ilman tehokkaita OCR-työkaluja.

Ratkaisun yleiskatsaus

Aspose.OCR for .NET tarjoaa joustavia tunnistamisasetuksia, joiden avulla voidaan poistaa sekä kirjoitettu että käsikirjoitettu teksti lomakkeista, prosessin tarkastuskoneista ja tuloksesta rakennettuja tuloksia – ihanteellinen liiketoimintaan, terveydenhuoltoon, henkilöstöön, koulutukseen ja muuhun.

edellytykset

Ennen kuin aloitat, varmista että sinulla on:

  • Visual Studio 2019 tai uudempi
  • .NET 6.0 tai uudempi (tai .Net Framework 4.6.2+)
  • ASPOSE.OCR for .NET alkaen NuGet
  • Tärkeä C# kokemus
PM> Install-Package Aspose.OCR

Vaiheittainen toteutus

Vaihe 1: Asenna ja asenna Aspose.OCR

using Aspose.OCR;

Vaihe 2: Tarkista tai valokuvaa lomakkeet

Valmista lomakkeen kuvia (JPEG, PNG, PDF tai TIFF). Voit lisätä useita tiedostoja pakkauksen.

OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("form1.png");
input.Add("form2.jpg");

Vaihe 3: Määritä tunnistusasetukset

Muokkaa asetuksia kielelle, asetukselle ja (tarvittaessa) käsikirjoituksen havaitsemiselle.

RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.DOCUMENT; // For complex or multi-field forms

Vaihe 4: Käynnistä Data Extraction -prosessia

AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);

Vaihe 5: Digitaalisen tiedon vienti tai käyttö

foreach (RecognitionResult result in results)
{
    Console.WriteLine(result.RecognitionText); // Extracted text
    result.Save("form_data.txt", SaveFormat.Text); // Save as plain text
    result.Save("form_data.xlsx", SaveFormat.Xlsx); // Save as spreadsheet
}

Vaihe 6: Lisää virheiden käsittely

try
{
    AsposeOcr ocr = new AsposeOcr();
    List<RecognitionResult> results = ocr.Recognize(input, settings);
    // further processing
}
catch (Exception ex)
{
    Console.WriteLine($"Error: {ex.Message}");
}

Vaihe 7: Optimoi asetuksen ja käsikirjoituksen

  • Käsin kirjoitetuissa kentissä käytä korkeampia DPI-skannauksia ja kielen asetuksia
  • Käytä DetectAreasMode.TABLE taulukon lomakkeille tai DOCUMENT erilaisille asetuksille
  • Testaa näytteen muotoja tunkeutumiseen asetuksia
// Example: Add all images from a directory
foreach (string file in Directory.GetFiles("./forms", "*.png"))
{
    input.Add(file);
}

Vaihe 8: Täydellinen esimerkki

using Aspose.OCR;
using System;
using System.Collections.Generic;

class Program
{
    static void Main(string[] args)
    {
        try
        {
            OcrInput input = new OcrInput(InputType.SingleImage);
            input.Add("form1.png");
            input.Add("form2.jpg");

            RecognitionSettings settings = new RecognitionSettings();
            settings.Language = Language.English;
            settings.DetectAreasMode = DetectAreasMode.DOCUMENT;

            AsposeOcr ocr = new AsposeOcr();
            List<RecognitionResult> results = ocr.Recognize(input, settings);

            foreach (RecognitionResult result in results)
            {
                Console.WriteLine(result.RecognitionText);
                result.Save("form_data.txt", SaveFormat.Text);
                result.Save("form_data.xlsx", SaveFormat.Xlsx);
            }
        }
        catch (Exception ex)
        {
            Console.WriteLine($"Error: {ex.Message}");
        }
    }
}

Käytä tapauksia ja sovelluksia

Terveydenhuolto ja HR

Poista ja digitalisoida lomakkeen tiedot potilaan vastaanotosta, työhakemuksista tai kyselyistä.

Tutkimus ja koulutus

Automaattinen kysely ja kyselyn käsittely nopeampaan analyysiin.

Logistiikka ja liiketoiminta

Digitoi toimitusluettelot, tarkastuslomakkeet tai varastojen tarkistuslistoja.

Yhteiset haasteet ja ratkaisut

Haaste 1: Käsikirjoitetut tai laadukkaat kentät

** Ratkaisu:** Käytä laadukkaita skannauksia ja säädä tunnistusasetuksia käsikirjoitukseen.

Haaste 2: Epäsäännölliset muotoilut

** Ratkaisu:** Käytä dokumentointimenettelyä monimutkaisiin asetuksiin ja testaa näytteitä.

Tapaus 3: Batch Extraction

** Ratkaisu:** Käytä direktiivipohjaista kokoonpanoa korkean tilavuuden lomakkeille.

suorituskyvyn huomioon ottaminen

  • Batch-prosessi nopeuden ja skalaavuuden varmistamiseksi
  • OCR-objekteja käytön jälkeen
  • Tuotannon validointi ennen integraatiota

Parhaat käytännöt

  • Tarkista digitoituja tietoja tarkkuutta ennen automaatiota
  • Tune asetukset kunkin lomakkeen malli tyyppi
  • Alkuperäiset arkistot auditointiin
  • ASPOSE.OCR päivitetään säännöllisesti ominaisuuksien parantamiseksi

Edistyneet skenaariot

Skenaario 1: Manuaalinen kirjoittaminen lomakkeista

settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.DOCUMENT;
// Optionally, pre-filter for handwriting using image preprocessing

Skenaario 2: Vienti JSONille tietokannan tuonnille

foreach (RecognitionResult result in results)
{
    result.Save("form_data.json", SaveFormat.Json);
}

johtopäätöksiä

Aspose.OCR for .NET automaatit muodostavat tiedonlähtö – poistaa manuaalinen sisäänkäynti ja nopeuttaa liiketoiminnan, tutkimuksen tai hallinnollisten työnkulkujen.

Katso lisää edistyksellisiä käyttö- ja koodin malleja ASPOSE.OCR .NET API-referenssille .

 Suomi