Kuinka automaattisesti tallentaa tietoja lomakkeista Aspose.OCR:llä
Paperin lomakkeista, kyselylomakkeesta tai kyselyistä saadut tiedot ovat klassinen tiedonsiirto. .NET:n Aspose.OCR:llä voit digitalisoida lomakkeen tietoja skannauksista tai valokuvissa, vähentää virheitä ja muuttaa rakenteamattomia asiakirjoja jäsenneltyihin, muokattaviin tietoihin.
Reaalimaailman ongelma
Manuaalinen lomakkeen tiedot ovat hitaita, kalliita ja alttiita virheisiin - erityisesti suurissa organisaatioissa, tutkimuksessa tai logistiikassa. käsikirjoitus, monipuoliset järjestelmät ja sekoitettu kenttätyypit tekevät automaatiosta haastavaa ilman tehokkaita OCR-työkaluja.
Ratkaisun yleiskatsaus
Aspose.OCR for .NET tarjoaa joustavia tunnistamisasetuksia, joiden avulla voidaan poistaa sekä kirjoitettu että käsikirjoitettu teksti lomakkeista, prosessin tarkastuskoneista ja tuloksesta rakennettuja tuloksia – ihanteellinen liiketoimintaan, terveydenhuoltoon, henkilöstöön, koulutukseen ja muuhun.
edellytykset
Ennen kuin aloitat, varmista että sinulla on:
- Visual Studio 2019 tai uudempi
- .NET 6.0 tai uudempi (tai .Net Framework 4.6.2+)
- ASPOSE.OCR for .NET alkaen NuGet
- Tärkeä C# kokemus
PM> Install-Package Aspose.OCR
Vaiheittainen toteutus
Vaihe 1: Asenna ja asenna Aspose.OCR
using Aspose.OCR;
Vaihe 2: Tarkista tai valokuvaa lomakkeet
Valmista lomakkeen kuvia (JPEG, PNG, PDF tai TIFF). Voit lisätä useita tiedostoja pakkauksen.
OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("form1.png");
input.Add("form2.jpg");
Vaihe 3: Määritä tunnistusasetukset
Muokkaa asetuksia kielelle, asetukselle ja (tarvittaessa) käsikirjoituksen havaitsemiselle.
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.DOCUMENT; // For complex or multi-field forms
Vaihe 4: Käynnistä Data Extraction -prosessia
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
Vaihe 5: Digitaalisen tiedon vienti tai käyttö
foreach (RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText); // Extracted text
result.Save("form_data.txt", SaveFormat.Text); // Save as plain text
result.Save("form_data.xlsx", SaveFormat.Xlsx); // Save as spreadsheet
}
Vaihe 6: Lisää virheiden käsittely
try
{
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
// further processing
}
catch (Exception ex)
{
Console.WriteLine($"Error: {ex.Message}");
}
Vaihe 7: Optimoi asetuksen ja käsikirjoituksen
- Käsin kirjoitetuissa kentissä käytä korkeampia DPI-skannauksia ja kielen asetuksia
- Käytä DetectAreasMode.TABLE taulukon lomakkeille tai DOCUMENT erilaisille asetuksille
- Testaa näytteen muotoja tunkeutumiseen asetuksia
// Example: Add all images from a directory
foreach (string file in Directory.GetFiles("./forms", "*.png"))
{
input.Add(file);
}
Vaihe 8: Täydellinen esimerkki
using Aspose.OCR;
using System;
using System.Collections.Generic;
class Program
{
static void Main(string[] args)
{
try
{
OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("form1.png");
input.Add("form2.jpg");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.DOCUMENT;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
foreach (RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
result.Save("form_data.txt", SaveFormat.Text);
result.Save("form_data.xlsx", SaveFormat.Xlsx);
}
}
catch (Exception ex)
{
Console.WriteLine($"Error: {ex.Message}");
}
}
}
Käytä tapauksia ja sovelluksia
Terveydenhuolto ja HR
Poista ja digitalisoida lomakkeen tiedot potilaan vastaanotosta, työhakemuksista tai kyselyistä.
Tutkimus ja koulutus
Automaattinen kysely ja kyselyn käsittely nopeampaan analyysiin.
Logistiikka ja liiketoiminta
Digitoi toimitusluettelot, tarkastuslomakkeet tai varastojen tarkistuslistoja.
Yhteiset haasteet ja ratkaisut
Haaste 1: Käsikirjoitetut tai laadukkaat kentät
** Ratkaisu:** Käytä laadukkaita skannauksia ja säädä tunnistusasetuksia käsikirjoitukseen.
Haaste 2: Epäsäännölliset muotoilut
** Ratkaisu:** Käytä dokumentointimenettelyä monimutkaisiin asetuksiin ja testaa näytteitä.
Tapaus 3: Batch Extraction
** Ratkaisu:** Käytä direktiivipohjaista kokoonpanoa korkean tilavuuden lomakkeille.
suorituskyvyn huomioon ottaminen
- Batch-prosessi nopeuden ja skalaavuuden varmistamiseksi
- OCR-objekteja käytön jälkeen
- Tuotannon validointi ennen integraatiota
Parhaat käytännöt
- Tarkista digitoituja tietoja tarkkuutta ennen automaatiota
- Tune asetukset kunkin lomakkeen malli tyyppi
- Alkuperäiset arkistot auditointiin
- ASPOSE.OCR päivitetään säännöllisesti ominaisuuksien parantamiseksi
Edistyneet skenaariot
Skenaario 1: Manuaalinen kirjoittaminen lomakkeista
settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.DOCUMENT;
// Optionally, pre-filter for handwriting using image preprocessing
Skenaario 2: Vienti JSONille tietokannan tuonnille
foreach (RecognitionResult result in results)
{
result.Save("form_data.json", SaveFormat.Json);
}
johtopäätöksiä
Aspose.OCR for .NET automaatit muodostavat tiedonlähtö – poistaa manuaalinen sisäänkäynti ja nopeuttaa liiketoiminnan, tutkimuksen tai hallinnollisten työnkulkujen.
Katso lisää edistyksellisiä käyttö- ja koodin malleja ASPOSE.OCR .NET API-referenssille .