Hogyan lehet automatizálni az adatbevételt az űrlapokból az Aspose.OCR segítségével
A papírformátumokból, kérdőívekből vagy felmérésekből származó információk kivonása egy klasszikus adatbevételi üveg. Az Aspose.OCR for .NET segítségével digitalizálhatja a formanyomtatványokat a szkennelésektől vagy a fotóktól, csökkenti a hibákat és szerkezet nélküli dokumentumokat szerkeszthető, strukturált adatokká alakíthat.
Valódi problémák
A kézi formanyomtatvány adatbevétele lassú, költséges és nagyon hajlamos a hibákra – különösen a nagy szervezetekben, kutatásokban vagy logisztikában.A kézírás, a változatos elrendezések és a vegyes mezőtípusok az automatizálást kihívást jelentenek anélkül, hogy erős OCR eszközök lennének.
megoldás áttekintése
Az ASPOSE.OCR for .NET rugalmas felismerési beállításokat biztosít a nyomtatott és kézzel írt szövegek kivonására a formanyomtatványokból, a folyamatellenőrző dobozokról és az eredmény strukturált eredményekből – ideális üzleti, egészségügyi, HR, oktatási és egyéb célokra.
előfeltételek
Mielőtt elkezdené, győződjön meg róla, hogy:
- Visual Studio 2019 vagy újabb
- .NET 6.0 vagy újabb (vagy .Net Framework 4.6.2+)
- ASPOSE.OCR for .NET a NuGet-ről
- C# tapasztalat
PM> Install-Package Aspose.OCR
lépésről lépésre megvalósítás
1. lépés: Az Aspose.OCR telepítése és konfigurálása
using Aspose.OCR;
2. lépés: szkennelje vagy fényképezze az űrlapokat
Készítsd el a formanyomtatványokat (JPEG, PNG, PDF vagy TIFF). Több fájlt hozzáadhat a csomag kivonásához.
OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("form1.png");
input.Add("form2.jpg");
3. lépés: A felismerési beállítások beállítása
Ajánlása beállítások nyelv, elrendezés, és (ha szükséges) kézirat felismerése.
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.DOCUMENT; // For complex or multi-field forms
4. lépés: Indítsa el az adatgyűjtési folyamatot
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
5. lépés: Digitalizált adatok exportálása vagy felhasználása
foreach (RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText); // Extracted text
result.Save("form_data.txt", SaveFormat.Text); // Save as plain text
result.Save("form_data.xlsx", SaveFormat.Xlsx); // Save as spreadsheet
}
6. lépés: Hibaelhárítás hozzáadása
try
{
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
// further processing
}
catch (Exception ex)
{
Console.WriteLine($"Error: {ex.Message}");
}
7. lépés: Optimalizálja a layout és a kézirat
- A kézzel írt mezők esetében használjon magasabb DPI szkennelést és módosítsa a nyelvi beállításokat
- Használja a DetectAreasMode.TABLE táblázati formanyomtatványokhoz, vagy a DOCUMENT különböző elrendezésekhez
- Tesztelés mintákkal a tune beállításokhoz
// Example: Add all images from a directory
foreach (string file in Directory.GetFiles("./forms", "*.png"))
{
input.Add(file);
}
8. lépés: Teljes példa
using Aspose.OCR;
using System;
using System.Collections.Generic;
class Program
{
static void Main(string[] args)
{
try
{
OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("form1.png");
input.Add("form2.jpg");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.DOCUMENT;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
foreach (RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
result.Save("form_data.txt", SaveFormat.Text);
result.Save("form_data.xlsx", SaveFormat.Xlsx);
}
}
catch (Exception ex)
{
Console.WriteLine($"Error: {ex.Message}");
}
}
}
Esetek és alkalmazások használata
Egészségügy és HR
A formanyomtatványok kivonása és digitalizálása a betegbevitelre, a munkakeresésre vagy a felmérésekre vonatkozóan.
Kutatás és oktatás
Automatikus kérdőív és felmérés feldolgozása gyorsabb elemzéshez.
Logisztika és üzleti
Digitalizáljon szállítási jegyzeteket, ellenőrzési formanyomtatványokat vagy készletellenőrzési listákat.
Közös kihívások és megoldások
1. kihívás: kézzel írt vagy alacsony minőségű mezők
** Megoldás:** Használjon kiváló minőségű szkennelést és módosítsa a felismerési beállításokat a kézirathoz.
2. kihívás: szabálytalan formájú elrendezések
** Megoldás:** A dokumentum mód használata összetett elrendezésekhez, valamint a minták tesztelése.
3. kihívás: Batch Extraction
** Megoldás:** A nagy mennyiségű formanyomtatványok esetében használja a katalóguson alapuló csomagfeldolgozást.
A teljesítmény megfontolása
- Batch folyamat a sebesség és a skálázhatóság érdekében
- Az OCR objektumok használata után
- Megerősítse az integráció előtti eredményt
Legjobb gyakorlatok
- Digitalizált adatok felülvizsgálata az automatizálás előtt
- Tüneti beállítások minden formanyomtatvány típusához
- Archívumok a könyvvizsgálatra
- Az ASPOSE.OCR rendszeres frissítése a funkciók javítása érdekében
fejlett forgatókönyvek
1. forgatókönyv: Kézikönyv kivonása formából
settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.DOCUMENT;
// Optionally, pre-filter for handwriting using image preprocessing
2. forgatókönyv: Export JSON adatbázis import
foreach (RecognitionResult result in results)
{
result.Save("form_data.json", SaveFormat.Json);
}
következtetések
Az ASPOSE.OCR for .NET automates formálja az adatok kivonását – megszünteti a kézi belépést és felgyorsítja az üzleti, kutatási vagy adminisztratív munkafolyamatokat.
Lásd továbbfejlesztett használati és kódmintákat a Az ASPOSE.OCR a .NET API referenciájához .