Hogyan lehet kivonni az asztali adatokat a képekből Aspose.OCR
Az Aspose.OCR Table to Text for .NET segítségével automatizálhatja a strukturált táblázati adatok kivonását a képekből – időt takarít meg, csökkenti a hibákat, és lehetővé teszi az adatbázisokkal, az Excel-vel vagy a jelentési eszközökkel való szűk integrációt.
Valódi problémák
A vállalkozások gyakran kapnak táblákat számlákban, jelentésekben vagy formanyomtatványokban, mint például képek vagy szkennelések. Az adatok kézi újbóli beillesztése a lapokba vagy az elemzési platformokra hatástalan és hibás, különösen a nagy mennyiségű vagy összetett táplálékok esetében.
megoldás áttekintése
Az ASPOSE.OCR Table to Text for .NET automatizálja a táblázat felismerését és az adatok kivonását a képekből, pontosan azonosítva a sejt szerkezetét és tartalmát. Ez lehetővé teszi, hogy a szkennelt vagy fényképezett tábukat strukturált, kereshető és szerkeszthető formátumokká alakítson minimális kódmal.
előfeltételek
Mielőtt elkezdené, szüksége lesz:
- Visual Studio 2019 vagy újabb
- .NET 6.0 vagy újabb (vagy .Net Framework 4.6.2+)
- ASPOSE.OCR for .NET a NuGet-ről
- Alapvető C# tudás
PM> Install-Package Aspose.OCR
lépésről lépésre megvalósítás
1. lépés: Az Aspose.OCR telepítése és konfigurálása
Adja meg az Aspose.OCR csomagot, és tartalmazza a szükséges névterületeket:
using Aspose.OCR;
2. lépés: Készítse el az asztali képbevételt
Hozzáadjon egy vagy több táblázati képet a bejegyzéshez. a csomag kivonásához használjon több fájlt.
OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("table1.png");
input.Add("table2.jpg");
3. lépés: Állítsa be az asztali felismerési beállításokat
Az asztali érzékelési mód lehetővé teszi, hogy a szerkezet pontosan felismerhető legyen.
RecognitionSettings settings = new RecognitionSettings();
settings.DetectAreasMode = DetectAreasMode.TABLE;
settings.Language = Language.English; // Adjust if table contains non-English text
4. lépés: Végezze el az asztali felismerési folyamatot
Ismerje meg a táblákat a konfigurált beállításokkal:
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
5. lépés: Táblázati adatok exportálása és felhasználása
Az elismert táblázati adatok mentése vagy feldolgozása. szöveg, Excel, JSON vagy más formátumokba exportálható.
foreach (RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText); // Raw table as text
result.Save("table.csv", SaveFormat.Csv); // Save as CSV
result.Save("table.xlsx", SaveFormat.Xlsx); // Save as Excel
}
6. lépés: Hibaelhárítás hozzáadása
Hozzáadjuk a kivételes kezelést a robusztus megoldások létrehozásához.
try
{
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
// further processing...
}
catch (Exception ex)
{
Console.WriteLine($"Error: {ex.Message}");
}
7. lépés: Optimalizálja a komplex táblázatokat
- Használjon nagy felbontású szkennelést/fotókat a pontos szerkezeti felismeréshez
- Teszt a különböző asztali elrendezésekkel (összekapcsolt sejtek, több vonalos fejjelek, határok)
- Szükség esetén a felismerési beállításokat
// Example: Add all images from a folder
foreach (string file in Directory.GetFiles("./tables", "*.png"))
{
input.Add(file);
}
8. lépés: A teljes munka példája
using Aspose.OCR;
using System;
using System.Collections.Generic;
class Program
{
static void Main(string[] args)
{
try
{
OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("table1.png");
input.Add("table2.jpg");
RecognitionSettings settings = new RecognitionSettings();
settings.DetectAreasMode = DetectAreasMode.TABLE;
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
foreach (RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
result.Save("table.csv", SaveFormat.Csv);
result.Save("table.xlsx", SaveFormat.Xlsx);
}
}
catch (Exception ex)
{
Console.WriteLine($"Error: {ex.Message}");
}
}
}
Esetek és alkalmazások használata
Pénzügyi jelentések és számlák
A tranzakciós táblák kivonása a képekből az Excel vagy az adatbázis rendszerekbe automatikusan.
Kutatás és elemzés
Digitalizálja az adatelemzés céljából a szkennelt publikációkból vagy felmérési űrlapokból származó táblákat.
Automatizált adatmigráció
Emigrálj öröklési dokumentumokat vagy szkennelt papírkönyvek a modern strukturált formátumokba.
Közös kihívások és megoldások
1. kihívás: Blurry vagy komplex asztali képek
** Megoldás:** A strukturális felismerés javítása érdekében használjon egyértelműbb képeket vagy kísérleteket az előfeldolgozással.
2. kihívás: Nem szabványos asztali elrendezések
** Megoldás:** Tesztelje és módosítsa a beállításokat a bonyolult elrendezésekhez vagy a határok nélküli táblákhoz.
3. kihívás: Big Batches vagy vegyes képtípusok
** Megoldás:** Használja a készletfeldolgozást és a katalógus szkennelését, hogy automatizálja a kivonatot sok fájlból.
A teljesítmény megfontolása
- Használjon jól fényes, magas színű képeket
- Batch folyamat a hatékonyságért
- Az OCR objektumok használata után
Legjobb gyakorlatok
- Mindig érvényesítse az exportált táblázatadatokat a további feldolgozás előtt
- Az optimális szerkezeti felismerés előkészítése
- Biztonságos és biztonsági mentés eredeti szkennelések / képek
- Használja a megfelelő export formátumot a munkafolyamathoz (CSV, XLSX, JSON)
fejlett forgatókönyvek
1. forgatókönyv: Mixed-Language Table Extraction
settings.Language = Language.Chinese;
2. forgatókönyv: A táblázat és a szöveg kivonása kombinálása
settings.DetectAreasMode = DetectAreasMode.COMBINE;
következtetések
Az ASPOSE.OCR Table to Text for .NET átalakítja a képmappákat strukturált, szerkeszthető adatokká – nincs kézi bejegyzés szükséges. gyorsabb pénzügyi jelentések, elemzések és digitális archívumok pontos, automatizált táblázatok kivonásával.
További példák és technikai részletekért látogasson el a Az ASPOSE.OCR a .NET API referenciájához .