Hogyan lehet kivonni a táblázatokat és az adatokat a képekből az Aspose.OCR segítségével
A képekből, űrlapokból vagy szkennelt jelentésekből származó táblák kivonása kihívást jelent – a kézi retyping lassú és hibaellenes.A Aspose.OCR Table to Text for .NET automatizálja a tablettadatok kivonatát és szerkezetét a képektől és a fotóktól.
Valódi problémák
Pénzügyi beszámolók, felmérési formanyomtatványok és tudományos eredmények gyakran elkapják a szkennelt táblákban vagy képekben. kézi visszaállítása ezeket az adatokat időt veszít, és a hibák bevezetésének kockázata.
megoldás áttekintése
Az ASPOSE.OCR for .NET pontosan felismerheti, kivonhatja és átalakíthatja a képekből vagy szkennelt PDF-kból származó táblákat gépi olvasható formátumokba – tökéletes az Excel, a jelentés vagy a munkafolyamat automatizálásához.
előfeltételek
- Visual Studio 2019 vagy újabb
- .NET 6.0 vagy újabb (vagy .Net Framework 4.6.2+)
- ASPOSE.OCR for .NET a NuGet-ről
- Alapvető C# tudás
PM> Install-Package Aspose.OCR
lépésről lépésre megvalósítás
1. lépés: Az Aspose.OCR telepítése és konfigurálása
using Aspose.OCR;
2. lépés: A táblázatokat tartalmazó képek szkennelése vagy fényképezése
OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("table1.jpg");
input.Add("report_page.png");
3. lépés: Állítsa be az asztali felismerési beállításokat
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.TABLE; // Key for tables
4. lépés: Végezze el az asztali kivonási folyamatot
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
5. lépés: Export táblázat adatai
foreach (RecognitionResult result in results)
{
result.Save("table_data.xlsx", SaveFormat.Xlsx); // Excel output
result.Save("table_data.csv", SaveFormat.Csv); // CSV output
result.Save("table_data.txt", SaveFormat.Text); // Plain text output
}
6. lépés: Hibaelhárítás és validáció hozzáadása
try
{
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
// Further processing
}
catch (Exception ex)
{
Console.WriteLine($"Error: {ex.Message}");
}
7. lépés: Optimalizálja a komplex, forgatott vagy többoldalú táblázatokat
- Preprocess képek deskew vagy crop
- Használjon nagy felbontású szkennelést vagy fényképeket
- A többoldalú PDF-k esetében adja meg az egyes oldalakat külön bevitellé
foreach (string file in Directory.GetFiles("./scans", "*.png"))
{
input.Add(file);
}
8. lépés: Teljes példa
using Aspose.OCR;
using System;
using System.Collections.Generic;
class Program
{
static void Main(string[] args)
{
try
{
OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("table1.jpg");
input.Add("report_page.png");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.TABLE;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
foreach (RecognitionResult result in results)
{
result.Save("table_data.xlsx", SaveFormat.Xlsx);
result.Save("table_data.csv", SaveFormat.Csv);
result.Save("table_data.txt", SaveFormat.Text);
}
}
catch (Exception ex)
{
Console.WriteLine($"Error: {ex.Message}");
}
}
}
Esetek és alkalmazások használata
Pénzügyi és tudományos jelentések
A pénzügyi jelentésekből, a laboratóriumi eredményekből vagy a kutatási dokumentumokból származó táblákat azonnali elemzéshez az Excelben.
A felmérés és a formafeldolgozás
Digitalizálja a táblákat a szkennelt űrlapokból, ellenőrzési listákból vagy a cenzúra nyilvántartásokból.
munkafolyamat automatizálása
A strukturált táblázatadatokat közvetlenül az üzleti alkalmazásokba, a BI-eszközökbe vagy az adatbázisokba helyezzük.
Közös kihívások és megoldások
1. kihívás: rossz minőségű vagy összetett táblák
** Megoldás:** Használja a magas színű képeket és tesztelje a mintakészleteket.
2. kihívás: forgatott vagy törött táblák
** Megoldás:** A képek feldolgozását megelőzően letöltése; használja a DetectAreasMode.TABLE-t.
3. kihívás: többoldalú jelentések
** Megoldás:** Adja meg az egyes oldalakat egy külön bevitellel a csomagfeldolgozáshoz.
A teljesítmény megfontolása
- Batch a sebességért
- Kiváló minőségű szkennelések/fotók
- OCR tárgyak rendelkezésre állása nagy futások után
Legjobb gyakorlatok
- Megerősítse az integráció előtti eredményt
- Tune táblázat felismerési beállítások szükség szerint
- Az eredeti és digitalizált adatok mentése
- Tesztelés valós mintákkal a telepítés előtt
fejlett forgatókönyvek
1. forgatókönyv: Többnyelvű asztali kivonás
settings.Language = Language.German;
2. forgatókönyv: export JSON adatcsövekhez
foreach (RecognitionResult result in results)
{
result.Save("table_data.json", SaveFormat.Json);
}
következtetések
Az ASPOSE.OCR Table to Text for .NET átalakítja a képeket és a szkennelést működőképes, strukturált táblázati adatokká – kész elemzésre, jelentésre és automatizálásra.
Lásd több táblázatfelismerési kód mintákat a Az ASPOSE.OCR a .NET API referenciájához .