Kā izņemt tabulas datus no attēliem ar Aspose.OCR
Ar Aspose.OCR Tabula uz Tekstu .NET, jūs varat automātiski iegūt strukturētu tabulas datus no attēliem - ietaupot laiku, samazinot kļūdas, un ļauj bezjēdzīgu integrāciju ar datu bāzi, Excel, vai ziņošanas rīki.
Reālā pasaules problēma
Uzņēmumi bieži saņem tabulas rēķinā, ziņojumos vai veidlapās, piemēram, attēlus vai skenēšanas. Manuāli pārcelšana šos datus uz plašsaziņas līdzekļiem vai analīzes platformām ir neefektīva un kļūdaināmā, it īpaši lieliem apjomiem vai sarežģītām tabulām.
Risinājumu pārskats
Aspose.OCR Table to Text for .NET automatizē tabulas atpazīšanu un datu ekstrakciju no attēliem, precīzi identificējot šūnu struktūru un saturu.
Prerequisites
Pirms sākat, jums būs nepieciešams:
- Visual Studio 2019 vai vēlāk
- .NET 6.0 vai jaunāks (vai .Net Framework 4.6.2+)
- Aspose.OCR par .NET no NuGet
- C# zināšanas
PM> Install-Package Aspose.OCR
Step-by-step īstenošana
1. solis: Uzstādīt un konfigurēt Aspose.OCR
Pievienojiet Aspose.OCR paketi un iekļauj nepieciešamos nosaukuma telpas:
using Aspose.OCR;
2. solis: Sagatavojiet tabulas attēla ievadījumus
Pievienojiet vienu vai vairākus tabulas attēlus jūsu ievadīšanai. batch ekstrakcijai izmantojiet vairākas failus.
OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("table1.png");
input.Add("table2.jpg");
3. solis: Iestatīt tabulas atpazīšanas iestatījumus
Iegūstiet tabulas detekcijas režīmu, lai nodrošinātu, ka struktūra tiek precīzi atpazīta.
RecognitionSettings settings = new RecognitionSettings();
settings.DetectAreasMode = DetectAreasMode.TABLE;
settings.Language = Language.English; // Adjust if table contains non-English text
4. solis: Izveidojiet tabulas atpazīšanas procesu
Atzīt tabulas ar konfigurētiem iestatījumiem:
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
5. solis: Eksportēt un izmantot tabulas datus
Saglabājiet vai apstrādājiet atpazītos tabulas datus. Jūs varat eksportēt uz tekstu, Excel, JSON vai citiem formātiem.
foreach (RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText); // Raw table as text
result.Save("table.csv", SaveFormat.Csv); // Save as CSV
result.Save("table.xlsx", SaveFormat.Xlsx); // Save as Excel
}
6. solis: pievienojiet kļūdu apstrādi
Pievienojiet izņēmuma apstrādi, lai izveidotu spēcīgus risinājumus.
try
{
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
// further processing...
}
catch (Exception ex)
{
Console.WriteLine($"Error: {ex.Message}");
}
7. solis: Optimizējiet kompleksas tabulas
- Izmantojiet augstas izšķirtspējas skenēšanas/fotogrāfijas precīzam struktūras atklāšanai
- Testēšana ar dažādiem galda izkārtojumiem (saistītās šūnas, vairāku līniju virsrakstis, robežas)
- Tune atpazīšanas iestatījumi, kā nepieciešams
// Example: Add all images from a folder
foreach (string file in Directory.GetFiles("./tables", "*.png"))
{
input.Add(file);
}
8. solis: pilns darba piemērs
using Aspose.OCR;
using System;
using System.Collections.Generic;
class Program
{
static void Main(string[] args)
{
try
{
OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("table1.png");
input.Add("table2.jpg");
RecognitionSettings settings = new RecognitionSettings();
settings.DetectAreasMode = DetectAreasMode.TABLE;
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
foreach (RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
result.Save("table.csv", SaveFormat.Csv);
result.Save("table.xlsx", SaveFormat.Xlsx);
}
}
catch (Exception ex)
{
Console.WriteLine($"Error: {ex.Message}");
}
}
}
Izmantojiet gadījumus un pieteikumus
Finanšu pārskati un rēķini
Izveidojiet darījumu tabulas no attēliem Excel vai datubāzes sistēmās automātiski.
Pētniecība un analīze
Digitalizējiet tabulas no skenētiem publikācijām vai aptaujas veidlapām datu analīzei.
Automātiskā datu migrācija
Migrēt mantojuma dokumentus vai skenētus papīra ierakstus mūsdienu strukturētajos formātos.
Kopīgi izaicinājumi un risinājumi
1. izaicinājums: Blurry vai kompleksas tabulas attēli
Rīze: Izmantojiet skaidrākus attēlus vai eksperimentus ar priekšapstrādi, lai uzlabotu struktūras atpazīstamību.
2. izaicinājums: nestandarta galda izkārtojumi
Rīze: Pārbaudiet un pielāgojiet iestatījumus sarežģītām izkārtojumiem vai bez robežām.
3. izaicinājums: Lieli attēli vai sajauktie attēlu veidi
Lēmums: Izmanto kompleksa apstrādi un direktoriju skenēšanu, lai automātiski iegūtu no daudziem failiem.
Darbības apsvērumi
- Izmantojiet labi apgaismotas, augstas kvalitātes attēlus
- Batch process efektivitātes nodrošināšanai
- OCR priekšmeti pēc lietošanas
Labākās prakses
- Vienmēr validējiet eksportētos tabulas datus pirms turpmākas apstrādes
- Preprocesijas attēli optimālai struktūras atklāšanai
- Aizsargāt un kopēt oriģinālus skanējumus / attēlus
- Izmantojiet pareizo eksporta formātu jūsu darba plūsmai (CSV, XLSX, JSON)
Augstākie scenāriji
1. scenārijs: Mixed-Language tabulas ekstrakcija
settings.Language = Language.Chinese;
Scenārija 2: Kombinācija tabula un teksta ekstrakcija
settings.DetectAreasMode = DetectAreasMode.COMBINE;
Conclusion
Aspose.OCR Table to Text for .NET pārvērš attēla tabulas strukturētiem, rediģējamiem datiem – nav nepieciešama manuāla ievade.
Lai iegūtu vairāk piemēru un tehnisko informāciju, apmeklējiet Aspose.OCR par .NET API atsauci .