Hvordan utveksle tabeller og tabelldata fra bilder med Aspose.OCR
Ekstraksjon av tabeller fra bilder, skjemaer eller skannede rapporter er utfordrende – manuell retyping er langsom og feilfri. Aspose.OCR Table to Text for .NET automatiserer ekstraksjonen og struktureringen av tabeldata fra billeder og bilder.
Real-verdens problem
Finansielle rapporter, undersøkelsesskjemaer og vitenskapelige resultater er ofte fanget i skannede tabeller eller bilder. Manuelt gjenoppretting av disse dataene spiser timer og risiko for å introdusere feil.
Oversikt over løsning
Aspose.OCR for .NET kan nøyaktig oppdage, ekstrakte og konvertere tabeller fra bilder eller skannede PDF-er til maskinlesbare formater – perfekt for Excel, rapportering eller arbeidsflyt automatisering.
Prerequisites
- Visual Studio 2019 eller senere
- .NET 6.0 eller nyere (eller .Net Framework 4.6.2+)
- Aspose.OCR for .NET fra NuGet
- grunnleggende C# kunnskap
PM> Install-Package Aspose.OCR
Step-by-step implementering
Steg 1: Installere og konfigurere Aspose.OCR
using Aspose.OCR;
Steg 2: Skanne eller fotografere bilder som inneholder tabeller
OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("table1.jpg");
input.Add("report_page.png");
Trinn 3: Konfigurere tabell gjenkjenning innstillinger
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.TABLE; // Key for tables
Steg 4: Utfør tabellekstraksjonsprosessen
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
Steg 5: Eksport tabell data
foreach (RecognitionResult result in results)
{
result.Save("table_data.xlsx", SaveFormat.Xlsx); // Excel output
result.Save("table_data.csv", SaveFormat.Csv); // CSV output
result.Save("table_data.txt", SaveFormat.Text); // Plain text output
}
Steg 6: Legg til feilbehandling og validering
try
{
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
// Further processing
}
catch (Exception ex)
{
Console.WriteLine($"Error: {ex.Message}");
}
Steg 7: Optimaliser for komplekse, roterte eller flersidede tabeller
- Forhåndsbehandling av bilder til deskew eller crop
- Bruk høyoppløsningsskanninger eller bilder
- For flersidede PDF-er, legge til hver side som en separat inngang
foreach (string file in Directory.GetFiles("./scans", "*.png"))
{
input.Add(file);
}
Steg 8: Komplett eksempel
using Aspose.OCR;
using System;
using System.Collections.Generic;
class Program
{
static void Main(string[] args)
{
try
{
OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("table1.jpg");
input.Add("report_page.png");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.TABLE;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
foreach (RecognitionResult result in results)
{
result.Save("table_data.xlsx", SaveFormat.Xlsx);
result.Save("table_data.csv", SaveFormat.Csv);
result.Save("table_data.txt", SaveFormat.Text);
}
}
catch (Exception ex)
{
Console.WriteLine($"Error: {ex.Message}");
}
}
}
Bruker tilfeller og applikasjoner
Finansiell og vitenskapelig rapportering
Ekstrakter tabeller fra finansielle rapporter, laboratorie resultater, eller forskningsdokumenter for øyeblikkelig analyse i Excel.
Undersøkelser og formbehandling
Digitalisere tabeller fra skannede skjemaer, sjekklister eller census-registreringer.
Arbeidsflyt automatisering
Fyll strukturerte tabelldata direkte inn i dine forretningsapplikasjoner, BI-verktøy eller databaser.
Vanlige utfordringer og løsninger
Utfordring 1: dårlig kvalitet eller komplekse tabeller
Løsning: Bruk høye bilder og test på prøver. forhåndsbehandling for å forbedre klarhet.
Utfordring 2: Roterte eller skjebne tabeller
Løsning: Deskew bilder før behandling; bruk DetectAreasMode.TABLE.
Utfordring 3: Multi-Page Reports
Løsning: Legg til hver side som en separat inngang for batchbehandling.
Performance vurderinger
- Batch for hastighet
- Bruk kvalitetsskanning/bilder
- Oppsettelse av OCR-objekter etter store løp
Beste praksis
- Validering av produktet før integrasjon
- Tune tabell gjenkjenningsinnstillinger som nødvendig
- Kopiering av originale og digitaliserte data
- Test med virkelige prøver før implementering
Avanserte scenarier
Scenario 1: Flerspråklig tabellutvinning
settings.Language = Language.German;
Scenario 2: Eksport til JSON for datarør
foreach (RecognitionResult result in results)
{
result.Save("table_data.json", SaveFormat.Json);
}
Conclusion
Aspose.OCR Tabell til tekst for .NET konverterer bilder og skanninger til aktiverbare, strukturerte tabelldata – klar for analyse, rapportering og automatisering.
Se mer tabell gjenkjenning koder prøver i Aspose.OCR for .NET API Referanse .