Hvordan utveksle tabeller og tabelldata fra bilder med Aspose.OCR

Hvordan utveksle tabeller og tabelldata fra bilder med Aspose.OCR

Ekstraksjon av tabeller fra bilder, skjemaer eller skannede rapporter er utfordrende – manuell retyping er langsom og feilfri. Aspose.OCR Table to Text for .NET automatiserer ekstraksjonen og struktureringen av tabeldata fra billeder og bilder.

Real-verdens problem

Finansielle rapporter, undersøkelsesskjemaer og vitenskapelige resultater er ofte fanget i skannede tabeller eller bilder. Manuelt gjenoppretting av disse dataene spiser timer og risiko for å introdusere feil.

Oversikt over løsning

Aspose.OCR for .NET kan nøyaktig oppdage, ekstrakte og konvertere tabeller fra bilder eller skannede PDF-er til maskinlesbare formater – perfekt for Excel, rapportering eller arbeidsflyt automatisering.

Prerequisites

  • Visual Studio 2019 eller senere
  • .NET 6.0 eller nyere (eller .Net Framework 4.6.2+)
  • Aspose.OCR for .NET fra NuGet
  • grunnleggende C# kunnskap
PM> Install-Package Aspose.OCR

Step-by-step implementering

Steg 1: Installere og konfigurere Aspose.OCR

using Aspose.OCR;

Steg 2: Skanne eller fotografere bilder som inneholder tabeller

OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("table1.jpg");
input.Add("report_page.png");

Trinn 3: Konfigurere tabell gjenkjenning innstillinger

RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.TABLE; // Key for tables

Steg 4: Utfør tabellekstraksjonsprosessen

AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);

Steg 5: Eksport tabell data

foreach (RecognitionResult result in results)
{
    result.Save("table_data.xlsx", SaveFormat.Xlsx); // Excel output
    result.Save("table_data.csv", SaveFormat.Csv);   // CSV output
    result.Save("table_data.txt", SaveFormat.Text);  // Plain text output
}

Steg 6: Legg til feilbehandling og validering

try
{
    AsposeOcr ocr = new AsposeOcr();
    List<RecognitionResult> results = ocr.Recognize(input, settings);
    // Further processing
}
catch (Exception ex)
{
    Console.WriteLine($"Error: {ex.Message}");
}

Steg 7: Optimaliser for komplekse, roterte eller flersidede tabeller

  • Forhåndsbehandling av bilder til deskew eller crop
  • Bruk høyoppløsningsskanninger eller bilder
  • For flersidede PDF-er, legge til hver side som en separat inngang
foreach (string file in Directory.GetFiles("./scans", "*.png"))
{
    input.Add(file);
}

Steg 8: Komplett eksempel

using Aspose.OCR;
using System;
using System.Collections.Generic;

class Program
{
    static void Main(string[] args)
    {
        try
        {
            OcrInput input = new OcrInput(InputType.SingleImage);
            input.Add("table1.jpg");
            input.Add("report_page.png");

            RecognitionSettings settings = new RecognitionSettings();
            settings.Language = Language.English;
            settings.DetectAreasMode = DetectAreasMode.TABLE;

            AsposeOcr ocr = new AsposeOcr();
            List<RecognitionResult> results = ocr.Recognize(input, settings);

            foreach (RecognitionResult result in results)
            {
                result.Save("table_data.xlsx", SaveFormat.Xlsx);
                result.Save("table_data.csv", SaveFormat.Csv);
                result.Save("table_data.txt", SaveFormat.Text);
            }
        }
        catch (Exception ex)
        {
            Console.WriteLine($"Error: {ex.Message}");
        }
    }
}

Bruker tilfeller og applikasjoner

Finansiell og vitenskapelig rapportering

Ekstrakter tabeller fra finansielle rapporter, laboratorie resultater, eller forskningsdokumenter for øyeblikkelig analyse i Excel.

Undersøkelser og formbehandling

Digitalisere tabeller fra skannede skjemaer, sjekklister eller census-registreringer.

Arbeidsflyt automatisering

Fyll strukturerte tabelldata direkte inn i dine forretningsapplikasjoner, BI-verktøy eller databaser.

Vanlige utfordringer og løsninger

Utfordring 1: dårlig kvalitet eller komplekse tabeller

Løsning: Bruk høye bilder og test på prøver. forhåndsbehandling for å forbedre klarhet.

Utfordring 2: Roterte eller skjebne tabeller

Løsning: Deskew bilder før behandling; bruk DetectAreasMode.TABLE.

Utfordring 3: Multi-Page Reports

Løsning: Legg til hver side som en separat inngang for batchbehandling.

Performance vurderinger

  • Batch for hastighet
  • Bruk kvalitetsskanning/bilder
  • Oppsettelse av OCR-objekter etter store løp

Beste praksis

  • Validering av produktet før integrasjon
  • Tune tabell gjenkjenningsinnstillinger som nødvendig
  • Kopiering av originale og digitaliserte data
  • Test med virkelige prøver før implementering

Avanserte scenarier

Scenario 1: Flerspråklig tabellutvinning

settings.Language = Language.German;

Scenario 2: Eksport til JSON for datarør

foreach (RecognitionResult result in results)
{
    result.Save("table_data.json", SaveFormat.Json);
}

Conclusion

Aspose.OCR Tabell til tekst for .NET konverterer bilder og skanninger til aktiverbare, strukturerte tabelldata – klar for analyse, rapportering og automatisering.

Se mer tabell gjenkjenning koder prøver i Aspose.OCR for .NET API Referanse .

 Norsk