Hvordan til at udveksle tabeller og tabulære data fra billeder med Aspose.OCR

Hvordan til at udveksle tabeller og tabulære data fra billeder med Aspose.OCR

Ekstraktion af tabeller fra billeder, formularer eller scannede rapporter er udfordrende – manuel retyping er langsom og fejlfrit. Aspose.OCR Table to Text for .NET automatiserer ekstraktionen og struktureringen af tabeldata fra fotos og billeder.

Det virkelige problem

Finansielle rapporter, undersøgelsesformularer og videnskabelige resultater er ofte fanget i scannede tabeller eller billeder. Manuelt genopretning af disse data taber timer og risici for at indføre fejl.

Oversigt over løsning

Aspose.OCR for .NET kan nøjagtigt opdage, udveksle og konvertere tabeller fra billeder eller scannede PDF’er til maskinlæsbare formater - perfekt til Excel, rapportering eller arbejdsprocesautomation.

Forudsætninger

  • Visual Studio 2019 eller senere
  • .NET 6.0 eller nyere (eller .Net Framework 4.6.2+)
  • Aspose.OCR til .NET fra NuGet
  • Grundlæggende C# viden
PM> Install-Package Aspose.OCR

Step-by-Step gennemførelse

Trin 1: Installation og konfiguration af Aspose.OCR

using Aspose.OCR;

Trin 2: Skanning eller fotografering af billeder, der indeholder tabeller

OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("table1.jpg");
input.Add("report_page.png");

Trin 3: Konfigurer tabellidentifikationsindstillinger

RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.TABLE; // Key for tables

Trin 4: Udfør bordekstraktionsprocessen

AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);

Steg 5: Eksport tabellata

foreach (RecognitionResult result in results)
{
    result.Save("table_data.xlsx", SaveFormat.Xlsx); // Excel output
    result.Save("table_data.csv", SaveFormat.Csv);   // CSV output
    result.Save("table_data.txt", SaveFormat.Text);  // Plain text output
}

Trin 6: Tilføj fejlbehandling og validering

try
{
    AsposeOcr ocr = new AsposeOcr();
    List<RecognitionResult> results = ocr.Recognize(input, settings);
    // Further processing
}
catch (Exception ex)
{
    Console.WriteLine($"Error: {ex.Message}");
}

Trin 7: Optimering af komplekse, roterede eller multi-page tabeller

  • Forarbejdning af billeder til deskew eller crop
  • Brug høj opløsning scanner eller billeder
  • For multipage PDF’er tilføjes hver side som en separat indtastning
foreach (string file in Directory.GetFiles("./scans", "*.png"))
{
    input.Add(file);
}

Trin 8: Fuld eksempler

using Aspose.OCR;
using System;
using System.Collections.Generic;

class Program
{
    static void Main(string[] args)
    {
        try
        {
            OcrInput input = new OcrInput(InputType.SingleImage);
            input.Add("table1.jpg");
            input.Add("report_page.png");

            RecognitionSettings settings = new RecognitionSettings();
            settings.Language = Language.English;
            settings.DetectAreasMode = DetectAreasMode.TABLE;

            AsposeOcr ocr = new AsposeOcr();
            List<RecognitionResult> results = ocr.Recognize(input, settings);

            foreach (RecognitionResult result in results)
            {
                result.Save("table_data.xlsx", SaveFormat.Xlsx);
                result.Save("table_data.csv", SaveFormat.Csv);
                result.Save("table_data.txt", SaveFormat.Text);
            }
        }
        catch (Exception ex)
        {
            Console.WriteLine($"Error: {ex.Message}");
        }
    }
}

Brug af tilfælde og applikationer

Finansielle og videnskabelige rapportering

Udvælg tabeller fra finansielle rapporter, laboratorie resultater eller forskningsdokumenter til øjeblikkelig analyse i Excel.

Undersøgelse og formbehandling

Digitalisere tabeller fra scannede formularer, checklister eller censuroptegnelser.

Arbejdsfløj Automation

Giv strukturerede tabeldata direkte til dine forretningsapplikationer, BI-værktøjer eller databaser.

Fælles udfordringer og løsninger

Udfordring 1: dårlig kvalitet eller komplekse tabeller

Løsning: Brug billeder med høj hastighed og test på prøvesæt. præprocess for at forbedre klarheden.

Udfordring 2: Roterede eller skævede tabeller

Løsning: Deskew billeder før behandling; brug DetectAreasMode.TABLE.

Udfordring 3: Multi-Page rapporter

Løsning: Tilføj hver side som en separat input til batchbehandling.

Performance overvejelser

  • Batch for hastighed
  • Brug af høj kvalitet scanner/billeder
  • OCR-objekter efter store løb

Bedste praksis

  • Validering af produktet før integration
  • Tune tabel genkendelsesindstillinger som nødvendigt
  • Oprindelige og digitaliserede data
  • Test med virkelige prøver før implementering

Avancerede scenarier

Scenario 1: Multi-Language Table Extraction

settings.Language = Language.German;

Scenario 2: Eksport til JSON for datarør

foreach (RecognitionResult result in results)
{
    result.Save("table_data.json", SaveFormat.Json);
}

Konklusion

Aspose.OCR Table to Text for .NET omdanner billeder og scanninger til aktiverbare, strukturerede tabeldata – klar til analyse, rapportering og automatisering.

Se flere tabellen genkendelse koder eksempler i Aspose.OCR til .NET API Reference .

 Dansk