Hvordan utveksle strukturerte data fra tabeller og former i bilder

Hvordan utveksle strukturerte data fra tabeller og former i bilder

Utvinning av data fra skannede tabeller eller fylte skjemaer er viktig for bedriftsautomasjon, rapportering og overholdelse. Aspose.OCR Table to Text for .NET styrker denne prosessen, nøyaktig oppdager celle- og feltstruktur og eksporterer til redigerbare formater.

Real-verdens problem

Bedrifter mottar ofte fakturaer, rapporter eller skjemaer som bilder eller skanninger. Manuell innføring av tabelldata eller formfelt er sakte, feilfri, og dyrt i skala.

Oversikt over løsning

Med Tabell til tekst for .NET kan du trekke strukturerte data – inkludert rader, kolonner og feltverdier – direkte fra bilder.

Prerequisites

  • Visual Studio 2019 eller senere
  • .NET 6.0 eller nyere (eller .Net Framework 4.6.2+)
  • Aspose.OCR for .NET fra NuGet
  • Grunnleggende C# ferdigheter
PM> Install-Package Aspose.OCR

Step-by-step implementering

Steg 1: Installere og konfigurere Aspose.OCR

using Aspose.OCR;

Steg 2: Forbered tabell eller form bilder

OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("scanned_invoice.png");
input.Add("filled_form.jpg");

Trinn 3: Konfigurere gjenkjenningsinnstillinger for tabeller/skjemaer

RecognitionSettings settings = new RecognitionSettings();
settings.DetectAreasMode = DetectAreasMode.TABLE; // or DetectAreasMode.FORM
settings.Language = Language.English;

Steg 4: Ta ut tabell eller form data

AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);

Steg 5: Eksport strukturert produksjon

foreach (RecognitionResult result in results)
{
    result.Save("output_table.xlsx", SaveFormat.Xlsx); // Spreadsheet
    result.Save("output_table.json", SaveFormat.Json); // JSON
    result.Save("output_table.txt", SaveFormat.Text);  // Text
}

Steg 6: Å håndtere feil og validerte resultater

try
{
    AsposeOcr ocr = new AsposeOcr();
    List<RecognitionResult> results = ocr.Recognize(input, settings);
    // Further processing...
}
catch (Exception ex)
{
    Console.WriteLine($"Error: {ex.Message}");
}

Steg 7: Optimalisere for tabell/form variasjoner

  • Test på prøver med forskjellige grenser, fonts eller feltplasseringer
  • Tune forhåndsbehandling innstillinger for best oppdagelse

Steg 8: Automatisk batch ekstraksjon

Behandle alle relevante bilder i en mappe:

foreach (string file in Directory.GetFiles("./forms", "*.jpg"))
{
    input.Add(file);
}

Steg 9: Et fullstendig eksempel

using Aspose.OCR;
using System;
using System.Collections.Generic;
using System.IO;

class Program
{
    static void Main(string[] args)
    {
        try
        {
            OcrInput input = new OcrInput(InputType.SingleImage);
            input.Add("scanned_invoice.png");
            input.Add("filled_form.jpg");

            RecognitionSettings settings = new RecognitionSettings();
            settings.DetectAreasMode = DetectAreasMode.TABLE;
            settings.Language = Language.English;

            AsposeOcr ocr = new AsposeOcr();
            List<RecognitionResult> results = ocr.Recognize(input, settings);

            foreach (RecognitionResult result in results)
            {
                result.Save("output_table.xlsx", SaveFormat.Xlsx);
                result.Save("output_table.json", SaveFormat.Json);
                result.Save("output_table.txt", SaveFormat.Text);
            }
        }
        catch (Exception ex)
        {
            Console.WriteLine($"Error: {ex.Message}");
        }
    }
}

Bruker tilfeller og applikasjoner

Fakturering og rapportering Automation

Utvinning av finansielle data for regnskap eller analyse.

Undersøkelser og registreringsskjemaer

Pull strukturerte svar for CRM, ERP eller BI systemer.

Overholdelse og revisjon

Automatisk utvinning og validering av data fra innsendte skjemaer eller tabeller.

Vanlige utfordringer og løsninger

Utfordring 1: Uregelmessige bordgrenser eller layouts

Løsning: Bruk forbehandling og prøvetunning for å forbedre oppdagelsen.

Utfordring 2: Blandt innhold (tekst og tabeller)

Løsning: Kjører med AUTO eller skiller etter bildetype for beste resultater.

Utfordring 3: Kompleks former med mange felt

Løsning: Test og tweak gjenkjenning for høyt tetthetsformer.

Performance vurderinger

  • Tabell gjenkjenning er mer CPU-intensiv; overvåking batch jobber
  • Validering av utganger for kritiske arbeidsflyter
  • Batch eksport for integrasjon med andre verktøy

Beste praksis

  • Validerer strukturerte data på prøver før skalering
  • Sikre og arkivere både kildebilder og utvinning
  • Oppdater Aspose.OCR regelmessig for nøyaktighetsbedringer
  • Tune innstillinger for nye dokument layouter

Avanserte scenarier

Scenario 1: Eksport til databaser eller BI-verktøy

// Use JSON or Excel export for integration with data pipelines

Scenario 2: Real-time ekstraksjon i webapper

// Integrate extraction logic into ASP.NET or workflow API

Conclusion

Aspose.OCR Table to Text for .NET gjør det mulig å automatisere strukturert datautvinning fra bilder og skjemaer, og støtter alt fra forretningsautomasjon til overholdelse og analyse.

For avanserte tabellekstraksjonsfunksjoner, besøk Aspose.OCR for .NET API Referanse .

 Norsk