Kā izņemt tabulas datus no attēliem ar Aspose.OCR

Kā izņemt tabulas datus no attēliem ar Aspose.OCR

Ar Aspose.OCR Tabula uz Tekstu .NET, jūs varat automātiski iegūt strukturētu tabulas datus no attēliem - ietaupot laiku, samazinot kļūdas, un ļauj bezjēdzīgu integrāciju ar datu bāzi, Excel, vai ziņošanas rīki.

Reālā pasaules problēma

Uzņēmumi bieži saņem tabulas rēķinā, ziņojumos vai veidlapās, piemēram, attēlus vai skenēšanas. Manuāli pārcelšana šos datus uz plašsaziņas līdzekļiem vai analīzes platformām ir neefektīva un kļūdaināmā, it īpaši lieliem apjomiem vai sarežģītām tabulām.

Risinājumu pārskats

Aspose.OCR Table to Text for .NET automatizē tabulas atpazīšanu un datu ekstrakciju no attēliem, precīzi identificējot šūnu struktūru un saturu.

Prerequisites

Pirms sākat, jums būs nepieciešams:

  • Visual Studio 2019 vai vēlāk
  • .NET 6.0 vai jaunāks (vai .Net Framework 4.6.2+)
  • Aspose.OCR par .NET no NuGet
  • C# zināšanas
PM> Install-Package Aspose.OCR

Step-by-step īstenošana

1. solis: Uzstādīt un konfigurēt Aspose.OCR

Pievienojiet Aspose.OCR paketi un iekļauj nepieciešamos nosaukuma telpas:

using Aspose.OCR;

2. solis: Sagatavojiet tabulas attēla ievadījumus

Pievienojiet vienu vai vairākus tabulas attēlus jūsu ievadīšanai. batch ekstrakcijai izmantojiet vairākas failus.

OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("table1.png");
input.Add("table2.jpg");

3. solis: Iestatīt tabulas atpazīšanas iestatījumus

Iegūstiet tabulas detekcijas režīmu, lai nodrošinātu, ka struktūra tiek precīzi atpazīta.

RecognitionSettings settings = new RecognitionSettings();
settings.DetectAreasMode = DetectAreasMode.TABLE;
settings.Language = Language.English; // Adjust if table contains non-English text

4. solis: Izveidojiet tabulas atpazīšanas procesu

Atzīt tabulas ar konfigurētiem iestatījumiem:

AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);

5. solis: Eksportēt un izmantot tabulas datus

Saglabājiet vai apstrādājiet atpazītos tabulas datus. Jūs varat eksportēt uz tekstu, Excel, JSON vai citiem formātiem.

foreach (RecognitionResult result in results)
{
    Console.WriteLine(result.RecognitionText); // Raw table as text
    result.Save("table.csv", SaveFormat.Csv); // Save as CSV
    result.Save("table.xlsx", SaveFormat.Xlsx); // Save as Excel
}

6. solis: pievienojiet kļūdu apstrādi

Pievienojiet izņēmuma apstrādi, lai izveidotu spēcīgus risinājumus.

try
{
    AsposeOcr ocr = new AsposeOcr();
    List<RecognitionResult> results = ocr.Recognize(input, settings);
    // further processing...
}
catch (Exception ex)
{
    Console.WriteLine($"Error: {ex.Message}");
}

7. solis: Optimizējiet kompleksas tabulas

  • Izmantojiet augstas izšķirtspējas skenēšanas/fotogrāfijas precīzam struktūras atklāšanai
  • Testēšana ar dažādiem galda izkārtojumiem (saistītās šūnas, vairāku līniju virsrakstis, robežas)
  • Tune atpazīšanas iestatījumi, kā nepieciešams
// Example: Add all images from a folder
foreach (string file in Directory.GetFiles("./tables", "*.png"))
{
    input.Add(file);
}

8. solis: pilns darba piemērs

using Aspose.OCR;
using System;
using System.Collections.Generic;

class Program
{
    static void Main(string[] args)
    {
        try
        {
            OcrInput input = new OcrInput(InputType.SingleImage);
            input.Add("table1.png");
            input.Add("table2.jpg");

            RecognitionSettings settings = new RecognitionSettings();
            settings.DetectAreasMode = DetectAreasMode.TABLE;
            settings.Language = Language.English;

            AsposeOcr ocr = new AsposeOcr();
            List<RecognitionResult> results = ocr.Recognize(input, settings);

            foreach (RecognitionResult result in results)
            {
                Console.WriteLine(result.RecognitionText);
                result.Save("table.csv", SaveFormat.Csv);
                result.Save("table.xlsx", SaveFormat.Xlsx);
            }
        }
        catch (Exception ex)
        {
            Console.WriteLine($"Error: {ex.Message}");
        }
    }
}

Izmantojiet gadījumus un pieteikumus

Finanšu pārskati un rēķini

Izveidojiet darījumu tabulas no attēliem Excel vai datubāzes sistēmās automātiski.

Pētniecība un analīze

Digitalizējiet tabulas no skenētiem publikācijām vai aptaujas veidlapām datu analīzei.

Automātiskā datu migrācija

Migrēt mantojuma dokumentus vai skenētus papīra ierakstus mūsdienu strukturētajos formātos.

Kopīgi izaicinājumi un risinājumi

1. izaicinājums: Blurry vai kompleksas tabulas attēli

Rīze: Izmantojiet skaidrākus attēlus vai eksperimentus ar priekšapstrādi, lai uzlabotu struktūras atpazīstamību.

2. izaicinājums: nestandarta galda izkārtojumi

Rīze: Pārbaudiet un pielāgojiet iestatījumus sarežģītām izkārtojumiem vai bez robežām.

3. izaicinājums: Lieli attēli vai sajauktie attēlu veidi

Lēmums: Izmanto kompleksa apstrādi un direktoriju skenēšanu, lai automātiski iegūtu no daudziem failiem.

Darbības apsvērumi

  • Izmantojiet labi apgaismotas, augstas kvalitātes attēlus
  • Batch process efektivitātes nodrošināšanai
  • OCR priekšmeti pēc lietošanas

Labākās prakses

  • Vienmēr validējiet eksportētos tabulas datus pirms turpmākas apstrādes
  • Preprocesijas attēli optimālai struktūras atklāšanai
  • Aizsargāt un kopēt oriģinālus skanējumus / attēlus
  • Izmantojiet pareizo eksporta formātu jūsu darba plūsmai (CSV, XLSX, JSON)

Augstākie scenāriji

1. scenārijs: Mixed-Language tabulas ekstrakcija

settings.Language = Language.Chinese;

Scenārija 2: Kombinācija tabula un teksta ekstrakcija

settings.DetectAreasMode = DetectAreasMode.COMBINE;

Conclusion

Aspose.OCR Table to Text for .NET pārvērš attēla tabulas strukturētiem, rediģējamiem datiem – nav nepieciešama manuāla ievade.

Lai iegūtu vairāk piemēru un tehnisko informāciju, apmeklējiet Aspose.OCR par .NET API atsauci .

 Latviski