Hogyan lehet kivonni a táblázatokat és az adatokat a képekből az Aspose.OCR segítségével

Hogyan lehet kivonni a táblázatokat és az adatokat a képekből az Aspose.OCR segítségével

A képekből, űrlapokból vagy szkennelt jelentésekből származó táblák kivonása kihívást jelent – a kézi retyping lassú és hibaellenes.A Aspose.OCR Table to Text for .NET automatizálja a tablettadatok kivonatát és szerkezetét a képektől és a fotóktól.

Valódi problémák

Pénzügyi beszámolók, felmérési formanyomtatványok és tudományos eredmények gyakran elkapják a szkennelt táblákban vagy képekben. kézi visszaállítása ezeket az adatokat időt veszít, és a hibák bevezetésének kockázata.

megoldás áttekintése

Az ASPOSE.OCR for .NET pontosan felismerheti, kivonhatja és átalakíthatja a képekből vagy szkennelt PDF-kból származó táblákat gépi olvasható formátumokba – tökéletes az Excel, a jelentés vagy a munkafolyamat automatizálásához.

előfeltételek

  • Visual Studio 2019 vagy újabb
  • .NET 6.0 vagy újabb (vagy .Net Framework 4.6.2+)
  • ASPOSE.OCR for .NET a NuGet-ről
  • Alapvető C# tudás
PM> Install-Package Aspose.OCR

lépésről lépésre megvalósítás

1. lépés: Az Aspose.OCR telepítése és konfigurálása

using Aspose.OCR;

2. lépés: A táblázatokat tartalmazó képek szkennelése vagy fényképezése

OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("table1.jpg");
input.Add("report_page.png");

3. lépés: Állítsa be az asztali felismerési beállításokat

RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.TABLE; // Key for tables

4. lépés: Végezze el az asztali kivonási folyamatot

AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);

5. lépés: Export táblázat adatai

foreach (RecognitionResult result in results)
{
    result.Save("table_data.xlsx", SaveFormat.Xlsx); // Excel output
    result.Save("table_data.csv", SaveFormat.Csv);   // CSV output
    result.Save("table_data.txt", SaveFormat.Text);  // Plain text output
}

6. lépés: Hibaelhárítás és validáció hozzáadása

try
{
    AsposeOcr ocr = new AsposeOcr();
    List<RecognitionResult> results = ocr.Recognize(input, settings);
    // Further processing
}
catch (Exception ex)
{
    Console.WriteLine($"Error: {ex.Message}");
}

7. lépés: Optimalizálja a komplex, forgatott vagy többoldalú táblázatokat

  • Preprocess képek deskew vagy crop
  • Használjon nagy felbontású szkennelést vagy fényképeket
  • A többoldalú PDF-k esetében adja meg az egyes oldalakat külön bevitellé
foreach (string file in Directory.GetFiles("./scans", "*.png"))
{
    input.Add(file);
}

8. lépés: Teljes példa

using Aspose.OCR;
using System;
using System.Collections.Generic;

class Program
{
    static void Main(string[] args)
    {
        try
        {
            OcrInput input = new OcrInput(InputType.SingleImage);
            input.Add("table1.jpg");
            input.Add("report_page.png");

            RecognitionSettings settings = new RecognitionSettings();
            settings.Language = Language.English;
            settings.DetectAreasMode = DetectAreasMode.TABLE;

            AsposeOcr ocr = new AsposeOcr();
            List<RecognitionResult> results = ocr.Recognize(input, settings);

            foreach (RecognitionResult result in results)
            {
                result.Save("table_data.xlsx", SaveFormat.Xlsx);
                result.Save("table_data.csv", SaveFormat.Csv);
                result.Save("table_data.txt", SaveFormat.Text);
            }
        }
        catch (Exception ex)
        {
            Console.WriteLine($"Error: {ex.Message}");
        }
    }
}

Esetek és alkalmazások használata

Pénzügyi és tudományos jelentések

A pénzügyi jelentésekből, a laboratóriumi eredményekből vagy a kutatási dokumentumokból származó táblákat azonnali elemzéshez az Excelben.

A felmérés és a formafeldolgozás

Digitalizálja a táblákat a szkennelt űrlapokból, ellenőrzési listákból vagy a cenzúra nyilvántartásokból.

munkafolyamat automatizálása

A strukturált táblázatadatokat közvetlenül az üzleti alkalmazásokba, a BI-eszközökbe vagy az adatbázisokba helyezzük.

Közös kihívások és megoldások

1. kihívás: rossz minőségű vagy összetett táblák

** Megoldás:** Használja a magas színű képeket és tesztelje a mintakészleteket.

2. kihívás: forgatott vagy törött táblák

** Megoldás:** A képek feldolgozását megelőzően letöltése; használja a DetectAreasMode.TABLE-t.

3. kihívás: többoldalú jelentések

** Megoldás:** Adja meg az egyes oldalakat egy külön bevitellel a csomagfeldolgozáshoz.

A teljesítmény megfontolása

  • Batch a sebességért
  • Kiváló minőségű szkennelések/fotók
  • OCR tárgyak rendelkezésre állása nagy futások után

Legjobb gyakorlatok

  • Megerősítse az integráció előtti eredményt
  • Tune táblázat felismerési beállítások szükség szerint
  • Az eredeti és digitalizált adatok mentése
  • Tesztelés valós mintákkal a telepítés előtt

fejlett forgatókönyvek

1. forgatókönyv: Többnyelvű asztali kivonás

settings.Language = Language.German;

2. forgatókönyv: export JSON adatcsövekhez

foreach (RecognitionResult result in results)
{
    result.Save("table_data.json", SaveFormat.Json);
}

következtetések

Az ASPOSE.OCR Table to Text for .NET átalakítja a képeket és a szkennelést működőképes, strukturált táblázati adatokká – kész elemzésre, jelentésre és automatizálásra.

Lásd több táblázatfelismerési kód mintákat a Az ASPOSE.OCR a .NET API referenciájához .

 Magyar