Hogyan lehet kivonni az asztali adatokat a képekből Aspose.OCR

Hogyan lehet kivonni az asztali adatokat a képekből Aspose.OCR

Az Aspose.OCR Table to Text for .NET segítségével automatizálhatja a strukturált táblázati adatok kivonását a képekből – időt takarít meg, csökkenti a hibákat, és lehetővé teszi az adatbázisokkal, az Excel-vel vagy a jelentési eszközökkel való szűk integrációt.

Valódi problémák

A vállalkozások gyakran kapnak táblákat számlákban, jelentésekben vagy formanyomtatványokban, mint például képek vagy szkennelések. Az adatok kézi újbóli beillesztése a lapokba vagy az elemzési platformokra hatástalan és hibás, különösen a nagy mennyiségű vagy összetett táplálékok esetében.

megoldás áttekintése

Az ASPOSE.OCR Table to Text for .NET automatizálja a táblázat felismerését és az adatok kivonását a képekből, pontosan azonosítva a sejt szerkezetét és tartalmát. Ez lehetővé teszi, hogy a szkennelt vagy fényképezett tábukat strukturált, kereshető és szerkeszthető formátumokká alakítson minimális kódmal.

előfeltételek

Mielőtt elkezdené, szüksége lesz:

  • Visual Studio 2019 vagy újabb
  • .NET 6.0 vagy újabb (vagy .Net Framework 4.6.2+)
  • ASPOSE.OCR for .NET a NuGet-ről
  • Alapvető C# tudás
PM> Install-Package Aspose.OCR

lépésről lépésre megvalósítás

1. lépés: Az Aspose.OCR telepítése és konfigurálása

Adja meg az Aspose.OCR csomagot, és tartalmazza a szükséges névterületeket:

using Aspose.OCR;

2. lépés: Készítse el az asztali képbevételt

Hozzáadjon egy vagy több táblázati képet a bejegyzéshez. a csomag kivonásához használjon több fájlt.

OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("table1.png");
input.Add("table2.jpg");

3. lépés: Állítsa be az asztali felismerési beállításokat

Az asztali érzékelési mód lehetővé teszi, hogy a szerkezet pontosan felismerhető legyen.

RecognitionSettings settings = new RecognitionSettings();
settings.DetectAreasMode = DetectAreasMode.TABLE;
settings.Language = Language.English; // Adjust if table contains non-English text

4. lépés: Végezze el az asztali felismerési folyamatot

Ismerje meg a táblákat a konfigurált beállításokkal:

AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);

5. lépés: Táblázati adatok exportálása és felhasználása

Az elismert táblázati adatok mentése vagy feldolgozása. szöveg, Excel, JSON vagy más formátumokba exportálható.

foreach (RecognitionResult result in results)
{
    Console.WriteLine(result.RecognitionText); // Raw table as text
    result.Save("table.csv", SaveFormat.Csv); // Save as CSV
    result.Save("table.xlsx", SaveFormat.Xlsx); // Save as Excel
}

6. lépés: Hibaelhárítás hozzáadása

Hozzáadjuk a kivételes kezelést a robusztus megoldások létrehozásához.

try
{
    AsposeOcr ocr = new AsposeOcr();
    List<RecognitionResult> results = ocr.Recognize(input, settings);
    // further processing...
}
catch (Exception ex)
{
    Console.WriteLine($"Error: {ex.Message}");
}

7. lépés: Optimalizálja a komplex táblázatokat

  • Használjon nagy felbontású szkennelést/fotókat a pontos szerkezeti felismeréshez
  • Teszt a különböző asztali elrendezésekkel (összekapcsolt sejtek, több vonalos fejjelek, határok)
  • Szükség esetén a felismerési beállításokat
// Example: Add all images from a folder
foreach (string file in Directory.GetFiles("./tables", "*.png"))
{
    input.Add(file);
}

8. lépés: A teljes munka példája

using Aspose.OCR;
using System;
using System.Collections.Generic;

class Program
{
    static void Main(string[] args)
    {
        try
        {
            OcrInput input = new OcrInput(InputType.SingleImage);
            input.Add("table1.png");
            input.Add("table2.jpg");

            RecognitionSettings settings = new RecognitionSettings();
            settings.DetectAreasMode = DetectAreasMode.TABLE;
            settings.Language = Language.English;

            AsposeOcr ocr = new AsposeOcr();
            List<RecognitionResult> results = ocr.Recognize(input, settings);

            foreach (RecognitionResult result in results)
            {
                Console.WriteLine(result.RecognitionText);
                result.Save("table.csv", SaveFormat.Csv);
                result.Save("table.xlsx", SaveFormat.Xlsx);
            }
        }
        catch (Exception ex)
        {
            Console.WriteLine($"Error: {ex.Message}");
        }
    }
}

Esetek és alkalmazások használata

Pénzügyi jelentések és számlák

A tranzakciós táblák kivonása a képekből az Excel vagy az adatbázis rendszerekbe automatikusan.

Kutatás és elemzés

Digitalizálja az adatelemzés céljából a szkennelt publikációkból vagy felmérési űrlapokból származó táblákat.

Automatizált adatmigráció

Emigrálj öröklési dokumentumokat vagy szkennelt papírkönyvek a modern strukturált formátumokba.

Közös kihívások és megoldások

1. kihívás: Blurry vagy komplex asztali képek

** Megoldás:** A strukturális felismerés javítása érdekében használjon egyértelműbb képeket vagy kísérleteket az előfeldolgozással.

2. kihívás: Nem szabványos asztali elrendezések

** Megoldás:** Tesztelje és módosítsa a beállításokat a bonyolult elrendezésekhez vagy a határok nélküli táblákhoz.

3. kihívás: Big Batches vagy vegyes képtípusok

** Megoldás:** Használja a készletfeldolgozást és a katalógus szkennelését, hogy automatizálja a kivonatot sok fájlból.

A teljesítmény megfontolása

  • Használjon jól fényes, magas színű képeket
  • Batch folyamat a hatékonyságért
  • Az OCR objektumok használata után

Legjobb gyakorlatok

  • Mindig érvényesítse az exportált táblázatadatokat a további feldolgozás előtt
  • Az optimális szerkezeti felismerés előkészítése
  • Biztonságos és biztonsági mentés eredeti szkennelések / képek
  • Használja a megfelelő export formátumot a munkafolyamathoz (CSV, XLSX, JSON)

fejlett forgatókönyvek

1. forgatókönyv: Mixed-Language Table Extraction

settings.Language = Language.Chinese;

2. forgatókönyv: A táblázat és a szöveg kivonása kombinálása

settings.DetectAreasMode = DetectAreasMode.COMBINE;

következtetések

Az ASPOSE.OCR Table to Text for .NET átalakítja a képmappákat strukturált, szerkeszthető adatokká – nincs kézi bejegyzés szükséges. gyorsabb pénzügyi jelentések, elemzések és digitális archívumok pontos, automatizált táblázatok kivonásával.

További példák és technikai részletekért látogasson el a Az ASPOSE.OCR a .NET API referenciájához .

 Magyar