Kuinka poistaa taulukoita ja taulukon tietoja kuvista Aspose.OCR:llä

Kuinka poistaa taulukoita ja taulukon tietoja kuvista Aspose.OCR:llä

Taulukkojen poisto kuvien, lomakkeiden tai skannattujen raporttien on haastavaa – manuaalinen retyping on hidasta ja virheellistä. Aspose.OCR Table to Text for .NET automaattisesti poistaa ja rakentaa taulukon tietoja kuvista ja valokuvista.

Reaalimaailman ongelma

Rahoitusilmoitukset, kyselylomakkeet ja tieteelliset tulokset jäävät usein salattuihin taulukoihin tai kuviin. Manuaalisesti tämän tiedon palauttaminen tuhlaa tunteja ja riskejä virheitä.

Ratkaisun yleiskatsaus

Aspose.OCR for .NET voi tarkkaan havaita, poistaa ja muuntaa taulukoita kuvissa tai skannattujen PDF-tiedostojen koneellisesti luettavissa muodossa – täydellinen Excelin, raportoinnin tai työnkulun automaatioon.

edellytykset

  • Visual Studio 2019 tai uudempi
  • .NET 6.0 tai uudempi (tai .Net Framework 4.6.2+)
  • ASPOSE.OCR for .NET alkaen NuGet
  • Perustiedot C#
PM> Install-Package Aspose.OCR

Vaiheittainen toteutus

Vaihe 1: Asenna ja asenna Aspose.OCR

using Aspose.OCR;

Vaihe 2: Tarkista tai valokuvata kuvia, jotka sisältävät taulukoita

OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("table1.jpg");
input.Add("report_page.png");

Vaihe 3: Määritä taulukon tunnistusasetukset

RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.TABLE; // Key for tables

Vaihe 4: Käynnistä pöytäkierroksen prosessi

AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);

Vaihe 5: Vienti taulukon tiedot

foreach (RecognitionResult result in results)
{
    result.Save("table_data.xlsx", SaveFormat.Xlsx); // Excel output
    result.Save("table_data.csv", SaveFormat.Csv);   // CSV output
    result.Save("table_data.txt", SaveFormat.Text);  // Plain text output
}

Vaihe 6: Lisää virheen käsittely ja validointi

try
{
    AsposeOcr ocr = new AsposeOcr();
    List<RecognitionResult> results = ocr.Recognize(input, settings);
    // Further processing
}
catch (Exception ex)
{
    Console.WriteLine($"Error: {ex.Message}");
}

Vaihe 7: Optimoi monimutkaisia, pyöristettyjä tai monipuolisia taulukoita

  • Ennaltaehkäisevät kuvat deskew tai crop
  • Käytä korkean resoluution skannauksia tai valokuvia
  • Useiden sivujen PDF-tiedostojen osalta lisää jokainen sivu erillisenä tuloksena
foreach (string file in Directory.GetFiles("./scans", "*.png"))
{
    input.Add(file);
}

Vaihe 8: Täydellinen esimerkki

using Aspose.OCR;
using System;
using System.Collections.Generic;

class Program
{
    static void Main(string[] args)
    {
        try
        {
            OcrInput input = new OcrInput(InputType.SingleImage);
            input.Add("table1.jpg");
            input.Add("report_page.png");

            RecognitionSettings settings = new RecognitionSettings();
            settings.Language = Language.English;
            settings.DetectAreasMode = DetectAreasMode.TABLE;

            AsposeOcr ocr = new AsposeOcr();
            List<RecognitionResult> results = ocr.Recognize(input, settings);

            foreach (RecognitionResult result in results)
            {
                result.Save("table_data.xlsx", SaveFormat.Xlsx);
                result.Save("table_data.csv", SaveFormat.Csv);
                result.Save("table_data.txt", SaveFormat.Text);
            }
        }
        catch (Exception ex)
        {
            Console.WriteLine($"Error: {ex.Message}");
        }
    }
}

Käytä tapauksia ja sovelluksia

Taloudellinen ja tieteellinen raportointi

Poista taulukot tilinpäätöksistä, laboratoriotuloksista tai tutkimuspapereista välitöntä analyysiä varten Excelissa.

Tutkimus ja muoto käsittely

Digitoi taulukoita skannatuista lomakkeista, tarkastusluetteloista tai laskutusrekistereistä.

Työnkulun automaatio

Tuoda rakenteelliset taulukon tiedot suoraan yrityksesi sovelluksiin, BI-työkaluihin tai tietokantoihin.

Yhteiset haasteet ja ratkaisut

Haaste 1: Huonolaatuinen tai monimutkainen taulukot

** Ratkaisu:** Käytä korkeatasoisia kuvia ja testaa näytönohjaimia.

Haaste 2: Pyöreät tai kierrätetyt pöydät

** Ratkaisu:** Deskew kuvia ennen käsittelyä; käytä DetectAreasMode.TABLE.

Haaste 3: Monivuotiset raportit

** Ratkaisu:** Lisää kunkin sivun erillisenä sisällönä pakettikäsittelyyn.

suorituskyvyn huomioon ottaminen

  • Batch prosessi nopeuteen
  • Käytä laadukkaita skannauksia / valokuvia
  • OCR-objektien käyttöönotto suurien juoksujen jälkeen

Parhaat käytännöt

  • Tuotannon validointi ennen integraatiota
  • Tune taulukon tunnistusasetukset tarvittaessa
  • Alkuperäiset ja digitoidut tiedot
  • Testaa todellisia näytteitä ennen käyttöönottoa

Edistyneet skenaariot

Käsikirja 1: Monikielinen pöytäkäyttö

settings.Language = Language.German;

Skenaario 2: JSON:n vienti tietolähteille

foreach (RecognitionResult result in results)
{
    result.Save("table_data.json", SaveFormat.Json);
}

johtopäätöksiä

Aspose.OCR Table to Text for .NET muuttaa kuvia ja skannauksia toimivaan, rakenteelliseen taulukon tietoon – valmis analyysiin, raportointiin ja automaatioon.

Katso lisää taulukon tunnistuskoodin näytteitä ASPOSE.OCR .NET API-referenssille .

 Suomi