Kuinka poistaa taulukoita ja taulukon tietoja kuvista Aspose.OCR:llä
Taulukkojen poisto kuvien, lomakkeiden tai skannattujen raporttien on haastavaa – manuaalinen retyping on hidasta ja virheellistä. Aspose.OCR Table to Text for .NET automaattisesti poistaa ja rakentaa taulukon tietoja kuvista ja valokuvista.
Reaalimaailman ongelma
Rahoitusilmoitukset, kyselylomakkeet ja tieteelliset tulokset jäävät usein salattuihin taulukoihin tai kuviin. Manuaalisesti tämän tiedon palauttaminen tuhlaa tunteja ja riskejä virheitä.
Ratkaisun yleiskatsaus
Aspose.OCR for .NET voi tarkkaan havaita, poistaa ja muuntaa taulukoita kuvissa tai skannattujen PDF-tiedostojen koneellisesti luettavissa muodossa – täydellinen Excelin, raportoinnin tai työnkulun automaatioon.
edellytykset
- Visual Studio 2019 tai uudempi
- .NET 6.0 tai uudempi (tai .Net Framework 4.6.2+)
- ASPOSE.OCR for .NET alkaen NuGet
- Perustiedot C#
PM> Install-Package Aspose.OCR
Vaiheittainen toteutus
Vaihe 1: Asenna ja asenna Aspose.OCR
using Aspose.OCR;
Vaihe 2: Tarkista tai valokuvata kuvia, jotka sisältävät taulukoita
OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("table1.jpg");
input.Add("report_page.png");
Vaihe 3: Määritä taulukon tunnistusasetukset
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.TABLE; // Key for tables
Vaihe 4: Käynnistä pöytäkierroksen prosessi
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
Vaihe 5: Vienti taulukon tiedot
foreach (RecognitionResult result in results)
{
result.Save("table_data.xlsx", SaveFormat.Xlsx); // Excel output
result.Save("table_data.csv", SaveFormat.Csv); // CSV output
result.Save("table_data.txt", SaveFormat.Text); // Plain text output
}
Vaihe 6: Lisää virheen käsittely ja validointi
try
{
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
// Further processing
}
catch (Exception ex)
{
Console.WriteLine($"Error: {ex.Message}");
}
Vaihe 7: Optimoi monimutkaisia, pyöristettyjä tai monipuolisia taulukoita
- Ennaltaehkäisevät kuvat deskew tai crop
- Käytä korkean resoluution skannauksia tai valokuvia
- Useiden sivujen PDF-tiedostojen osalta lisää jokainen sivu erillisenä tuloksena
foreach (string file in Directory.GetFiles("./scans", "*.png"))
{
input.Add(file);
}
Vaihe 8: Täydellinen esimerkki
using Aspose.OCR;
using System;
using System.Collections.Generic;
class Program
{
static void Main(string[] args)
{
try
{
OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("table1.jpg");
input.Add("report_page.png");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.TABLE;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
foreach (RecognitionResult result in results)
{
result.Save("table_data.xlsx", SaveFormat.Xlsx);
result.Save("table_data.csv", SaveFormat.Csv);
result.Save("table_data.txt", SaveFormat.Text);
}
}
catch (Exception ex)
{
Console.WriteLine($"Error: {ex.Message}");
}
}
}
Käytä tapauksia ja sovelluksia
Taloudellinen ja tieteellinen raportointi
Poista taulukot tilinpäätöksistä, laboratoriotuloksista tai tutkimuspapereista välitöntä analyysiä varten Excelissa.
Tutkimus ja muoto käsittely
Digitoi taulukoita skannatuista lomakkeista, tarkastusluetteloista tai laskutusrekistereistä.
Työnkulun automaatio
Tuoda rakenteelliset taulukon tiedot suoraan yrityksesi sovelluksiin, BI-työkaluihin tai tietokantoihin.
Yhteiset haasteet ja ratkaisut
Haaste 1: Huonolaatuinen tai monimutkainen taulukot
** Ratkaisu:** Käytä korkeatasoisia kuvia ja testaa näytönohjaimia.
Haaste 2: Pyöreät tai kierrätetyt pöydät
** Ratkaisu:** Deskew kuvia ennen käsittelyä; käytä DetectAreasMode.TABLE.
Haaste 3: Monivuotiset raportit
** Ratkaisu:** Lisää kunkin sivun erillisenä sisällönä pakettikäsittelyyn.
suorituskyvyn huomioon ottaminen
- Batch prosessi nopeuteen
- Käytä laadukkaita skannauksia / valokuvia
- OCR-objektien käyttöönotto suurien juoksujen jälkeen
Parhaat käytännöt
- Tuotannon validointi ennen integraatiota
- Tune taulukon tunnistusasetukset tarvittaessa
- Alkuperäiset ja digitoidut tiedot
- Testaa todellisia näytteitä ennen käyttöönottoa
Edistyneet skenaariot
Käsikirja 1: Monikielinen pöytäkäyttö
settings.Language = Language.German;
Skenaario 2: JSON:n vienti tietolähteille
foreach (RecognitionResult result in results)
{
result.Save("table_data.json", SaveFormat.Json);
}
johtopäätöksiä
Aspose.OCR Table to Text for .NET muuttaa kuvia ja skannauksia toimivaan, rakenteelliseen taulukon tietoon – valmis analyysiin, raportointiin ja automaatioon.
Katso lisää taulukon tunnistuskoodin näytteitä ASPOSE.OCR .NET API-referenssille .