Tablolar ve tablo verileri Aspose.OCR ile resimlerden nasıl çıkarılır

Tablolar ve tablo verileri Aspose.OCR ile resimlerden nasıl çıkarılır

Tabloların görüntülerden, formlardan veya taranan raporlardan çıkarılması zor – manuel retyping yavaş ve hataya dayanıklıdır. Aspose.OCR Tablo to Text for .NET tablo verilerinin görüntüleri ve fotoğraflardan elde edilmesini ve yapılandırılmasını otomatikleştirir.

Gerçek Dünya Sorunları

Finansal raporlar, anket formları ve bilimsel sonuçlar genellikle taranan tablolarda veya resimlerde sıkışır. bu verileri manuel olarak yeniden oluşturmak saatleri kaybeder ve hataları ortaya çıkarma riski vardır.

Çözüm Özetleri

Aspose.OCR for .NET, görüntülerden veya taramalı PDF’lerden tabloları makine okunabilir biçimlere doğru bir şekilde tespit edebilir, çıkarabilir ve dönüştürebilir - Excel, raporlama veya çalışma akışının otomatikleştirilmesi için mükemmel.

Ön koşullar

  • Visual Studio 2019 veya sonraki
  • .NET 6.0 veya sonraki (veya .Net Framework 4.6.2+)
  • Aspose.OCR için .NET için NuGet
  • Temel C# Bilgisi
PM> Install-Package Aspose.OCR

adım adım uygulama

Adım 1: Aspose.OCR yükleme ve ayarlayın

using Aspose.OCR;

Adım 2: Tabloları içeren görüntüleri tarayın veya fotoğraflayın

OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("table1.jpg");
input.Add("report_page.png");

Adım 3: Tablo Tanıma Ayarları ayarlayın

RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.TABLE; // Key for tables

Adım 4: Masa çıkarma işlemi çalıştırın

AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);

Adım 5: İhracat tablosu verileri

foreach (RecognitionResult result in results)
{
    result.Save("table_data.xlsx", SaveFormat.Xlsx); // Excel output
    result.Save("table_data.csv", SaveFormat.Csv);   // CSV output
    result.Save("table_data.txt", SaveFormat.Text);  // Plain text output
}

Adım 6: Hata işleme ve doğrulama ekleyin

try
{
    AsposeOcr ocr = new AsposeOcr();
    List<RecognitionResult> results = ocr.Recognize(input, settings);
    // Further processing
}
catch (Exception ex)
{
    Console.WriteLine($"Error: {ex.Message}");
}

Adım 7: Kompleks, döndürülmüş veya çok sayfalık tablolar için optimizasyon

  • Görüntüleri decew veya crop için önceden işleme
  • Yüksek çözünürlüklü tarama veya fotoğraf kullanın
  • Çok sayfalık PDF’ler için, her sayfa ayrı bir giriş olarak ekleyin
foreach (string file in Directory.GetFiles("./scans", "*.png"))
{
    input.Add(file);
}

Adım 8: Tam Bir Örnek

using Aspose.OCR;
using System;
using System.Collections.Generic;

class Program
{
    static void Main(string[] args)
    {
        try
        {
            OcrInput input = new OcrInput(InputType.SingleImage);
            input.Add("table1.jpg");
            input.Add("report_page.png");

            RecognitionSettings settings = new RecognitionSettings();
            settings.Language = Language.English;
            settings.DetectAreasMode = DetectAreasMode.TABLE;

            AsposeOcr ocr = new AsposeOcr();
            List<RecognitionResult> results = ocr.Recognize(input, settings);

            foreach (RecognitionResult result in results)
            {
                result.Save("table_data.xlsx", SaveFormat.Xlsx);
                result.Save("table_data.csv", SaveFormat.Csv);
                result.Save("table_data.txt", SaveFormat.Text);
            }
        }
        catch (Exception ex)
        {
            Console.WriteLine($"Error: {ex.Message}");
        }
    }
}

Cases ve Uygulamaları Kullanın

Finansal ve Bilimsel Raporlama

Excel’de anlık analiz için finansal raporlardan, laboratuvar sonuçlarından veya araştırma belgelerinden tablolar çıkarın.

Soruşturma ve Form İşleme

Tabloları taran formlardan, kontrol listelerinden veya inceleme kayıtlarından dijitalleştirin.

Workflow Otomatik

Yapılandırılmış tablo verilerini doğrudan iş uygulamalarınıza, BI araçlarına veya veritabanlarına aktarın.

Toplu Sorunlar ve Çözümler

Challenge 1: Kötü Kalite veya Karmaşık Tablolar

Çözüm: Yüksek çözünürlüklü görüntüleri kullanın ve örnek setleri üzerinde test edin.

2. Çabalar: Yürüyen veya döndürülen tablolar

** Çözüm:** İşleme başlamadan önce resimleri kaydırın; DetectAreasMode.TABLE kullanın.

Challenge 3: Çok sayfalık raporlar

** Çözüm:** Her sayfayı paket işleme için ayrı bir giriş olarak ekleyin.

performans değerlendirmeleri

  • Hız için Batch Süreci
  • Yüksek kaliteli tarama / fotoğraf kullanın
  • Büyük sürüşlerden sonra OCR nesnelerinin mevcut olması

En İyi Uygulamalar

  • Entegre edilmeden önce üretimi doğrulayın
  • Tune tablo tanıma ayarları gerektiğinde
  • Orijinal ve dijital verileri yedekleme
  • Kullanmadan önce gerçek örnekler ile test

Gelişmiş Senaryolar

Senaryo 1: Çok dilli masa ekstraksiyonu

settings.Language = Language.German;

2. Senaryo: JSON’a veri boruları için ihracat

foreach (RecognitionResult result in results)
{
    result.Save("table_data.json", SaveFormat.Json);
}

Sonuç

Aspose.OCR Tablo to Text for .NET görüntüleri ve taramaları etkinleştirilebilir, yapılandırılmış tablo verilerine dönüştürür - analiz, raporlama ve otomasyon için hazır.

Daha fazla tablo tanıma kodu örnekleri görüntüle Aspose.OCR .NET API Referans için .

 Türkçe