Görüntülerdeki tablolar ve formlardan yapılandırılmış verileri nasıl çıkarılır

Görüntülerdeki tablolar ve formlardan yapılandırılmış verileri nasıl çıkarılır

Tarama tablolarından veya doldurulmuş formlardan veri çıkarmak, iş otomasyonu, raporlama ve uyumluluğu için gereklidir. .NET için Aspose.OCR Tablo to Text bu süreci hızlandırır, hücre ve alan yapısını doğru bir şekilde tespit eder ve düzenlenebilir biçimlere ihraç eder.

Gerçek Dünya Sorunları

İşletmeler genellikle faturalar, raporlar veya resimler veya taramalar olarak formlar alırlar. tablo verileri veya form alanlarının manuel girişleri yavaş, hataya dayanıklı ve ölçekte pahalıdır.

Çözüm Özetleri

.NET için Tablo-Teks ile, satırlar, sütunlar ve alan değerleri de dahil olmak üzere yapılandırılmış verileri doğrudan resimlerden çıkarabilirsiniz. sonuçlar Excel, JSON veya veritabanları ve otomasyon platformları ile entegre edilebilir.

Ön koşullar

  • Visual Studio 2019 veya sonraki
  • .NET 6.0 veya sonraki (veya .Net Framework 4.6.2+)
  • Aspose.OCR için .NET için NuGet
  • Temel C# Yetenekleri
PM> Install-Package Aspose.OCR

adım adım uygulama

Adım 1: Aspose.OCR yükleme ve ayarlayın

using Aspose.OCR;

Adım 2: Tablo veya form resimleri hazırlayın

OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("scanned_invoice.png");
input.Add("filled_form.jpg");

Adım 3: Tablolar / Formlar için Tanıma Ayarları ayarlayın

RecognitionSettings settings = new RecognitionSettings();
settings.DetectAreasMode = DetectAreasMode.TABLE; // or DetectAreasMode.FORM
settings.Language = Language.English;

Adım 4: Tablo veya form verilerini çıkarın

AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);

Adım 5: Yapılandırılmış ihracat

foreach (RecognitionResult result in results)
{
    result.Save("output_table.xlsx", SaveFormat.Xlsx); // Spreadsheet
    result.Save("output_table.json", SaveFormat.Json); // JSON
    result.Save("output_table.txt", SaveFormat.Text);  // Text
}

Adım 6: Hataları ele almak ve sonuçları doğrulamak

try
{
    AsposeOcr ocr = new AsposeOcr();
    List<RecognitionResult> results = ocr.Recognize(input, settings);
    // Further processing...
}
catch (Exception ex)
{
    Console.WriteLine($"Error: {ex.Message}");
}

Adım 7: Tablo / Şekil Değişiklikleri için Optimize

  • Farklı sınırları, yazı tipleri veya alan yerleri olan örnekler üzerinde test
  • En iyi tespit için önceden işleme ayarları

Adım 8: Otomatik Batch Ekstraksiyonu

Tüm ilgili resimleri bir klasörde işlemeyin:

foreach (string file in Directory.GetFiles("./forms", "*.jpg"))
{
    input.Add(file);
}

Adım 9: Tam Bir Örnek

using Aspose.OCR;
using System;
using System.Collections.Generic;
using System.IO;

class Program
{
    static void Main(string[] args)
    {
        try
        {
            OcrInput input = new OcrInput(InputType.SingleImage);
            input.Add("scanned_invoice.png");
            input.Add("filled_form.jpg");

            RecognitionSettings settings = new RecognitionSettings();
            settings.DetectAreasMode = DetectAreasMode.TABLE;
            settings.Language = Language.English;

            AsposeOcr ocr = new AsposeOcr();
            List<RecognitionResult> results = ocr.Recognize(input, settings);

            foreach (RecognitionResult result in results)
            {
                result.Save("output_table.xlsx", SaveFormat.Xlsx);
                result.Save("output_table.json", SaveFormat.Json);
                result.Save("output_table.txt", SaveFormat.Text);
            }
        }
        catch (Exception ex)
        {
            Console.WriteLine($"Error: {ex.Message}");
        }
    }
}

Cases ve Uygulamaları Kullanın

Hesaplama ve Raporlama Otomatikleştirme

Muhasebe veya analiz için finansal verileri çıkarın.

Soruşturma ve kayıt formları

CRM, ERP veya BI sistemleri için yapılandırılmış yanıtlar.

Uyumluluk ve Denetim

Gönderilen formlardan veya tablolardan verilerin otomatik olarak çıkarılması ve doğrulanması.

Toplu Sorunlar ve Çözümler

1. Sorun: Düzenlenmemiş masa sınırları veya düzenlemeler

** Çözüm:** Deteksiyonu iyileştirmek için ön işleme ve örnek tonlama kullanın.

Challenge 2: Mixed Content (Tekst ve Tablolar)

** Çözüm: ** En iyi sonuçlar için AUTO ile çalıştırın veya resim türüne göre ayrı yapın.

Challenge 3: Çok Alanlı Karmaşık Şekiller

** Çözüm: ** Yüksek yoğunluklu formlar için test ve tweak tanıma.

performans değerlendirmeleri

  • Masa tanıma daha CPU yoğun; monitör batch işleri
  • kritik çalışma akışları için geçerli çıkışlar
  • Batch ihracatı diğer araçlarla entegrasyon için

En İyi Uygulamalar

  • Örnekler üzerinde yapılandırılmış verileri ölçmeden önce doğrulayın
  • Güvenli ve hem kaynak görüntüleri hem de elde edilen çıkışları arşivle
  • Doğruluk geliştirmeleri için Aspose.OCR’yi düzenli olarak güncelleyin
  • Yeni belge düzenlemeleri için Tune ayarları

Gelişmiş Senaryolar

Senaryo 1: Veritabanına veya BI Araçlarına İhracat

// Use JSON or Excel export for integration with data pipelines

Senaryo 2: Web Uygulamalarında Gerçek Zamanlı Ekstraksiyon

// Integrate extraction logic into ASP.NET or workflow API

Sonuç

Aspose.OCR Tablo to Text for .NET, iş otomasyonundan uyumluluk ve analize kadar her şeyi destekleyen resimlerden ve formlardan yapılandırılmış veri çıkarımını otomatikleştirmenizi sağlar.

Gelişmiş tablo ekstraksiyon özellikleri için, ziyaret Aspose.OCR .NET API Referans için .

 Türkçe