Tablo verilerini Aspose.OCR ile resimlerden nasıl çıkarılır

Tablo verilerini Aspose.OCR ile resimlerden nasıl çıkarılır

Tabloların taran veya fotoğraflanan görüntülerden çıkarılması genellikle manuel, hataya dayalı bir süreçtir. .NET için Aspose.OCR Tablo to Text ile, yapılandırılmış tablo verilerinin görüntülerden çıkarılmasını otomatik hale getirebilirsiniz - zaman tasarrufu, hata azaltma ve veritabanları, Excel veya raporlama araçları ile çarpıcı bir entegrasyon sağlar.

Gerçek Dünya Sorunları

İşletmeler genellikle faturalarda, raporlarda veya resimler veya taramalar gibi formlarda tablolar alırlar. bu verileri manuel olarak spreadsheets veya analitik platformlara yeniden yerleştirmek, özellikle büyük hacimler veya karmaşık tablalar için etkisiz ve hataya neden olur.

Çözüm Özetleri

Aspose.OCR Tablo to Text for .NET tablo tanımını ve resimlerden veri çıkarmasını otomatikleştirir, hücre yapısını ve içeriğini doğru bir şekilde tanımlar. Bu, taranan veya fotoğraflanan tabloları en az kod ile yapılandırılmış, arama ve düzenlenebilir biçimlere dönüştürmenize olanak tanır.

Ön koşullar

Başlamadan önce şunlara ihtiyacınız olacak:

  • Visual Studio 2019 veya sonraki
  • .NET 6.0 veya sonraki (veya .Net Framework 4.6.2+)
  • Aspose.OCR için .NET için NuGet
  • Temel C# Bilgisi
PM> Install-Package Aspose.OCR

adım adım uygulama

Adım 1: Aspose.OCR yükleme ve ayarlayın

Aspose.OCR paketini ekleyin ve gerekli isim alanlarını içerir:

using Aspose.OCR;

Adım 2: Tablo Görüntüleri Girişleri Hazırlayın

Bir veya daha fazla tablo görüntüsünü girişinize ekleyin. batch çıkarmak için, birden fazla dosyayı kullanın.

OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("table1.png");
input.Add("table2.jpg");

Adım 3: Tablo Tanıma Ayarları ayarlayın

Yapının doğru bir şekilde tanınmasını sağlamak için masa algılama modunu etkinleştirin.

RecognitionSettings settings = new RecognitionSettings();
settings.DetectAreasMode = DetectAreasMode.TABLE;
settings.Language = Language.English; // Adjust if table contains non-English text

Adım 4: Tablo Tanıma Süreci Başlatın

Tabloları yapılandırılmış ayarlarla tanımlayın:

AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);

Adım 5: Tablo verilerini ihraç etmek ve kullanmak

Tanıdık tablo verilerini kaydedin veya işleyebilirsiniz. metin, Excel, JSON veya diğer biçimlere ihraç edebilirsiniz.

foreach (RecognitionResult result in results)
{
    Console.WriteLine(result.RecognitionText); // Raw table as text
    result.Save("table.csv", SaveFormat.Csv); // Save as CSV
    result.Save("table.xlsx", SaveFormat.Xlsx); // Save as Excel
}

6. Adım: Hatayı Çözmek

Güçlü çözümler oluşturmak için istisna işleme ekleyin.

try
{
    AsposeOcr ocr = new AsposeOcr();
    List<RecognitionResult> results = ocr.Recognize(input, settings);
    // further processing...
}
catch (Exception ex)
{
    Console.WriteLine($"Error: {ex.Message}");
}

Adım 7: Karmaşık tablolar için optimizasyon

  • Yüksek çözünürlüklü tarama/fotoğrafları doğru yapı tespiti için kullanın
  • Çeşitli masa düzenleri ile test (karışık hücreler, çok çizgi başlıklar, sınırlar)
  • İhtiyaç duyulduğunda Tune tanıma ayarları
// Example: Add all images from a folder
foreach (string file in Directory.GetFiles("./tables", "*.png"))
{
    input.Add(file);
}

Adım 8: Tam Çalışma Örneği

using Aspose.OCR;
using System;
using System.Collections.Generic;

class Program
{
    static void Main(string[] args)
    {
        try
        {
            OcrInput input = new OcrInput(InputType.SingleImage);
            input.Add("table1.png");
            input.Add("table2.jpg");

            RecognitionSettings settings = new RecognitionSettings();
            settings.DetectAreasMode = DetectAreasMode.TABLE;
            settings.Language = Language.English;

            AsposeOcr ocr = new AsposeOcr();
            List<RecognitionResult> results = ocr.Recognize(input, settings);

            foreach (RecognitionResult result in results)
            {
                Console.WriteLine(result.RecognitionText);
                result.Save("table.csv", SaveFormat.Csv);
                result.Save("table.xlsx", SaveFormat.Xlsx);
            }
        }
        catch (Exception ex)
        {
            Console.WriteLine($"Error: {ex.Message}");
        }
    }
}

Cases ve Uygulamaları Kullanın

Finansal Raporlar ve Faturalar

Görüntülerden işlem tablolarını otomatik olarak Excel veya veritabanı sistemlerine çıkarın.

Araştırma ve Analiz

Veri analizi için tarama yayınlarından veya anket formlarından tabloları dijitalleştirin.

Otomatik veri göçü

Miras belgeleri veya taramalı kağıt kayıtları modern yapılandırılmış biçimlere aktarın.

Toplu Sorunlar ve Çözümler

Challenge 1: Blurry veya Kompleks Masa Görüntüleri

** Çözüm:** Yapı tanımını iyileştirmek için daha net görüntüler veya önceden işlenmiş deneyler kullanın.

Challenge 2: Standart olmayan masa düzenleri

** Çözüm:** Karmaşık düzenler veya sınırsız tablolar için ayarları test ve ayarlar.

Challenge 3: Büyük boyutlar veya karışık görüntü türleri

** Çözüm:** Çeşitli dosyaların çıkarılmasını otomatik hale getirmek için paket işleme ve dizin taraması kullanın.

performans değerlendirmeleri

  • Güzel, yüksek resimli resimler kullanın
  • verimlilik için batch işlemi
  • Kullanıldıktan sonra OCR nesneleri

En İyi Uygulamalar

  • Her zaman daha fazla işleme başlamadan önce ihraç edilen tablo verilerini doğrulayın
  • Optimal yapı tespiti için ön işleme görüntüleri
  • Güvenli ve yedekleme orijinal tarama / resimler
  • Çalışma akışınız için doğru ihracat biçimini kullanın (CSV, XLSX, JSON)

Gelişmiş Senaryolar

Senaryo 1: Karışık dil tablosu ekstraksiyonu

settings.Language = Language.Chinese;

2. Senaryo: Tablo ve Metin Ekstraksiyonu Birleştirmek

settings.DetectAreasMode = DetectAreasMode.COMBINE;

Sonuç

Aspose.OCR Tablo to Text for .NET, görüntü tablolarını yapılandırılmış, düzenlenebilir verilere dönüştürür - manuel giriş gerektirmez.

Daha fazla bilgi ve teknik detaylar için lütfen ziyaret edin. Aspose.OCR .NET API Referans için .

 Türkçe