Tablolar ve tablo verileri Aspose.OCR ile resimlerden nasıl çıkarılır
Tabloların görüntülerden, formlardan veya taranan raporlardan çıkarılması zor – manuel retyping yavaş ve hataya dayanıklıdır. Aspose.OCR Tablo to Text for .NET tablo verilerinin görüntüleri ve fotoğraflardan elde edilmesini ve yapılandırılmasını otomatikleştirir.
Gerçek Dünya Sorunları
Finansal raporlar, anket formları ve bilimsel sonuçlar genellikle taranan tablolarda veya resimlerde sıkışır. bu verileri manuel olarak yeniden oluşturmak saatleri kaybeder ve hataları ortaya çıkarma riski vardır.
Çözüm Özetleri
Aspose.OCR for .NET, görüntülerden veya taramalı PDF’lerden tabloları makine okunabilir biçimlere doğru bir şekilde tespit edebilir, çıkarabilir ve dönüştürebilir - Excel, raporlama veya çalışma akışının otomatikleştirilmesi için mükemmel.
Ön koşullar
- Visual Studio 2019 veya sonraki
- .NET 6.0 veya sonraki (veya .Net Framework 4.6.2+)
- Aspose.OCR için .NET için NuGet
- Temel C# Bilgisi
PM> Install-Package Aspose.OCR
adım adım uygulama
Adım 1: Aspose.OCR yükleme ve ayarlayın
using Aspose.OCR;
Adım 2: Tabloları içeren görüntüleri tarayın veya fotoğraflayın
OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("table1.jpg");
input.Add("report_page.png");
Adım 3: Tablo Tanıma Ayarları ayarlayın
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.TABLE; // Key for tables
Adım 4: Masa çıkarma işlemi çalıştırın
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
Adım 5: İhracat tablosu verileri
foreach (RecognitionResult result in results)
{
result.Save("table_data.xlsx", SaveFormat.Xlsx); // Excel output
result.Save("table_data.csv", SaveFormat.Csv); // CSV output
result.Save("table_data.txt", SaveFormat.Text); // Plain text output
}
Adım 6: Hata işleme ve doğrulama ekleyin
try
{
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
// Further processing
}
catch (Exception ex)
{
Console.WriteLine($"Error: {ex.Message}");
}
Adım 7: Kompleks, döndürülmüş veya çok sayfalık tablolar için optimizasyon
- Görüntüleri decew veya crop için önceden işleme
- Yüksek çözünürlüklü tarama veya fotoğraf kullanın
- Çok sayfalık PDF’ler için, her sayfa ayrı bir giriş olarak ekleyin
foreach (string file in Directory.GetFiles("./scans", "*.png"))
{
input.Add(file);
}
Adım 8: Tam Bir Örnek
using Aspose.OCR;
using System;
using System.Collections.Generic;
class Program
{
static void Main(string[] args)
{
try
{
OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("table1.jpg");
input.Add("report_page.png");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
settings.DetectAreasMode = DetectAreasMode.TABLE;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
foreach (RecognitionResult result in results)
{
result.Save("table_data.xlsx", SaveFormat.Xlsx);
result.Save("table_data.csv", SaveFormat.Csv);
result.Save("table_data.txt", SaveFormat.Text);
}
}
catch (Exception ex)
{
Console.WriteLine($"Error: {ex.Message}");
}
}
}
Cases ve Uygulamaları Kullanın
Finansal ve Bilimsel Raporlama
Excel’de anlık analiz için finansal raporlardan, laboratuvar sonuçlarından veya araştırma belgelerinden tablolar çıkarın.
Soruşturma ve Form İşleme
Tabloları taran formlardan, kontrol listelerinden veya inceleme kayıtlarından dijitalleştirin.
Workflow Otomatik
Yapılandırılmış tablo verilerini doğrudan iş uygulamalarınıza, BI araçlarına veya veritabanlarına aktarın.
Toplu Sorunlar ve Çözümler
Challenge 1: Kötü Kalite veya Karmaşık Tablolar
Çözüm: Yüksek çözünürlüklü görüntüleri kullanın ve örnek setleri üzerinde test edin.
2. Çabalar: Yürüyen veya döndürülen tablolar
** Çözüm:** İşleme başlamadan önce resimleri kaydırın; DetectAreasMode.TABLE kullanın.
Challenge 3: Çok sayfalık raporlar
** Çözüm:** Her sayfayı paket işleme için ayrı bir giriş olarak ekleyin.
performans değerlendirmeleri
- Hız için Batch Süreci
- Yüksek kaliteli tarama / fotoğraf kullanın
- Büyük sürüşlerden sonra OCR nesnelerinin mevcut olması
En İyi Uygulamalar
- Entegre edilmeden önce üretimi doğrulayın
- Tune tablo tanıma ayarları gerektiğinde
- Orijinal ve dijital verileri yedekleme
- Kullanmadan önce gerçek örnekler ile test
Gelişmiş Senaryolar
Senaryo 1: Çok dilli masa ekstraksiyonu
settings.Language = Language.German;
2. Senaryo: JSON’a veri boruları için ihracat
foreach (RecognitionResult result in results)
{
result.Save("table_data.json", SaveFormat.Json);
}
Sonuç
Aspose.OCR Tablo to Text for .NET görüntüleri ve taramaları etkinleştirilebilir, yapılandırılmış tablo verilerine dönüştürür - analiz, raporlama ve otomasyon için hazır.
Daha fazla tablo tanıma kodu örnekleri görüntüle Aspose.OCR .NET API Referans için .