Görüntülerdeki tablolar ve formlardan yapılandırılmış verileri nasıl çıkarılır
Tarama tablolarından veya doldurulmuş formlardan veri çıkarmak, iş otomasyonu, raporlama ve uyumluluğu için gereklidir. .NET için Aspose.OCR Tablo to Text bu süreci hızlandırır, hücre ve alan yapısını doğru bir şekilde tespit eder ve düzenlenebilir biçimlere ihraç eder.
Gerçek Dünya Sorunları
İşletmeler genellikle faturalar, raporlar veya resimler veya taramalar olarak formlar alırlar. tablo verileri veya form alanlarının manuel girişleri yavaş, hataya dayanıklı ve ölçekte pahalıdır.
Çözüm Özetleri
.NET için Tablo-Teks ile, satırlar, sütunlar ve alan değerleri de dahil olmak üzere yapılandırılmış verileri doğrudan resimlerden çıkarabilirsiniz. sonuçlar Excel, JSON veya veritabanları ve otomasyon platformları ile entegre edilebilir.
Ön koşullar
- Visual Studio 2019 veya sonraki
- .NET 6.0 veya sonraki (veya .Net Framework 4.6.2+)
- Aspose.OCR için .NET için NuGet
- Temel C# Yetenekleri
PM> Install-Package Aspose.OCR
adım adım uygulama
Adım 1: Aspose.OCR yükleme ve ayarlayın
using Aspose.OCR;
Adım 2: Tablo veya form resimleri hazırlayın
OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("scanned_invoice.png");
input.Add("filled_form.jpg");
Adım 3: Tablolar / Formlar için Tanıma Ayarları ayarlayın
RecognitionSettings settings = new RecognitionSettings();
settings.DetectAreasMode = DetectAreasMode.TABLE; // or DetectAreasMode.FORM
settings.Language = Language.English;
Adım 4: Tablo veya form verilerini çıkarın
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
Adım 5: Yapılandırılmış ihracat
foreach (RecognitionResult result in results)
{
result.Save("output_table.xlsx", SaveFormat.Xlsx); // Spreadsheet
result.Save("output_table.json", SaveFormat.Json); // JSON
result.Save("output_table.txt", SaveFormat.Text); // Text
}
Adım 6: Hataları ele almak ve sonuçları doğrulamak
try
{
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
// Further processing...
}
catch (Exception ex)
{
Console.WriteLine($"Error: {ex.Message}");
}
Adım 7: Tablo / Şekil Değişiklikleri için Optimize
- Farklı sınırları, yazı tipleri veya alan yerleri olan örnekler üzerinde test
- En iyi tespit için önceden işleme ayarları
Adım 8: Otomatik Batch Ekstraksiyonu
Tüm ilgili resimleri bir klasörde işlemeyin:
foreach (string file in Directory.GetFiles("./forms", "*.jpg"))
{
input.Add(file);
}
Adım 9: Tam Bir Örnek
using Aspose.OCR;
using System;
using System.Collections.Generic;
using System.IO;
class Program
{
static void Main(string[] args)
{
try
{
OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("scanned_invoice.png");
input.Add("filled_form.jpg");
RecognitionSettings settings = new RecognitionSettings();
settings.DetectAreasMode = DetectAreasMode.TABLE;
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);
foreach (RecognitionResult result in results)
{
result.Save("output_table.xlsx", SaveFormat.Xlsx);
result.Save("output_table.json", SaveFormat.Json);
result.Save("output_table.txt", SaveFormat.Text);
}
}
catch (Exception ex)
{
Console.WriteLine($"Error: {ex.Message}");
}
}
}
Cases ve Uygulamaları Kullanın
Hesaplama ve Raporlama Otomatikleştirme
Muhasebe veya analiz için finansal verileri çıkarın.
Soruşturma ve kayıt formları
CRM, ERP veya BI sistemleri için yapılandırılmış yanıtlar.
Uyumluluk ve Denetim
Gönderilen formlardan veya tablolardan verilerin otomatik olarak çıkarılması ve doğrulanması.
Toplu Sorunlar ve Çözümler
1. Sorun: Düzenlenmemiş masa sınırları veya düzenlemeler
** Çözüm:** Deteksiyonu iyileştirmek için ön işleme ve örnek tonlama kullanın.
Challenge 2: Mixed Content (Tekst ve Tablolar)
** Çözüm: ** En iyi sonuçlar için AUTO ile çalıştırın veya resim türüne göre ayrı yapın.
Challenge 3: Çok Alanlı Karmaşık Şekiller
** Çözüm: ** Yüksek yoğunluklu formlar için test ve tweak tanıma.
performans değerlendirmeleri
- Masa tanıma daha CPU yoğun; monitör batch işleri
- kritik çalışma akışları için geçerli çıkışlar
- Batch ihracatı diğer araçlarla entegrasyon için
En İyi Uygulamalar
- Örnekler üzerinde yapılandırılmış verileri ölçmeden önce doğrulayın
- Güvenli ve hem kaynak görüntüleri hem de elde edilen çıkışları arşivle
- Doğruluk geliştirmeleri için Aspose.OCR’yi düzenli olarak güncelleyin
- Yeni belge düzenlemeleri için Tune ayarları
Gelişmiş Senaryolar
Senaryo 1: Veritabanına veya BI Araçlarına İhracat
// Use JSON or Excel export for integration with data pipelines
Senaryo 2: Web Uygulamalarında Gerçek Zamanlı Ekstraksiyon
// Integrate extraction logic into ASP.NET or workflow API
Sonuç
Aspose.OCR Tablo to Text for .NET, iş otomasyonundan uyumluluk ve analize kadar her şeyi destekleyen resimlerden ve formlardan yapılandırılmış veri çıkarımını otomatikleştirmenizi sağlar.
Gelişmiş tablo ekstraksiyon özellikleri için, ziyaret Aspose.OCR .NET API Referans için .