Deskew ile OCR için Tarama Görüntüleri Nasıl Hazırlanır .NET

Deskew ile OCR için Tarama Görüntüleri Nasıl Hazırlanır .NET

Accurate OCR (Optical Character Recognition) mükemmel bir şekilde uyumlu görüntülerle başlar. kaydırılmış veya döndürülmüş taramalar oCR’nin doğruluğunu azaltır, bu nedenle çarpışma kritik bir ön işleme adımdır. .NET için Aspose.Imaging, herhangi bir dış O CR aracında en iyi sonuçlar için belgeleri / fotoğrafları çekmenizi sağlar

Gerçek Dünya Sorunları

OCR motorları iyi uyumlu görüntüler üzerinde en iyi şekilde çalışır. çürümüş taramalar eksik karakterlere veya metin hatalarına neden olur. manuel sıkıştırma büyük parçalar için çok yavaş.

Çözüm Özetleri

PNG veya TIFF gibi kayıp olmayan bir biçimde kaydedin, seçtiğiniz OCR yazılımına (Aspose.OCR, Tesseract, vb.) ithal etmeye hazır.

Ön koşullar

  • Visual Studio 2019 veya sonraki
  • .NET 6.0 veya sonraki (veya .Net Framework 4.6.2+)
  • Aspose.Imaging için .NET için NuGet
  • Scanlanmış bir belge veya görüntü (JPEG, PNG, TIFF, vb.)
PM> Install-Package Aspose.Imaging

adım adım uygulama

1. Adım: Tarayıcı görüntüyü kapatın

using Aspose.Imaging;
using Aspose.Imaging.ImageOptions;

string inputPath = "./input/scan_for_ocr.png";
string outputPath = "./output/scan_for_ocr_deskewed.png";

using (var image = (RasterImage)Image.Load(inputPath))
{
    // Deskew and use white background for optimal OCR results
    image.NormalizeAngle(false, Color.White);
    image.Save(outputPath, new PngOptions()); // PNG or TIFF recommended
}

2. Adım: Herhangi bir OCR motoruna kaydırılmış görüntüleri geçin

  • En sevdiğiniz OCR aracını kullanarak, çizilmiş görüntüden metni tanımak için kullanın.
  • Örnek : İthalat scan_for_ocr_deskewed.png OCR boru hattınıza veya yazılımınıza (Aspose.OCR, Tesseract, ABBYY, vb.) girin.

Adım 3: İnceleme ve Yenileme

  • OCR sonuçlarını kontrol edin. hassasiyet düşük ise, çatı / arka plan ayarlarını veya tarama kalitesini ayarlar.
  • Digitalizasyon iş akışınızı verimli tutmak için tüm yeni taramalar için paket işleme düşünün.

Cases ve Uygulamaları Kullanın

  • Arşivlerin, kayıtların, sözleşmelerin veya arama yapılabilir metin için formların dijitalleştirilmesi
  • Uyumluluk ve denetim için iş belgelerinin hazırlanması
  • Herhangi bir OCR veya belge otomasyon boru hattında doğruluğu artırmak

Toplu Sorunlar ve Çözümler

Düzeltilmiş görüntüler hala OCR hatalarına neden olur: Farklı arka plan renkleri, gürültü için ön filtreleme veya daha yüksek çözünürlüklü taramalar deneyin.

Çıkış dosyaları çok büyüktür: Kaplama ile TIFF veya PNG kullanın, şeffaflık gerekirse.

** Görüntü biçimleri karışımı:** OCR’den önce tüm taramaları kayıp olmayan bir biçime normalleştirin.

En İyi Uygulamalar

  • OCR için her zaman kayıp olmayan görüntü biçimlerini kullanın
  • Referans için orijinal ve işlenmiş resimleri tutun
  • Ekibiniz için planlama ve dijitalleşme çalışma akışını belgelendirin

FAQ Hakkında

**Q: Tüm resimleri bir klasörde çözebilebilir miyim?**A: Evet - önceki set örneklerinde gösterildiği gibi tüm dosyaların üzerinde bu kodu bir yuva haline getirin.

**Q: Hangi arka plan rengi OCR için en iyi çalışır?**A: Beyaz, metin için en güvenli olanıdır; grafikler için şeffaf kullanın veya belgenizi eşleştirin.

**Q: Dosyaları sızdırdıktan sonra sıkıştırmak iyi mi?**A: OCR doğruluğunu azaltan eserlerden kaçınmak için kayıpsız kompres kullanın.

Sonuç

Aspose.Imaging için .NET güvenilir OCR, dijitalleşme ve iş otomasyonu için bir zorunludur. boru hattınızı temiz, hızlı ve doğru tutun! Aspose.Imaging için .NET API Referans .

 Türkçe