OCR için tarama belgelerini .NET'te nasıl yetiştirilir
Optical Character Recognition (OCR) için taramalı belgeleri hazırlarken, resimlerin metin ağır alanlarına odaklanması önemlidir. belgenin ilgili olmayan parçalarını taramak, OCR yazılımının metni daha doğru ve verimli bir şekilde çıkarabileceğini sağlar. Aspose.Imaging for .NET taramalı belgeleri taramak ve OCR işleme hazırlamak için gerekli araçları sağlar.
OCR için Cropping Scanned Belgelerin Faydaları
Güçlü Gelişmeler:- OCR çabalarını ilgili metin bölümlerine odaklayın, gürültü veya ilgisiz içeriği önleyin.
Küçük işleme süresi:- İşlenmesi gereken alanı en aza indirmek için görüntüyü toplayın, OCR sürecini hızlandırın.
Daha iyi metin ekstraksiyonu:- Yazının OCR motorları için doğru bir şekilde uyumlu ve iyi çerçeveli olduğundan emin olun.
Etiket Arşivi: Aspose.Imaging
- Yükleme The .NET SDK için Sizin sisteminizde.
- Projeye Aspose.Imaging ekleyin:
dotnet add package Aspose.Imaging
- Bir ölçülen lisans alın ve kullanarak yapılandırın
SetMeteredKey()
.
OCR için bitki tarama belgeleri için adım adım rehber
Adım 1: Ölçülen lisansı ayarlayın
Aspose.Imaging’i sınırsız erişim için ayarlayın.
using Aspose.Imaging;
Metered license = new Metered();
license.SetMeteredKey("<your public key>", "<your private key>");
Console.WriteLine("Metered license configured successfully.");
Adım 2: Scanlanmış belge görüntüsünü yükleyin
OCR hazırlanması için toplanması gereken taranan belge dosyasını yükleyin.
string inputPath = @"c:\documents\scanned_document.png";
using (var image = Image.Load(inputPath))
{
Console.WriteLine($"Loaded scanned document: {inputPath}");
}
Adım 3: Bitki alanını belirleyin
Çekilmesi gereken metnin etrafındaki düz alanı belirleyin.
var cropArea = new Rectangle(50, 50, 500, 500); // Crop area: x, y, width, height
image.Crop(cropArea);
Console.WriteLine($"Cropped image to the defined area: {cropArea.Width}x{cropArea.Height}");
Adım 4: Bitki işlemi uygulayın
Kullanmak için Crop()
Görüntüden gerekli metin bölümü çıkarma yöntemi.
image.Crop(cropArea);
Console.WriteLine("Applied crop operation to isolate text for OCR.");
Adım 5: Çarpılmış görüntüyü kaydedin
OCR işleme için kaydedilen görüntüyü kaydedin.
image.Save(@"c:\output\ocr_ready_image.png", new PngOptions());
Console.WriteLine("Cropped image saved successfully for OCR.");
Kullanım ve Kullanım
Doküman İşleme Sistemleri:- Görüntüleri OCR için hazırlamak için otomatik belge tarama sistemlerinde tarama uygulayın.
OCR Çalışma Akışı Entegrasyonu:- Bitki belgeleri daha hızlı ve daha doğru metin çıkarımı için OCR motorlarına aktarmadan önce.
Çıkış Validasyonu:- Yazının açıkça görülebileceğinden ve düzgün bir şekilde çerçeveleneceğinden emin olmak için çarpılmış görüntüyü açın.
Gerçek dünya uygulamaları
Yasal ve tıbbi belge taraması:- OCR işleme için önemli bir metin üzerine odaklanmak için tahıl tarama sözleşmeleri veya tıbbi kayıtlar.
Arşiv Sistemi:- Tarihi belgeleri metin çıkarımı ve dijitalleştirme için hazırlayın.
E-Hükümet Hizmetleri:- Scanlanmış formlardan veya uygulamalarından metin çıkarma otomatikleştirin.
Toplam Sorunlar ve Çözümler
Doğru bitki alanı:- emin olun
Rectangle
Koordinasyonlar bölümün metni ile uyumludur.Düşük kaliteli resimler:- Tarama görüntüsünün OCR doğruluğu için yeterince yüksek çözünürlüğe sahip olduğundan emin olun.
Dosya izinleri:- Doğrulama çıkış dizinleri uygun yazma izni vardır.
Sonuç
Aspose.Imaging for .NET kullanarak, OCR işleme için önemli bölümlere odaklanmak için kolayca taramalı belgeleri toplayabilirsiniz.Bu çözüm, belge yönetimi, yasal sistemler ve sağlık hizmetlerinde otomatik çalışma akışları için idealdir.