.NET ile metin ve belge versiyonlarını nasıl karşılaştırırsınız
Sözleşmelerin, formların veya iş belgelerinin farklı taramalı versiyonları arasındaki metni karşılaştırmak, yasal inceleme ve uyumluluk için önemlidir. .NET için Aspose.OCR Image Text Finder, otomatik olarak birden fazla görüntüden metin çıkararak ve kıyaslayarak süreci hızlandırır.
Gerçek Dünya Sorunları
Versiyon değişikliklerinin manuel incelemesi yavaş, insan hatalarına maruz kalır ve ölçeklenemez - özellikle çok sayıda belge revizyonunu veya yasal sözleşmeleri ele alırken.
Çözüm Özetleri
Karşılaştırmayı iki veya daha fazla taramalı görüntüden metin çıkararak otomatikleştirin, daha sonra diff mantığı kullanarak dokunmatik değişiklikleri vurgulamak ve kaydetmek.
Ön koşullar
- Visual Studio 2019 veya sonraki
- .NET 6.0 veya sonraki (veya .Net Framework 4.6.2+)
- Aspose.OCR için .NET için NuGet
PM> Install-Package Aspose.OCR
adım adım uygulama
Adım 1: Dosya versiyonları hazırlayın
string original = "contract_v1.png";
string revised = "contract_v2.png";
Adım 2: Görüntülerden metni tanımak ve çıkarmak
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
string originalText = ocr.Recognize(new OcrInput(InputType.SingleImage) { original }, settings)[0].RecognitionText;
string revisedText = ocr.Recognize(new OcrInput(InputType.SingleImage) { revised }, settings)[0].RecognitionText;
3. Adım: Yazı ve farklılıklar karşılaştırın
Dif / karşılaştırma bir metin kütüphanesi (örneğin, DiffPlex, yerleşik mantık) farklılıkları belirlemek için kullanın:
using DiffPlex;
using DiffPlex.DiffBuilder;
using DiffPlex.DiffBuilder.Model;
var diffBuilder = new InlineDiffBuilder(new Differ());
var diff = diffBuilder.BuildDiffModel(originalText, revisedText);
foreach (var line in diff.Lines)
{
if (line.Type != ChangeType.Unchanged)
Console.WriteLine($"{line.Type}: {line.Text}");
}
Adım 4: Kayıt ve ihracat karşılaştırma sonuçları
- CSV, log dosyası veya insan okunabilir diff raporu için değişiklikleri kaydedin
// Example: Write all changes to a report
File.AppendAllText("text_diff_report.txt", $"{line.Type}: {line.Text}\n");
Adım 5: Batch veya Otomatik Versiyon Kontrolü
- Tüm versiyonları bir klasörde karşılaştırın, gerektiğinde otomatikleştirin
Adım 6: Tam Bir Örnek
using Aspose.OCR;
using DiffPlex;
using DiffPlex.DiffBuilder;
using DiffPlex.DiffBuilder.Model;
using System;
using System.IO;
class Program
{
static void Main(string[] args)
{
string original = "contract_v1.png";
string revised = "contract_v2.png";
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
string originalText = ocr.Recognize(new OcrInput(InputType.SingleImage) { original }, settings)[0].RecognitionText;
string revisedText = ocr.Recognize(new OcrInput(InputType.SingleImage) { revised }, settings)[0].RecognitionText;
var diffBuilder = new InlineDiffBuilder(new Differ());
var diff = diffBuilder.BuildDiffModel(originalText, revisedText);
foreach (var line in diff.Lines)
{
if (line.Type != ChangeType.Unchanged)
File.AppendAllText("text_diff_report.txt", $"{line.Type}: {line.Text}\n");
}
}
}
Cases ve Uygulamaları Kullanın
Yasal ve uyumluluk incelemesi
Scanlanmış sözleşmelerin, politikaların veya anlaşmaların değişikliklerini hızlı bir şekilde tespit edin.
İş Süreci Denetimi
Dijital arşivlerde yetkisiz veya onaylanmamış düzenlemeleri tespit edin.
Dosya Yönetimi Otomatik
Tüm belge versiyonları üzerindeki değişikliklerin tam bir denetim izini tutun.
Toplu Sorunlar ve Çözümler
Challenge 1: Küçük biçimlendirme veya OCR hataları
** Çözüm:** Ayarları tonlayın, işaretlenmiş değişiklikler üzerine ikincil manuel inceleme yapın.
Challenge 2: Büyük belge setleri
** Çözüm:** Otomatik ve paralelleştirin, tüm sonuçları etkili denetim için kaydedin.
3. Sorun: Sahte Olumlu / Olumsuz
** Çözüm:** Dif algoritmasını yenilemek, gerçek dünya örnekleri ile çıkışları doğrulamak.
performans değerlendirmeleri
- Diff mantığı büyük belgelerde yavaş olabilir – monitör ve optimizasyon
- Tüm diff raporları uyumluluk için güvenli bir şekilde saklayın
- En iyi tanıma için sağlam OCR ayarları kullanın
En İyi Uygulamalar
- Tüm versiyonlarda aynı OCR ve tarama ayarlarını kullanın
- kritik/yüksek riskli belgelerdeki defler doğrulama
- Tüm raporları kaydedin ve yedekleyin
- Anahtar belgeler için otomatik düzenli versiyon karşılaştırması
Gelişmiş Senaryolar
Senaryo 1: Görsel çıkış farklılıklarını vurgulayın
Yasal ekipler için tespit edilen metin değişikliklerini vurgulayan kayıtlı PDF’ler / resimler oluşturun.
2. Senaryo: Önemli değişiklikler hakkında otomatik bildirim
Önemli bir yasal koşul eklendiğinde / kaldırıldığında uyarı/e-posta gönderin.
Sonuç
Aspose.OCR Image Text Finder for .NET, otomatik, ölçeklenebilir ve denetlenebilir belge versiyonu karşılaştırmasını sağlar – yasal, iş ve uyumluluk ekibinin taranan dosyalarda önemli değişiklikleri tespit etmesine izin verir.
Daha gelişmiş karşılaştırma çalışma akışları için, bakınız Aspose.OCR .NET API Referans için .