.NET ile metin ve belge versiyonlarını nasıl karşılaştırırsınız

.NET ile metin ve belge versiyonlarını nasıl karşılaştırırsınız

Sözleşmelerin, formların veya iş belgelerinin farklı taramalı versiyonları arasındaki metni karşılaştırmak, yasal inceleme ve uyumluluk için önemlidir. .NET için Aspose.OCR Image Text Finder, otomatik olarak birden fazla görüntüden metin çıkararak ve kıyaslayarak süreci hızlandırır.

Gerçek Dünya Sorunları

Versiyon değişikliklerinin manuel incelemesi yavaş, insan hatalarına maruz kalır ve ölçeklenemez - özellikle çok sayıda belge revizyonunu veya yasal sözleşmeleri ele alırken.

Çözüm Özetleri

Karşılaştırmayı iki veya daha fazla taramalı görüntüden metin çıkararak otomatikleştirin, daha sonra diff mantığı kullanarak dokunmatik değişiklikleri vurgulamak ve kaydetmek.

Ön koşullar

  • Visual Studio 2019 veya sonraki
  • .NET 6.0 veya sonraki (veya .Net Framework 4.6.2+)
  • Aspose.OCR için .NET için NuGet
PM> Install-Package Aspose.OCR

adım adım uygulama

Adım 1: Dosya versiyonları hazırlayın

string original = "contract_v1.png";
string revised = "contract_v2.png";

Adım 2: Görüntülerden metni tanımak ve çıkarmak

RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
string originalText = ocr.Recognize(new OcrInput(InputType.SingleImage) { original }, settings)[0].RecognitionText;
string revisedText = ocr.Recognize(new OcrInput(InputType.SingleImage) { revised }, settings)[0].RecognitionText;

3. Adım: Yazı ve farklılıklar karşılaştırın

Dif / karşılaştırma bir metin kütüphanesi (örneğin, DiffPlex, yerleşik mantık) farklılıkları belirlemek için kullanın:

using DiffPlex;
using DiffPlex.DiffBuilder;
using DiffPlex.DiffBuilder.Model;

var diffBuilder = new InlineDiffBuilder(new Differ());
var diff = diffBuilder.BuildDiffModel(originalText, revisedText);
foreach (var line in diff.Lines)
{
    if (line.Type != ChangeType.Unchanged)
        Console.WriteLine($"{line.Type}: {line.Text}");
}

Adım 4: Kayıt ve ihracat karşılaştırma sonuçları

  • CSV, log dosyası veya insan okunabilir diff raporu için değişiklikleri kaydedin
// Example: Write all changes to a report
File.AppendAllText("text_diff_report.txt", $"{line.Type}: {line.Text}\n");

Adım 5: Batch veya Otomatik Versiyon Kontrolü

  • Tüm versiyonları bir klasörde karşılaştırın, gerektiğinde otomatikleştirin

Adım 6: Tam Bir Örnek

using Aspose.OCR;
using DiffPlex;
using DiffPlex.DiffBuilder;
using DiffPlex.DiffBuilder.Model;
using System;
using System.IO;

class Program
{
    static void Main(string[] args)
    {
        string original = "contract_v1.png";
        string revised = "contract_v2.png";
        RecognitionSettings settings = new RecognitionSettings();
        settings.Language = Language.English;
        AsposeOcr ocr = new AsposeOcr();
        string originalText = ocr.Recognize(new OcrInput(InputType.SingleImage) { original }, settings)[0].RecognitionText;
        string revisedText = ocr.Recognize(new OcrInput(InputType.SingleImage) { revised }, settings)[0].RecognitionText;
        var diffBuilder = new InlineDiffBuilder(new Differ());
        var diff = diffBuilder.BuildDiffModel(originalText, revisedText);
        foreach (var line in diff.Lines)
        {
            if (line.Type != ChangeType.Unchanged)
                File.AppendAllText("text_diff_report.txt", $"{line.Type}: {line.Text}\n");
        }
    }
}

Cases ve Uygulamaları Kullanın

Yasal ve uyumluluk incelemesi

Scanlanmış sözleşmelerin, politikaların veya anlaşmaların değişikliklerini hızlı bir şekilde tespit edin.

İş Süreci Denetimi

Dijital arşivlerde yetkisiz veya onaylanmamış düzenlemeleri tespit edin.

Dosya Yönetimi Otomatik

Tüm belge versiyonları üzerindeki değişikliklerin tam bir denetim izini tutun.

Toplu Sorunlar ve Çözümler

Challenge 1: Küçük biçimlendirme veya OCR hataları

** Çözüm:** Ayarları tonlayın, işaretlenmiş değişiklikler üzerine ikincil manuel inceleme yapın.

Challenge 2: Büyük belge setleri

** Çözüm:** Otomatik ve paralelleştirin, tüm sonuçları etkili denetim için kaydedin.

3. Sorun: Sahte Olumlu / Olumsuz

** Çözüm:** Dif algoritmasını yenilemek, gerçek dünya örnekleri ile çıkışları doğrulamak.

performans değerlendirmeleri

  • Diff mantığı büyük belgelerde yavaş olabilir – monitör ve optimizasyon
  • Tüm diff raporları uyumluluk için güvenli bir şekilde saklayın
  • En iyi tanıma için sağlam OCR ayarları kullanın

En İyi Uygulamalar

  • Tüm versiyonlarda aynı OCR ve tarama ayarlarını kullanın
  • kritik/yüksek riskli belgelerdeki defler doğrulama
  • Tüm raporları kaydedin ve yedekleyin
  • Anahtar belgeler için otomatik düzenli versiyon karşılaştırması

Gelişmiş Senaryolar

Senaryo 1: Görsel çıkış farklılıklarını vurgulayın

Yasal ekipler için tespit edilen metin değişikliklerini vurgulayan kayıtlı PDF’ler / resimler oluşturun.

2. Senaryo: Önemli değişiklikler hakkında otomatik bildirim

Önemli bir yasal koşul eklendiğinde / kaldırıldığında uyarı/e-posta gönderin.

Sonuç

Aspose.OCR Image Text Finder for .NET, otomatik, ölçeklenebilir ve denetlenebilir belge versiyonu karşılaştırmasını sağlar – yasal, iş ve uyumluluk ekibinin taranan dosyalarda önemli değişiklikleri tespit etmesine izin verir.

Daha gelişmiş karşılaştırma çalışma akışları için, bakınız Aspose.OCR .NET API Referans için .

 Türkçe