.NET ile Otomatik PII veya Anahtar Kelime Düzenleme Pipeline Nasıl Oluşturulur

.NET ile Otomatik PII veya Anahtar Kelime Düzenleme Pipeline Nasıl Oluşturulur

Görüntülerde kişisel olarak tanımlanabilir bilgi (PII) ve hassas anahtar kelimelerin düzenlenmesi, gizlilik, yasal ve uyumluluk işlemleri için çok önemlidir. .NET için Aspose.OCR Image Text Finder, paket çalışma akışlarında algılama ve düzenlemeyi otomatik hale getirir.

Gerçek Dünya Sorunları

Tarama dosyalarında gizli verilerin manuel düzenlenmesi yavaş, hataya dayanıklı ve pahalıdır. otomatikleştirme, uyumluluk ve gizlilik denetimleri için güvenilir ve tutarlı gizleme sağlamak için gereklidir.

Çözüm Özetleri

OCR kullanarak PII veya anahtar kelimeleri otomatik olarak tespit edin, sonra maske, blur veya resimde değiştirin ve düzenlenmiş sonuçları kaydedin - gizlilik ve güvenlik sağlar.

Ön koşullar

  • Visual Studio 2019 veya sonraki
  • .NET 6.0 veya sonraki (veya .Net Framework 4.6.2+)
  • Aspose.OCR için .NET için NuGet
  • PII veya bir metin dosyasında anahtar kelime listesi
PM> Install-Package Aspose.OCR

adım adım uygulama

Adım 1: PII/Keyword List ve Giriş Görüntüleri Hazırlayın

List<string> piiList = new List<string>(File.ReadAllLines("pii_keywords.txt"));
string[] files = Directory.GetFiles("./input", "*.png");

Adım 2: PII / Anahtar Kelimeler için arama

RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
foreach (string file in files)
{
    foreach (string pii in piiList)
    {
        bool found = ocr.ImageHasText(file, pii, settings);
        if (found)
        {
            // Proceed to redact in Step 3
        }
    }
}

Adım 3: Düzenlenmiş Terimler veya Maske

  • Aspose.OCR terimleri tespit ederken, düzenleme görüntü kütüphaneleri (örneğin, System.Drawing, SkiaSharp) ile uygulanmalıdır.
// Example using System.Drawing to overlay black box (simplified)
using (var image = new Bitmap(file))
{
    using (var g = Graphics.FromImage(image))
    {
        // Locate/estimate bounding box for found term (requires mapping OCR region, see docs/API)
        // g.FillRectangle(Brushes.Black, x, y, width, height);
    }
    image.Save($"./redacted/redacted_{Path.GetFileName(file)}");
}

Adım 4: Düzenlenmiş dosyaları kaydedin

File.AppendAllText("redaction_log.csv", $"{file},{pii},redacted\n");

Adım 5: Tam Batch Çalışma Akışı Örneği

using Aspose.OCR;
using System;
using System.Collections.Generic;
using System.IO;
using System.Drawing;

class Program
{
    static void Main(string[] args)
    {
        List<string> piiList = new List<string>(File.ReadAllLines("pii_keywords.txt"));
        string[] files = Directory.GetFiles("./input", "*.png");
        RecognitionSettings settings = new RecognitionSettings();
        settings.Language = Language.English;
        AsposeOcr ocr = new AsposeOcr();
        foreach (string file in files)
        {
            foreach (string pii in piiList)
            {
                bool found = ocr.ImageHasText(file, pii, settings);
                if (found)
                {
                    // Redact by overlay (simplified; see docs for bounding box)
                    using (var image = new Bitmap(file))
                    using (var g = Graphics.FromImage(image))
                    {
                        // Example: Draw rectangle where text is found (requires OCR region info)
                        // g.FillRectangle(Brushes.Black, x, y, width, height);
                        // Save redacted copy
                        image.Save($"./redacted/redacted_{Path.GetFileName(file)}");
                    }
                    File.AppendAllText("redaction_log.csv", $"{file},{pii},redacted\n");
                }
            }
        }
    }
}

Not: Doğru bölge haritalama için, tespit edilen metin bloklarının koordinatlarını elde etmek için Aspose.OCR’nin tanıma bölgeleri API’sini kullanın, sonra kesinlikle maske edin.

Cases ve Uygulamaları Kullanın

Hukuk ve Uyumluluk

Sözleşmelerin, HR dosyalarının ve düzenlenmiş belgelerin otomatik yazılması.

Gizlilik Denetimi

Tarama dosyalarında, tarama veya kanıt dosyalarında PII sızıntısı olmaması.

Batch DLP (Data Loss Prevention) - veri kaybının önlenmesi

Görüntülenen resimlerde hassas bilgilerin rastgele paylaşılmasını veya depolanmasını durdurun.

Toplu Sorunlar ve Çözümler

Challenge 1: Doğru metin bölgelerini bulmak

** Çözüm:** OCR metin bölgesi çıkışı ve haritayı gizlemek için görüntü koordinatlarına kullanın.

2. Sorun: Sahte Olumlu / Olumsuz

** Çözüm:** Anahtar kelime listeleri yapın, düzenlenmiş görüntüleri doğrulayın ve denetimleri çalıştırın.

Challenge 3: Batch İş Boyutu

** Çözüm:** Paralleşme ve ölçek için otomatik hata işleme.

performans değerlendirmeleri

  • Bölge hesaplaması ve görüntü yazma büyük paketler için yavaş olabilir — gerekirse async kullanın
  • Tüm düzenlemeleri uyumluluk incelemesi için kaydedin

En İyi Uygulamalar

  • Çeşitli Görüntülerle Doğruluk Haritalama Bölgesi
  • Yeni PII desenleri için anahtar kelime listelerini düzenli olarak güncelleyin
  • Orijinal ve düzenlenmiş dosyaları korumak
  • Manual spot-checks ile doğrulanır

Gelişmiş Senaryolar

Senaryo 1: Blackout yerine Blur

Görüntü filtrelerini daha ince maske için tespit edilen bölgeleri karıştırmak için kullanın.

Senaryo 2: Özelleştirilmiş Düzenleme / Değiştirme metni

Siyah kutu yerine özelleştirilmiş etiket (örneğin “REDACTED”) yıkayın.

Sonuç

Aspose.OCR Image Text Finder for .NET, PII / anahtar kelime düzenlemeyi ölçekte otomatikleştirmenizi sağlar – yasal riskleri azaltır ve görüntü arşivlerinde gizliliği garanti eder.

Doğru bölge APIs ve yazma entegrasyonu için, bakınız Aspose.OCR .NET API Referans için .

 Türkçe