Kā izveidot automatizētu PII vai atslēgvārdu rediģēšanas cauruļu ar .NET

Kā izveidot automatizētu PII vai atslēgvārdu rediģēšanas cauruļu ar .NET

Personas identifikācijas informācijas (PII) un jutīgu atslēgvārdu rediģēšana skenētajos attēlos ir svarīga privātuma, juridisko un atbilstības darbībām. Aspose.OCR Image Text Finder for .NET ļauj automātiski atklāt un redižēt darba plūsmas.

Reālā pasaules problēma

Manuāla konfidenciālo datu sagatavošana skenētajos arhīvos ir lēna, kļūdainoša un dārga.Automācija ir nepieciešama, lai nodrošinātu uzticamu un konsekventu masku atbilstības un privātuma auditu veikšanai.

Risinājumu pārskats

Automātiski atklāt PII vai atslēgvārdus, izmantojot OCR, tad maskēt, blurēt vai aizstāt tos attēlā un saglabāt rediģētos rezultātus – nodrošinot privātumu un drošību.

Prerequisites

  • Visual Studio 2019 vai vēlāk
  • .NET 6.0 vai jaunāks (vai .Net Framework 4.6.2+)
  • Aspose.OCR par .NET no NuGet
  • PII vai atslēgvārdu saraksts teksta failā
PM> Install-Package Aspose.OCR

Step-by-step īstenošana

1. solis: Sagatavojiet PII / atslēgvārdu sarakstu un ievades attēlus

List<string> piiList = new List<string>(File.ReadAllLines("pii_keywords.txt"));
string[] files = Directory.GetFiles("./input", "*.png");

2. solis: PII / atslēgvārdu meklēšana

RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
foreach (string file in files)
{
    foreach (string pii in piiList)
    {
        bool found = ocr.ImageHasText(file, pii, settings);
        if (found)
        {
            // Proceed to redact in Step 3
        }
    }
}

3. solis: Redzēt vai maskēt konstatētos nosacījumus

  • Lai gan Aspose.OCR atklāj terminus, redakcija ir jāpiemēro ar attēlu bibliotēkām (t.i., System.Drawing, SkiaSharp).
// Example using System.Drawing to overlay black box (simplified)
using (var image = new Bitmap(file))
{
    using (var g = Graphics.FromImage(image))
    {
        // Locate/estimate bounding box for found term (requires mapping OCR region, see docs/API)
        // g.FillRectangle(Brushes.Black, x, y, width, height);
    }
    image.Save($"./redacted/redacted_{Path.GetFileName(file)}");
}

4. solis: ierakstiet rediģētos failus

File.AppendAllText("redaction_log.csv", $"{file},{pii},redacted\n");

5. solis: Pilnīgs darba plūsmas piemērs

using Aspose.OCR;
using System;
using System.Collections.Generic;
using System.IO;
using System.Drawing;

class Program
{
    static void Main(string[] args)
    {
        List<string> piiList = new List<string>(File.ReadAllLines("pii_keywords.txt"));
        string[] files = Directory.GetFiles("./input", "*.png");
        RecognitionSettings settings = new RecognitionSettings();
        settings.Language = Language.English;
        AsposeOcr ocr = new AsposeOcr();
        foreach (string file in files)
        {
            foreach (string pii in piiList)
            {
                bool found = ocr.ImageHasText(file, pii, settings);
                if (found)
                {
                    // Redact by overlay (simplified; see docs for bounding box)
                    using (var image = new Bitmap(file))
                    using (var g = Graphics.FromImage(image))
                    {
                        // Example: Draw rectangle where text is found (requires OCR region info)
                        // g.FillRectangle(Brushes.Black, x, y, width, height);
                        // Save redacted copy
                        image.Save($"./redacted/redacted_{Path.GetFileName(file)}");
                    }
                    File.AppendAllText("redaction_log.csv", $"{file},{pii},redacted\n");
                }
            }
        }
    }
}

Piezīme: Lai precīzi mapētu reģionu, izmantojiet Aspose.OCR atpazīšanas reģiona API, lai iegūtu konstatēto teksta bloku koordinātus, pēc tam precīzāk masku.

Izmantojiet gadījumus un pieteikumus

Juridiskā un atbilstība

Automātiska līgumu, HR failu un regulēto dokumentu redakcija.

Privātuma revīzija

Pārliecinieties, ka PII neizplūst skenētajos arhīvos, uz kuģa vai pierādījumu failos.

Datu zuduma novēršana (Data Loss Prevention)

Pārtrauc nejauši dalīties vai uzglabāt jutīgu informāciju skenētajos attēlos.

Kopīgi izaicinājumi un risinājumi

1. uzdevums: precīzu tekstu reģionu atrašana

Rīze: Izmantojiet OCR teksta reģiona iznākumu un kartes attēla koordinātus maskušanai.

2. izaicinājums: nepatiesi pozitīvi / negatīvi

Rīkojums: Izveidojiet atslēgvārdu sarakstus, validējiet rediģētos attēlus un veiciet revīzijas.

3. izaicinājums: Batch Job Size

Rīze: Paralēli un automātiski kļūdu apstrāde skalai.

Darbības apsvērumi

  • Reģionu aprēķins un attēla rakstīšana var būt lēna lieliem gabaliem — vajadzības gadījumā izmanto async
  • Lejupielādēt visus redakcijas atbilstības pārskatīšanai

Labākās prakses

  • Pārbaudiet reģionu, lai mapētu precizitāti ar dažādiem attēliem
  • Regulāri atjaunina atslēgvārdu sarakstus jauniem PII modeļiem
  • Aizsargā gan oriģinālus, gan rediģētos failus
  • Pārbaudiet manuāli ar spot-checks

Augstākie scenāriji

1. scenārijs: Blur nevis Blackout

Izmantojiet attēla filtrus, lai ziedotu konstatētos reģionus ar subtilāku masku.

2. scenārijs: Custom Redaction/Replacement Text

Pārklājiet pielāgotās etiķetes (piemēram, “REDACTED”) nevis melnā kastē.

Conclusion

Aspose.OCR Image Text Finder for .NET ļauj automatizēt PII / atslēgvārdu redakciju skaitā – samazinot juridisko risku un nodrošinot privātumu visās attēla arhīvās.

Precīzu reģionālo APIs un redakcijas integrāciju, skatiet Aspose.OCR par .NET API atsauci .

 Latviski