Како изградити аутоматски ПИИ или Кључне речи уређивање цеви са .NET

Како изградити аутоматски ПИИ или Кључне речи уређивање цеви са .NET

Редактирање лично идентификованих информација (ПИИ) и осетљивих кључних речи у скенираним сликама је од суштинског значаја за приватност, правне и операције поштовања.Аппосе.ОЦР Имиџ Тест Фендер за .НЕТ омогућава аутоматско откривање и уређивање у радним токовима.

Реал светски проблем

Ручно уређивање поверених података у скенираним архивима је споро, непогрешно и скупо.Автоматизација је потребна како би се осигурало поуздано и конзистентно маскирање за ревизије поштовања и приватности.

Преглед решења

Аутоматски открива ПИИ или кључне речи користећи ОЦР, затим маскира, блури или их замењује на слици и сачува уређене резултате – осигуравајући приватност и безбедност.

Принципи

  • Visual Studio 2019 или касније
  • .NET 6.0 или новији (или .Net Framework 4.6.2+)
  • Aspose.OCR za .NET od NuGet
  • PII или листа кључних речи у текстуалном датотеку
PM> Install-Package Aspose.OCR

Корак по корак спровођење

Корак 1: Припремите ПИИ / Кључне речи листе и уносне слике

List<string> piiList = new List<string>(File.ReadAllLines("pii_keywords.txt"));
string[] files = Directory.GetFiles("./input", "*.png");

Корак 2: Потрага за ПИИ / Кључне речи

RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
foreach (string file in files)
{
    foreach (string pii in piiList)
    {
        bool found = ocr.ImageHasText(file, pii, settings);
        if (found)
        {
            // Proceed to redact in Step 3
        }
    }
}

Корак 3: Редактирајте или маскирате откривене услове

  • Док Асписе.ОЦР открива термине, уређивање мора бити примењено са сличним библиотекама (на пример, Систем.Снимање, СкиаСхарп).
// Example using System.Drawing to overlay black box (simplified)
using (var image = new Bitmap(file))
{
    using (var g = Graphics.FromImage(image))
    {
        // Locate/estimate bounding box for found term (requires mapping OCR region, see docs/API)
        // g.FillRectangle(Brushes.Black, x, y, width, height);
    }
    image.Save($"./redacted/redacted_{Path.GetFileName(file)}");
}

Корак 4: Пријавите уређене датотеке

File.AppendAllText("redaction_log.csv", $"{file},{pii},redacted\n");

Корак 5: Потпуни примјер радног тока бацх

using Aspose.OCR;
using System;
using System.Collections.Generic;
using System.IO;
using System.Drawing;

class Program
{
    static void Main(string[] args)
    {
        List<string> piiList = new List<string>(File.ReadAllLines("pii_keywords.txt"));
        string[] files = Directory.GetFiles("./input", "*.png");
        RecognitionSettings settings = new RecognitionSettings();
        settings.Language = Language.English;
        AsposeOcr ocr = new AsposeOcr();
        foreach (string file in files)
        {
            foreach (string pii in piiList)
            {
                bool found = ocr.ImageHasText(file, pii, settings);
                if (found)
                {
                    // Redact by overlay (simplified; see docs for bounding box)
                    using (var image = new Bitmap(file))
                    using (var g = Graphics.FromImage(image))
                    {
                        // Example: Draw rectangle where text is found (requires OCR region info)
                        // g.FillRectangle(Brushes.Black, x, y, width, height);
                        // Save redacted copy
                        image.Save($"./redacted/redacted_{Path.GetFileName(file)}");
                    }
                    File.AppendAllText("redaction_log.csv", $"{file},{pii},redacted\n");
                }
            }
        }
    }
}

Напомена: За прецизно мапирање региона, користите АПИ региона препознавања Асписе.ОЦР да бисте добили координате откривених текстуалних блокова, а затим тачно маскирајте.

Коришћење случајева и апликација

Закон и поштовање

Аутоматска редакција уговора, ХР датотека и регулисаних докумената.

Revizija privatnosti

Обезбедите да ПИИ не пролазе у скенираним архивима, наборним или доказним датотекама.

Батцх ДЛП (превенција губитка података)

Престаните случајно дељење или складиштење осетљивих информација у скенираним сликама.

Заједнички изазови и решења

Проблем 1: Проналажење прецизних текстуалних региона

Решење: Користите ОЦР излаз текстуалне области и мапу за координате слике за маскирање.

Проблем 2: Фалсификовани позитивни / негативни

Решење: Направите листе кључних речи, валидирајте уређене слике и извршите ревизије.

Sledeći Чланак Проблем 3: Батцх радна величина

Решење: Паралелно и аутоматско управљање грешкама за скалу.

Размишљање о перформанси

  • Регионално израчунавање и писање слике може бити споро за велике партије – ако је потребно, користите асинц
  • Пријавите све редакције за преглед у складу са

Најбоља пракса

  • Тест региона мапирање тачности са различитим сликама
  • Редовно ажурирају листе кључних речи за нове ПИИ обрасца
  • Заштитите оригиналне и уређене датотеке
  • Валидација са ручним спот-цхековима

Напредни сценарио

Сценарио 1: Блур уместо Блацкаут

Користите филтере слике да блурају откривене области за суптилније маскирање.

Сценарио 2: Прилагођени текст за уређивање / замену

Пребаците прилагођену етикету (на пример, “РЕДАКТИРЕН”) уместо црне кутије.

Закључак

Aspose.OCR Image Text Finder for .NET omogućava automatizaciju PII/keyword redacije na skali – smanjujući pravne rizike i osiguravajući privatnost u arhivima slika.

За прецизне регионалне АПИ и интеграцију редакције, погледајте Aspose.OCR за .NET API референце .

 Српски