Како изградити аутоматски ПИИ или Кључне речи уређивање цеви са .NET
Редактирање лично идентификованих информација (ПИИ) и осетљивих кључних речи у скенираним сликама је од суштинског значаја за приватност, правне и операције поштовања.Аппосе.ОЦР Имиџ Тест Фендер за .НЕТ омогућава аутоматско откривање и уређивање у радним токовима.
Реал светски проблем
Ручно уређивање поверених података у скенираним архивима је споро, непогрешно и скупо.Автоматизација је потребна како би се осигурало поуздано и конзистентно маскирање за ревизије поштовања и приватности.
Преглед решења
Аутоматски открива ПИИ или кључне речи користећи ОЦР, затим маскира, блури или их замењује на слици и сачува уређене резултате – осигуравајући приватност и безбедност.
Принципи
- Visual Studio 2019 или касније
- .NET 6.0 или новији (или .Net Framework 4.6.2+)
- Aspose.OCR za .NET od NuGet
- PII или листа кључних речи у текстуалном датотеку
PM> Install-Package Aspose.OCR
Корак по корак спровођење
Корак 1: Припремите ПИИ / Кључне речи листе и уносне слике
List<string> piiList = new List<string>(File.ReadAllLines("pii_keywords.txt"));
string[] files = Directory.GetFiles("./input", "*.png");
Корак 2: Потрага за ПИИ / Кључне речи
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
foreach (string file in files)
{
foreach (string pii in piiList)
{
bool found = ocr.ImageHasText(file, pii, settings);
if (found)
{
// Proceed to redact in Step 3
}
}
}
Корак 3: Редактирајте или маскирате откривене услове
- Док Асписе.ОЦР открива термине, уређивање мора бити примењено са сличним библиотекама (на пример, Систем.Снимање, СкиаСхарп).
// Example using System.Drawing to overlay black box (simplified)
using (var image = new Bitmap(file))
{
using (var g = Graphics.FromImage(image))
{
// Locate/estimate bounding box for found term (requires mapping OCR region, see docs/API)
// g.FillRectangle(Brushes.Black, x, y, width, height);
}
image.Save($"./redacted/redacted_{Path.GetFileName(file)}");
}
Корак 4: Пријавите уређене датотеке
File.AppendAllText("redaction_log.csv", $"{file},{pii},redacted\n");
Корак 5: Потпуни примјер радног тока бацх
using Aspose.OCR;
using System;
using System.Collections.Generic;
using System.IO;
using System.Drawing;
class Program
{
static void Main(string[] args)
{
List<string> piiList = new List<string>(File.ReadAllLines("pii_keywords.txt"));
string[] files = Directory.GetFiles("./input", "*.png");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
foreach (string file in files)
{
foreach (string pii in piiList)
{
bool found = ocr.ImageHasText(file, pii, settings);
if (found)
{
// Redact by overlay (simplified; see docs for bounding box)
using (var image = new Bitmap(file))
using (var g = Graphics.FromImage(image))
{
// Example: Draw rectangle where text is found (requires OCR region info)
// g.FillRectangle(Brushes.Black, x, y, width, height);
// Save redacted copy
image.Save($"./redacted/redacted_{Path.GetFileName(file)}");
}
File.AppendAllText("redaction_log.csv", $"{file},{pii},redacted\n");
}
}
}
}
}
Напомена: За прецизно мапирање региона, користите АПИ региона препознавања Асписе.ОЦР да бисте добили координате откривених текстуалних блокова, а затим тачно маскирајте.
Коришћење случајева и апликација
Закон и поштовање
Аутоматска редакција уговора, ХР датотека и регулисаних докумената.
Revizija privatnosti
Обезбедите да ПИИ не пролазе у скенираним архивима, наборним или доказним датотекама.
Батцх ДЛП (превенција губитка података)
Престаните случајно дељење или складиштење осетљивих информација у скенираним сликама.
Заједнички изазови и решења
Проблем 1: Проналажење прецизних текстуалних региона
Решење: Користите ОЦР излаз текстуалне области и мапу за координате слике за маскирање.
Проблем 2: Фалсификовани позитивни / негативни
Решење: Направите листе кључних речи, валидирајте уређене слике и извршите ревизије.
Sledeći Чланак Проблем 3: Батцх радна величина
Решење: Паралелно и аутоматско управљање грешкама за скалу.
Размишљање о перформанси
- Регионално израчунавање и писање слике може бити споро за велике партије – ако је потребно, користите асинц
- Пријавите све редакције за преглед у складу са
Најбоља пракса
- Тест региона мапирање тачности са различитим сликама
- Редовно ажурирају листе кључних речи за нове ПИИ обрасца
- Заштитите оригиналне и уређене датотеке
- Валидација са ручним спот-цхековима
Напредни сценарио
Сценарио 1: Блур уместо Блацкаут
Користите филтере слике да блурају откривене области за суптилније маскирање.
Сценарио 2: Прилагођени текст за уређивање / замену
Пребаците прилагођену етикету (на пример, “РЕДАКТИРЕН”) уместо црне кутије.
Закључак
Aspose.OCR Image Text Finder for .NET omogućava automatizaciju PII/keyword redacije na skali – smanjujući pravne rizike i osiguravajući privatnost u arhivima slika.
За прецизне регионалне АПИ и интеграцију редакције, погледајте Aspose.OCR за .NET API референце .