چگونه یک PII اتوماتیک یا خط لوله ویرایش کلمات کلیدی با .NET بسازیم
ویرایش اطلاعات قابل شناسایی شخصی (PII) و کلمات کلیدی حساس در تصاویر اسکن شده برای عملیات حفظ حریم خصوصی، حقوقی و انطباق ضروری است. Aspose.OCR Image Text Finder برای .NET اجازه می دهد تا به طور خودکار تشخیص و نوشتن در جریان های کار بسته.
مشکل دنیای واقعی
ویرایش دستی اطلاعات محرمانه در اسناد اسکن شده آهسته، بدون خطا و گران است. اتوماسیون برای اطمینان از مخفی کردن قابل اعتماد و منسجم برای نظارت بر انطباق و حریم خصوصی مورد نیاز است .
بررسی راه حل
به طور خودکار PII یا کلمات کلیدی را با استفاده از OCR تشخیص دهید، سپس آنها را در تصویر ماسک کنید، برش دهید یا جایگزین کنید و نتایج ویرایش شده را ذخیره کنید – حریم خصوصی و امنیت را تضمین کنید.
پیش شرط
- Visual Studio 2019 یا بالاتر
- .NET 6.0 یا بالاتر (یا .Net Framework 4.6.2+)
- Aspose.OCR برای .NET از NuGet
- PII یا لیست کلمات کلیدی در یک فایل متن
PM> Install-Package Aspose.OCR
پیاده سازی گام به گام
مرحله 1: آماده سازی PII / لیست کلمات کلیدی و تصاویر ورودی
List<string> piiList = new List<string>(File.ReadAllLines("pii_keywords.txt"));
string[] files = Directory.GetFiles("./input", "*.png");
مرحله 2: جستجو برای PII / کلمات کلیدی
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
foreach (string file in files)
{
foreach (string pii in piiList)
{
bool found = ocr.ImageHasText(file, pii, settings);
if (found)
{
// Proceed to redact in Step 3
}
}
}
مرحله 3: ویرایش یا ماسک شرایط شناسایی شده
- در حالی که Aspose.OCR اصطلاحات را تشخیص می دهد، ویرایش باید با کتابخانه های تصویر (به عنوان مثال، System.Drawing، SkiaSharp) اعمال شود.
// Example using System.Drawing to overlay black box (simplified)
using (var image = new Bitmap(file))
{
using (var g = Graphics.FromImage(image))
{
// Locate/estimate bounding box for found term (requires mapping OCR region, see docs/API)
// g.FillRectangle(Brushes.Black, x, y, width, height);
}
image.Save($"./redacted/redacted_{Path.GetFileName(file)}");
}
مرحله چهارم: فایل های ویرایش شده را وارد کنید
File.AppendAllText("redaction_log.csv", $"{file},{pii},redacted\n");
مرحله 5: نمونه کامل جریان کار باتش
using Aspose.OCR;
using System;
using System.Collections.Generic;
using System.IO;
using System.Drawing;
class Program
{
static void Main(string[] args)
{
List<string> piiList = new List<string>(File.ReadAllLines("pii_keywords.txt"));
string[] files = Directory.GetFiles("./input", "*.png");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
foreach (string file in files)
{
foreach (string pii in piiList)
{
bool found = ocr.ImageHasText(file, pii, settings);
if (found)
{
// Redact by overlay (simplified; see docs for bounding box)
using (var image = new Bitmap(file))
using (var g = Graphics.FromImage(image))
{
// Example: Draw rectangle where text is found (requires OCR region info)
// g.FillRectangle(Brushes.Black, x, y, width, height);
// Save redacted copy
image.Save($"./redacted/redacted_{Path.GetFileName(file)}");
}
File.AppendAllText("redaction_log.csv", $"{file},{pii},redacted\n");
}
}
}
}
}
نکته: برای نقشه برداری دقیق منطقه، از APIs منطقه شناسایی Aspose.OCR استفاده کنید تا هماهنگی های بلوک های متن کشف شده را بدست آورید و سپس دقیقا ماسک کنید.
استفاده از موارد و برنامه ها
قانون و انطباق
ویرایش اتوماتیک قراردادهای، فایل های HR و اسناد تنظیم شده.
حسابرسی حریم خصوصی
اطمینان حاصل کنید که هیچ PII در اسناد اسکن شده، بر روی کشتی، و یا فایل های شواهد.
پیشگیری از از دست دادن داده (Data Loss Prevention)
توقف به طور تصادفی به اشتراک گذاری یا ذخیره اطلاعات حساس در تصاویر اسکن شده.
چالش ها و راه حل های مشترک
چالش اول: پیدا کردن مناطق متن دقیق
** راه حل:** از خروجی منطقه متن OCR و نقشه برای مخفی کردن هماهنگی های تصویر استفاده کنید.
چالش دوم: مثبت ها و منفی ها
** راه حل:** لیست کلمات کلیدی را تایپ کنید، تصاویر ویرایش شده را تأیید کنید و حسابرسی ها را انجام دهید.
چالش 3 : اندازه کار بوته
** راه حل:** به صورت موازی و اتوماتیک مدیریت خطا برای مقیاس.
بررسی عملکرد
- محاسبه منطقه و نوشتن تصویر ممکن است برای بسته های بزرگ آهسته باشد – در صورت لزوم از async استفاده کنید.
- ثبت نام تمام مقالات برای بررسی انطباق
بهترین شیوهها
- آزمایش منطقه نقشه برداری دقیق با تصاویر متنوع
- به طور منظم به روز رسانی لیست کلمات کلیدی برای الگوهای جدید PII
- حفظ فایل های اصلی و ویرایش شده
- تصدیق با چک های مکان دستی
سناریوهای پیشرفته
سناریو 1: Blur به جای Blackout
از فیلترهای تصویر برای آبیاری مناطق شناسایی شده برای ماسک های ظریف تر استفاده کنید.
سناریو 2: ویرایش سفارشی / جایگزین متن
برچسب های سفارشی (به عنوان مثال، “REDACTED”) را به جای جعبه سیاه پوشش دهید.
نتیجه گیری
Aspose.OCR Image Text Finder برای .NET به شما اجازه می دهد تا PII / کلمه کلیدی را در مقیاس خودکار کنید – ریسک قانونی را کاهش دهید و حریم خصوصی در سراسر آرشیو های تصویر را تضمین کنید.
برای APIs منطقه دقیق و ادغام نوشتاری، ببینید Aspose.OCR برای .NET API مرجع .