چگونه اطلاعات حساس را در نتایج OCR با استفاده از Aspose.OCR ذخیره و ویرایش کنیم

چگونه اطلاعات حساس را در نتایج OCR با استفاده از Aspose.OCR ذخیره و ویرایش کنیم

سازمان ها باید قوانین مانند GDPR و CCPA در هنگام پردازش قراردادهای اسکن شده، شناسه ها، یا اسناد پزشکی. این به معنای شناسایی و ویرایش داده های حساس قبل از آرشیو و یا به اشتراک گذاری نتایج OCR. Aspose.OCR برای .NET به شما کمک می کند به اتوماسیون ویراستن و درمان امن برای کسب و کار و انطباق قانونی.

مشکل دنیای واقعی

ویرایش دستی نام ها، اعداد حساب یا سایر PII ها آهسته، بدون خطا و غیر قابل مقیاس است – به ویژه برای آرشیو های بزرگ.

بررسی راه حل

با Aspose.OCR برای .NET، شما می توانید به طور خودکار جستجو، ماسک، و صادرات متن ویرایش شده از هر سند شناخته شده.

پیش شرط

  • Visual Studio 2019 یا بالاتر
  • .NET 6.0 یا بالاتر (یا .NET Framework 4.6.2+)
  • Aspose.OCR برای .NET از NuGet
  • آشنایی با C# regex و نیازهای حریم خصوصی
PM> Install-Package Aspose.OCR

پیاده سازی گام به گام

مرحله 1: نصب و تنظیم Aspose.OCR

using Aspose.OCR;

مرحله دوم: شناسایی و استخراج متن

OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("confidential_contract.png");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);

مرحله 3: شناسایی داده های حساس با استفاده از الگوهای

استفاده از regex یا کلمات کلیدی برای PII (SSN، ایمیل ها، نام ها و غیره.):

string piiPattern = @"(\d{3}-\d{2}-\d{4})|([a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\\.[a-zA-Z]{2,})";
foreach (RecognitionResult result in results)
{
    MatchCollection matches = Regex.Matches(result.RecognitionText, piiPattern);
    // Log, audit, or review matches
}

مرحله چهارم: اطلاعات حساس را ویرایش یا ماسک کنید

جایگزین کردن بازی های حساس با [REDACTED] یا مشابه:

foreach (RecognitionResult result in results)
{
    string redacted = Regex.Replace(result.RecognitionText, piiPattern, "[REDACTED]");
    File.WriteAllText("./output/redacted.txt", redacted);
}

مرحله 5: صادرات به فرمت های امن (PDF، JSON)

foreach (RecognitionResult result in results)
{
    string redacted = Regex.Replace(result.RecognitionText, piiPattern, "[REDACTED]");
    File.WriteAllText("./output/redacted.txt", redacted);
    // Optionally save to PDF/JSON using Aspose.OCR export features
    // result.Save("./output/redacted.pdf", SaveFormat.Pdf);
}

مرحله ششم: ثبت نام و ویرایش

  • بررسی هر رویداد نوشتاری
  • حفظ سوابق برای بررسی انطباق

مرحله هفتم: ویرایش و نظارت اتوماتیک

تمام فایل ها را در یک پوشه پردازش کنید:

foreach (string file in Directory.GetFiles("./input", "*.jpg"))
{
    // Add to OCR batch, then process and redact as above
}

مرحله هشتم: نمونه کامل

using Aspose.OCR;
using System;
using System.Collections.Generic;
using System.IO;
using System.Text.RegularExpressions;

class Program
{
    static void Main(string[] args)
    {
        try
        {
            OcrInput input = new OcrInput(InputType.SingleImage);
            input.Add("confidential_contract.png");
            RecognitionSettings settings = new RecognitionSettings();
            settings.Language = Language.English;
            AsposeOcr ocr = new AsposeOcr();
            List<RecognitionResult> results = ocr.Recognize(input, settings);
            string piiPattern = @"(\d{3}-\d{2}-\d{4})|([a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\\.[a-zA-Z]{2,})";
            foreach (RecognitionResult result in results)
            {
                string redacted = Regex.Replace(result.RecognitionText, piiPattern, "[REDACTED]");
                File.WriteAllText("./output/redacted.txt", redacted);
            }
        }
        catch (Exception ex)
        {
            Console.WriteLine($"Redaction error: {ex.Message}");
        }
    }
}

استفاده از موارد و برنامه ها

انطباق با حریم خصوصی (GDPR / CCPA / PCI)

ویرایش خودکار PII قبل از به اشتراک گذاری، آرشیو و یا پردازش بیشتر.

حقوقی، HR و سوابق پزشکی

به طور ایمن صادرات نسخه های ویرایش شده برای بررسی و یا رعایت جریان های کار.

حسابرسی و مدیریت ریسک

اطمینان حاصل کنید که با سوابق حسابرسی و ماسک مداوم مطابقت دارد.

چالش ها و راه حل های مشترک

چالش اول: الگوهای حساس از دست رفته

راه حل: الگوهای regex را گسترش دهید؛ به طور کامل بر روی داده های متنوع آزمایش کنید.

چالش دوم: امنیت فایل های خروجی

راه حل: خروجی ها را در مکان های رمزگذاری شده با دسترسی محدود ذخیره کنید.

چالش سوم: عملکرد در بازی های بزرگ

راه حل: اتوماتیک، موازی و نظارت بر ویرایش های شکست خورده.

بررسی عملکرد

  • Regex و ویرایش می تواند کارهای بزرگ را کند کند؛ اندازه شاخه نظارت
  • حفاظت از فایل های موقت و صادر شده
  • به طور منظم در برابر قوانین انطباق

بهترین شیوه‌ها

  • به روز رسانی الگوهای regex به عنوان تهدیدات و یا تغییر مقررات
  • ثبت هر نسخه برای انطباق
  • اطمینان از تمام داده ها و نتایج پردازش شده
  • آموزش کارکنان در مورد نیازهای حریم خصوصی و اتوماسیون

سناریوهای پیشرفته

سناریو 1: ویرایش چند زبانه PII

گسترش رگکس و لیست کلمات کلیدی برای الگوهای غیر انگلیسی و زمینه.

سناریو 2: صادرات نتایج اصلاح شده به طور مستقیم به ابر امن

یکپارچه سازی با S3، Azure یا سایر نقاط پایان امن پس از ویرایش.

نتیجه گیری

Aspose.OCR برای .NET PII و نوشتن داده های حساس را اتوماتیک می کند، با اطمینان از انطباق و مدیریت اسناد سریع، منسجم و آماده حسابرسی.

برای جریان های کار حریم خصوصی و راهنمایی های نوشتاری پیشرفته، نگاهی به Aspose.OCR برای .NET API مرجع .

 فارسی