Aspose.OCR을 사용하여 OCR 결과에 민감한 정보를 보장하고 편집하는 방법

Aspose.OCR을 사용하여 OCR 결과에 민감한 정보를 보장하고 편집하는 방법

조직은 스캔 된 계약, ID 또는 의료 문서를 처리 할 때 GDPR 및 CCPA와 같은 규정을 준수해야합니다.이것은 OCR 결과를 아카이브하거나 공유하기 전에 민감한 데이터를 식별하고 편집하는 것입니다. .NET을위한 Aspose.OCR은 비즈니스 및 법적 준수를 위해 편지를 자동화하고 안전한 처리를 도와줍니다.

현실 세계 문제

이름, 계정 번호 또는 기타 PII의 수동 편집은 느리고, 오류가 발생하며, 특히 큰 아카이브의 경우 크지 않습니다.자동화는 위험을 줄이고 일관된 개인 정보 보호를 제공합니다.

솔루션 검토

Aspose.OCR for .NET, 당신은 자동으로 검색, 마스크, 그리고 어떤 인식 된 문서에서 편집 된 텍스트를 수출 할 수 있습니다.

원칙

  • Visual Studio 2019 또는 이후
  • .NET 6.0 또는 이후 (또는 .Net Framework 4.6.2+)
  • NuGet에서 .NET을 위한 ASPOSE.OCR
  • C# regex 및 개인 정보 보호 요구 사항에 대한 친밀감
PM> Install-Package Aspose.OCR

단계별 실행

단계 1 : ASPOSE.OCR 설치 및 설정

using Aspose.OCR;

단계 2 : 텍스트를 인식하고 추출

OcrInput input = new OcrInput(InputType.SingleImage);
input.Add("confidential_contract.png");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
List<RecognitionResult> results = ocr.Recognize(input, settings);

단계 3: 패턴을 사용하여 민감한 데이터를 식별

PII에 대한 regex 또는 키워드를 사용하십시오 (SSN, 이메일, 이름 등):

string piiPattern = @"(\d{3}-\d{2}-\d{4})|([a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\\.[a-zA-Z]{2,})";
foreach (RecognitionResult result in results)
{
    MatchCollection matches = Regex.Matches(result.RecognitionText, piiPattern);
    // Log, audit, or review matches
}

단계 4: 편집 또는 마스크 민감한 정보

민감한 경기를 [REDACTED] 또는 이와 유사한 경기로 대체하십시오 :

foreach (RecognitionResult result in results)
{
    string redacted = Regex.Replace(result.RecognitionText, piiPattern, "[REDACTED]");
    File.WriteAllText("./output/redacted.txt", redacted);
}

단계 5 : 안전한 형식으로 수출 (PDF, JSON)

foreach (RecognitionResult result in results)
{
    string redacted = Regex.Replace(result.RecognitionText, piiPattern, "[REDACTED]");
    File.WriteAllText("./output/redacted.txt", redacted);
    // Optionally save to PDF/JSON using Aspose.OCR export features
    // result.Save("./output/redacted.pdf", SaveFormat.Pdf);
}

단계 6 : 로그 및 유효 편집

  • 각 편집 이벤트에 대한 검토
  • 준수 검토를 위한 로그 유지

단계 7 : 자동 배치 편집 및 모니터링

모든 파일을 하나의 폴더로 처리합니다 :

foreach (string file in Directory.GetFiles("./input", "*.jpg"))
{
    // Add to OCR batch, then process and redact as above
}

단계 8 : 완전한 예제

using Aspose.OCR;
using System;
using System.Collections.Generic;
using System.IO;
using System.Text.RegularExpressions;

class Program
{
    static void Main(string[] args)
    {
        try
        {
            OcrInput input = new OcrInput(InputType.SingleImage);
            input.Add("confidential_contract.png");
            RecognitionSettings settings = new RecognitionSettings();
            settings.Language = Language.English;
            AsposeOcr ocr = new AsposeOcr();
            List<RecognitionResult> results = ocr.Recognize(input, settings);
            string piiPattern = @"(\d{3}-\d{2}-\d{4})|([a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\\.[a-zA-Z]{2,})";
            foreach (RecognitionResult result in results)
            {
                string redacted = Regex.Replace(result.RecognitionText, piiPattern, "[REDACTED]");
                File.WriteAllText("./output/redacted.txt", redacted);
            }
        }
        catch (Exception ex)
        {
            Console.WriteLine($"Redaction error: {ex.Message}");
        }
    }
}

사례 및 응용 프로그램 사용

개인 정보 보호 준수 (GDPR / CCPA / PCI)

공유, 아카이브 또는 추가 처리 전에 PII의 자동 편집.

법률, HR 및 의료 기록

안전하게 수출 편집 된 버전을 검토하거나 작업 흐름을 준수합니다.

컨설팅 및 위험 관리

검토 기록과 일관된 마스크를 준수하십시오.

일반적인 도전과 해결책

도전 1 : 잃어버린 민감한 패턴

솔루션: 레지크스 패턴을 확장; 다양한 데이터를 철저히 테스트합니다.

도전 2 : 출력 파일 보안

** 솔루션:** 제한된 액세스가 있는 암호화된 위치에 출구를 저장합니다.

도전 3 : 큰 배치에서의 성과

** 솔루션:** 실패한 편집을 자동화, 병렬화 및 모니터링합니다.

성과 고려 사항

  • Regex 및 편집은 큰 작업을 느리게 할 수 있습니다; 모니터링 크기
  • 안전한 임시 및 수출 파일
  • 규칙 준수에 대해 정기적으로 검증

모범 사례

  • 위협 또는 규정 변경으로 regex 패턴을 업데이트
  • 각 편집을 기록하여 준수
  • 처리된 모든 데이터와 결과를 보장합니다.
  • 개인 정보 보호 요구 사항 및 자동화에 대한 직원 교육

고급 시나리오

시나리오 1 : 다국어 PII 편집

영어가 아닌 패턴과 맥락을위한 레지크스 및 키워드 목록을 확장합니다.

시나리오 2 : Secure Cloud에 직접 수출된 결과

작성 후 S3, Azure 또는 다른 안전한 끝점과 통합하십시오.

결론

Aspose.OCR for .NET는 PII 및 민감한 데이터 편집을 자동화하여 준수 및 안전한 문서 처리 빠르고 일관되고 검토 준비가되어 있습니다.

개인 정보 보호 작업 흐름 및 고급 편집 팁, 참조 .NET API 참조를 위한 ASPOSE.OCR .

 한국어