이미지에서 여러 키워드 또는 패턴을 찾는 방법

이미지에서 여러 키워드 또는 패턴을 찾는 방법

광범위한 이미지 아카이브에서 여러 키워드 또는 텍스트 패턴을 검색하는 것은 준수, 보안 및 디지털 발견에 필수적입니다. .NET을 위한 Aspose.OCR Image Text Finder는 키어 또는 regex 패널 목록에 대한 스캔 이미지를 쉽게 배치 할 수 있습니다.

현실 세계 문제

여러 용어 (예를 들어, 이름, ID, 기밀 문장)에 대한 이미지의 수동 검토는 천천 개의 파일을 통해 특히 느리고 신뢰할 수 없습니다.

솔루션 검토

이미지의 배치에 여러 키워드 또는 regex 검색을 실행함으로써 자동 탐지.보고 또는 준수, HR, 또는 디지털 법률 사용 사례를 위해 경기에서 행동.

원칙

  • Visual Studio 2019 또는 이후
  • .NET 6.0 또는 이후 (또는 .Net Framework 4.6.2+)
  • NuGet에서 .NET을 위한 ASPOSE.OCR
PM> Install-Package Aspose.OCR

단계별 실행

단계 1 : ASPOSE.OCR 설치 및 설정

using Aspose.OCR;

단계 2 : 키워드 또는 패턴을 정의하십시오.

List<string> keywords = new List<string> { "Confidential", "PII", "Invoice", "2025" };
List<string> regexPatterns = new List<string> { @"\d{3}-\d{2}-\d{4}", @"[A-Z]{2}[0-9]{6}" }; // SSN, Passport

단계 3: 키워드 / 패턴을위한 검색 이미지를 배치

string[] files = Directory.GetFiles("./input", "*.png");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
foreach (string file in files)
{
    foreach (string keyword in keywords)
    {
        bool found = ocr.ImageHasText(file, keyword, settings);
        if (found) Console.WriteLine($"Keyword '{keyword}' found in {file}");
    }
    foreach (string pattern in regexPatterns)
    {
        bool found = ocr.ImageHasText(file, pattern, settings);
        if (found) Console.WriteLine($"Pattern '{pattern}' found in {file}");
    }
}

단계 4 : 경기에 로그 및 행동

  • 결과를 CSV로 저장하거나 경고를 보내거나 일정을 시작합니다.
// Example: Append to log file
File.AppendAllText("search_log.csv", $"{file},{keyword or pattern},found\n");

단계 5 : 실수 처리 및 성과

  • 강력한 배치 작업을 위해 try/catch를 사용하십시오.
  • 필요하다면 대형 세트를 비교하십시오.
try
{
    // Searching logic
}
catch (Exception ex)
{
    File.AppendAllText("search_errors.log", ex.Message + Environment.NewLine);
}

단계 6 : 완전한 예제

using Aspose.OCR;
using System;
using System.Collections.Generic;
using System.IO;

class Program
{
    static void Main(string[] args)
    {
        List<string> keywords = new List<string> { "Confidential", "PII", "Invoice", "2025" };
        List<string> regexPatterns = new List<string> { @"\d{3}-\d{2}-\d{4}", @"[A-Z]{2}[0-9]{6}" };
        try
        {
            string[] files = Directory.GetFiles("./input", "*.png");
            RecognitionSettings settings = new RecognitionSettings();
            settings.Language = Language.English;
            AsposeOcr ocr = new AsposeOcr();
            foreach (string file in files)
            {
                foreach (string keyword in keywords)
                {
                    bool found = ocr.ImageHasText(file, keyword, settings);
                    if (found)
                        File.AppendAllText("search_log.csv", $"{file},{keyword},found\n");
                }
                foreach (string pattern in regexPatterns)
                {
                    bool found = ocr.ImageHasText(file, pattern, settings);
                    if (found)
                        File.AppendAllText("search_log.csv", $"{file},{pattern},found\n");
                }
            }
        }
        catch (Exception ex)
        {
            File.AppendAllText("search_errors.log", ex.Message + Environment.NewLine);
        }
    }
}

사례 및 응용 프로그램 사용

준수 검토

검은 목록의 단어 또는 민감한 패턴을 위해 스캔 된 파일을 자동으로 확인합니다.

HR, 법률 및 보안

탑승 또는 증거 파일에 기밀 문장, 직원 이름 또는 PII의 존재를 확인합니다.

트렌드 및 주파수 분석

대형 문서 세트에서 시간이 지남에 따라 키워드의 주파수를 계산하고 보고합니다.

일반적인 도전과 해결책

도전 1 : 잘못된 긍정

** 솔루션:** 키워드 및 regex를 재검토하고, edge 사례를 수동으로 검토합니다.

도전 2 : 큰 배치 크기

** 솔루션:** 병렬 처리 및 강력한 오류 처리를 사용합니다.

도전 3 : 다중 언어

솔루션: 언어 배치에 따라 인식 설정 및 키워드 목록을 조정합니다.

성과 고려 사항

  • 배치 작업은 큰 아카이브 - 모니터 CPU, 디스크 및 로그에 오래 걸릴 수 있습니다.
  • 높은 통로를 위해 필요한 경우 균형
  • 리뷰 및 준수에 대한 모든 결과를 기록

모범 사례

  • 정기적으로 키워드 목록을 정리하고 업데이트합니다.
  • 자동 오류 기록 및 보고
  • 대표적인 아카이브 샘플 테스트
  • 안전한 로그 및 검색 결과

고급 시나리오

시나리오 1 : 출력 PDF에서 검색 및 결과를 강조

발견 된 키워드가 강조 된 이미지 수출 (자정 후 처리).

시나리오 2 : 일정한 배치 키워드 검토

일주일 또는 밤에 수행하기 위해 자동 작업.

결론

ASPOSE.OCR Image Text Finder for .NET은 강력하고 자동화된 배치 키워드 및 패턴 검색을 제공하며 이미지 아카이브에 따라 준수, 보안 및 트렌드 분석을 지원합니다.

See .NET API 참조를 위한 ASPOSE.OCR 고급 텍스트 검색 예제.

 한국어