이미지에서 여러 키워드 또는 패턴을 찾는 방법
광범위한 이미지 아카이브에서 여러 키워드 또는 텍스트 패턴을 검색하는 것은 준수, 보안 및 디지털 발견에 필수적입니다. .NET을 위한 Aspose.OCR Image Text Finder는 키어 또는 regex 패널 목록에 대한 스캔 이미지를 쉽게 배치 할 수 있습니다.
현실 세계 문제
여러 용어 (예를 들어, 이름, ID, 기밀 문장)에 대한 이미지의 수동 검토는 천천 개의 파일을 통해 특히 느리고 신뢰할 수 없습니다.
솔루션 검토
이미지의 배치에 여러 키워드 또는 regex 검색을 실행함으로써 자동 탐지.보고 또는 준수, HR, 또는 디지털 법률 사용 사례를 위해 경기에서 행동.
원칙
- Visual Studio 2019 또는 이후
- .NET 6.0 또는 이후 (또는 .Net Framework 4.6.2+)
- NuGet에서 .NET을 위한 ASPOSE.OCR
PM> Install-Package Aspose.OCR
단계별 실행
단계 1 : ASPOSE.OCR 설치 및 설정
using Aspose.OCR;
단계 2 : 키워드 또는 패턴을 정의하십시오.
List<string> keywords = new List<string> { "Confidential", "PII", "Invoice", "2025" };
List<string> regexPatterns = new List<string> { @"\d{3}-\d{2}-\d{4}", @"[A-Z]{2}[0-9]{6}" }; // SSN, Passport
단계 3: 키워드 / 패턴을위한 검색 이미지를 배치
string[] files = Directory.GetFiles("./input", "*.png");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
foreach (string file in files)
{
foreach (string keyword in keywords)
{
bool found = ocr.ImageHasText(file, keyword, settings);
if (found) Console.WriteLine($"Keyword '{keyword}' found in {file}");
}
foreach (string pattern in regexPatterns)
{
bool found = ocr.ImageHasText(file, pattern, settings);
if (found) Console.WriteLine($"Pattern '{pattern}' found in {file}");
}
}
단계 4 : 경기에 로그 및 행동
- 결과를 CSV로 저장하거나 경고를 보내거나 일정을 시작합니다.
// Example: Append to log file
File.AppendAllText("search_log.csv", $"{file},{keyword or pattern},found\n");
단계 5 : 실수 처리 및 성과
- 강력한 배치 작업을 위해 try/catch를 사용하십시오.
- 필요하다면 대형 세트를 비교하십시오.
try
{
// Searching logic
}
catch (Exception ex)
{
File.AppendAllText("search_errors.log", ex.Message + Environment.NewLine);
}
단계 6 : 완전한 예제
using Aspose.OCR;
using System;
using System.Collections.Generic;
using System.IO;
class Program
{
static void Main(string[] args)
{
List<string> keywords = new List<string> { "Confidential", "PII", "Invoice", "2025" };
List<string> regexPatterns = new List<string> { @"\d{3}-\d{2}-\d{4}", @"[A-Z]{2}[0-9]{6}" };
try
{
string[] files = Directory.GetFiles("./input", "*.png");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
foreach (string file in files)
{
foreach (string keyword in keywords)
{
bool found = ocr.ImageHasText(file, keyword, settings);
if (found)
File.AppendAllText("search_log.csv", $"{file},{keyword},found\n");
}
foreach (string pattern in regexPatterns)
{
bool found = ocr.ImageHasText(file, pattern, settings);
if (found)
File.AppendAllText("search_log.csv", $"{file},{pattern},found\n");
}
}
}
catch (Exception ex)
{
File.AppendAllText("search_errors.log", ex.Message + Environment.NewLine);
}
}
}
사례 및 응용 프로그램 사용
준수 검토
검은 목록의 단어 또는 민감한 패턴을 위해 스캔 된 파일을 자동으로 확인합니다.
HR, 법률 및 보안
탑승 또는 증거 파일에 기밀 문장, 직원 이름 또는 PII의 존재를 확인합니다.
트렌드 및 주파수 분석
대형 문서 세트에서 시간이 지남에 따라 키워드의 주파수를 계산하고 보고합니다.
일반적인 도전과 해결책
도전 1 : 잘못된 긍정
** 솔루션:** 키워드 및 regex를 재검토하고, edge 사례를 수동으로 검토합니다.
도전 2 : 큰 배치 크기
** 솔루션:** 병렬 처리 및 강력한 오류 처리를 사용합니다.
도전 3 : 다중 언어
솔루션: 언어 배치에 따라 인식 설정 및 키워드 목록을 조정합니다.
성과 고려 사항
- 배치 작업은 큰 아카이브 - 모니터 CPU, 디스크 및 로그에 오래 걸릴 수 있습니다.
- 높은 통로를 위해 필요한 경우 균형
- 리뷰 및 준수에 대한 모든 결과를 기록
모범 사례
- 정기적으로 키워드 목록을 정리하고 업데이트합니다.
- 자동 오류 기록 및 보고
- 대표적인 아카이브 샘플 테스트
- 안전한 로그 및 검색 결과
고급 시나리오
시나리오 1 : 출력 PDF에서 검색 및 결과를 강조
발견 된 키워드가 강조 된 이미지 수출 (자정 후 처리).
시나리오 2 : 일정한 배치 키워드 검토
일주일 또는 밤에 수행하기 위해 자동 작업.
결론
ASPOSE.OCR Image Text Finder for .NET은 강력하고 자동화된 배치 키워드 및 패턴 검색을 제공하며 이미지 아카이브에 따라 준수, 보안 및 트렌드 분석을 지원합니다.
See .NET API 참조를 위한 ASPOSE.OCR 고급 텍스트 검색 예제.