Aspose.OCR과 함께 이미지에서 텍스트를 검색하고 비교하는 방법
이미지 내에서 텍스트를 검색하거나 비교하는 것은 준수, 디지털 아카이브 및 자동 분류에 필수적입니다. .NET을 위한 Aspose.OCR Image Text Finder는 PII 탐지에서 법적 검토에 이르기까지 다양한 사용 사례를 통하여 정확하게 이미지를 식별, 검색 및 비교할 수 있습니다.
현실 세계 문제
비즈니스는 종종 민감한 콘텐츠를 검색하거나 서명을 확인하거나 이미지 파일의 다른 버전 사이의 텍스트를 비교해야합니다.수동 검사는 특히 큰 디지털 아카이브 또는 문서 세트에서 느리고 신뢰할 수 없습니다.
솔루션 검토
Aspose.OCR을 사용하면 이미지 내에서 특정 텍스트 또는 패턴을 검색할 수 있으며, 두 개의 이미지의 문자 내용을 비교하여 차이점을 발견 할 수 있습니다. 계약 검토, 준수 또는 디지털 자산 관리에 좋은.
원칙
당신은 필요할 것입니다 :
- Visual Studio 2019 또는 이후
- .NET 6.0 또는 이후 (또는 .Net Framework 4.6.2+)
- NuGet에서 .NET을 위한 ASPOSE.OCR
- 기본 C# 기술
PM> Install-Package Aspose.OCR
단계별 실행
단계 1 : ASPOSE.OCR 설치 및 설정
패키지를 추가하고 필요한 이름 공간:
using Aspose.OCR;
단계 2 : 사진 파일을 준비하십시오.
검색하거나 비교하려는 이미지를 설정합니다.
string img1 = "document1.png";
string img2 = "document2.jpg";
3단계: 검색 및 비교 옵션 설정
텍스트 검색 (string 또는 regex) 및 비교를 위한 설정을 설정합니다.
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English; // Adjust as needed
단계 4 : 이미지에서 텍스트를 검색
사용하시기 바랍니다 ImageHasText
빠르고 유연한 텍스트 검색 방법 (지지 스트립 및 regex) :
AsposeOcr ocr = new AsposeOcr();
bool isFound = ocr.ImageHasText(img1, "Confidential", settings); // String search
Console.WriteLine($"Text found: {isFound}");
// Regex search example:
bool regexFound = ocr.ImageHasText(img1, @"\d{3}-\d{2}-\d{4}", settings); // e.g., US SSN pattern
Console.WriteLine($"Regex found: {regexFound}");
단계 5 : 두 개의 이미지의 텍스트를 비교하십시오.
사용하기 CompareImageTexts
텍스트 콘텐츠의 차이점에 대해 알아보십시오 :
int similarity = ocr.CompareImageTexts(img1, img2, settings, true); // true = case-insensitive
Console.WriteLine($"Image text similarity: {similarity}%");
단계 6 : 오류 처리 추가
캡처 및 생산 강도를위한 오류 처리 :
try
{
AsposeOcr ocr = new AsposeOcr();
bool found = ocr.ImageHasText(img1, "PII", settings);
int sim = ocr.CompareImageTexts(img1, img2, settings, false);
}
catch (Exception ex)
{
Console.WriteLine($"Error: {ex.Message}");
}
단계 7 : 대량 검색 또는 비교를 위해 최적화
- Async 또는 Parallel 패턴을 사용하여 배치에서 이미지 처리
- 사전 처리 이미지 (작물, 청소) 더 높은 정확도를 위해
- 고급 시나리오를 위한 Fine-tune regex
// Example: Search for a pattern in all images in a folder
foreach (string file in Directory.GetFiles("./archive", "*.png"))
{
bool found = ocr.ImageHasText(file, "Confidential", settings);
if (found) { Console.WriteLine($"Found in: {file}"); }
}
단계 8 : 완전한 예제
using Aspose.OCR;
using System;
class Program
{
static void Main(string[] args)
{
try
{
string img1 = "contract1.png";
string img2 = "contract2.png";
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
// Search for specific text
bool isFound = ocr.ImageHasText(img1, "NDA", settings);
Console.WriteLine($"Text found: {isFound}");
// Compare two images
int similarity = ocr.CompareImageTexts(img1, img2, settings, true);
Console.WriteLine($"Image text similarity: {similarity}%");
}
catch (Exception ex)
{
Console.WriteLine($"Error: {ex.Message}");
}
}
}
사례 및 응용 프로그램 사용
준수 및 PII 탐지
디지털 이미지 아카이브 내에서 기밀 데이터 또는 패턴 (예: ID, SSN)을 검색합니다.
법률 및 계약 검토
서명 또는 편집 후 텍스트 차이에 대한 이미지 기반 계약 또는 문서를 비교합니다.
디지털 자산 관리
비즈니스 프로세스 자동화를 위한 대형 이미지 저장소에서 자동 태그 또는 검색을 가능하게 합니다.
일반적인 도전과 해결책
도전 1 : 다양한 텍스트 스타일을 가진 이미지
** 솔루션:** 사례에 민감하지 않고 regex와 일치하는 방법을 사용하십시오; 다양한 글꼴 / 배경에 테스트합니다.
도전 2 : 큰 배치 검색
** 솔루션:** 가능한 경우 병렬 또는 비동기 작업 흐름과 사전 처리 이미지를 사용합니다.
도전 3 : 복잡한 패턴 또는 편집 된 텍스트
** 솔루션:** 샘플 이미지에 대한 레지크스 및 테스트를 재현; 소음 또는 편집 된 이미지를위한 톤 설정.
성과 고려 사항
- 큰 아카이브의 속도를 위한 배치 프로세스
- 최상의 정확성을 위해 고품질의 출처 이미지를 사용하십시오.
- 가짜 긍정적 인 것을 최소화하기 위해 검색 패턴을 사용하십시오.
모범 사례
- 먼저 샘플 세트에 있는 모든 검색 및 비교 패턴을 테스트합니다.
- 안전하게 처리하고 민감한 정보 또는 검색 결과를 기록
- 기능 및 정확도 개선을 위해 Aspose.OCR을 정기적으로 업데이트합니다.
고급 시나리오
시나리오 1 : 편집을위한 고급 Regex
bool found = ocr.ImageHasText(img1, @"(Account|Card)\s*#:?\s*\d{4,}", settings);
시나리오 2 : 다국어 검색
settings.Language = Language.French;
bool isFound = ocr.ImageHasText(img1, "Confidentiel", settings);
결론
Aspose.OCR Image Text Finder for .NET은 아카이브, 법률 및 준수 작업 흐름을 통해 효율적으로 이미지 기반 텍스트를 검색, 탐지 및 비교할 수 있습니다.
더 많은 예를 찾으십시오 .NET API 참조를 위한 ASPOSE.OCR .