Aspose.OCR과 함께 이미지에서 텍스트를 검색하고 비교하는 방법

Aspose.OCR과 함께 이미지에서 텍스트를 검색하고 비교하는 방법

이미지 내에서 텍스트를 검색하거나 비교하는 것은 준수, 디지털 아카이브 및 자동 분류에 필수적입니다. .NET을 위한 Aspose.OCR Image Text Finder는 PII 탐지에서 법적 검토에 이르기까지 다양한 사용 사례를 통하여 정확하게 이미지를 식별, 검색 및 비교할 수 있습니다.

현실 세계 문제

비즈니스는 종종 민감한 콘텐츠를 검색하거나 서명을 확인하거나 이미지 파일의 다른 버전 사이의 텍스트를 비교해야합니다.수동 검사는 특히 큰 디지털 아카이브 또는 문서 세트에서 느리고 신뢰할 수 없습니다.

솔루션 검토

Aspose.OCR을 사용하면 이미지 내에서 특정 텍스트 또는 패턴을 검색할 수 있으며, 두 개의 이미지의 문자 내용을 비교하여 차이점을 발견 할 수 있습니다. 계약 검토, 준수 또는 디지털 자산 관리에 좋은.

원칙

당신은 필요할 것입니다 :

  • Visual Studio 2019 또는 이후
  • .NET 6.0 또는 이후 (또는 .Net Framework 4.6.2+)
  • NuGet에서 .NET을 위한 ASPOSE.OCR
  • 기본 C# 기술
PM> Install-Package Aspose.OCR

단계별 실행

단계 1 : ASPOSE.OCR 설치 및 설정

패키지를 추가하고 필요한 이름 공간:

using Aspose.OCR;

단계 2 : 사진 파일을 준비하십시오.

검색하거나 비교하려는 이미지를 설정합니다.

string img1 = "document1.png";
string img2 = "document2.jpg";

3단계: 검색 및 비교 옵션 설정

텍스트 검색 (string 또는 regex) 및 비교를 위한 설정을 설정합니다.

RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English; // Adjust as needed

단계 4 : 이미지에서 텍스트를 검색

사용하시기 바랍니다 ImageHasText 빠르고 유연한 텍스트 검색 방법 (지지 스트립 및 regex) :

AsposeOcr ocr = new AsposeOcr();
bool isFound = ocr.ImageHasText(img1, "Confidential", settings); // String search
Console.WriteLine($"Text found: {isFound}");

// Regex search example:
bool regexFound = ocr.ImageHasText(img1, @"\d{3}-\d{2}-\d{4}", settings); // e.g., US SSN pattern
Console.WriteLine($"Regex found: {regexFound}");

단계 5 : 두 개의 이미지의 텍스트를 비교하십시오.

사용하기 CompareImageTexts 텍스트 콘텐츠의 차이점에 대해 알아보십시오 :

int similarity = ocr.CompareImageTexts(img1, img2, settings, true); // true = case-insensitive
Console.WriteLine($"Image text similarity: {similarity}%");

단계 6 : 오류 처리 추가

캡처 및 생산 강도를위한 오류 처리 :

try
{
    AsposeOcr ocr = new AsposeOcr();
    bool found = ocr.ImageHasText(img1, "PII", settings);
    int sim = ocr.CompareImageTexts(img1, img2, settings, false);
}
catch (Exception ex)
{
    Console.WriteLine($"Error: {ex.Message}");
}

단계 7 : 대량 검색 또는 비교를 위해 최적화

  • Async 또는 Parallel 패턴을 사용하여 배치에서 이미지 처리
  • 사전 처리 이미지 (작물, 청소) 더 높은 정확도를 위해
  • 고급 시나리오를 위한 Fine-tune regex
// Example: Search for a pattern in all images in a folder
foreach (string file in Directory.GetFiles("./archive", "*.png"))
{
    bool found = ocr.ImageHasText(file, "Confidential", settings);
    if (found) { Console.WriteLine($"Found in: {file}"); }
}

단계 8 : 완전한 예제

using Aspose.OCR;
using System;

class Program
{
    static void Main(string[] args)
    {
        try
        {
            string img1 = "contract1.png";
            string img2 = "contract2.png";

            RecognitionSettings settings = new RecognitionSettings();
            settings.Language = Language.English;

            AsposeOcr ocr = new AsposeOcr();
            // Search for specific text
            bool isFound = ocr.ImageHasText(img1, "NDA", settings);
            Console.WriteLine($"Text found: {isFound}");

            // Compare two images
            int similarity = ocr.CompareImageTexts(img1, img2, settings, true);
            Console.WriteLine($"Image text similarity: {similarity}%");
        }
        catch (Exception ex)
        {
            Console.WriteLine($"Error: {ex.Message}");
        }
    }
}

사례 및 응용 프로그램 사용

준수 및 PII 탐지

디지털 이미지 아카이브 내에서 기밀 데이터 또는 패턴 (예: ID, SSN)을 검색합니다.

법률 및 계약 검토

서명 또는 편집 후 텍스트 차이에 대한 이미지 기반 계약 또는 문서를 비교합니다.

디지털 자산 관리

비즈니스 프로세스 자동화를 위한 대형 이미지 저장소에서 자동 태그 또는 검색을 가능하게 합니다.

일반적인 도전과 해결책

도전 1 : 다양한 텍스트 스타일을 가진 이미지

** 솔루션:** 사례에 민감하지 않고 regex와 일치하는 방법을 사용하십시오; 다양한 글꼴 / 배경에 테스트합니다.

도전 2 : 큰 배치 검색

** 솔루션:** 가능한 경우 병렬 또는 비동기 작업 흐름과 사전 처리 이미지를 사용합니다.

도전 3 : 복잡한 패턴 또는 편집 된 텍스트

** 솔루션:** 샘플 이미지에 대한 레지크스 및 테스트를 재현; 소음 또는 편집 된 이미지를위한 톤 설정.

성과 고려 사항

  • 큰 아카이브의 속도를 위한 배치 프로세스
  • 최상의 정확성을 위해 고품질의 출처 이미지를 사용하십시오.
  • 가짜 긍정적 인 것을 최소화하기 위해 검색 패턴을 사용하십시오.

모범 사례

  • 먼저 샘플 세트에 있는 모든 검색 및 비교 패턴을 테스트합니다.
  • 안전하게 처리하고 민감한 정보 또는 검색 결과를 기록
  • 기능 및 정확도 개선을 위해 Aspose.OCR을 정기적으로 업데이트합니다.

고급 시나리오

시나리오 1 : 편집을위한 고급 Regex

bool found = ocr.ImageHasText(img1, @"(Account|Card)\s*#:?\s*\d{4,}", settings);

시나리오 2 : 다국어 검색

settings.Language = Language.French;
bool isFound = ocr.ImageHasText(img1, "Confidentiel", settings);

결론

Aspose.OCR Image Text Finder for .NET은 아카이브, 법률 및 준수 작업 흐름을 통해 효율적으로 이미지 기반 텍스트를 검색, 탐지 및 비교할 수 있습니다.

더 많은 예를 찾으십시오 .NET API 참조를 위한 ASPOSE.OCR .

 한국어