Hvordan man søger flere nøgleord eller mønstre i billeder

Hvordan man søger flere nøgleord eller mønstre i billeder

Søgning efter flere nøgleord eller tekstmønstre i store billedarkiver er afgørende for overholdelse, sikkerhed og digital opdagelse. Aspose.OCR Image Text Finder for .NET gør det nemt at batch scanbilleder for lister af nøglebilleder eller regex mønster.

Det virkelige problem

Manuel anmeldelse af billeder for flere termer (f.eks. navne, ID’er, fortrolige sætninger) er langsom og upålidelig, især over tusindvis af filer.

Oversigt over løsning

Automatisk opdagelse ved at køre flere nøgleord eller regex søgninger på pakker af billeder. rapporter eller handle på kampe for overholdelse, HR, eller digitale forensiske brug sager.

Forudsætninger

  • Visual Studio 2019 eller senere
  • .NET 6.0 eller nyere (eller .Net Framework 4.6.2+)
  • Aspose.OCR til .NET fra NuGet
PM> Install-Package Aspose.OCR

Step-by-Step gennemførelse

Trin 1: Installation og konfiguration af Aspose.OCR

using Aspose.OCR;

Trin 2: Indtast dine nøgleord eller mønstre

List<string> keywords = new List<string> { "Confidential", "PII", "Invoice", "2025" };
List<string> regexPatterns = new List<string> { @"\d{3}-\d{2}-\d{4}", @"[A-Z]{2}[0-9]{6}" }; // SSN, Passport

Trin 3: Batch søgbilleder for nøgleord/Patterns

string[] files = Directory.GetFiles("./input", "*.png");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
foreach (string file in files)
{
    foreach (string keyword in keywords)
    {
        bool found = ocr.ImageHasText(file, keyword, settings);
        if (found) Console.WriteLine($"Keyword '{keyword}' found in {file}");
    }
    foreach (string pattern in regexPatterns)
    {
        bool found = ocr.ImageHasText(file, pattern, settings);
        if (found) Console.WriteLine($"Pattern '{pattern}' found in {file}");
    }
}

Trin 4: Log og handling på kampe

  • Save resultater til CSV, send alarmer eller udløse arbejdsprocessen på match.
// Example: Append to log file
File.AppendAllText("search_log.csv", $"{file},{keyword or pattern},found\n");

Trin 5: Fejlbehandling og præstation

  • Brug try/catch til robuste batchjobs
  • Parallel til store sæt, hvis det er nødvendigt
try
{
    // Searching logic
}
catch (Exception ex)
{
    File.AppendAllText("search_errors.log", ex.Message + Environment.NewLine);
}

Næste skridt: Et komplet eksempel

using Aspose.OCR;
using System;
using System.Collections.Generic;
using System.IO;

class Program
{
    static void Main(string[] args)
    {
        List<string> keywords = new List<string> { "Confidential", "PII", "Invoice", "2025" };
        List<string> regexPatterns = new List<string> { @"\d{3}-\d{2}-\d{4}", @"[A-Z]{2}[0-9]{6}" };
        try
        {
            string[] files = Directory.GetFiles("./input", "*.png");
            RecognitionSettings settings = new RecognitionSettings();
            settings.Language = Language.English;
            AsposeOcr ocr = new AsposeOcr();
            foreach (string file in files)
            {
                foreach (string keyword in keywords)
                {
                    bool found = ocr.ImageHasText(file, keyword, settings);
                    if (found)
                        File.AppendAllText("search_log.csv", $"{file},{keyword},found\n");
                }
                foreach (string pattern in regexPatterns)
                {
                    bool found = ocr.ImageHasText(file, pattern, settings);
                    if (found)
                        File.AppendAllText("search_log.csv", $"{file},{pattern},found\n");
                }
            }
        }
        catch (Exception ex)
        {
            File.AppendAllText("search_errors.log", ex.Message + Environment.NewLine);
        }
    }
}

Brug af tilfælde og applikationer

Overensstemmelsesaudits

Automatisk tjek scannede arkiver for sortlistede ord eller følsomme mønstre.

HR, juridisk og sikkerhed

Detekter tilstedeværelsen af fortrolige sætninger, medarbejdernavn eller PII i onboarding eller bevisfiler.

Trend- og frekvensanalyse

Tænk og rapporter frekvensen af nøgleord over tid i store dokumenter.

Fælles udfordringer og løsninger

Udfordring 1: Falske positive

Løsning: Refine nøgleord og regex; gennemgå edge sager manuelt.

Udfordring 2: Stor batch størrelse

Løsning: Brug parallel behandling og robust fejlbehandling.

Udfordring 3: Flere sprog

Løsning: Tilpasse genkendelsesindstillinger og nøgleordlister pr. sprogpakke.

Performance overvejelser

  • Batch jobs kan køre lang tid for store arkiver – monitor CPU, disk og logs
  • Paralleliser, hvis det er nødvendigt for høj gennemsnit
  • Log alle resultater for gennemgang og overholdelse

Bedste praksis

  • Rengøring og opdatering af nøgleordlister regelmæssigt
  • Automatisk fejllogging og rapportering
  • Test på repræsentative arkiver
  • Sikker log og søgeresultater

Avancerede scenarier

Scenario 1: Søgning og fremhævelse af resultater i udgang PDF

Eksport billeder med fundet nøgleord fremhævet (anpasset post-processing).

Scenario 2: Regelmæssige Batch Keyword Audits

Automatisk arbejde at køre om natten eller om ugen for overholdelse.

Konklusion

Aspose.OCR Image Text Finder for .NET giver en kraftig, automatiseret pakkeord og mønster søgning – der understøtter overensstemmelse, sikkerhed og trendanalyse i billedarkiverne.

See Aspose.OCR til .NET API Reference For avanceret tekst søgning eksempler.

 Dansk