Hvordan søke etter flere nøkkelord eller mønstre i bilder

Hvordan søke etter flere nøkkelord eller mønstre i bilder

Søk etter flere nøkkelord eller tekstmønstre i store bildearkiver er avgjørende for overholdelse, sikkerhet og digital oppdagelse. Aspose.OCR Image Text Finder for .NET gjør det enkelt å batch scan bilder for lister av nøkkels ord eller regex mønster.

Real-verdens problem

Manuell oversikt over bilder for flere termer (f.eks. navn, ID, konfidensielle fraser) er sakte og upålitelig, spesielt over tusenvis av filer.

Oversikt over løsning

Automatisk oppdagelse ved å kjøre flere søkeord eller regex søk på bilder. rapporter eller handle på matcher for overholdelse, HR, eller digitale forensikk bruken av tilfeller.

Prerequisites

  • Visual Studio 2019 eller senere
  • .NET 6.0 eller nyere (eller .Net Framework 4.6.2+)
  • Aspose.OCR for .NET fra NuGet
PM> Install-Package Aspose.OCR

Step-by-step implementering

Steg 1: Installere og konfigurere Aspose.OCR

using Aspose.OCR;

Steg 2: Definer dine nøkkelord eller mønstre

List<string> keywords = new List<string> { "Confidential", "PII", "Invoice", "2025" };
List<string> regexPatterns = new List<string> { @"\d{3}-\d{2}-\d{4}", @"[A-Z]{2}[0-9]{6}" }; // SSN, Passport

Trinn 3: Batch søk bilder for nøkkelord/Patterns

string[] files = Directory.GetFiles("./input", "*.png");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
foreach (string file in files)
{
    foreach (string keyword in keywords)
    {
        bool found = ocr.ImageHasText(file, keyword, settings);
        if (found) Console.WriteLine($"Keyword '{keyword}' found in {file}");
    }
    foreach (string pattern in regexPatterns)
    {
        bool found = ocr.ImageHasText(file, pattern, settings);
        if (found) Console.WriteLine($"Pattern '{pattern}' found in {file}");
    }
}

Steg 4: Log og handling på kamper

  • Lagre resultatene til CSV, sende varslinger eller utløse arbeidsflyten på match.
// Example: Append to log file
File.AppendAllText("search_log.csv", $"{file},{keyword or pattern},found\n");

Steg 5: Feil håndtering og ytelse

  • Bruk try/catch for robuste batchjobber
  • Paralleler for store sett hvis det er nødvendig
try
{
    // Searching logic
}
catch (Exception ex)
{
    File.AppendAllText("search_errors.log", ex.Message + Environment.NewLine);
}

Steg 6: Komplett eksempel

using Aspose.OCR;
using System;
using System.Collections.Generic;
using System.IO;

class Program
{
    static void Main(string[] args)
    {
        List<string> keywords = new List<string> { "Confidential", "PII", "Invoice", "2025" };
        List<string> regexPatterns = new List<string> { @"\d{3}-\d{2}-\d{4}", @"[A-Z]{2}[0-9]{6}" };
        try
        {
            string[] files = Directory.GetFiles("./input", "*.png");
            RecognitionSettings settings = new RecognitionSettings();
            settings.Language = Language.English;
            AsposeOcr ocr = new AsposeOcr();
            foreach (string file in files)
            {
                foreach (string keyword in keywords)
                {
                    bool found = ocr.ImageHasText(file, keyword, settings);
                    if (found)
                        File.AppendAllText("search_log.csv", $"{file},{keyword},found\n");
                }
                foreach (string pattern in regexPatterns)
                {
                    bool found = ocr.ImageHasText(file, pattern, settings);
                    if (found)
                        File.AppendAllText("search_log.csv", $"{file},{pattern},found\n");
                }
            }
        }
        catch (Exception ex)
        {
            File.AppendAllText("search_errors.log", ex.Message + Environment.NewLine);
        }
    }
}

Bruker tilfeller og applikasjoner

Overholdelsesrevisjoner

Automatisk sjekk skannede arkiver for svartlistede ord eller følsomme mønstre.

HR, juridisk og sikkerhet

Detekter tilstedeværelsen av konfidensielle fraser, medarbeidernavn, eller PII i boarding eller bevisfiler.

Trend- og frekvensanalyse

Beregne og rapportere frekvensen av nøkkelord over tid i store dokumenter.

Vanlige utfordringer og løsninger

Utfordring 1: Falske positive

Løsning: Refine nøkkelord og regex; gjennomgå edge tilfeller manuelt.

Utfordring 2: Stor batch størrelse

Løsning: Bruk parallell behandling og robust feilbehandling.

Utfordring 3: Flere språk

Løsning: Justere gjenkjenningsinnstillinger og søkeordlister per språkpakke.

Performance vurderinger

  • Batch jobber kan kjøre lenge for store arkiver – CPU-monitor, disk og logg
  • Sammenlign hvis det er nødvendig for høy gjennomføring
  • Registrer alle resultatene for gjennomgang og overholdelse

Beste praksis

  • Rengjør og oppdater keyword-lister regelmessig
  • Automatisk feil logging og rapportering
  • Test på representative arkivmønstre
  • Sikker logg og søkeresultater

Avanserte scenarier

Scenario 1: Søk og fremheve resultater i utgang PDF

Eksport bilder med funnet nøkkelord understreket (kustom post-processing).

Scenario 2: Kalender Regelmessige Batch Keyword Audits

Automatisk jobb å kjøre nattlig eller ukentlig for overholdelse.

Conclusion

Aspose.OCR Image Text Finder for .NET gjør det mulig med kraftig, automatisert batch nøkkelord og mønster søk – som støtter overensstemmelse, sikkerhet og trendanalyse gjennom bildearkiver.

See Aspose.OCR for .NET API Referanse For avanserte tekst søk eksempler.

 Norsk