Wie man mehrere Schlüsselwörter oder Muster in Bildern sucht

Wie man mehrere Schlüsselwörter oder Muster in Bildern sucht

Die Suche nach mehreren Schlüsselwörtern oder Textmustern in großen Bildarchiven ist von entscheidender Bedeutung für die Einhaltung, Sicherheit und digitale Entdeckung. Aspose.OCR Image Text Finder für .NET macht es einfach, Scan-Bildungen für Listen von Keywords oder Regex-Muster zu batchieren.

Real-Weltproblem

Die manuelle Bewertung von Bildern für mehrere Begriffe (z. B. Namen, IDs, vertrauliche Ausdrücke) ist langsam und unzuverlässig, vor allem über Tausende von Dateien.

Überblick der Lösung

Automatische Entdeckung durch die Durchführung von Multi-Keyword- oder Regex-Suchen auf Bildern. Berichten oder Handeln auf Spielen für die Einhaltung, HR oder digitale Forensik verwenden Fälle.

Voraussetzung

  • Visual Studio 2019 oder später
  • .NET 6.0 oder höher (oder .Net Framework 4.6.2+)
  • Aspose.OCR für .NET von NuGet
PM> Install-Package Aspose.OCR

Schritt für Schritt Implementierung

Schritt 1: Installieren und konfigurieren Aspose.OCR

using Aspose.OCR;

Schritt 2: Definieren Sie Ihre Schlüsselwörter oder Muster

List<string> keywords = new List<string> { "Confidential", "PII", "Invoice", "2025" };
List<string> regexPatterns = new List<string> { @"\d{3}-\d{2}-\d{4}", @"[A-Z]{2}[0-9]{6}" }; // SSN, Passport

Schritt 3: Sammeln Sie Suchbilder für Schlüsselwörter/Patterns

string[] files = Directory.GetFiles("./input", "*.png");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
foreach (string file in files)
{
    foreach (string keyword in keywords)
    {
        bool found = ocr.ImageHasText(file, keyword, settings);
        if (found) Console.WriteLine($"Keyword '{keyword}' found in {file}");
    }
    foreach (string pattern in regexPatterns)
    {
        bool found = ocr.ImageHasText(file, pattern, settings);
        if (found) Console.WriteLine($"Pattern '{pattern}' found in {file}");
    }
}

Schritt 4: Log und Aktion auf Spiele

  • Speichern Sie die Ergebnisse in CSV, senden Sie Warnungen oder trigger Workflow auf Match.
// Example: Append to log file
File.AppendAllText("search_log.csv", $"{file},{keyword or pattern},found\n");

Schritt 5: Fehlerbehandlung und Leistung

  • Nutzen Sie try/catch für robuste batch-jobs
  • Parallelize für große Sets, wenn nötig
try
{
    // Searching logic
}
catch (Exception ex)
{
    File.AppendAllText("search_errors.log", ex.Message + Environment.NewLine);
}

Schritt 6: Vollständiges Beispiel

using Aspose.OCR;
using System;
using System.Collections.Generic;
using System.IO;

class Program
{
    static void Main(string[] args)
    {
        List<string> keywords = new List<string> { "Confidential", "PII", "Invoice", "2025" };
        List<string> regexPatterns = new List<string> { @"\d{3}-\d{2}-\d{4}", @"[A-Z]{2}[0-9]{6}" };
        try
        {
            string[] files = Directory.GetFiles("./input", "*.png");
            RecognitionSettings settings = new RecognitionSettings();
            settings.Language = Language.English;
            AsposeOcr ocr = new AsposeOcr();
            foreach (string file in files)
            {
                foreach (string keyword in keywords)
                {
                    bool found = ocr.ImageHasText(file, keyword, settings);
                    if (found)
                        File.AppendAllText("search_log.csv", $"{file},{keyword},found\n");
                }
                foreach (string pattern in regexPatterns)
                {
                    bool found = ocr.ImageHasText(file, pattern, settings);
                    if (found)
                        File.AppendAllText("search_log.csv", $"{file},{pattern},found\n");
                }
            }
        }
        catch (Exception ex)
        {
            File.AppendAllText("search_errors.log", ex.Message + Environment.NewLine);
        }
    }
}

Verwendung von Fällen und Anwendungen

Einhaltungskontrollen

Automatisch überprüfen Sie scannente Dateien für schwarze Wörter oder empfindliche Muster.

HR, Legal und Sicherheit

Erkennen Sie die Anwesenheit vertraulicher Ausdrücke, Angestelltennamen oder PII in den Onboarding- oder Beweisdateien.

Trend- und Frequenzanalyse

Berechnen und berichten die Häufigkeit von Schlüsselwörtern im Laufe der Zeit in großen Dokumenten.

Gemeinsame Herausforderungen und Lösungen

Herausforderung 1: Falsche Positive

Lösung: Refine Schlüsselwörter und regex; überprüfe Edge-Fälle manuell.

Herausforderung 2: Große Batch Größe

Lösung: Verwenden Sie parallele Verarbeitung und robuste Fehlerbehandlung.

Herausforderung 3: Vielfältige Sprachen

Lösung: Einstellungen der Anerkennung und Keyword-Listen pro Sprachband anpassen.

Performance Beachtung

  • Batch-Arbeits können für große Dateien lange dauern – Monitor CPU, Disk und Logs
  • Parallelize, falls erforderlich für einen hohen Durchbruch
  • Alle Ergebnisse für Überprüfung und Einhaltung registrieren

Beste Praktiken

  • Reinigen und aktualisieren Sie Keyword-Listen regelmäßig
  • Automatische Fehlerlogging und Berichterstattung
  • Test auf repräsentative Archivproben
  • Sichere Logs und Suchergebnisse

Fortgeschrittene Szenarien

Scenario 1: Suchergebnisse und Highlights in Output PDF

Exportieren Sie Bilder mit gefundenen Schlüsselwörtern hervorgehoben (anpassung nach Verarbeitung).

Szenario 2: Regelmäßige Batch Keyword Audits

Automatische Arbeit, die Nacht oder wöchentlich für die Einhaltung durchgeführt wird.

Schlussfolgerungen

ASPOSE.OCR Image Text Finder für .NET ermöglicht leistungsstarke, automatisierte Batch-Schlüsselwörter und Muster-Suche – die Kompatibilität, Sicherheit und Trendanalyse in Bildarchiven unterstützt.

See Aspose.OCR für .NET API Referenz für fortschrittliche Textsuche Beispiele.

 Deutsch