Hogyan keressünk több kulcsszót vagy mintát a képekben

Hogyan keressünk több kulcsszót vagy mintát a képekben

A több kulcsszó vagy szöveges minták keresése a nagy kép archívumokban elengedhetetlen a megfelelés, a biztonság és a digitális felfedezés szempontjából.A Aspose.OCR Image Text Finder for .NET megkönnyíti a szkennelési képek listáinak vagy a regex mintákat.

Valódi problémák

A kézi felülvizsgálat a képek több kifejezés (például nevek, azonosítók, bizalmas kifejezések) lassú és megbízhatatlan, különösen több ezer fájl.

megoldás áttekintése

Automatikus kimutatás több kulcsszó vagy regex keresések futtatásával a képeket. jelentés vagy cselekvés a mérkőzések megfelelőség, HR, vagy digitális jogorvoslat használata esetek.

előfeltételek

  • Visual Studio 2019 vagy újabb
  • .NET 6.0 vagy újabb (vagy .Net Framework 4.6.2+)
  • ASPOSE.OCR for .NET a NuGet-ről
PM> Install-Package Aspose.OCR

lépésről lépésre megvalósítás

1. lépés: Az Aspose.OCR telepítése és konfigurálása

using Aspose.OCR;

2. lépés: Határozza meg a kulcsszavakat vagy mintáit

List<string> keywords = new List<string> { "Confidential", "PII", "Invoice", "2025" };
List<string> regexPatterns = new List<string> { @"\d{3}-\d{2}-\d{4}", @"[A-Z]{2}[0-9]{6}" }; // SSN, Passport

3. lépés: Keresse meg a keresési képeket a kulcsszavakért / paraméterekért

string[] files = Directory.GetFiles("./input", "*.png");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
foreach (string file in files)
{
    foreach (string keyword in keywords)
    {
        bool found = ocr.ImageHasText(file, keyword, settings);
        if (found) Console.WriteLine($"Keyword '{keyword}' found in {file}");
    }
    foreach (string pattern in regexPatterns)
    {
        bool found = ocr.ImageHasText(file, pattern, settings);
        if (found) Console.WriteLine($"Pattern '{pattern}' found in {file}");
    }
}

4. lépés: Regisztrálj és cselekedj a mérkőzéseken

  • Mentse az eredményeket a CSV-be, küldje el az értesítéseket, vagy indítsa el a munkafolyamatot a mérkőzésen.
// Example: Append to log file
File.AppendAllText("search_log.csv", $"{file},{keyword or pattern},found\n");

5. lépés: Hibaelhárítás és teljesítmény

  • Használja a try/catch-t a robusztus batch munkákhoz
  • Szükség esetén nagy készletekhez párhuzamosan
try
{
    // Searching logic
}
catch (Exception ex)
{
    File.AppendAllText("search_errors.log", ex.Message + Environment.NewLine);
}

6. lépés: Teljes példa

using Aspose.OCR;
using System;
using System.Collections.Generic;
using System.IO;

class Program
{
    static void Main(string[] args)
    {
        List<string> keywords = new List<string> { "Confidential", "PII", "Invoice", "2025" };
        List<string> regexPatterns = new List<string> { @"\d{3}-\d{2}-\d{4}", @"[A-Z]{2}[0-9]{6}" };
        try
        {
            string[] files = Directory.GetFiles("./input", "*.png");
            RecognitionSettings settings = new RecognitionSettings();
            settings.Language = Language.English;
            AsposeOcr ocr = new AsposeOcr();
            foreach (string file in files)
            {
                foreach (string keyword in keywords)
                {
                    bool found = ocr.ImageHasText(file, keyword, settings);
                    if (found)
                        File.AppendAllText("search_log.csv", $"{file},{keyword},found\n");
                }
                foreach (string pattern in regexPatterns)
                {
                    bool found = ocr.ImageHasText(file, pattern, settings);
                    if (found)
                        File.AppendAllText("search_log.csv", $"{file},{pattern},found\n");
                }
            }
        }
        catch (Exception ex)
        {
            File.AppendAllText("search_errors.log", ex.Message + Environment.NewLine);
        }
    }
}

Esetek és alkalmazások használata

megfelelőségi ellenőrzések

Automatikusan ellenőrizze a szkennelt archívumokat fekete listájú szavak vagy érzékeny minták esetében.

HR, jogi és biztonsági

Fedezze fel a bizalmas kifejezések, alkalmazottak nevek vagy PII jelenlétét a fedélzetén vagy a bizonyítékfájlokban.

Trend és frekvencia elemzés

Számolja és jelentse a kulcsszavak gyakoriságát idővel a nagy dokumentumkészletekben.

Közös kihívások és megoldások

1. kihívás: hamis pozitív

** Megoldás:** A kulcsszavakat és a regex-t manuálisan felülvizsgáljuk.

2. kihívás: nagy csomagtartalom

** Megoldás:** Használja a párhuzamos feldolgozást és a robusztus hibaelhárítást.

3. kihívás: többnyelv

** Megoldás:** A felismerési beállításokat és a kulcsszavak listáit nyelvi csomagonként módosítjuk.

A teljesítmény megfontolása

  • A batch munkák hosszú ideig futhatnak a nagy archívumok – monitor CPU, lemez és naplók
  • Szükség esetén párhuzamosan a magas átjárhatósághoz
  • Jelölje be az összes eredményt a felülvizsgálat és a megfelelés érdekében

Legjobb gyakorlatok

  • A kulcsszavak listáit rendszeresen tisztítjuk és frissítjük
  • Automatikus hiba rögzítése és jelentése
  • A reprezentatív archív minták tesztelése
  • Biztonságos naplók és keresési eredmények

fejlett forgatókönyvek

1. forgatókönyv: Keresési és kiemelkedési eredmények PDF-ben

Export képek megtalálható kulcsszavak hangsúlyozott (könnyű post-feldolgozás).

2. forgatókönyv: Rendszeres Batch Keyword Audits

Automatikus munka éjszaka vagy hetente a megfelelés érdekében.

következtetések

Az ASPOSE.OCR Image Text Finder for .NET lehetővé teszi az erőteljes, automatizált kulcsszavak és minták keresését – támogatva a megfelelést, a biztonságot és a trendelemzést a kép archívumokon keresztül.

See Az ASPOSE.OCR a .NET API referenciájához a fejlett szöveges keresési példákhoz.

 Magyar