Hogyan keressünk több kulcsszót vagy mintát a képekben
A több kulcsszó vagy szöveges minták keresése a nagy kép archívumokban elengedhetetlen a megfelelés, a biztonság és a digitális felfedezés szempontjából.A Aspose.OCR Image Text Finder for .NET megkönnyíti a szkennelési képek listáinak vagy a regex mintákat.
Valódi problémák
A kézi felülvizsgálat a képek több kifejezés (például nevek, azonosítók, bizalmas kifejezések) lassú és megbízhatatlan, különösen több ezer fájl.
megoldás áttekintése
Automatikus kimutatás több kulcsszó vagy regex keresések futtatásával a képeket. jelentés vagy cselekvés a mérkőzések megfelelőség, HR, vagy digitális jogorvoslat használata esetek.
előfeltételek
- Visual Studio 2019 vagy újabb
- .NET 6.0 vagy újabb (vagy .Net Framework 4.6.2+)
- ASPOSE.OCR for .NET a NuGet-ről
PM> Install-Package Aspose.OCR
lépésről lépésre megvalósítás
1. lépés: Az Aspose.OCR telepítése és konfigurálása
using Aspose.OCR;
2. lépés: Határozza meg a kulcsszavakat vagy mintáit
List<string> keywords = new List<string> { "Confidential", "PII", "Invoice", "2025" };
List<string> regexPatterns = new List<string> { @"\d{3}-\d{2}-\d{4}", @"[A-Z]{2}[0-9]{6}" }; // SSN, Passport
3. lépés: Keresse meg a keresési képeket a kulcsszavakért / paraméterekért
string[] files = Directory.GetFiles("./input", "*.png");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
foreach (string file in files)
{
foreach (string keyword in keywords)
{
bool found = ocr.ImageHasText(file, keyword, settings);
if (found) Console.WriteLine($"Keyword '{keyword}' found in {file}");
}
foreach (string pattern in regexPatterns)
{
bool found = ocr.ImageHasText(file, pattern, settings);
if (found) Console.WriteLine($"Pattern '{pattern}' found in {file}");
}
}
4. lépés: Regisztrálj és cselekedj a mérkőzéseken
- Mentse az eredményeket a CSV-be, küldje el az értesítéseket, vagy indítsa el a munkafolyamatot a mérkőzésen.
// Example: Append to log file
File.AppendAllText("search_log.csv", $"{file},{keyword or pattern},found\n");
5. lépés: Hibaelhárítás és teljesítmény
- Használja a try/catch-t a robusztus batch munkákhoz
- Szükség esetén nagy készletekhez párhuzamosan
try
{
// Searching logic
}
catch (Exception ex)
{
File.AppendAllText("search_errors.log", ex.Message + Environment.NewLine);
}
6. lépés: Teljes példa
using Aspose.OCR;
using System;
using System.Collections.Generic;
using System.IO;
class Program
{
static void Main(string[] args)
{
List<string> keywords = new List<string> { "Confidential", "PII", "Invoice", "2025" };
List<string> regexPatterns = new List<string> { @"\d{3}-\d{2}-\d{4}", @"[A-Z]{2}[0-9]{6}" };
try
{
string[] files = Directory.GetFiles("./input", "*.png");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
foreach (string file in files)
{
foreach (string keyword in keywords)
{
bool found = ocr.ImageHasText(file, keyword, settings);
if (found)
File.AppendAllText("search_log.csv", $"{file},{keyword},found\n");
}
foreach (string pattern in regexPatterns)
{
bool found = ocr.ImageHasText(file, pattern, settings);
if (found)
File.AppendAllText("search_log.csv", $"{file},{pattern},found\n");
}
}
}
catch (Exception ex)
{
File.AppendAllText("search_errors.log", ex.Message + Environment.NewLine);
}
}
}
Esetek és alkalmazások használata
megfelelőségi ellenőrzések
Automatikusan ellenőrizze a szkennelt archívumokat fekete listájú szavak vagy érzékeny minták esetében.
HR, jogi és biztonsági
Fedezze fel a bizalmas kifejezések, alkalmazottak nevek vagy PII jelenlétét a fedélzetén vagy a bizonyítékfájlokban.
Trend és frekvencia elemzés
Számolja és jelentse a kulcsszavak gyakoriságát idővel a nagy dokumentumkészletekben.
Közös kihívások és megoldások
1. kihívás: hamis pozitív
** Megoldás:** A kulcsszavakat és a regex-t manuálisan felülvizsgáljuk.
2. kihívás: nagy csomagtartalom
** Megoldás:** Használja a párhuzamos feldolgozást és a robusztus hibaelhárítást.
3. kihívás: többnyelv
** Megoldás:** A felismerési beállításokat és a kulcsszavak listáit nyelvi csomagonként módosítjuk.
A teljesítmény megfontolása
- A batch munkák hosszú ideig futhatnak a nagy archívumok – monitor CPU, lemez és naplók
- Szükség esetén párhuzamosan a magas átjárhatósághoz
- Jelölje be az összes eredményt a felülvizsgálat és a megfelelés érdekében
Legjobb gyakorlatok
- A kulcsszavak listáit rendszeresen tisztítjuk és frissítjük
- Automatikus hiba rögzítése és jelentése
- A reprezentatív archív minták tesztelése
- Biztonságos naplók és keresési eredmények
fejlett forgatókönyvek
1. forgatókönyv: Keresési és kiemelkedési eredmények PDF-ben
Export képek megtalálható kulcsszavak hangsúlyozott (könnyű post-feldolgozás).
2. forgatókönyv: Rendszeres Batch Keyword Audits
Automatikus munka éjszaka vagy hetente a megfelelés érdekében.
következtetések
Az ASPOSE.OCR Image Text Finder for .NET lehetővé teszi az erőteljes, automatizált kulcsszavak és minták keresését – támogatva a megfelelést, a biztonságot és a trendelemzést a kép archívumokon keresztül.
See Az ASPOSE.OCR a .NET API referenciájához a fejlett szöveges keresési példákhoz.