Kaip ieškoti kelių raktinių žodžių ar pavyzdžių nuotraukose
Daugelio raktinių žodžių ar teksto pavyzdžių paieška dideliuose vaizdo archyvuose yra labai svarbi atitikčiai, saugumui ir skaitmeniniam atradimui. „Aspose.OCR Image Text Finder for .NET“ leidžia lengvai surinkti raktinius žodžius ar regex pavyzdžius.
Realaus pasaulio problemos
Manualus vaizdų peržiūra keliems terminams (pvz., vardai, ID, konfidencialios frazės) yra lėta ir nepatikima, ypač per tūkstančius failų.
Sprendimo apžvalga
Automatinis aptikimas vykdydamas kelis raktinius žodžius arba regex paiešką vaizdų rinkiniais. pranešti arba veikti rungtynėse dėl atitikties, žmogiškųjų išteklių ar skaitmeninės teisinės medicinos naudojimo atvejų.
Prerequisites
- „Visual Studio 2019“ arba vėliau
- .NET 6.0 arba naujesnė (arba .Net Framework 4.6.2+)
- ASPOSE.OCR už .NET iš NuGet
PM> Install-Package Aspose.OCR
Žingsnis po žingsnio įgyvendinimas
1 žingsnis: Įdiegti ir konfigūruoti Aspose.OCR
using Aspose.OCR;
2 žingsnis: apibrėžti raktinius žodžius ar modelius
List<string> keywords = new List<string> { "Confidential", "PII", "Invoice", "2025" };
List<string> regexPatterns = new List<string> { @"\d{3}-\d{2}-\d{4}", @"[A-Z]{2}[0-9]{6}" }; // SSN, Passport
3 žingsnis: Paieškos vaizdų rinkinys raktiniams žodžiams / rodikliams
string[] files = Directory.GetFiles("./input", "*.png");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
foreach (string file in files)
{
foreach (string keyword in keywords)
{
bool found = ocr.ImageHasText(file, keyword, settings);
if (found) Console.WriteLine($"Keyword '{keyword}' found in {file}");
}
foreach (string pattern in regexPatterns)
{
bool found = ocr.ImageHasText(file, pattern, settings);
if (found) Console.WriteLine($"Pattern '{pattern}' found in {file}");
}
}
4 žingsnis: Prisijunkite ir veikite rungtynėse
- Išsaugokite rezultatus į CSV, siųskite įspėjimus arba paleiskite darbo srautą rungtynėse.
// Example: Append to log file
File.AppendAllText("search_log.csv", $"{file},{keyword or pattern},found\n");
5 žingsnis: klaidų tvarkymas ir veiksmingumas
- Naudokite try/catch už tvirtą batch darbą
- Paralyžiuokite didelius rinkinį, jei reikia
try
{
// Searching logic
}
catch (Exception ex)
{
File.AppendAllText("search_errors.log", ex.Message + Environment.NewLine);
}
6 žingsnis: išsami pavyzdys
using Aspose.OCR;
using System;
using System.Collections.Generic;
using System.IO;
class Program
{
static void Main(string[] args)
{
List<string> keywords = new List<string> { "Confidential", "PII", "Invoice", "2025" };
List<string> regexPatterns = new List<string> { @"\d{3}-\d{2}-\d{4}", @"[A-Z]{2}[0-9]{6}" };
try
{
string[] files = Directory.GetFiles("./input", "*.png");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
foreach (string file in files)
{
foreach (string keyword in keywords)
{
bool found = ocr.ImageHasText(file, keyword, settings);
if (found)
File.AppendAllText("search_log.csv", $"{file},{keyword},found\n");
}
foreach (string pattern in regexPatterns)
{
bool found = ocr.ImageHasText(file, pattern, settings);
if (found)
File.AppendAllText("search_log.csv", $"{file},{pattern},found\n");
}
}
}
catch (Exception ex)
{
File.AppendAllText("search_errors.log", ex.Message + Environment.NewLine);
}
}
}
Naudokite atvejus ir paraiškas
Atitikties auditas
Automatiškai patikrinkite skenuojamus archyvus juodai išvardytoms žodžiams ar jautriems dizainams.
HR, teisinis ir saugumas
Atkreipkite dėmesį į konfidencialių frazių, darbuotojų vardų ar PII buvimą laivybos ar įrodymų failuose.
Trendų ir dažnių analizė
Skaičiuoti ir pranešti raktinių žodžių dažnumą laikui bėgant dideliuose dokumentų rinkiniuose.
Bendrieji iššūkiai ir sprendimai
1 iššūkis: klaidingi teigiami dalykai
Išsprendimas: Atsisiųskite raktinius žodžius ir regex; peržiūrėkite edge atvejus rankiniu būdu.
Iššūkis 2: didelis batų dydis
Išsprendimas: Naudokite lygiagrečią apdorojimą ir tvirtą klaidų tvarkymą.
3 iššūkis: keletas kalbų
Išsprendimas: Pritaikykite atpažinimo nustatymus ir raktinių žodžių sąrašus pagal kalbos rinkinį.
Veiksmingumo apžvalgos
- „Batch“ darbai gali trukti ilgai dideliems archyvams – monitorių CPU, disko ir logų
- Paralyžius, jei reikia didelio perteklių
- Įrašykite visus rezultatus peržiūros ir laikymosi tikslais
Geriausios praktikos
- Reguliariai išvalyti ir atnaujinti raktinių žodžių sąrašus
- Automatinis klaidų registravimas ir ataskaitų teikimas
- Eksperimentiniai archyvo pavyzdžiai
- Saugūs logai ir paieškos rezultatai
Išplėstiniai scenarijai
1 scenarijus: paieškos ir pabrėžimo rezultatai PDF
Eksportuoti vaizdus su rastais raktiniais žodžiais pabrėžiama (pasirinkta po apdorojimo).
2 scenarijus: tvarkaraštis Reguliarus raktinių žodžių auditas
Automatiškai dirbti naktį arba savaitę, kad būtų laikomasi.
Conclusion
ASPOSE.OCR Image Text Finder .NET leidžia galingą, automatizuotą raktinių žodžių ir modelio paiešką – palaiko atitikties, saugumo ir tendencijų analizę visose vaizdo archyvuose.
See ASPOSE.OCR už .NET API nuorodą Išplėstinio teksto paieškos pavyzdžiai.