Kā meklēt vairākus atslēgvārdus vai modeļus attēlos
Vairāku atslēgvārdu vai teksta paraugu meklēšana lielos attēla arhīvos ir būtiski atbilstības, drošības un digitālās atklāšanas vajadzībām.Aspose.OCR Image Text Finder for .NET padara to vieglāku, lai skenētu attēlus atmiņu sarakstos vai regex paraugiem.
Reālā pasaules problēma
Manu attēlu pārskats vairākiem terminiem (piemēram, vārdi, ID, konfidenciālie teikumi) ir lēns un uzticams, it īpaši tūkstošiem failu.
Risinājumu pārskats
Automātiskā detekcija, veicinot daudzu atslēgvārdu vai regex meklējumus attēlu komplektos. ziņot vai rīkoties spēles atbilstības, HR vai digitālās medicīnas izmantošanas gadījumus.
Prerequisites
- Visual Studio 2019 vai vēlāk
- .NET 6.0 vai jaunāks (vai .Net Framework 4.6.2+)
- Aspose.OCR par .NET no NuGet
PM> Install-Package Aspose.OCR
Step-by-step īstenošana
1. solis: Uzstādīt un konfigurēt Aspose.OCR
using Aspose.OCR;
2. solis: definējiet atslēgvārdus vai modeļus
List<string> keywords = new List<string> { "Confidential", "PII", "Invoice", "2025" };
List<string> regexPatterns = new List<string> { @"\d{3}-\d{2}-\d{4}", @"[A-Z]{2}[0-9]{6}" }; // SSN, Passport
3. solis: Atrašanās attēli par atslēgvārdiem / parametriem
string[] files = Directory.GetFiles("./input", "*.png");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
foreach (string file in files)
{
foreach (string keyword in keywords)
{
bool found = ocr.ImageHasText(file, keyword, settings);
if (found) Console.WriteLine($"Keyword '{keyword}' found in {file}");
}
foreach (string pattern in regexPatterns)
{
bool found = ocr.ImageHasText(file, pattern, settings);
if (found) Console.WriteLine($"Pattern '{pattern}' found in {file}");
}
}
4. solis: reģistrēties un rīkoties spēlē
- Iegūstiet rezultātus CSV, nosūtiet brīdinājumus vai izlaidiet darba plūsmu.
// Example: Append to log file
File.AppendAllText("search_log.csv", $"{file},{keyword or pattern},found\n");
5. solis: kļūdu apstrāde un veiktspēja
- Izmantojiet try/catch robustam batch darbam
- Paralēli uz lieliem komplektiem, ja nepieciešams
try
{
// Searching logic
}
catch (Exception ex)
{
File.AppendAllText("search_errors.log", ex.Message + Environment.NewLine);
}
6. solis: pilns piemērs
using Aspose.OCR;
using System;
using System.Collections.Generic;
using System.IO;
class Program
{
static void Main(string[] args)
{
List<string> keywords = new List<string> { "Confidential", "PII", "Invoice", "2025" };
List<string> regexPatterns = new List<string> { @"\d{3}-\d{2}-\d{4}", @"[A-Z]{2}[0-9]{6}" };
try
{
string[] files = Directory.GetFiles("./input", "*.png");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
foreach (string file in files)
{
foreach (string keyword in keywords)
{
bool found = ocr.ImageHasText(file, keyword, settings);
if (found)
File.AppendAllText("search_log.csv", $"{file},{keyword},found\n");
}
foreach (string pattern in regexPatterns)
{
bool found = ocr.ImageHasText(file, pattern, settings);
if (found)
File.AppendAllText("search_log.csv", $"{file},{pattern},found\n");
}
}
}
catch (Exception ex)
{
File.AppendAllText("search_errors.log", ex.Message + Environment.NewLine);
}
}
}
Izmantojiet gadījumus un pieteikumus
Atbilstības revīzija
Automātiski pārbaudiet skenētos arhīvus melnā saraksta vārdiem vai jutīgiem paraugiem.
HR, Juridiskā un drošības
Atzīt konfidenciālu frāzi, darbinieku vārdus vai PII klātbūtni uz kuģa vai pierādījumu failos.
Tendenču un frekvenču analīze
Aprēķiniet un ziņojiet par atslēgvārdu biežumu laika gaitā lielos dokumentu komplektos.
Kopīgi izaicinājumi un risinājumi
1. problēma: nepatiesi pozitīvi
Rezolācija: Refinēt atslēgvārdus un regex; manuāli pārskatīt pagriezienu lietas.
2. izaicinājums: Lielais batch izmērs
Rīkojums: Izmantojiet paralēli apstrādi un spēcīgu kļūdu pārvaldību.
3. problēma: daudzu valodu
Rīze: Iestatīt atpazīšanas iestatījumus un atslēgvārdu sarakstus pēc valodas paketes.
Darbības apsvērumi
- Batch darbi var ilgt lieliem arhīviem – monitoru CPU, disku un logs
- Paralēli, ja nepieciešams augsta caurlaidība
- Lejupielādēt visus rezultātus pārskatīšanai un atbilstībai
Labākās prakses
- Regulāri tīrīt un atjaunināt atslēgvārdu sarakstus
- Automātiskās kļūdas reģistrēšana un ziņošana
- Pārbaude par reprezentatīviem arhīvu paraugiem
- Drošas logs un meklēšanas rezultāti
Augstākie scenāriji
Scenārija 1: Meklēšanas un paaugstināšanas rezultāti PDF iznākumā
Izveidojiet attēlus ar konstatētajiem atslēgvārdiem, kas ir uzsvērti (piemērotas pēcapstrādes).
2. scenārijs: Regular Batch Keyword Audits
Automātiskā darba veikšana naktī vai nedēļā atbilstības nolūkā.
Conclusion
Aspose.OCR Image Text Finder for .NET ļauj spēcīgu, automātisku atslēgvārdu un paraugu meklēšanu – atbalstot atbilstību, drošību un tendences analīzi visā attēla arhīvās.
See Aspose.OCR par .NET API atsauci Sīkāka teksta meklēšanas piemērs.