Kā meklēt vairākus atslēgvārdus vai modeļus attēlos

Kā meklēt vairākus atslēgvārdus vai modeļus attēlos

Vairāku atslēgvārdu vai teksta paraugu meklēšana lielos attēla arhīvos ir būtiski atbilstības, drošības un digitālās atklāšanas vajadzībām.Aspose.OCR Image Text Finder for .NET padara to vieglāku, lai skenētu attēlus atmiņu sarakstos vai regex paraugiem.

Reālā pasaules problēma

Manu attēlu pārskats vairākiem terminiem (piemēram, vārdi, ID, konfidenciālie teikumi) ir lēns un uzticams, it īpaši tūkstošiem failu.

Risinājumu pārskats

Automātiskā detekcija, veicinot daudzu atslēgvārdu vai regex meklējumus attēlu komplektos. ziņot vai rīkoties spēles atbilstības, HR vai digitālās medicīnas izmantošanas gadījumus.

Prerequisites

  • Visual Studio 2019 vai vēlāk
  • .NET 6.0 vai jaunāks (vai .Net Framework 4.6.2+)
  • Aspose.OCR par .NET no NuGet
PM> Install-Package Aspose.OCR

Step-by-step īstenošana

1. solis: Uzstādīt un konfigurēt Aspose.OCR

using Aspose.OCR;

2. solis: definējiet atslēgvārdus vai modeļus

List<string> keywords = new List<string> { "Confidential", "PII", "Invoice", "2025" };
List<string> regexPatterns = new List<string> { @"\d{3}-\d{2}-\d{4}", @"[A-Z]{2}[0-9]{6}" }; // SSN, Passport

3. solis: Atrašanās attēli par atslēgvārdiem / parametriem

string[] files = Directory.GetFiles("./input", "*.png");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
foreach (string file in files)
{
    foreach (string keyword in keywords)
    {
        bool found = ocr.ImageHasText(file, keyword, settings);
        if (found) Console.WriteLine($"Keyword '{keyword}' found in {file}");
    }
    foreach (string pattern in regexPatterns)
    {
        bool found = ocr.ImageHasText(file, pattern, settings);
        if (found) Console.WriteLine($"Pattern '{pattern}' found in {file}");
    }
}

4. solis: reģistrēties un rīkoties spēlē

  • Iegūstiet rezultātus CSV, nosūtiet brīdinājumus vai izlaidiet darba plūsmu.
// Example: Append to log file
File.AppendAllText("search_log.csv", $"{file},{keyword or pattern},found\n");

5. solis: kļūdu apstrāde un veiktspēja

  • Izmantojiet try/catch robustam batch darbam
  • Paralēli uz lieliem komplektiem, ja nepieciešams
try
{
    // Searching logic
}
catch (Exception ex)
{
    File.AppendAllText("search_errors.log", ex.Message + Environment.NewLine);
}

6. solis: pilns piemērs

using Aspose.OCR;
using System;
using System.Collections.Generic;
using System.IO;

class Program
{
    static void Main(string[] args)
    {
        List<string> keywords = new List<string> { "Confidential", "PII", "Invoice", "2025" };
        List<string> regexPatterns = new List<string> { @"\d{3}-\d{2}-\d{4}", @"[A-Z]{2}[0-9]{6}" };
        try
        {
            string[] files = Directory.GetFiles("./input", "*.png");
            RecognitionSettings settings = new RecognitionSettings();
            settings.Language = Language.English;
            AsposeOcr ocr = new AsposeOcr();
            foreach (string file in files)
            {
                foreach (string keyword in keywords)
                {
                    bool found = ocr.ImageHasText(file, keyword, settings);
                    if (found)
                        File.AppendAllText("search_log.csv", $"{file},{keyword},found\n");
                }
                foreach (string pattern in regexPatterns)
                {
                    bool found = ocr.ImageHasText(file, pattern, settings);
                    if (found)
                        File.AppendAllText("search_log.csv", $"{file},{pattern},found\n");
                }
            }
        }
        catch (Exception ex)
        {
            File.AppendAllText("search_errors.log", ex.Message + Environment.NewLine);
        }
    }
}

Izmantojiet gadījumus un pieteikumus

Atbilstības revīzija

Automātiski pārbaudiet skenētos arhīvus melnā saraksta vārdiem vai jutīgiem paraugiem.

HR, Juridiskā un drošības

Atzīt konfidenciālu frāzi, darbinieku vārdus vai PII klātbūtni uz kuģa vai pierādījumu failos.

Tendenču un frekvenču analīze

Aprēķiniet un ziņojiet par atslēgvārdu biežumu laika gaitā lielos dokumentu komplektos.

Kopīgi izaicinājumi un risinājumi

1. problēma: nepatiesi pozitīvi

Rezolācija: Refinēt atslēgvārdus un regex; manuāli pārskatīt pagriezienu lietas.

2. izaicinājums: Lielais batch izmērs

Rīkojums: Izmantojiet paralēli apstrādi un spēcīgu kļūdu pārvaldību.

3. problēma: daudzu valodu

Rīze: Iestatīt atpazīšanas iestatījumus un atslēgvārdu sarakstus pēc valodas paketes.

Darbības apsvērumi

  • Batch darbi var ilgt lieliem arhīviem – monitoru CPU, disku un logs
  • Paralēli, ja nepieciešams augsta caurlaidība
  • Lejupielādēt visus rezultātus pārskatīšanai un atbilstībai

Labākās prakses

  • Regulāri tīrīt un atjaunināt atslēgvārdu sarakstus
  • Automātiskās kļūdas reģistrēšana un ziņošana
  • Pārbaude par reprezentatīviem arhīvu paraugiem
  • Drošas logs un meklēšanas rezultāti

Augstākie scenāriji

Scenārija 1: Meklēšanas un paaugstināšanas rezultāti PDF iznākumā

Izveidojiet attēlus ar konstatētajiem atslēgvārdiem, kas ir uzsvērti (piemērotas pēcapstrādes).

2. scenārijs: Regular Batch Keyword Audits

Automātiskā darba veikšana naktī vai nedēļā atbilstības nolūkā.

Conclusion

Aspose.OCR Image Text Finder for .NET ļauj spēcīgu, automātisku atslēgvārdu un paraugu meklēšanu – atbalstot atbilstību, drošību un tendences analīzi visā attēla arhīvās.

See Aspose.OCR par .NET API atsauci Sīkāka teksta meklēšanas piemērs.

 Latviski