Kaip ieškoti kelių raktinių žodžių ar pavyzdžių nuotraukose

Kaip ieškoti kelių raktinių žodžių ar pavyzdžių nuotraukose

Daugelio raktinių žodžių ar teksto pavyzdžių paieška dideliuose vaizdo archyvuose yra labai svarbi atitikčiai, saugumui ir skaitmeniniam atradimui. „Aspose.OCR Image Text Finder for .NET“ leidžia lengvai surinkti raktinius žodžius ar regex pavyzdžius.

Realaus pasaulio problemos

Manualus vaizdų peržiūra keliems terminams (pvz., vardai, ID, konfidencialios frazės) yra lėta ir nepatikima, ypač per tūkstančius failų.

Sprendimo apžvalga

Automatinis aptikimas vykdydamas kelis raktinius žodžius arba regex paiešką vaizdų rinkiniais. pranešti arba veikti rungtynėse dėl atitikties, žmogiškųjų išteklių ar skaitmeninės teisinės medicinos naudojimo atvejų.

Prerequisites

  • „Visual Studio 2019“ arba vėliau
  • .NET 6.0 arba naujesnė (arba .Net Framework 4.6.2+)
  • ASPOSE.OCR už .NET iš NuGet
PM> Install-Package Aspose.OCR

Žingsnis po žingsnio įgyvendinimas

1 žingsnis: Įdiegti ir konfigūruoti Aspose.OCR

using Aspose.OCR;

2 žingsnis: apibrėžti raktinius žodžius ar modelius

List<string> keywords = new List<string> { "Confidential", "PII", "Invoice", "2025" };
List<string> regexPatterns = new List<string> { @"\d{3}-\d{2}-\d{4}", @"[A-Z]{2}[0-9]{6}" }; // SSN, Passport

3 žingsnis: Paieškos vaizdų rinkinys raktiniams žodžiams / rodikliams

string[] files = Directory.GetFiles("./input", "*.png");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
foreach (string file in files)
{
    foreach (string keyword in keywords)
    {
        bool found = ocr.ImageHasText(file, keyword, settings);
        if (found) Console.WriteLine($"Keyword '{keyword}' found in {file}");
    }
    foreach (string pattern in regexPatterns)
    {
        bool found = ocr.ImageHasText(file, pattern, settings);
        if (found) Console.WriteLine($"Pattern '{pattern}' found in {file}");
    }
}

4 žingsnis: Prisijunkite ir veikite rungtynėse

  • Išsaugokite rezultatus į CSV, siųskite įspėjimus arba paleiskite darbo srautą rungtynėse.
// Example: Append to log file
File.AppendAllText("search_log.csv", $"{file},{keyword or pattern},found\n");

5 žingsnis: klaidų tvarkymas ir veiksmingumas

  • Naudokite try/catch už tvirtą batch darbą
  • Paralyžiuokite didelius rinkinį, jei reikia
try
{
    // Searching logic
}
catch (Exception ex)
{
    File.AppendAllText("search_errors.log", ex.Message + Environment.NewLine);
}

6 žingsnis: išsami pavyzdys

using Aspose.OCR;
using System;
using System.Collections.Generic;
using System.IO;

class Program
{
    static void Main(string[] args)
    {
        List<string> keywords = new List<string> { "Confidential", "PII", "Invoice", "2025" };
        List<string> regexPatterns = new List<string> { @"\d{3}-\d{2}-\d{4}", @"[A-Z]{2}[0-9]{6}" };
        try
        {
            string[] files = Directory.GetFiles("./input", "*.png");
            RecognitionSettings settings = new RecognitionSettings();
            settings.Language = Language.English;
            AsposeOcr ocr = new AsposeOcr();
            foreach (string file in files)
            {
                foreach (string keyword in keywords)
                {
                    bool found = ocr.ImageHasText(file, keyword, settings);
                    if (found)
                        File.AppendAllText("search_log.csv", $"{file},{keyword},found\n");
                }
                foreach (string pattern in regexPatterns)
                {
                    bool found = ocr.ImageHasText(file, pattern, settings);
                    if (found)
                        File.AppendAllText("search_log.csv", $"{file},{pattern},found\n");
                }
            }
        }
        catch (Exception ex)
        {
            File.AppendAllText("search_errors.log", ex.Message + Environment.NewLine);
        }
    }
}

Naudokite atvejus ir paraiškas

Atitikties auditas

Automatiškai patikrinkite skenuojamus archyvus juodai išvardytoms žodžiams ar jautriems dizainams.

HR, teisinis ir saugumas

Atkreipkite dėmesį į konfidencialių frazių, darbuotojų vardų ar PII buvimą laivybos ar įrodymų failuose.

Trendų ir dažnių analizė

Skaičiuoti ir pranešti raktinių žodžių dažnumą laikui bėgant dideliuose dokumentų rinkiniuose.

Bendrieji iššūkiai ir sprendimai

1 iššūkis: klaidingi teigiami dalykai

Išsprendimas: Atsisiųskite raktinius žodžius ir regex; peržiūrėkite edge atvejus rankiniu būdu.

Iššūkis 2: didelis batų dydis

Išsprendimas: Naudokite lygiagrečią apdorojimą ir tvirtą klaidų tvarkymą.

3 iššūkis: keletas kalbų

Išsprendimas: Pritaikykite atpažinimo nustatymus ir raktinių žodžių sąrašus pagal kalbos rinkinį.

Veiksmingumo apžvalgos

  • „Batch“ darbai gali trukti ilgai dideliems archyvams – monitorių CPU, disko ir logų
  • Paralyžius, jei reikia didelio perteklių
  • Įrašykite visus rezultatus peržiūros ir laikymosi tikslais

Geriausios praktikos

  • Reguliariai išvalyti ir atnaujinti raktinių žodžių sąrašus
  • Automatinis klaidų registravimas ir ataskaitų teikimas
  • Eksperimentiniai archyvo pavyzdžiai
  • Saugūs logai ir paieškos rezultatai

Išplėstiniai scenarijai

1 scenarijus: paieškos ir pabrėžimo rezultatai PDF

Eksportuoti vaizdus su rastais raktiniais žodžiais pabrėžiama (pasirinkta po apdorojimo).

2 scenarijus: tvarkaraštis Reguliarus raktinių žodžių auditas

Automatiškai dirbti naktį arba savaitę, kad būtų laikomasi.

Conclusion

ASPOSE.OCR Image Text Finder .NET leidžia galingą, automatizuotą raktinių žodžių ir modelio paiešką – palaiko atitikties, saugumo ir tendencijų analizę visose vaizdo archyvuose.

See ASPOSE.OCR už .NET API nuorodą Išplėstinio teksto paieškos pavyzdžiai.

 Lietuvių