Како претражити више кључних речи или обрасца у сликама

Како претражити више кључних речи или обрасца у сликама

Претраживање више кључних речи или текстуалних обрасца у великим архивима слике је од суштинског значаја за усклађеност, безбедност и дигитално откривање.Аппосе.ОЦР Слика Текстови Фандер за .НЕТ чини лако да се бацк скенирање слика за листе кљивих речи и регекс образаца.

Реал светски проблем

Ручни преглед слика за више термина (на пример, имена, ИД, приватне фразе) је споран и непоуздани, посебно преко хиљада датотека.

Преглед решења

Аутоматско откривање покретањем више кључних речи или регекс претраге на батовима слика. извештавање или деловање на утакмицама за усклађеност, људске ресурсе, или случајеве коришћења дигиталне медицине.

Принципи

  • Visual Studio 2019 или касније
  • .NET 6.0 или новији (или .Net Framework 4.6.2+)
  • Aspose.OCR za .NET od NuGet
PM> Install-Package Aspose.OCR

Корак по корак спровођење

Корак 1: Инсталирајте и конфигуришете Aspose.OCR

using Aspose.OCR;

Корак 2: Дефинишите своје кључне речи или обрасци

List<string> keywords = new List<string> { "Confidential", "PII", "Invoice", "2025" };
List<string> regexPatterns = new List<string> { @"\d{3}-\d{2}-\d{4}", @"[A-Z]{2}[0-9]{6}" }; // SSN, Passport

Корак 3: Бацк претраге слике за кључне речи/патерне

string[] files = Directory.GetFiles("./input", "*.png");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
foreach (string file in files)
{
    foreach (string keyword in keywords)
    {
        bool found = ocr.ImageHasText(file, keyword, settings);
        if (found) Console.WriteLine($"Keyword '{keyword}' found in {file}");
    }
    foreach (string pattern in regexPatterns)
    {
        bool found = ocr.ImageHasText(file, pattern, settings);
        if (found) Console.WriteLine($"Pattern '{pattern}' found in {file}");
    }
}

Корак 4: Пријављивање и акција на утакмицама

  • Сачувајте резултате у ЦСВ, пошаљите упозорења или покрените радни ток на мечу.
// Example: Append to log file
File.AppendAllText("search_log.csv", $"{file},{keyword or pattern},found\n");

Корак 5: Управљање грешкама и перформансе

  • Koristite try/catch za robustne batch poslove
  • Паралелно за велике сете ако је потребно
try
{
    // Searching logic
}
catch (Exception ex)
{
    File.AppendAllText("search_errors.log", ex.Message + Environment.NewLine);
}

Корак 6: Потпуни пример

using Aspose.OCR;
using System;
using System.Collections.Generic;
using System.IO;

class Program
{
    static void Main(string[] args)
    {
        List<string> keywords = new List<string> { "Confidential", "PII", "Invoice", "2025" };
        List<string> regexPatterns = new List<string> { @"\d{3}-\d{2}-\d{4}", @"[A-Z]{2}[0-9]{6}" };
        try
        {
            string[] files = Directory.GetFiles("./input", "*.png");
            RecognitionSettings settings = new RecognitionSettings();
            settings.Language = Language.English;
            AsposeOcr ocr = new AsposeOcr();
            foreach (string file in files)
            {
                foreach (string keyword in keywords)
                {
                    bool found = ocr.ImageHasText(file, keyword, settings);
                    if (found)
                        File.AppendAllText("search_log.csv", $"{file},{keyword},found\n");
                }
                foreach (string pattern in regexPatterns)
                {
                    bool found = ocr.ImageHasText(file, pattern, settings);
                    if (found)
                        File.AppendAllText("search_log.csv", $"{file},{pattern},found\n");
                }
            }
        }
        catch (Exception ex)
        {
            File.AppendAllText("search_errors.log", ex.Message + Environment.NewLine);
        }
    }
}

Коришћење случајева и апликација

Аудит у складу

Аутоматски проверите скениране архиве за црне речи или осетљиве узорке.

ХР, правни и безбедносни

Откријте присуство поверених фраза, имена запослених или ПИИ-а у бродовима или доказним датотекама.

Анализа трендова и фреквенција

Број и извештавање фреквенције кључних речи током времена у великим сетовима докумената.

Заједнички изазови и решења

Проблем 1: Фалсификовани позитиви

Решење: Рефинирајте кључне речи и регекс; ручно прегледајте крајне случајеве.

Проблем 2: Велики бацх величина

Решење: Употреба паралелног обраде и јаког управљања грешкама.

Проблем 3: Многи језици

Решење: Прилагодите подешавања препознавања и листе кључних речи по језику.

Размишљање о перформанси

  • Баццх радови могу дуго радити за велике архиве – ЦПУ монитора, диска и дневника
  • Паралелно, ако је потребно за висок проток
  • Региструјте све резултате за преглед и поштовање

Најбоља пракса

  • Редовно чистите и ажурирајте листе кључних речи
  • Аутоматско пријављивање грешака и извештавање
  • Тест на репрезентативним архивним узорцима
  • Bezbedni logovi i rezultati pretraživanja

Напредни сценарио

Сценарио 1: Претрага и наглашавање резултата у излазу ПДФ

Експортирајте слике са пронађеним наглашеним кључним речима (прилагођено пост-процесирање).

Сценарио 2: Распоред редовне бацх ревизије кључних речи

Аутоматски посао да се ради ноћу или недељно за поштовање.

Закључак

Aspose.OCR Image Text Finder za .NET omogućava moćno, automatizovano pretraživanje ključnih reči i uzoraka – podržavajući usklađenost, bezbednost i analizu trendova u arhivima slika.

See Aspose.OCR за .NET API референце За напредне примере претраге текста.

 Српски