چگونه کلمات کلیدی یا الگوهای چندگانه را در تصاویر جستجو کنیم

چگونه کلمات کلیدی یا الگوهای چندگانه را در تصاویر جستجو کنیم

جستجو برای کلمات کلیدی چندگانه یا الگوهای متن در آرشیو های تصویر بزرگ برای انطباق، امنیت و کشف دیجیتال بسیار مهم است. Aspose.OCR Image Text Finder برای .NET باعث می شود آسان برای جمع آوری تصاویر اسکن برای لیست های کلمه کلیدی یا مدل های regex.

مشکل دنیای واقعی

بررسی دستی تصاویر برای چندین اصطلاح (به عنوان مثال، نام، شناسه ها، عبارات محرمانه) آهسته و غیر قابل اعتماد است، به ویژه در سراسر هزاران فایل.

بررسی راه حل

تشخیص اتوماتیک با انجام جستجوی چند کلمه کلیدی یا ردیابی بر روی مجموعه ای از تصاویر گزارش یا عمل در بازی ها برای رعایت، HR، و یا موارد استفاده از قانونگذاری دیجیتال.

پیش شرط

  • Visual Studio 2019 یا بالاتر
  • .NET 6.0 یا بالاتر (یا .Net Framework 4.6.2+)
  • Aspose.OCR برای .NET از NuGet
PM> Install-Package Aspose.OCR

پیاده سازی گام به گام

مرحله 1: نصب و تنظیم Aspose.OCR

using Aspose.OCR;

مرحله 2: کلمات کلیدی یا الگوهای خود را تعریف کنید

List<string> keywords = new List<string> { "Confidential", "PII", "Invoice", "2025" };
List<string> regexPatterns = new List<string> { @"\d{3}-\d{2}-\d{4}", @"[A-Z]{2}[0-9]{6}" }; // SSN, Passport

مرحله 3: تصویر جستجو برای کلمات کلیدی / الگوهای

string[] files = Directory.GetFiles("./input", "*.png");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
foreach (string file in files)
{
    foreach (string keyword in keywords)
    {
        bool found = ocr.ImageHasText(file, keyword, settings);
        if (found) Console.WriteLine($"Keyword '{keyword}' found in {file}");
    }
    foreach (string pattern in regexPatterns)
    {
        bool found = ocr.ImageHasText(file, pattern, settings);
        if (found) Console.WriteLine($"Pattern '{pattern}' found in {file}");
    }
}

مرحله چهارم: ثبت نام و عمل در بازی ها

  • نتایج را به CSV ذخیره کنید، هشدارها را ارسال کنید یا جریان کار را در مسابقه راه اندازی کنید.
// Example: Append to log file
File.AppendAllText("search_log.csv", $"{file},{keyword or pattern},found\n");

مرحله پنجم: مدیریت اشتباهات و عملکرد

  • استفاده از try/catch برای کارهای جامد
  • در صورت لزوم برای مجموعه های بزرگ پاراگراف کنید.
try
{
    // Searching logic
}
catch (Exception ex)
{
    File.AppendAllText("search_errors.log", ex.Message + Environment.NewLine);
}

مرحله ششم: نمونه کامل

using Aspose.OCR;
using System;
using System.Collections.Generic;
using System.IO;

class Program
{
    static void Main(string[] args)
    {
        List<string> keywords = new List<string> { "Confidential", "PII", "Invoice", "2025" };
        List<string> regexPatterns = new List<string> { @"\d{3}-\d{2}-\d{4}", @"[A-Z]{2}[0-9]{6}" };
        try
        {
            string[] files = Directory.GetFiles("./input", "*.png");
            RecognitionSettings settings = new RecognitionSettings();
            settings.Language = Language.English;
            AsposeOcr ocr = new AsposeOcr();
            foreach (string file in files)
            {
                foreach (string keyword in keywords)
                {
                    bool found = ocr.ImageHasText(file, keyword, settings);
                    if (found)
                        File.AppendAllText("search_log.csv", $"{file},{keyword},found\n");
                }
                foreach (string pattern in regexPatterns)
                {
                    bool found = ocr.ImageHasText(file, pattern, settings);
                    if (found)
                        File.AppendAllText("search_log.csv", $"{file},{pattern},found\n");
                }
            }
        }
        catch (Exception ex)
        {
            File.AppendAllText("search_errors.log", ex.Message + Environment.NewLine);
        }
    }
}

استفاده از موارد و برنامه ها

حسابرسی انطباق

به طور خودکار فایل های اسکن شده را برای کلمات لیست سیاه یا الگوهای حساس بررسی کنید.

HR، حقوقی و امنیت

شناسایی حضور عبارات محرمانه، نام کارکنان و یا PII در سوار شدن یا اسناد شواهد.

تحلیل روند و فرکانس

شمارش و گزارش فرکانس کلمات کلیدی در طول زمان در مجموعه های بزرگ اسناد.

چالش ها و راه حل های مشترک

فصل اول: مزایای نادرست

** راه حل:** کلمات کلیدی و regex را به صورت دستی بررسی کنید.

چالش دوم: حجم بوته بزرگ

** راه حل:** استفاده از پردازش موازی و مدیریت خطا قوی.

فصل سوم: زبان های چندگانه

** راه حل:** تنظیم تنظیمات تشخیص و لیست کلمات کلیدی در هر مجموعه زبان.

بررسی عملکرد

  • کارهای بسته بندی می تواند برای فایل های بزرگ طولانی انجام شود – CPU مانیتور، دیسک و سوابق
  • در صورت لزوم برای پهنای باند
  • ثبت تمام نتایج برای بررسی و رعایت

بهترین شیوه‌ها

  • تمیز کردن و به روز رسانی لیست کلمات کلیدی به طور منظم
  • خطای اتوماتیک ثبت نام و گزارش
  • آزمایش نمونه های نمایندگی آرشیو
  • سوابق امن و نتایج جستجو

سناریوهای پیشرفته

سناریو 1: نتایج جستجو و برجسته در خروجی PDF

صادرات تصاویر با کلمات کلیدی یافت شده برجسته (پس از پردازش سفارشی).

سناریو ۲: برنامه ریزی برای بازرسی کلمات کلیدی به طور منظم

کارهای اتوماتیک برای انجام شبانه یا هفتگی برای انطباق

نتیجه گیری

Aspose.OCR Image Text Finder برای .NET اجازه می دهد تا قدرتمند، اتوماتیک کلمات کلیدی و الگوهای جستجو – پشتیبانی از انطباق، امنیت و تجزیه و تحلیل روند در سراسر اسناد تصویر.

See Aspose.OCR برای .NET API مرجع برای مثال های جستجوی متن پیشرفته.

 فارسی