चित्रों में कई कीवर्ड या पैटर्न खोजने के लिए कैसे

चित्रों में कई कीवर्ड या पैटर्न खोजने के लिए कैसे

बड़ी छवि संग्रह में कई कीवर्ड या टेक्स्ट पैटर्न की तलाश करना अनुपालन, सुरक्षा और डिजिटल खोज के लिए महत्वपूर्ण है. Aspose.OCR Image Text Finder for .NET को कुंजी शब्दों या regex मॉडलों की सूचियों पर स्कैन छवियों को बैच करना आसान बनाता है।

असली दुनिया की समस्या

कई शब्दों (जैसे नाम, आईडी, गोपनीय वाक्यांश) के लिए चित्रों की मैन्युअल समीक्षा धीमी और अविश्वसनीय है, विशेष रूप से हजारों फ़ाइलों के माध्यम से।

समाधान समीक्षा

मल्टी-कीवर्ड या रीगेक्स खोजों को चलाने के द्वारा स्वचालित पहचान छवियों के बैट्स पर रिपोर्ट करें या अनुपालन के लिए मैचों पर कार्रवाई करें, मानव संसाधन, या डिजिटल कानूनी चिकित्सा उपयोग के मामलों।

Prerequisites

  • Visual Studio 2019 या बाद में
  • .NET 6.0 या बाद में (या .Net Framework 4.6.2+)
  • NuGet से .NET के लिए Aspose.OCR
PM> Install-Package Aspose.OCR

चरण-दर-चरण कार्यान्वयन

चरण 1: Aspose.OCR स्थापित करें और सेट करें

using Aspose.OCR;

चरण 2: अपने कुंजी शब्दों या पैटर्न को परिभाषित करें

List<string> keywords = new List<string> { "Confidential", "PII", "Invoice", "2025" };
List<string> regexPatterns = new List<string> { @"\d{3}-\d{2}-\d{4}", @"[A-Z]{2}[0-9]{6}" }; // SSN, Passport

चरण 3: कुंजी शब्द / पैटर्न के लिए बैच खोज छवियों

string[] files = Directory.GetFiles("./input", "*.png");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
foreach (string file in files)
{
    foreach (string keyword in keywords)
    {
        bool found = ocr.ImageHasText(file, keyword, settings);
        if (found) Console.WriteLine($"Keyword '{keyword}' found in {file}");
    }
    foreach (string pattern in regexPatterns)
    {
        bool found = ocr.ImageHasText(file, pattern, settings);
        if (found) Console.WriteLine($"Pattern '{pattern}' found in {file}");
    }
}

चरण 4: लॉग और मैचों पर कार्रवाई करें

  • परिणामों को CSV में संग्रहीत करें, चेतावनी भेजें, या मैच पर कार्यप्रवाह को लॉन्च करें।
// Example: Append to log file
File.AppendAllText("search_log.csv", $"{file},{keyword or pattern},found\n");

चरण 5: त्रुटियों का प्रबंधन और प्रदर्शन

  • मजबूत बैच नौकरियों के लिए try/catch का उपयोग करें
  • जरूरत पड़ने पर बड़े सेट के लिए समानांतर करें
try
{
    // Searching logic
}
catch (Exception ex)
{
    File.AppendAllText("search_errors.log", ex.Message + Environment.NewLine);
}

चरण 6: पूर्ण उदाहरण

using Aspose.OCR;
using System;
using System.Collections.Generic;
using System.IO;

class Program
{
    static void Main(string[] args)
    {
        List<string> keywords = new List<string> { "Confidential", "PII", "Invoice", "2025" };
        List<string> regexPatterns = new List<string> { @"\d{3}-\d{2}-\d{4}", @"[A-Z]{2}[0-9]{6}" };
        try
        {
            string[] files = Directory.GetFiles("./input", "*.png");
            RecognitionSettings settings = new RecognitionSettings();
            settings.Language = Language.English;
            AsposeOcr ocr = new AsposeOcr();
            foreach (string file in files)
            {
                foreach (string keyword in keywords)
                {
                    bool found = ocr.ImageHasText(file, keyword, settings);
                    if (found)
                        File.AppendAllText("search_log.csv", $"{file},{keyword},found\n");
                }
                foreach (string pattern in regexPatterns)
                {
                    bool found = ocr.ImageHasText(file, pattern, settings);
                    if (found)
                        File.AppendAllText("search_log.csv", $"{file},{pattern},found\n");
                }
            }
        }
        catch (Exception ex)
        {
            File.AppendAllText("search_errors.log", ex.Message + Environment.NewLine);
        }
    }
}

मामलों और अनुप्रयोगों का उपयोग करें

अनुपालन की जांच

ब्लैकलिस्ट शब्दों या संवेदनशील पैटर्न के लिए स्वचालित रूप से स्कैन किए गए फ़ाइलों की जांच करें।

एचआर, कानूनी और सुरक्षा

कवर या सबूत फ़ाइलों में गोपनीय वाक्यांशों, कर्मचारियों के नाम, या PII की उपस्थिति का पता लगाएं।

ट्रेंड और आवृत्ति विश्लेषण

बड़ी दस्तावेज़ सेट में समय के साथ कीवर्ड की आवृत्ति की गिनती और रिपोर्ट करें।

आम चुनौतियां और समाधान

चुनौती 1: नकली सकारात्मक

** समाधान:** कुंजी शब्दों और regex को रीफिन करें; मैनुअल रूप से edge मामलों की समीक्षा करें।

चुनौती 2: बड़े बैच आकार

** समाधान:** समानांतर प्रसंस्करण और मजबूत त्रुटि प्रबंधन का उपयोग करें।

चुनौती 3: बहुभाषी

** समाधान:** भाषा बैच के लिए पहचान सेटिंग्स और कीवर्ड सूची को समायोजित करें।

प्रदर्शन विचार

  • बैच नौकरियां बड़ी फ़ाइलों के लिए लंबे समय तक चल सकती हैं – मॉनिटर सीपीयू, डिस्क, और लॉग
  • उच्च पारगमन के लिए यदि आवश्यक हो तो समानांतर करें
  • समीक्षा और अनुपालन के लिए सभी परिणामों को लॉग करें

सर्वश्रेष्ठ अभ्यास

  • कुंजी शब्दों की सूची को नियमित रूप से साफ और अपडेट करें
  • स्वचालित त्रुटि लॉगिंग और रिपोर्टिंग
  • प्रतिनिधि संग्रह नमूनों पर परीक्षण
  • सुरक्षित लॉग और खोज परिणाम

उन्नत परिदृश्य

परिदृश्य 1: खोज और आउटपुट में परिणामों को उजागर करें PDF

खोजे गए कुंजी शब्दों को उजागर करके छवियों को निर्यात करें (कस्टम पोस्ट-प्रसंस्करण)।

परिदृश्य 2: नियमित बैच कीवर्ड समीक्षा कार्यक्रम

अनुपालन के लिए रात-रात या साप्ताहिक रूप से काम करना स्वचालित है।

Conclusion

.NET के लिए Aspose.OCR Image Text Finder शक्तिशाली, स्वचालित बैच कुंजी शब्द और पैटर्न खोज की अनुमति देता है – छवि संग्रह में अनुपालन, सुरक्षा और रुझान विश्लेषण का समर्थन करता है।

See .NET API संदर्भ के लिए Aspose.OCR उन्नत पाठ खोज उदाहरणों के लिए।

 हिंदी