Miten etsiä useita avainsanoja tai malleja kuvissa

Miten etsiä useita avainsanoja tai malleja kuvissa

Useiden avainsanojen tai tekstimallien etsiminen suurissa kuvan arkistoissa on ratkaisevan tärkeää vaatimustenmukaisuuden, turvallisuuden ja digitaalisen löytämisen kannalta. Aspose.OCR Image Text Finder for .NET tekee sen helppokäyttöisen skannata kuvia avain- tai regex-malleiden luetteloille.

Reaalimaailman ongelma

Kuvien manuaalinen tarkastelu useille termeille (esim. nimet, tunnisteet, luottamukselliset lauseet) on hidasta ja luotettavaa, erityisesti tuhansia tiedostoja.

Ratkaisun yleiskatsaus

Automaattinen havaitseminen käynnistämällä useita avainsanoja tai regex-hakemuksia kuvien sarjoilla. raportoida tai toimia otteluissa vaatimustenmukaisuuden, HR: n tai digitaalisen oikeuslääketieteen käytön tapauksia.

edellytykset

  • Visual Studio 2019 tai uudempi
  • .NET 6.0 tai uudempi (tai .Net Framework 4.6.2+)
  • ASPOSE.OCR for .NET alkaen NuGet
PM> Install-Package Aspose.OCR

Vaiheittainen toteutus

Vaihe 1: Asenna ja asenna Aspose.OCR

using Aspose.OCR;

Vaihe 2: Määritä avainsanoja tai malleja

List<string> keywords = new List<string> { "Confidential", "PII", "Invoice", "2025" };
List<string> regexPatterns = new List<string> { @"\d{3}-\d{2}-\d{4}", @"[A-Z]{2}[0-9]{6}" }; // SSN, Passport

Vaihe 3: Batch Search Images for Keywords/Patterns

string[] files = Directory.GetFiles("./input", "*.png");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
foreach (string file in files)
{
    foreach (string keyword in keywords)
    {
        bool found = ocr.ImageHasText(file, keyword, settings);
        if (found) Console.WriteLine($"Keyword '{keyword}' found in {file}");
    }
    foreach (string pattern in regexPatterns)
    {
        bool found = ocr.ImageHasText(file, pattern, settings);
        if (found) Console.WriteLine($"Pattern '{pattern}' found in {file}");
    }
}

Vaihe 4: Rekisteröityä ja toimia otteluissa

  • Tallenna tulokset CSV: ssä, lähetä hälytykset tai käynnistää työnkulun ottelussa.
// Example: Append to log file
File.AppendAllText("search_log.csv", $"{file},{keyword or pattern},found\n");

Vaihe 5: Virheiden käsittely ja suorituskyky

  • Käytä try/catch-tyyliä robustille työpaikoille
  • Parallelisaatio suurille joukkoille tarvittaessa
try
{
    // Searching logic
}
catch (Exception ex)
{
    File.AppendAllText("search_errors.log", ex.Message + Environment.NewLine);
}

Vaihe 6: Täydellinen esimerkki

using Aspose.OCR;
using System;
using System.Collections.Generic;
using System.IO;

class Program
{
    static void Main(string[] args)
    {
        List<string> keywords = new List<string> { "Confidential", "PII", "Invoice", "2025" };
        List<string> regexPatterns = new List<string> { @"\d{3}-\d{2}-\d{4}", @"[A-Z]{2}[0-9]{6}" };
        try
        {
            string[] files = Directory.GetFiles("./input", "*.png");
            RecognitionSettings settings = new RecognitionSettings();
            settings.Language = Language.English;
            AsposeOcr ocr = new AsposeOcr();
            foreach (string file in files)
            {
                foreach (string keyword in keywords)
                {
                    bool found = ocr.ImageHasText(file, keyword, settings);
                    if (found)
                        File.AppendAllText("search_log.csv", $"{file},{keyword},found\n");
                }
                foreach (string pattern in regexPatterns)
                {
                    bool found = ocr.ImageHasText(file, pattern, settings);
                    if (found)
                        File.AppendAllText("search_log.csv", $"{file},{pattern},found\n");
                }
            }
        }
        catch (Exception ex)
        {
            File.AppendAllText("search_errors.log", ex.Message + Environment.NewLine);
        }
    }
}

Käytä tapauksia ja sovelluksia

vaatimustenmukaisuuden tarkastukset

Tarkista automaattisesti skannatut tiedostot mustan luettelon sanoista tai herkistä malleista.

HR, oikeudellinen ja turvallisuus

Tunnista luottamuksellisten lauseiden, työntekijän nimien tai PII:n läsnäolo purjehdus- tai näyttötiedostoissa.

Trendin ja taajuuden analyysi

Laske ja raportoi avainsanojen taajuutta ajan mittaan suurissa asiakirjoissa.

Yhteiset haasteet ja ratkaisut

Ensimmäinen haaste: väärä positiivisuus

** Ratkaisu:** Tarkista avainsanoja ja regex; tarkista edge tapaukset manuaalisesti.

Haaste 2: Suuri batch koko

** Ratkaisu:** Käytä rinnakkaista käsittelyä ja vakaa virhehoito.

Haaste 3: Monikieliset kielet

** Ratkaisu:** Muokkaa tunnistuksen asetuksia ja avainsanojen luetteloita kielellä.

suorituskyvyn huomioon ottaminen

  • Batch-tehtävät voivat kestää pitkään suuria tiedostoja – monitori CPU, levyt ja arkistoja
  • Parallelize tarvittaessa korkean läpimurron
  • Rekisteröi kaikki tulokset tarkasteluun ja noudattamiseen

Parhaat käytännöt

  • Puhdista ja päivitä avainsanoja säännöllisesti
  • Virheiden automaattinen kirjaaminen ja raportointi
  • Arkkitehtuurin edustavat näytöt
  • Turvalliset logit ja hakutulokset

Edistyneet skenaariot

Käsikirja 1: Etsi ja korostaa tuloksia PDF-tuloksessa

Tuoda kuvia havaittujen avainsanojen kanssa (käsitelty jälkeinen käsittely).

Skenaario 2: Aikataulu säännölliset avainsanojen tarkastukset

Automaattinen työ suorittaa yöllä tai viikoittain vaatimustenmukaisuuden vuoksi.

johtopäätöksiä

Aspose.OCR Image Text Finder for .NET mahdollistaa tehokkaan ja automatisoidun matkapuhelin avainsanan ja mallin hakemisen, joka tukee vaatimustenmukaisuutta, turvallisuutta ja trendianalyysiä koko kuvan arkistoissa.

See ASPOSE.OCR .NET API-referenssille Edistyneiden tekstien etsimisen esimerkkejä.

 Suomi