Miten etsiä useita avainsanoja tai malleja kuvissa
Useiden avainsanojen tai tekstimallien etsiminen suurissa kuvan arkistoissa on ratkaisevan tärkeää vaatimustenmukaisuuden, turvallisuuden ja digitaalisen löytämisen kannalta. Aspose.OCR Image Text Finder for .NET tekee sen helppokäyttöisen skannata kuvia avain- tai regex-malleiden luetteloille.
Reaalimaailman ongelma
Kuvien manuaalinen tarkastelu useille termeille (esim. nimet, tunnisteet, luottamukselliset lauseet) on hidasta ja luotettavaa, erityisesti tuhansia tiedostoja.
Ratkaisun yleiskatsaus
Automaattinen havaitseminen käynnistämällä useita avainsanoja tai regex-hakemuksia kuvien sarjoilla. raportoida tai toimia otteluissa vaatimustenmukaisuuden, HR: n tai digitaalisen oikeuslääketieteen käytön tapauksia.
edellytykset
- Visual Studio 2019 tai uudempi
- .NET 6.0 tai uudempi (tai .Net Framework 4.6.2+)
- ASPOSE.OCR for .NET alkaen NuGet
PM> Install-Package Aspose.OCR
Vaiheittainen toteutus
Vaihe 1: Asenna ja asenna Aspose.OCR
using Aspose.OCR;
Vaihe 2: Määritä avainsanoja tai malleja
List<string> keywords = new List<string> { "Confidential", "PII", "Invoice", "2025" };
List<string> regexPatterns = new List<string> { @"\d{3}-\d{2}-\d{4}", @"[A-Z]{2}[0-9]{6}" }; // SSN, Passport
Vaihe 3: Batch Search Images for Keywords/Patterns
string[] files = Directory.GetFiles("./input", "*.png");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
foreach (string file in files)
{
foreach (string keyword in keywords)
{
bool found = ocr.ImageHasText(file, keyword, settings);
if (found) Console.WriteLine($"Keyword '{keyword}' found in {file}");
}
foreach (string pattern in regexPatterns)
{
bool found = ocr.ImageHasText(file, pattern, settings);
if (found) Console.WriteLine($"Pattern '{pattern}' found in {file}");
}
}
Vaihe 4: Rekisteröityä ja toimia otteluissa
- Tallenna tulokset CSV: ssä, lähetä hälytykset tai käynnistää työnkulun ottelussa.
// Example: Append to log file
File.AppendAllText("search_log.csv", $"{file},{keyword or pattern},found\n");
Vaihe 5: Virheiden käsittely ja suorituskyky
- Käytä try/catch-tyyliä robustille työpaikoille
- Parallelisaatio suurille joukkoille tarvittaessa
try
{
// Searching logic
}
catch (Exception ex)
{
File.AppendAllText("search_errors.log", ex.Message + Environment.NewLine);
}
Vaihe 6: Täydellinen esimerkki
using Aspose.OCR;
using System;
using System.Collections.Generic;
using System.IO;
class Program
{
static void Main(string[] args)
{
List<string> keywords = new List<string> { "Confidential", "PII", "Invoice", "2025" };
List<string> regexPatterns = new List<string> { @"\d{3}-\d{2}-\d{4}", @"[A-Z]{2}[0-9]{6}" };
try
{
string[] files = Directory.GetFiles("./input", "*.png");
RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English;
AsposeOcr ocr = new AsposeOcr();
foreach (string file in files)
{
foreach (string keyword in keywords)
{
bool found = ocr.ImageHasText(file, keyword, settings);
if (found)
File.AppendAllText("search_log.csv", $"{file},{keyword},found\n");
}
foreach (string pattern in regexPatterns)
{
bool found = ocr.ImageHasText(file, pattern, settings);
if (found)
File.AppendAllText("search_log.csv", $"{file},{pattern},found\n");
}
}
}
catch (Exception ex)
{
File.AppendAllText("search_errors.log", ex.Message + Environment.NewLine);
}
}
}
Käytä tapauksia ja sovelluksia
vaatimustenmukaisuuden tarkastukset
Tarkista automaattisesti skannatut tiedostot mustan luettelon sanoista tai herkistä malleista.
HR, oikeudellinen ja turvallisuus
Tunnista luottamuksellisten lauseiden, työntekijän nimien tai PII:n läsnäolo purjehdus- tai näyttötiedostoissa.
Trendin ja taajuuden analyysi
Laske ja raportoi avainsanojen taajuutta ajan mittaan suurissa asiakirjoissa.
Yhteiset haasteet ja ratkaisut
Ensimmäinen haaste: väärä positiivisuus
** Ratkaisu:** Tarkista avainsanoja ja regex; tarkista edge tapaukset manuaalisesti.
Haaste 2: Suuri batch koko
** Ratkaisu:** Käytä rinnakkaista käsittelyä ja vakaa virhehoito.
Haaste 3: Monikieliset kielet
** Ratkaisu:** Muokkaa tunnistuksen asetuksia ja avainsanojen luetteloita kielellä.
suorituskyvyn huomioon ottaminen
- Batch-tehtävät voivat kestää pitkään suuria tiedostoja – monitori CPU, levyt ja arkistoja
- Parallelize tarvittaessa korkean läpimurron
- Rekisteröi kaikki tulokset tarkasteluun ja noudattamiseen
Parhaat käytännöt
- Puhdista ja päivitä avainsanoja säännöllisesti
- Virheiden automaattinen kirjaaminen ja raportointi
- Arkkitehtuurin edustavat näytöt
- Turvalliset logit ja hakutulokset
Edistyneet skenaariot
Käsikirja 1: Etsi ja korostaa tuloksia PDF-tuloksessa
Tuoda kuvia havaittujen avainsanojen kanssa (käsitelty jälkeinen käsittely).
Skenaario 2: Aikataulu säännölliset avainsanojen tarkastukset
Automaattinen työ suorittaa yöllä tai viikoittain vaatimustenmukaisuuden vuoksi.
johtopäätöksiä
Aspose.OCR Image Text Finder for .NET mahdollistaa tehokkaan ja automatisoidun matkapuhelin avainsanan ja mallin hakemisen, joka tukee vaatimustenmukaisuutta, turvallisuutta ja trendianalyysiä koko kuvan arkistoissa.
See ASPOSE.OCR .NET API-referenssille Edistyneiden tekstien etsimisen esimerkkejä.