Kaip ieškoti ir palyginti tekstą nuotraukose su Aspose.OCR

Kaip ieškoti ir palyginti tekstą nuotraukose su Aspose.OCR

Ieškoti ar palyginti tekstą nuotraukose yra būtina atitikties, skaitmeninių archyvų ir automatinio klasifikavimo. Aspose.OCR Image Text Finder for .NET leidžia jums identifikuoti, ieškoti ir lyginti vaizdo tekstas tiksliai – per įvairius naudojimo atvejus nuo PII aptikimo iki teisinio peržiūros.

Realaus pasaulio problemos

Verslui dažnai reikia ieškoti jautrio turinio, patikrinti parašus arba palyginti tekstą tarp skirtingų vaizdo failų versijų. Maniniai patikrinimai yra lėti ir nepatikimi, ypač dideliems skaitmeniniams archyvams ar dokumentų rinkiniams.

Sprendimo apžvalga

Su Aspose.OCR galite ieškoti konkrečių tekstų ar modelių (naudojant juostus ar regex) nuotraukose ir palyginti dviejų vaizdų tekstinį turinį, kad nustatytumėte skirtumus.

Prerequisites

Jums reikės:

  • „Visual Studio 2019“ arba vėliau
  • .NET 6.0 arba naujesnė (arba .Net Framework 4.6.2+)
  • ASPOSE.OCR už .NET iš NuGet
  • Pagrindiniai C# įgūdžiai
PM> Install-Package Aspose.OCR

Žingsnis po žingsnio įgyvendinimas

1 žingsnis: Įdiegti ir konfigūruoti Aspose.OCR

Pridėkite paketą ir reikalaujamas pavadinimų erdvės:

using Aspose.OCR;

2 žingsnis: paruoškite savo vaizdo failus

Įveskite nuotraukas, kurias norite ieškoti arba palyginti.

string img1 = "document1.png";
string img2 = "document2.jpg";

3 žingsnis: nustatykite paieškos ir palyginimo parinktis

Konfiguruoti nustatymus teksto paieškos (string arba regex) ir palyginimas.

RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English; // Adjust as needed

4 žingsnis: ieškoti teksto paveikslėlyje

Naudokite jį ImageHasText greito, lanksčio teksto paieškos metodas (pagal juostus ir regex):

AsposeOcr ocr = new AsposeOcr();
bool isFound = ocr.ImageHasText(img1, "Confidential", settings); // String search
Console.WriteLine($"Text found: {isFound}");

// Regex search example:
bool regexFound = ocr.ImageHasText(img1, @"\d{3}-\d{2}-\d{4}", settings); // e.g., US SSN pattern
Console.WriteLine($"Regex found: {regexFound}");

5 žingsnis: palyginkite dviejų paveikslų tekstą

Use CompareImageTexts Atkreipkite dėmesį į tekstinio turinio skirtumus:

int similarity = ocr.CompareImageTexts(img1, img2, settings, true); // true = case-insensitive
Console.WriteLine($"Image text similarity: {similarity}%");

6 žingsnis: pridėti klaidų tvarkymą

Paimkite ir tvarkykite gamybos tvirtumo klaidas:

try
{
    AsposeOcr ocr = new AsposeOcr();
    bool found = ocr.ImageHasText(img1, "PII", settings);
    int sim = ocr.CompareImageTexts(img1, img2, settings, false);
}
catch (Exception ex)
{
    Console.WriteLine($"Error: {ex.Message}");
}

7 žingsnis: optimizuokite paiešką arba palyginimą

  • Nuotraukų apdorojimas batuose naudojant async arba lygiagrečius modelius
  • Preprocesiniai vaizdai (auginimas, valymas) didesnei tikslumui
  • Fine-tune regex pažangiems scenarijams
// Example: Search for a pattern in all images in a folder
foreach (string file in Directory.GetFiles("./archive", "*.png"))
{
    bool found = ocr.ImageHasText(file, "Confidential", settings);
    if (found) { Console.WriteLine($"Found in: {file}"); }
}

8 žingsnis: pilnas pavyzdys

using Aspose.OCR;
using System;

class Program
{
    static void Main(string[] args)
    {
        try
        {
            string img1 = "contract1.png";
            string img2 = "contract2.png";

            RecognitionSettings settings = new RecognitionSettings();
            settings.Language = Language.English;

            AsposeOcr ocr = new AsposeOcr();
            // Search for specific text
            bool isFound = ocr.ImageHasText(img1, "NDA", settings);
            Console.WriteLine($"Text found: {isFound}");

            // Compare two images
            int similarity = ocr.CompareImageTexts(img1, img2, settings, true);
            Console.WriteLine($"Image text similarity: {similarity}%");
        }
        catch (Exception ex)
        {
            Console.WriteLine($"Error: {ex.Message}");
        }
    }
}

Naudokite atvejus ir paraiškas

Atitikties ir PII aptikimas

Ieškoti konfidencialių duomenų ar pavyzdžių (pavyzdžiui, ID, SSN) skaitmeninio vaizdo archyvuose.

Teisės ir sutarties apžvalga

Palyginkite vaizdo sutartis ar dokumentus tekstinių skirtumų po pasirašymo ar redagavimo.

Skaitmeninio turto valdymas

Galite automatiškai pažymėti arba ieškoti dideliuose vaizdo įrašų sandėliuose verslo procesų automatizavimui.

Bendrieji iššūkiai ir sprendimai

1 iššūkis: įvairūs teksto stilių vaizdai

Išsprendimas: Naudokite atsitiktinį ir regex atitikimą; bandykite įvairius fontus / fonus.

Iššūkis 2: didelis batch paieškos

Išsprendimas: Jei įmanoma, naudokite lygiagrečius ar nesinkroninius darbo srautus ir išankstinius vaizdus.

3 iššūkis: sudėtingi modeliai arba redakcinis tekstas

Išsprendimas: Atkreipkite dėmesį į regex ir bandykite per pavyzdžių vaizdus; tune nustatymus triukšmo ar redaguotų vaizdų.

Veiksmingumo apžvalgos

  • „Batch“ greitis dideliuose archyvuose
  • Naudokite aukštos kokybės šaltinio nuotraukas geriausiam tikslumui
  • Patikrinkite paieškos modelius, kad sumažintumėte klaidingus teigiamus rezultatus

Geriausios praktikos

  • Išbandykite visus paieškos ir palyginimo modelius pirmiausia
  • Saugiai tvarkyti ir įrašyti jautrią informaciją ar paieškos rezultatus
  • Reguliariai atnaujinti Aspose.OCR funkcijų ir tikslumo patobulinimų

Išplėstiniai scenarijai

1 scenarijus: Advanced Regex for Redaction

bool found = ocr.ImageHasText(img1, @"(Account|Card)\s*#:?\s*\d{4,}", settings);

2 scenarijus: kelių kalbų paieškos

settings.Language = Language.French;
bool isFound = ocr.ImageHasText(img1, "Confidentiel", settings);

Conclusion

ASPOSE.OCR Image Text Finder .NET leidžia jums efektyviai ieškoti, aptikti ir palyginti vaizdą pagrįstą tekstą – per archyvus, teisinius ir atitikties darbo srautus.

Daugiau pavyzdžių rasite į ASPOSE.OCR už .NET API nuorodą .

 Lietuvių