Kā meklēt un salīdzināt tekstu attēlos ar Aspose.OCR

Kā meklēt un salīdzināt tekstu attēlos ar Aspose.OCR

Meklēt vai salīdzināt tekstu attēlu iekšienē ir būtiski atbilstības, digitālo arhīvu un automatizētu klasifikāciju. Aspose.OCR Image Text Finder for .NET ļauj identificēt, meklēt un salīdzināties attēla tekstu ar precizitāti — no PII atklāšanas līdz juridiskajai pārskatīšanai.

Reālā pasaules problēma

Uzņēmumiem bieži vien ir nepieciešams meklēt jutīgu saturu, verifikēt parakstus vai salīdzināt tekstu starp dažādiem attēla failu versijām.

Risinājumu pārskats

Ar Aspose.OCR jūs varat meklēt konkrētus tekstus vai modeļus (izmantojot līnijas vai regex) attēlos, un salīdzināt divu attēlu teksta saturu, lai noskaidrotu atšķirības.

Prerequisites

Jums būs nepieciešams:

  • Visual Studio 2019 vai vēlāk
  • .NET 6.0 vai jaunāks (vai .Net Framework 4.6.2+)
  • Aspose.OCR par .NET no NuGet
  • C# prasmes
PM> Install-Package Aspose.OCR

Step-by-step īstenošana

1. solis: Uzstādīt un konfigurēt Aspose.OCR

Pievienojiet iepakojumu un pieprasītos nosaukuma telpas:

using Aspose.OCR;

2. solis: sagatavojiet attēla failus

Iestatīt attēlus, kurus vēlaties meklēt vai salīdzināt.

string img1 = "document1.png";
string img2 = "document2.jpg";

3. solis: Iestatīt meklēšanas un salīdzināšanas iespējas

Iestatīt iestatījumus teksta meklēšanai (string vai regex) un salīdzinājumam.

RecognitionSettings settings = new RecognitionSettings();
settings.Language = Language.English; // Adjust as needed

4. solis: meklēt tekstu attēlu

Izmantojiet ImageHasText Ātra un elastīga teksta meklēšanas metode (atbalsta līnijas un regex):

AsposeOcr ocr = new AsposeOcr();
bool isFound = ocr.ImageHasText(img1, "Confidential", settings); // String search
Console.WriteLine($"Text found: {isFound}");

// Regex search example:
bool regexFound = ocr.ImageHasText(img1, @"\d{3}-\d{2}-\d{4}", settings); // e.g., US SSN pattern
Console.WriteLine($"Regex found: {regexFound}");

5. solis: salīdziniet divu attēlu tekstu

Use CompareImageTexts Atcerieties atšķirības tekstā:

int similarity = ocr.CompareImageTexts(img1, img2, settings, true); // true = case-insensitive
Console.WriteLine($"Image text similarity: {similarity}%");

6. solis: pievienojiet kļūdu apstrādi

Iepazīsti un pārvaldīt kļūdas ražošanas izturībai:

try
{
    AsposeOcr ocr = new AsposeOcr();
    bool found = ocr.ImageHasText(img1, "PII", settings);
    int sim = ocr.CompareImageTexts(img1, img2, settings, false);
}
catch (Exception ex)
{
    Console.WriteLine($"Error: {ex.Message}");
}

7. solis: optimizēt masu meklēšanu vai salīdzinājumu

  • Pārstrādā attēlus, izmantojot asink vai paralēli modeļus
  • Preprocesijas attēli (auglība, tīrīšana) augstāku precizitāti
  • Fine-tune regex progresīviem scenārijiem
// Example: Search for a pattern in all images in a folder
foreach (string file in Directory.GetFiles("./archive", "*.png"))
{
    bool found = ocr.ImageHasText(file, "Confidential", settings);
    if (found) { Console.WriteLine($"Found in: {file}"); }
}

8. solis: pilns piemērs

using Aspose.OCR;
using System;

class Program
{
    static void Main(string[] args)
    {
        try
        {
            string img1 = "contract1.png";
            string img2 = "contract2.png";

            RecognitionSettings settings = new RecognitionSettings();
            settings.Language = Language.English;

            AsposeOcr ocr = new AsposeOcr();
            // Search for specific text
            bool isFound = ocr.ImageHasText(img1, "NDA", settings);
            Console.WriteLine($"Text found: {isFound}");

            // Compare two images
            int similarity = ocr.CompareImageTexts(img1, img2, settings, true);
            Console.WriteLine($"Image text similarity: {similarity}%");
        }
        catch (Exception ex)
        {
            Console.WriteLine($"Error: {ex.Message}");
        }
    }
}

Izmantojiet gadījumus un pieteikumus

Atbilstība un PII atklāšana

Meklēt konfidenciālus datus vai modeļus (piemēram, ID, SSN) digitālajā attēla arhīvā.

Juridiskā un līguma pārskats

Salīdziniet attēla līgumus vai dokumentus par teksta atšķirībām pēc parakstīšanas vai rediģēšanas.

Digitālā aktīvu pārvaldība

Iegūstiet automatizētu marķēšanu vai meklēšanu lielās attēla reģistratūrās biznesa procesu automātijai.

Kopīgi izaicinājumi un risinājumi

1. izaicinājums: attēli ar dažādām teksta stilām

Rīkojums: Izmantojiet gadījumu necilvēcīgu un regex atbilstību; pārbaudiet dažādos burtos / fonos.

Izteikums 2: Lielais batch meklējumi

Rīze: Izmantojiet paralēlus vai asinkronus darba plūsmas un pirmsapstrādes attēlus, ja iespējams.

3. izaicinājums: sarežģīti modeļi vai rediģēts teksts

Lēmums: Reģistrējiet un pārbaudiet paraugu attēlus; tune iestatījumus trokšņa vai rediģēto attēlu dēļ.

Darbības apsvērumi

  • Batch process ātrumam lielos arhīvos
  • Izmanto augstas kvalitātes avotu attēlus par labāko precizitāti
  • Tune meklēšanas modeļi, lai samazinātu viltus pozitīvus

Labākās prakses

  • Pārbaudiet visus meklēšanas un salīdzināšanas modeļus uz paraugu kompleksiem vispirms
  • Droši apstrādāt un ierakstīt jutīgu informāciju vai meklēšanas rezultātus
  • Regulāri atjaunina Aspose.OCR funkciju un precizitātes uzlabošanai

Augstākie scenāriji

1. scenārijs: Advanced Regex for Redaction

bool found = ocr.ImageHasText(img1, @"(Account|Card)\s*#:?\s*\d{4,}", settings);

Scenārija 2: Daudzvalodu meklēšana

settings.Language = Language.French;
bool isFound = ocr.ImageHasText(img1, "Confidentiel", settings);

Conclusion

Aspose.OCR Image Text Finder for .NET ļauj efektīvi meklēt, atklāt un salīdzināt attēla balstītu tekstu – ar arhīvu, juridisko un atbilstības darba plūsmu starpniecību.

Atrodiet vairāk piemēru par Aspose.OCR par .NET API atsauci .

 Latviski